该 ai.embed 函数使用生成式 AI 将文本转换为矢量嵌入。 借助这些向量,AI 可以理解文本之间的关系,因此可以根据含义而不是确切的措辞来搜索、分组和比较内容。 使用单行代码,可以从数据帧中的列生成矢量嵌入。
注释
概述
ai.embed 函数扩展了 pandas Series 类。
若要生成每个输入行的矢量嵌入,请对 pandas Series 或 pandas DataFrame 的文本列调用函数。
该函数返回包含嵌入的 pandas 系列,该嵌入可以存储在新的 DataFrame 列中。
Syntax
df["embed"] = df["col1"].ai.embed()
参数
没有。
退货
该函数返回一个pandas Series,其中包含每个输入文本行的嵌入向量,作为float-32的numpy数组。 数组中的元素数取决于嵌入模型的维度,这些维度 在 AI 函数中可配置
Example
# This code uses AI. Always review output for mistakes.
df = pd.DataFrame([
"This duvet, lovingly hand-crafted from all-natural fabric, is perfect for a good night's sleep.",
"Tired of friends judging your baking? With these handy-dandy measuring cups, you'll create culinary delights.",
"Enjoy this *BRAND NEW CAR!* A compact SUV perfect for the professional commuter!"
], columns=["descriptions"])
df["embed"] = df["descriptions"].ai.embed()
display(df)
此示例代码单元提供以下输出:
相关内容
使用 ai.analyze_sentiment检测情绪。
使用 ai.classify 对文本进行分类。
使用 ai_extract提取实体。
使用 ai.fix_grammar修复语法。
使用 ai.generate_response回答自定义用户提示。
使用ai.summarize功能汇总文本。
使用 ai.translate 翻译文本。
详细了解 完整的 AI 函数集。
自定义 AI 函数的配置。
我们错过了所需的功能吗? 在面料创意论坛上提出建议。