該 ai.embed 功能利用生成式 AI 將文字轉換為向量嵌入。 這些向量讓 AI 能理解文本間的關係,因此你可以根據意義而非精確措辭來搜尋、分組和比較內容。 只要一行程式碼,你就能從資料框中的一欄產生向量嵌入。
備註
概觀
ai.embed 函式會擴充 pandas Series 類別。
要產生每個輸入列的向量嵌入,請呼叫 pandas 系列 或 pandas DataFrame 的文字欄上的函式。
該函式回傳包含嵌入的 pandas 系列,這些嵌入可儲存在新的 DataFrame 欄位中。
語法
df["embed"] = df["col1"].ai.embed()
參數
沒有。
退貨
函式回傳一個 pandas Series,其中包含每個輸入文字列的嵌入,這些嵌入以 浮點數32位的 numpy 陣列 顯示。 陣列中的元素數量取決於嵌入模型的尺寸,而這些尺寸可在 AI 函式中配置
Example
# This code uses AI. Always review output for mistakes.
df = pd.DataFrame([
"This duvet, lovingly hand-crafted from all-natural fabric, is perfect for a good night's sleep.",
"Tired of friends judging your baking? With these handy-dandy measuring cups, you'll create culinary delights.",
"Enjoy this *BRAND NEW CAR!* A compact SUV perfect for the professional commuter!"
], columns=["descriptions"])
df["embed"] = df["descriptions"].ai.embed()
display(df)
此範例程式碼儲存格提供下列輸出:
相關內容
用 ai.analyze_sentiment檢測情緒。
使用 ai.classify 對文本進行分類。
使用ai_extract提取實體。
用 ai.fix_grammar修復語法。
使用 ai.generate_response 回答自訂使用者提示。
使用 ai.similarity 計算相似度。
使用 ai.summarize 總結文本。
使用 ai.translate 翻譯文本。
進一步了解 全套 AI 功能。
自訂 AI功能的配置。
我們錯過了您需要的功能嗎? 請在 Fabric Ideas 論壇上提出建議。