pandas で ai.similarity を使用する

ai.similarity関数は、生成 AI を使用して 2 つの文字列式を比較し、セマンティック類似性スコアを計算します。 1 行のコードのみを使用します。 DataFrame の 1 つの列のテキスト値を、1 つの共通テキスト値または別の列のペアワイズテキスト値と比較できます。

注

この記事では、pandas での ai.similarity の使用について説明します。 PySpark で ai.similarity を使用するには、この記事を参照してください。
この概要記事では、他の AI 関数を参照してください。
AI 関数の構成をカスタマイズする方法について説明します。

概要

ai.similarity 関数は、pandas Series クラスを拡張します。

1 つの共通テキスト値に対する各入力行のセマンティック類似性を計算するには、 pandas DataFrame テキスト列で関数を呼び出します。関数は、入力列と同じディメンションを持つ別の列の対応するペアワイズ値に対する各行のセマンティック類似性を計算することもできます。

この関数は、新しい DataFrame 列に格納できる類似性スコアを含む pandas Series を返します。

df["similarity"] = df["col1"].ai.similarity("value")

df["similarity"] = df["col1"].ai.similarity(df["col2"])

パラメーター

名前	Description
`other` 必須	次のいずれかを含む文字列。 - 1 つの共通テキスト値。これは、入力行ごとに類似性スコアを計算するために使用されます。 - 入力と同じ次元を持つ別の pandas シリーズ。各入力行のペアごとの類似性スコアを計算するために使用するテキスト値が含まれています。

返品ポリシー

この関数は、各入力テキスト行の類似性スコアを含む pandas Series を返します。出力の類似性スコアは相対的であり、順位付けに最適です。スコアの値の範囲は、 -1 (反対) から 1* (同じ) までです。 0のスコア値は、値が意味に無関係であることを示します。

Example

1 つの値と比較する
ペアワイズ値と比較する

# This code uses AI. Always review output for mistakes.

df = pd.DataFrame([ 
        ("Bill Gates"), 
        ("Satya Nadella"), 
        ("Joan of Arc")
    ], columns=["name"])
    
df["similarity"] = df["name"].ai.similarity("Microsoft")
display(df)

このコードセルの例では、次の出力が提供されます。

# This code uses AI. Always review output for mistakes.

df = pd.DataFrame([ 
        ("Bill Gates", "Technology"), 
        ("Satya Nadella", "Healthcare"), 
        ("Joan of Arc", "Agriculture") 
    ], columns=["names", "industries"])
    
df["similarity"] = df["names"].ai.similarity(df["industries"])
display(df)

このコードセルの例では、次の出力が提供されます。

PySpark で ai.similarity を使用します。
ai.analyze_sentimentを使用してセンチメントを検出します。
ai.classify を使用してテキストを分類します。
ai.embed を使用してベクトル埋め込みを生成します。
ai_extractを使用してエンティティを抽出します。
ai.fix_grammarを使用して文法を修正します。
ai.generate_responseを使用してカスタムユーザープロンプトに応答します。
ai.summarize を使用してテキストを集計します。
ai.translate を使用してテキストを翻訳します。
AI 関数の完全なセットの詳細を確認します。
AI 関数の構成をカスタマイズします。
必要な機能が見逃されましたか? ファブリックアイデアフォーラムでそれを提案.

フィードバック

このページはお役に立ちましたか?

Last updated on 2025-11-13

次の方法で共有

pandas で ai.similarity を使用する

概要

構文

パラメーター

返品ポリシー

Example

関連コンテンツ

フィードバック

その他のリソース