次の方法で共有


PySpark でai.analyze_sentimentを使用する

ai.analyze_sentiment関数は、生成 AI を使用して、1 行のコードで入力テキストの感情状態を検出します。 入力の感情状態が肯定的、否定的、混合、または中立のいずれであるかを検出できます。 また、指定したラベルに従って感情的な状態を検出することもできます。 関数がセンチメントを特定できない場合、出力は空白のままです。

  • この記事では、PySpark での ai.analyze_sentiment の使用について説明します。 pandas でai.analyze_sentimentを使用するには、この記事を参照してください。
  • この概要記事では、他の AI 関数を参照してください。
  • AI 関数の構成をカスタマイズする方法について説明します。

概要

ai.analyze_sentiment関数は Spark DataFrames で使用できます。 既存の入力列の名前をパラメーターとして指定する必要があります。

この関数は新しい DataFrame を返し、各入力テキスト行のセンチメント ラベルが出力列に格納されます。

構文

# Default sentiment labels
df.ai.analyze_sentiment(input_col="input", output_col="sentiment")

# Custom sentiment labels
df.ai.analyze_sentiment(input_col="input", output_col="sentiment", labels=["happy", "angry", "indifferent"])

パラメーター

名前 Description
input_col
必須
センチメントを分析するための入力テキスト値を持つ既存の列の名前を含む 文字列
output_col
オプション
新しい列の名前を含む 文字列 は、入力テキストの各行のセンチメントラベルを格納します。 このパラメーターを設定しない場合は、出力列に既定の名前が生成されます。
labels
オプション
入力テキスト値と一致するセンチメント ラベルのセットを表す 1 つ以上の 文字列
error_col
オプション
入力テキストの各行の処理に起因する OpenAI エラーを格納する新しい列の名前を含む 文字列。 このパラメーターを設定しない場合は、エラー列の既定の名前が生成されます。 入力行にエラーがない場合、この列の値は null

返品ポリシー

この関数は、入力列のテキストの各行に一致するセンチメント ラベルを含む新しい列を含む Spark DataFrame を返します。 既定のセンチメント ラベルには、 positivenegativeneutral、または mixedが含まれます。 カスタム ラベルが指定されている場合は、それらのラベルが代わりに使用されます。 センチメントを特定できない場合、戻り値は null

Example

# This code uses AI. Always review output for mistakes.

df = spark.createDataFrame([
        ("The cleaning spray permanently stained my beautiful kitchen counter. Never again!",),
        ("I used this sunscreen on my vacation to Florida, and I didn't get burned at all. Would recommend.",),
        ("I'm torn about this speaker system. The sound was high quality, though it didn't connect to my roommate's phone.",),
        ("The umbrella is OK, I guess.",)
    ], ["reviews"])

sentiment = df.ai.analyze_sentiment(input_col="reviews", output_col="sentiment")
display(sentiment)

このコード セルの例では、次の出力が提供されます。