Freigeben über


Verwenden von ai.analyze_sentiment mit PySpark

Die ai.analyze_sentiment Funktion verwendet generative KI, um den emotionalen Zustand des Eingabetexts mit einer einzigen Codezeile zu erkennen. Es kann erkennen, ob der emotionale Zustand der Eingabe positiv, negativ, gemischt oder neutral ist. Es kann auch den emotionalen Zustand gemäß Ihren angegebenen Bezeichnungen erkennen. Wenn die Funktion die Stimmung nicht bestimmen kann, bleibt die Ausgabe leer.

Hinweis

Überblick

Die ai.analyze_sentiment Funktion ist für Spark DataFrames verfügbar. Sie müssen den Namen einer vorhandenen Eingabespalte als Parameter angeben.

Die Funktion gibt einen neuen DataFrame mit Stimmungsbezeichnungen für jede Eingabetextzeile zurück, die in einer Ausgabespalte gespeichert ist.

Syntax

# Default sentiment labels
df.ai.analyze_sentiment(input_col="input", output_col="sentiment")

# Custom sentiment labels
df.ai.analyze_sentiment(input_col="input", output_col="sentiment", labels=["happy", "angry", "indifferent"])

Die Parameter

Name Description
input_col
Erforderlich
Eine Zeichenfolge , die den Namen einer vorhandenen Spalte mit Eingabetextwerten enthält, die für die Stimmung analysiert werden sollen.
output_col
Wahlfrei
Eine Zeichenfolge , die den Namen einer neuen Spalte enthält, um die Stimmungsbezeichnung für jede Zeile mit Eingabetext zu speichern. Wenn Sie diesen Parameter nicht festlegen, wird für die Ausgabespalte ein Standardname generiert.
labels
Wahlfrei
Eine oder mehrere Zeichenfolgen, die den Satz von Stimmungsbezeichnungen darstellen, die mit Eingabetextwerten übereinstimmen sollen.
error_col
Wahlfrei
Eine Zeichenfolge , die den Namen einer neuen Spalte enthält, um alle OpenAI-Fehler zu speichern, die aus der Verarbeitung jeder Zeile von Eingabetext resultieren. Wenn Sie diesen Parameter nicht festlegen, wird für die Fehlerspalte ein Standardname generiert. Wenn eine Eingabezeile keine Fehler aufweist, lautet nullder Wert in dieser Spalte .

Rückkehr

Die Funktion gibt einen Spark DataFrame zurück, der eine neue Spalte enthält, die Stimmungsbeschriftungen enthält, die jeder Textzeile in der Eingabespalte entsprechen. Die Standardmäßigen Stimmungsbezeichnungen umfassen positive, , negative, neutraloder mixed. Wenn benutzerdefinierte Bezeichnungen angegeben werden, werden diese Bezeichnungen stattdessen verwendet. Wenn eine Stimmung nicht bestimmt werden kann, lautet der Rückgabewert null.

Example

# This code uses AI. Always review output for mistakes.

df = spark.createDataFrame([
        ("The cleaning spray permanently stained my beautiful kitchen counter. Never again!",),
        ("I used this sunscreen on my vacation to Florida, and I didn't get burned at all. Would recommend.",),
        ("I'm torn about this speaker system. The sound was high quality, though it didn't connect to my roommate's phone.",),
        ("The umbrella is OK, I guess.",)
    ], ["reviews"])

sentiment = df.ai.analyze_sentiment(input_col="reviews", output_col="sentiment")
display(sentiment)

Diese Beispielcodezelle stellt die folgende Ausgabe bereit:

Screenshot eines Datenrahmens mit Spalten