Zdieľať cez


Používanie ai.analyze_sentiment s PySpark

Funkcia ai.analyze_sentiment využíva generatívnu umelú inteligenciu na detekciu emocionálneho stavu vstupného textu pomocou jediného riadku kódu. Dokáže zistiť, či je emocionálny stav vstupu pozitívny, negatívny, zmiešaný alebo neutrálny. Dokáže tiež zistiť emocionálny stav podľa vami zadaných štítkov. Ak funkcia nedokáže určiť náladu, ponechá výstup prázdny.

Poznámka

Overview

Táto ai.analyze_sentiment funkcia je k dispozícii pre údajové rámce Spark. Názov existujúceho vstupného stĺpca musíte zadať ako parameter.

Funkcia vráti nový údajový rámec s označeniami nálady pre každý vstupný textový riadok uložený vo výstupnom stĺpci.

Syntax

# Default sentiment labels
df.ai.analyze_sentiment(input_col="input", output_col="sentiment")

# Custom sentiment labels
df.ai.analyze_sentiment(input_col="input", output_col="sentiment", labels=["happy", "angry", "indifferent"])

Parametre

Name Popis
input_col
Povinné
Reťazec, ktorý obsahuje názov existujúceho stĺpca so vstupnými textovými hodnotami na analýzu nálady.
output_col
Voliteľné
Reťazec, ktorý obsahuje názov nového stĺpca na uloženie označenia nálady pre každý riadok vstupného textu. Ak tento parameter nenastavíte, pre výstupný stĺpec sa vygeneruje predvolený názov.
labels
Voliteľné
Jeden alebo viac reťazcov , ktoré predstavujú množinu označení nálady, ktoré sa majú zhodovať so vstupnými textovými hodnotami.
error_col
Voliteľné
Reťazec, ktorý obsahuje názov nového stĺpca na uloženie všetkých chýb OpenAI, ktoré sú výsledkom spracovania každého riadka vstupného textu. Ak tento parameter nenastavíte, pre chybový stĺpec sa vygeneruje predvolený názov. Ak vstupný riadok neobsahuje žiadne chyby, hodnota v tomto stĺpci je null.

Vrátené hodnoty

Funkcia vráti údajový rámec Spark , ktorý obsahuje nový stĺpec, ktorý obsahuje označenia nálady, ktoré zodpovedajú každému riadku textu vo vstupnom stĺpci. Predvolené označenia nálady zahŕňajú positive, negative, neutralalebo mixed. Ak sú zadané vlastné štítky, použijú sa namiesto nich tieto štítky. Ak nie je možné určiť náladu, vrátená hodnota je null.

Príklad

# This code uses AI. Always review output for mistakes. 
# Read terms: https://azure.microsoft.com/support/legal/preview-supplemental-terms/.

df = spark.createDataFrame([
        ("The cleaning spray permanently stained my beautiful kitchen counter. Never again!",),
        ("I used this sunscreen on my vacation to Florida, and I didn't get burned at all. Would recommend.",),
        ("I'm torn about this speaker system. The sound was high quality, though it didn't connect to my roommate's phone.",),
        ("The umbrella is OK, I guess.",)
    ], ["reviews"])

sentiment = df.ai.analyze_sentiment(input_col="reviews", output_col="sentiment")
display(sentiment)

Táto príkladová bunka kódu poskytuje nasledujúci výstup:

Snímka obrazovky údajového rámca so stĺpcami