Sdílet prostřednictvím


Použití ai.analyze_sentiment s PySparkem

Funkce ai.analyze_sentiment používá generující AI ke zjištění emocionálního stavu vstupního textu s jedním řádkem kódu. Dokáže zjistit, jestli je emocionální stav vstupu pozitivní, negativní, smíšený nebo neutrální. Může také rozpoznat emocionální stav podle zadaných popisků. Pokud funkce nedokáže určit mínění, ponechá výstup prázdný.

Poznámka:

Přehled

Funkce ai.analyze_sentiment je k dispozici pro datové rámce Sparku. Jako parametr musíte zadat název existujícího vstupního sloupce.

Funkce vrátí nový datový rámec s popisky mínění pro každý vstupní textový řádek uložený ve výstupním sloupci.

Syntaxe

# Default sentiment labels
df.ai.analyze_sentiment(input_col="input", output_col="sentiment")

# Custom sentiment labels
df.ai.analyze_sentiment(input_col="input", output_col="sentiment", labels=["happy", "angry", "indifferent"])

Parametry

Název Description
input_col
Povinné
Řetězec, který obsahuje název existujícího sloupce se vstupními textovými hodnotami pro analýzu mínění.
output_col
Volitelný
Řetězec , který obsahuje název nového sloupce, do kterého se uloží popisek mínění pro každý řádek vstupního textu. Pokud tento parametr nenastavíte, vygeneruje se pro výstupní sloupec výchozí název.
labels
Volitelný
Jeden nebo více řetězců , které představují sadu popisků mínění, které odpovídají vstupním textovým hodnotám.
error_col
Volitelný
Řetězec, který obsahuje název nového sloupce pro uložení všech chyb OpenAI, které jsou výsledkem zpracování každého řádku vstupního textu. Pokud tento parametr nenastavíte, vygeneruje se pro sloupec s chybou výchozí název. Pokud vstupní řádek neobsahuje žádné chyby, hodnota v tomto sloupci je null.

Návraty

Funkce vrátí datový rámec Sparku , který obsahuje nový sloupec, který obsahuje popisky mínění, které odpovídají jednotlivým řádkům textu ve vstupním sloupci. Výchozí popisky mínění zahrnují positive, negative, neutral, nebo mixed. Pokud jsou zadány vlastní popisky, použijí se tyto popisky. Pokud nelze určit pocit, vrácená hodnota je null.

Example

# This code uses AI. Always review output for mistakes.

df = spark.createDataFrame([
        ("The cleaning spray permanently stained my beautiful kitchen counter. Never again!",),
        ("I used this sunscreen on my vacation to Florida, and I didn't get burned at all. Would recommend.",),
        ("I'm torn about this speaker system. The sound was high quality, though it didn't connect to my roommate's phone.",),
        ("The umbrella is OK, I guess.",)
    ], ["reviews"])

sentiment = df.ai.analyze_sentiment(input_col="reviews", output_col="sentiment")
display(sentiment)

Tato ukázková buňka kódu poskytuje následující výstup:

Snímek obrazovky s datovým rámcem se sloupci recenze a mínění Sloupec sentiment zahrnuje záporné, kladné, smíšené a neutrální.