Del via


Bruk ai.analyze_sentiment med PySpark

Funksjonen ai.analyze_sentiment bruker generativ AI for å oppdage den emosjonelle tilstanden til inndatateksten, med en enkelt kodelinje. Den kan oppdage om den emosjonelle tilstanden til inndataene er positiv, negativ, blandet eller nøytral. Den kan også oppdage den emosjonelle tilstanden i henhold til dine spesifiserte etiketter. Hvis funksjonen ikke kan bestemme sentimentet, lar den utdataene stå tomme.

Note

Oversikt

Funksjonen ai.analyze_sentiment er tilgjengelig for Spark DataFrames. Du må angi navnet på en eksisterende inndatakolonne som parameter.

Funksjonen returnerer en ny DataFrame, med sentimentetiketter for hver inndatatekstrad lagret i en utdatakolonne.

Syntaks

# Default sentiment labels
df.ai.analyze_sentiment(input_col="input", output_col="sentiment")

# Custom sentiment labels
df.ai.analyze_sentiment(input_col="input", output_col="sentiment", labels=["happy", "angry", "indifferent"])

Parametere

Name Beskrivelse
input_col
Obligatorisk
En streng som inneholder navnet på en eksisterende kolonne med inndatatekstverdier som skal analyseres for sentiment.
output_col
Valgfritt
En streng som inneholder navnet på en ny kolonne for å lagre sentimentetiketten for hver rad med inndatatekst. Hvis du ikke angir denne parameteren, genereres et standardnavn for utdatakolonnen.
labels
Valgfritt
Én eller flere strenger som representerer settet med sentimentetiketter som samsvarer med inndatatekstverdier.
error_col
Valgfritt
En streng som inneholder navnet på en ny kolonne for å lagre eventuelle OpenAI-feil som skyldes behandling av hver rad med inndatatekst. Hvis du ikke angir denne parameteren, genereres et standardnavn for feilkolonnen. Hvis en inndatarad ikke har noen feil, er verdien i denne kolonnen null.

Returnerer

Funksjonen returnerer en Spark DataFrame som inneholder en ny kolonne som inneholder sentimentetiketter som samsvarer med hver rad med tekst i inndatakolonnen. Standard sentimentetiketter inkluderer positive, negative, neutraleller mixed. Hvis egendefinerte etiketter er angitt, brukes disse etikettene i stedet. Hvis en sentiment ikke kan fastslås, er returverdien null.

Eksempel

# This code uses AI. Always review output for mistakes.

df = spark.createDataFrame([
        ("The cleaning spray permanently stained my beautiful kitchen counter. Never again!",),
        ("I used this sunscreen on my vacation to Florida, and I didn't get burned at all. Would recommend.",),
        ("I'm torn about this speaker system. The sound was high quality, though it didn't connect to my roommate's phone.",),
        ("The umbrella is OK, I guess.",)
    ], ["reviews"])

sentiment = df.ai.analyze_sentiment(input_col="reviews", output_col="sentiment")
display(sentiment)

Denne eksempelkodecellen gir følgende utdata:

Skjermbilde av en dataramme med kolonnene «anmeldelser» og «sentiment». «Sentiment»-kolonnen inkluderer «negativ», «positiv», «blandet» og «nøytral».