Bruk ai.analyze_sentiment med PySpark

Funksjonen ai.analyze_sentiment bruker generativ AI for å oppdage den emosjonelle tilstanden til inndatateksten, med en enkelt kodelinje. Den kan oppdage om den emosjonelle tilstanden til inndataene er positiv, negativ, blandet eller nøytral. Den kan også oppdage den emosjonelle tilstanden i henhold til dine spesifiserte etiketter. Hvis funksjonen ikke kan bestemme sentimentet, lar den utdataene stå tomme.

Note

Denne artikkelen dekker bruk av ai.analyze_sentiment med PySpark. For å bruke ai.analyze_sentiment med pandaer, se denne artikkelen.
Se andre AI-funksjoner i denne oversiktsartikkelen.
Lær hvordan du tilpasser konfigurasjonen av AI-funksjoner.

Oversikt

Funksjonen ai.analyze_sentiment er tilgjengelig for Spark DataFrames. Du må angi navnet på en eksisterende inndatakolonne som parameter.

Funksjonen returnerer en ny DataFrame, med sentimentetiketter for hver inndatatekstrad lagret i en utdatakolonne.

Syntaks

# Default sentiment labels
df.ai.analyze_sentiment(input_col="input", output_col="sentiment")

# Custom sentiment labels
df.ai.analyze_sentiment(input_col="input", output_col="sentiment", labels=["happy", "angry", "indifferent"])

Parametere

Name	Beskrivelse
`input_col` Obligatorisk	En streng som inneholder navnet på en eksisterende kolonne med inndatatekstverdier som skal analyseres for sentiment.
`output_col` Valgfritt	En streng som inneholder navnet på en ny kolonne for å lagre sentimentetiketten for hver rad med inndatatekst. Hvis du ikke angir denne parameteren, genereres et standardnavn for utdatakolonnen.
`labels` Valgfritt	Én eller flere strenger som representerer settet med sentimentetiketter som samsvarer med inndatatekstverdier.
`error_col` Valgfritt	En streng som inneholder navnet på en ny kolonne for å lagre eventuelle OpenAI-feil som skyldes behandling av hver rad med inndatatekst. Hvis du ikke angir denne parameteren, genereres et standardnavn for feilkolonnen. Hvis en inndatarad ikke har noen feil, er verdien i denne kolonnen `null`.

Returnerer

Funksjonen returnerer en Spark DataFrame som inneholder en ny kolonne som inneholder sentimentetiketter som samsvarer med hver rad med tekst i inndatakolonnen. Standard sentimentetiketter inkluderer positive, negative, neutraleller mixed. Hvis egendefinerte etiketter er angitt, brukes disse etikettene i stedet. Hvis en sentiment ikke kan fastslås, er returverdien null.

Eksempel

# This code uses AI. Always review output for mistakes.

df = spark.createDataFrame([
        ("The cleaning spray permanently stained my beautiful kitchen counter. Never again!",),
        ("I used this sunscreen on my vacation to Florida, and I didn't get burned at all. Would recommend.",),
        ("I'm torn about this speaker system. The sound was high quality, though it didn't connect to my roommate's phone.",),
        ("The umbrella is OK, I guess.",)
    ], ["reviews"])

sentiment = df.ai.analyze_sentiment(input_col="reviews", output_col="sentiment")
display(sentiment)

Denne eksempelkodecellen gir følgende utdata:

Brukes ai.analyze_sentiment med pandaer.
Kategoriser tekst med ai.classify.
Generer vektorinnlegginger med ai.embed.
Trekk ut enheter med ai_extract.
Løse grammatikk med ai.fix_grammar.
Svar på egendefinerte brukermeldinger med ai.generate_response.
Beregn likhet med ai.similarity.
Oppsummer tekst med ai.summarize.
Oversett tekst med ai.translate.
Finn ut mer om hele settet med AI-funksjoner.
Tilpass konfigurasjonen av AI-funksjoner.
Gikk vi glipp av en funksjon du trenger? Foreslå det på Fabric Ideas-forumet.

Tilbakemeldinger

Var denne siden nyttig?

Last updated on 2025-11-13