Brug ai.analyze_sentiment med PySpark

Funktionen ai.analyze_sentiment bruger generativ AI til at registrere den følelsesmæssige tilstand af inputteksten med en enkelt kodelinje. Den kan registrere, om den følelsesmæssige tilstand af inputtet er positiv, negativ, blandet eller neutral. Det kan også registrere den følelsesmæssige tilstand i henhold til dine specificerede etiketter. Hvis funktionen ikke kan bestemme synspunktet, lader den outputtet være tomt.

Notat

Denne artikel omhandler brug af ai.analyze_sentiment med PySpark. For at bruge ai.analyze_sentiment med pandaer, se denne artikel.
Se andre AI-funktioner i denne oversigtsartikel.
Få mere at vide om, hvordan du tilpasser konfigurationen af AI-funktioner.

Oversigt

Funktionen ai.analyze_sentiment er tilgængelig for Spark DataFrames. Du skal angive navnet på en eksisterende inputkolonne som en parameter.

Funktionen returnerer en ny DataFrame med synspunktsmærkater for hver inputtekstrække, der er gemt i en outputkolonne.

Syntaks

# Default sentiment labels
df.ai.analyze_sentiment(input_col="input", output_col="sentiment")

# Custom sentiment labels
df.ai.analyze_sentiment(input_col="input", output_col="sentiment", labels=["happy", "angry", "indifferent"])

Parametre

Navn	Beskrivelse
`input_col` Påkrævet	En streng , der indeholder navnet på en eksisterende kolonne med inputtekstværdier, der skal analyseres for synspunkter.
`output_col` Valgfrit	En streng , der indeholder navnet på en ny kolonne for at gemme synspunktsetiketten for hver række med inputtekst. Hvis du ikke angiver denne parameter, genereres der et standardnavn for outputkolonnen.
`labels` Valgfrit	En eller flere strenge , der repræsenterer det sæt synspunktsetiketter, der skal matche inputtekstværdier.
`error_col` Valgfrit	En streng , der indeholder navnet på en ny kolonne for at gemme eventuelle OpenAI-fejl, der skyldes behandling af hver række med inputtekst. Hvis du ikke angiver denne parameter, genereres der et standardnavn for fejlkolonnen. Hvis der ikke er nogen fejl i en inputrække, er værdien i denne kolonne `null`.

Returnerer

Funktionen returnerer en Spark DataFrame , der indeholder en ny kolonne, der indeholder synspunktsmærkater, der svarer til hver række tekst i inputkolonnen. Standardsynspunktsmærkaterne omfatter positive, negative, neutraleller mixed. Hvis der er angivet brugerdefinerede etiketter, bruges disse etiketter i stedet. Hvis et synspunkt ikke kan bestemmes, er returværdien null.

Eksempel

# This code uses AI. Always review output for mistakes.

df = spark.createDataFrame([
        ("The cleaning spray permanently stained my beautiful kitchen counter. Never again!",),
        ("I used this sunscreen on my vacation to Florida, and I didn't get burned at all. Would recommend.",),
        ("I'm torn about this speaker system. The sound was high quality, though it didn't connect to my roommate's phone.",),
        ("The umbrella is OK, I guess.",)
    ], ["reviews"])

sentiment = df.ai.analyze_sentiment(input_col="reviews", output_col="sentiment")
display(sentiment)

Denne eksempelkodecelle indeholder følgende output:

Brug ai.analyze_sentiment med pandaer.
Kategoriser tekst med ai.classify.
Generer vektorindlejringer med ai.embed.
Udtræk objekter med ai_extract.
Ret grammatik med ai.fix_grammar.
Svar på brugerdefinerede brugerprompter med ai.generate_response.
Beregn lighed med ai.similarity.
Opsummer tekst med ai.summarize.
Oversæt tekst med ai.translate.
Få mere at vide om det komplette sæt af AI-funktioner.
Tilpas konfigurationen af AI-funktioner.
Gik vi glip af en funktion, du har brug for? Foreslå det på Fabric Ideas forum.

Feedback

Var denne side nyttig?

Last updated on 2025-11-13