Del via


Brug ai.analyze_sentiment med PySpark

Funktionen ai.analyze_sentiment bruger generativ AI til at registrere den følelsesmæssige tilstand af inputteksten med en enkelt kodelinje. Den kan registrere, om den følelsesmæssige tilstand af inputtet er positiv, negativ, blandet eller neutral. Det kan også registrere den følelsesmæssige tilstand i henhold til dine specificerede etiketter. Hvis funktionen ikke kan bestemme synspunktet, lader den outputtet være tomt.

Notat

Oversigt

Funktionen ai.analyze_sentiment er tilgængelig for Spark DataFrames. Du skal angive navnet på en eksisterende inputkolonne som en parameter.

Funktionen returnerer en ny DataFrame med synspunktsmærkater for hver inputtekstrække, der er gemt i en outputkolonne.

Syntaks

# Default sentiment labels
df.ai.analyze_sentiment(input_col="input", output_col="sentiment")

# Custom sentiment labels
df.ai.analyze_sentiment(input_col="input", output_col="sentiment", labels=["happy", "angry", "indifferent"])

Parametre

Navn Beskrivelse
input_col
Påkrævet
En streng , der indeholder navnet på en eksisterende kolonne med inputtekstværdier, der skal analyseres for synspunkter.
output_col
Valgfrit
En streng , der indeholder navnet på en ny kolonne for at gemme synspunktsetiketten for hver række med inputtekst. Hvis du ikke angiver denne parameter, genereres der et standardnavn for outputkolonnen.
labels
Valgfrit
En eller flere strenge , der repræsenterer det sæt synspunktsetiketter, der skal matche inputtekstværdier.
error_col
Valgfrit
En streng , der indeholder navnet på en ny kolonne for at gemme eventuelle OpenAI-fejl, der skyldes behandling af hver række med inputtekst. Hvis du ikke angiver denne parameter, genereres der et standardnavn for fejlkolonnen. Hvis der ikke er nogen fejl i en inputrække, er værdien i denne kolonne null.

Returnerer

Funktionen returnerer en Spark DataFrame , der indeholder en ny kolonne, der indeholder synspunktsmærkater, der svarer til hver række tekst i inputkolonnen. Standardsynspunktsmærkaterne omfatter positive, negative, neutraleller mixed. Hvis der er angivet brugerdefinerede etiketter, bruges disse etiketter i stedet. Hvis et synspunkt ikke kan bestemmes, er returværdien null.

Eksempel

# This code uses AI. Always review output for mistakes.

df = spark.createDataFrame([
        ("The cleaning spray permanently stained my beautiful kitchen counter. Never again!",),
        ("I used this sunscreen on my vacation to Florida, and I didn't get burned at all. Would recommend.",),
        ("I'm torn about this speaker system. The sound was high quality, though it didn't connect to my roommate's phone.",),
        ("The umbrella is OK, I guess.",)
    ], ["reviews"])

sentiment = df.ai.analyze_sentiment(input_col="reviews", output_col="sentiment")
display(sentiment)

Denne eksempelkodecelle indeholder følgende output:

Skærmbillede af en dataramme med kolonnerne