Bruk ai.classify med PySpark

Funksjonen ai.classify bruker generativ AI for å kategorisere inndatatekst i henhold til egendefinerte etiketter du velger, med en enkelt kodelinje.

Note

Denne artikkelen dekker bruk av ai.classify med PySpark. For å bruke ai.classify med pandaer, se denne artikkelen.
Se andre AI-funksjoner i denne oversiktsartikkelen.
Lær hvordan du tilpasser konfigurasjonen av AI-funksjoner.

Oversikt

Funksjonen ai.classify er tilgjengelig for Spark DataFrames. Du må angi navnet på en eksisterende inndatakolonne som en parameter, sammen med en liste over klassifiseringsetiketter.

Funksjonen returnerer en ny DataFrame med etiketter som samsvarer med hver rad med inndatatekst, lagret i en utdatakolonne.

Syntaks

df.ai.classify(labels=["category1", "category2", "category3"], input_col="text", output_col="classification")

Parametere

Name	Beskrivelse
`labels` Obligatorisk	En matrise med strenger som representerer settet med klassifiseringsetiketter som samsvarer med tekstverdier i inndatakolonnen.
`input_col` Obligatorisk	En streng som inneholder navnet på en eksisterende kolonne med inndatatekstverdier som skal klassifiseres i henhold til de egendefinerte etikettene.
`output_col` Valgfritt	En streng som inneholder navnet på en ny kolonne der du vil lagre en klassifiseringsetikett for hver inndatatekstrad. Hvis du ikke angir denne parameteren, genereres et standardnavn for utdatakolonnen.
`error_col` Valgfritt	En streng som inneholder navnet på en ny kolonne. Den nye kolonnen lagrer eventuelle OpenAI-feil som skyldes behandling av hver rad med inndatatekst. Hvis du ikke angir denne parameteren, genereres et standardnavn for feilkolonnen. Hvis det ikke er noen feil for en rad med inndata, er verdien i denne kolonnen `null`.

Returnerer

Funksjonen returnerer en Spark DataFrame som inneholder en ny kolonne som inneholder klassifiseringsetiketter som samsvarer med hver inndatatekstrad. Hvis en tekstverdi ikke kan klassifiseres, er den tilsvarende etiketten null.

Eksempel

# This code uses AI. Always review output for mistakes. 

df = spark.createDataFrame([
        ("This duvet, lovingly hand-crafted from all-natural fabric, is perfect for a good night's sleep.",),
        ("Tired of friends judging your baking? With these handy-dandy measuring cups, you'll create culinary delights.",),
        ("Enjoy this *BRAND NEW CAR!* A compact SUV perfect for the professional commuter!",)
    ], ["descriptions"])
    
categories = df.ai.classify(labels=["kitchen", "bedroom", "garage", "other"], input_col="descriptions", output_col="categories")
display(categories)

Denne eksempelkodecellen gir følgende utdata:

Bruk ai.classify med pandaer.
Oppdag sentiment med ai.analyze_sentiment.
Generer vektorinnlegginger med ai.embed.
Trekk ut enheter med ai_extract.
Fiks grammatikk med ai.fix_grammar.
Svar på egendefinerte brukermeldinger med ai.generate_response.
Beregn likhet med ai.likhet.
Oppsummer tekst med ai.summarize.
Oversett tekst med ai.translate.
Finn ut mer om hele settet med AI-funksjoner.
Tilpass konfigurasjonen av AI-funksjoner.
Gikk vi glipp av en funksjon du trenger? Foreslå det på Fabric Ideas-forumet.

Tilbakemeldinger

Var denne siden nyttig?

Last updated on 2025-11-13