Del via


Bruk ai.translate med PySpark

Funksjonen ai.translate bruker generativ AI for å oversette inndatatekst til et nytt språk (etter eget valg), med en enkelt kodelinje.

Note

Oversikt

Funksjonen ai.translate er tilgjengelig for Spark DataFrames. Du må angi et eksisterende inndatakolonnenavn som parameter, sammen med et målspråk.

Funksjonen returnerer en ny DataFrame med oversettelser for hver inndatatekstrad, lagret i en utdatakolonne.

Syntaks

df.ai.translate(to_lang="spanish", input_col="text", output_col="translations")

Parametere

Name Beskrivelse
to_lang
Obligatorisk
En streng som representerer målspråket for tekstoversettelser.
input_col
Obligatorisk
En streng som inneholder navnet på en eksisterende kolonne med inndatatekstverdier som skal oversettes.
output_col
Valgfritt
En streng som inneholder navnet på en ny kolonne som lagrer oversettelser for hver inndatatekstrad. Hvis du ikke angir denne parameteren, genereres et standardnavn for utdatakolonnen.
error_col
Valgfritt
En streng som inneholder navnet på en ny kolonne som lagrer eventuelle OpenAI-feil som skyldes behandling av hver inndatatekstrad. Hvis du ikke angir denne parameteren, genereres et standardnavn for feilkolonnen. Hvis en inndatarad ikke har noen feil, er verdien i denne kolonnen null.

Returnerer

Funksjonen returnerer en Spark DataFrame som inneholder en ny kolonne som inneholder oversettelser for teksten i inndatakolonneraden. Hvis inndatateksten er null, blir resultatet null.

Eksempel

# This code uses AI. Always review output for mistakes.

df = spark.createDataFrame([
        ("Hello! How are you doing today?",),
        ("Tell me what you'd like to know, and I'll do my best to help.",),
        ("The only thing we have to fear is fear itself.",),
    ], ["text"])

translations = df.ai.translate(to_lang="spanish", input_col="text", output_col="translations")
display(translations)

Denne eksempelkodecellen gir følgende utdata:

Skjermbilde av en dataramme med kolonnene «tekst» og «oversettelser». Kolonnen