Freigeben über


Verwenden von ai.translate mit PySpark

Die ai.translate Funktion verwendet generative KI, um Eingabetext in eine neue Sprache (ihrer Wahl) mit einer einzigen Codezeile zu übersetzen.

Hinweis

Überblick

Die ai.translate Funktion ist für Spark DataFrames verfügbar. Sie müssen einen vorhandenen Eingabespaltennamen als Parameter zusammen mit einer Zielsprache angeben.

Die Funktion gibt einen neuen DataFrame mit Übersetzungen für jede Eingabetextzeile zurück, die in einer Ausgabespalte gespeichert ist.

Syntax

df.ai.translate(to_lang="spanish", input_col="text", output_col="translations")

Die Parameter

Name Description
to_lang
Erforderlich
Eine Zeichenfolge , die die Zielsprache für Textübersetzungen darstellt.
input_col
Erforderlich
Eine Zeichenfolge , die den Namen einer vorhandenen Spalte mit zu übersetzenden Eingabetextwerten enthält.
output_col
Wahlfrei
Eine Zeichenfolge , die den Namen einer neuen Spalte enthält, in der Übersetzungen für jede Eingabetextzeile gespeichert werden. Wenn Sie diesen Parameter nicht festlegen, wird für die Ausgabespalte ein Standardname generiert.
error_col
Wahlfrei
Eine Zeichenfolge , die den Namen einer neuen Spalte enthält, in der alle OpenAI-Fehler gespeichert werden, die aus der Verarbeitung der einzelnen Eingabetextzeilen resultieren. Wenn Sie diesen Parameter nicht festlegen, wird für die Fehlerspalte ein Standardname generiert. Wenn eine Eingabezeile keine Fehler aufweist, lautet nullder Wert in dieser Spalte .

Rückkehr

Die Funktion gibt einen Spark DataFrame zurück, der eine neue Spalte enthält, die Übersetzungen für den Text in der Eingabespaltenzeile enthält. Wenn der Eingabetext lautet null, lautet nulldas Ergebnis .

Example

# This code uses AI. Always review output for mistakes.

df = spark.createDataFrame([
        ("Hello! How are you doing today?",),
        ("Tell me what you'd like to know, and I'll do my best to help.",),
        ("The only thing we have to fear is fear itself.",),
    ], ["text"])

translations = df.ai.translate(to_lang="spanish", input_col="text", output_col="translations")
display(translations)

Diese Beispielcodezelle stellt die folgende Ausgabe bereit:

Screenshot eines Datenrahmens mit den Spalten