次の方法で共有


PySpark で ai.translate を使用する

ai.translate関数では、生成 AI を使用して、入力テキストを (選択した) 新しい言語に 1 行のコードで翻訳します。

  • この記事では、pySpark での ai.translate の使用について説明します。 pandas で ai.translate を使用するには、 この記事を参照してください。
  • この概要記事では、他の AI 関数を参照してください。
  • AI 関数の構成をカスタマイズする方法について説明します。

概要

ai.translate関数は Spark DataFrames で使用できます。 既存の入力列名を、ターゲット言語と共にパラメーターとして指定する必要があります。

この関数は、出力列に格納されている各入力テキスト行の翻訳を含む新しい DataFrame を返します。

構文

df.ai.translate(to_lang="spanish", input_col="text", output_col="translations")

パラメーター

名前 Description
to_lang
必須
テキスト翻訳のターゲット言語を表す 文字列
input_col
必須
翻訳する入力テキスト値を持つ既存の列の名前を含む 文字列
output_col
オプション
入力テキスト行ごとに翻訳を格納する新しい列の名前を含む 文字列。 このパラメーターを設定しない場合は、出力列に既定の名前が生成されます。
error_col
オプション
各入力テキスト行の処理に起因する OpenAI エラーを格納する新しい列の名前を含む 文字列。 このパラメーターを設定しない場合は、エラー列の既定の名前が生成されます。 入力行にエラーがない場合、この列の値は null

返品ポリシー

この関数は、入力列行のテキストの翻訳を含む新しい列を含む Spark DataFrame を返します。 入力テキストが null場合、結果は null

Example

# This code uses AI. Always review output for mistakes.

df = spark.createDataFrame([
        ("Hello! How are you doing today?",),
        ("Tell me what you'd like to know, and I'll do my best to help.",),
        ("The only thing we have to fear is fear itself.",),
    ], ["text"])

translations = df.ai.translate(to_lang="spanish", input_col="text", output_col="translations")
display(translations)

このコード セルの例では、次の出力が提供されます。

列 'text' と 'translations' を含むデータ フレームのスクリーンショット。'translations' 列には、スペイン語に翻訳されたテキストが含まれています。