次の方法で共有


ai.translate 関数を使用してテキストを翻訳する

ai.translate 関数では、Generative AI を使用して、入力テキストを選択した新しい言語に変換します。すべて 1 行のコードを使用します。

AI 関数は、Fabric の組み込みの大規模言語モデルの力を手に入れることで、データ エンジニアリングをターボチャージします。 詳細については、この概要記事 参照してください。

重要

この機能は、Fabric 1.3 ランタイム 以降で使用するために、プレビューにあります。

  • この概要記事 の前提条件 (AI 関数を使用するために一時的に必要な ライブラリのインストール など) を確認します。
  • 既定では、AI 関数は現在、gpt-3.5-turbo (0125) モデルを利用しています。 課金と消費率の詳細については、本記事参照してください。
  • 基になるモデルは複数の言語を処理できますが、ほとんどの AI 関数は英語のテキストで使用できるように最適化されています。
  • AI 関数の最初のロールアウト中、ユーザーは Fabric の組み込み AI エンドポイントを使用して 1 分あたり 1,000 件の要求に一時的に制限されます。

ヒント

ai.translate 関数は、10 言語でテストされました:チェコ語英語フィンランド語フランス語ドイツ語ギリシャ語、イタリア語 ポーランド語スペイン語、およびスウェーデン語 。 他の言語での結果は異なる場合があります。

pandas で ai.translate を使用する

ai.translate 関数は、pandas Series クラスを拡張します。 pandas DataFrame テキスト列で関数を呼び出して、各入力行を選択したターゲット言語に変換します。

この関数は、新しい DataFrame 列に格納できる翻訳を含む pandas Series を返します。

構文

df["translations"] = df["text"].ai.translate("target_language")

パラメーター

名前 説明
to_lang
必須
テキスト翻訳のターゲット言語を表す 文字列

収益

入力テキストの各行に対する翻訳が含まれた pandas Series。 入力テキストが null場合、結果は null

# This code uses AI. Always review output for mistakes. 
# Read terms: https://azure.microsoft.com/support/legal/preview-supplemental-terms/

df = pd.DataFrame([
        "Hello! How are you doing today?", 
        "Tell me what you'd like to know, and I'll do my best to help.", 
        "The only thing we have to fear is fear itself."
    ], columns=["text"])

df["translations"] = df["text"].ai.translate("spanish")
display(df)

PySpark で ai.translate を使用する

ai.translate 関数は、Spark DataFramesでも使用できます。 既存の入力列名を、ターゲット言語と共にパラメーターとして指定する必要があります。

この関数は新しい DataFrame を返し、出力列に格納されている入力テキスト行ごとに翻訳を行います。

構文

df.ai.translate(to_lang="spanish", input_col="text", output_col="translations")

パラメーター

名前 説明
to_lang
必須
テキスト翻訳のターゲット言語を表す 文字列
input_col
必須
翻訳する入力テキスト値を持つ既存の列の名前が含まれた文字列
output_col
任意
入力テキスト行ごとに翻訳を格納する新しい列の名前を含む 文字列。 このパラメーターが設定されていない場合は、出力列の既定の名前が生成されます。
error_col
任意
各入力テキスト行の処理に起因する OpenAI エラーを格納する新しい列の名前を含む 文字列。 このパラメーターが設定されていない場合は、エラー列の既定の名前が生成されます。 入力行にエラーがない場合、この列の値は null

収益

入力列行内のテキストの翻訳を含む新しい列が含まれた Spark DataFrame。 入力テキストが null場合、結果は null

# This code uses AI. Always review output for mistakes. 
# Read terms: https://azure.microsoft.com/support/legal/preview-supplemental-terms/

df = spark.createDataFrame([
        ("Hello! How are you doing today?",),
        ("Tell me what you'd like to know, and I'll do my best to help.",),
        ("The only thing we have to fear is fear itself.",),
    ], ["text"])

translations = df.ai.translate(to_lang="spanish", input_col="text", output_col="translations")
display(translations)