次の方法で共有


ai.fix_grammar 関数を使用して文法を修正する

ai.fix_grammar 関数は、Generative AI を使用して、入力テキストのスペル、文法、句読点をすべて 1 行のコードで修正します。

AI 関数は、Fabric の組み込みの大規模言語モデルの力を手に入れることで、データ エンジニアリングをターボチャージします。 詳細については、この概要記事 参照してください。

重要

この機能は、Fabric 1.3 ランタイム 以降で使用するために、プレビューにあります。

  • この概要記事 の前提条件 (AI 関数を使用するために一時的に必要な ライブラリのインストール など) を確認します。
  • 既定では、AI 関数は現在、gpt-3.5-turbo (0125) モデルを利用しています。 課金と消費率の詳細については、この記事を参照してください。
  • 基になるモデルは複数の言語を処理できますが、ほとんどの AI 関数は英語のテキストで使用できるように最適化されています。
  • AI 関数の最初のロールアウト中、ユーザーは Fabric の組み込み AI エンドポイントを使用して 1 分あたり 1,000 件の要求に一時的に制限されます。

pandas で ai.fix_grammar を使用する

ai.fix_grammar 関数は、pandas Series クラスを拡張します。 pandas DataFrame テキスト列で関数を呼び出して、入力の各行のスペル、文法、句読点を修正します。

この関数は、修正されたテキスト値を含む pandas Series を返します。この値は、新しい DataFrame 列に格納できます。

構文

df["corrections"] = df["text"].ai.fix_grammar()

パラメーター

なし

収益

この関数は、入力テキスト行ごとに修正されたテキストを含む pandas Series を返します。 入力テキストが null場合、結果は null

# This code uses AI. Always review output for mistakes. 
# Read terms: https://azure.microsoft.com/support/legal/preview-supplemental-terms/

df = pd.DataFrame([
        "There are an error here.",
        "She and me go weigh back. We used to hang out every weeks.",
        "The big picture are right, but you're details is all wrong."
    ], columns=["text"])

df["corrections"] = df["text"].ai.fix_grammar()
display(df)

PySpark で ai.fix_grammar を使用する

ai.fix_grammar 関数は、Spark DataFramesでも使用できます。 既存の入力列の名前をパラメーターとして指定する必要があります。

この関数は、出力列に格納されている入力テキスト行ごとに修正されたテキストを含む、新しい DataFrame を返します。

構文

df.ai.fix_grammar(input_col="text", output_col="corrections")

パラメーター

名前 説明
input_col
必須
文字列 は、スペル、文法、句読点を修正するための入力テキスト値を持つ既存の列名を含んでいます。
output_col
任意
新しい列の名前を含む 文字列 は、入力テキストの各行に対して修正されたテキストを格納します。 このパラメーターが設定されていない場合は、出力列の既定の名前が生成されます。
error_col
任意
文字列、入力テキストの各行の処理に起因する OpenAI エラーを格納するための新しい列の名前を含みます。 このパラメーターが設定されていない場合は、エラー列の既定の名前が生成されます。 入力行にエラーがない場合、この列の値は null

収益

入力列内のテキスト行ごとに修正されたテキストを含む新しい列が含まれた Spark DataFrame。 入力テキストが null場合、結果は null

# This code uses AI. Always review output for mistakes. 
# Read terms: https://azure.microsoft.com/support/legal/preview-supplemental-terms/

df = spark.createDataFrame([
        ("There are an error here.",),
        ("She and me go weigh back. We used to hang out every weeks.",),
        ("The big picture are right, but you're details is all wrong.",)
    ], ["text"])

results = df.ai.fix_grammar(input_col="text", output_col="corrections")
display(results)