AI 関数を使用してデータを変換およびエンリッチする

Microsoft Fabric AI Functions を使用すると、(開発者からアナリストまで) すべてのビジネスプロフェッショナルが、ジェネレーティブ AI を使用してエンタープライズデータを変換および強化できます。

AI 関数は、集計、分類、テキスト生成など、業界をリードする大規模言語モデル (LLM) を使用します。 1 行のコードを使用すると、次のことができます。

ai.analyze_sentiment: 入力テキストの感情状態を検出します。
ai.classify: ラベルに従って入力テキストを分類します。
ai.embed: 入力テキストのベクター埋め込みを生成します。
ai.extract: 入力テキスト (場所や名前など) から特定の種類の情報を抽出します。
ai.fix_grammar: 入力テキストのスペル、文法、句読点を修正します。
ai.generate_response:独自の指示に基づいて応答を生成します。
ai.similarity: 入力テキストの意味を 1 つのテキスト値または別の列のテキストと比較します。
ai.summarize: 入力テキストの概要を取得します。
ai.translate: 入力テキストを別の言語に翻訳します。

Pandas と Spark のどちらを使用する場合でも、これらの関数をデータサイエンスおよびデータエンジニアリングワークフローの一部として組み込むことができます。詳細な構成はなく、複雑なインフラストラクチャ管理もありません。特定の技術的な専門知識は必要ありません。

Prerequisites

Fabric の組み込みの AI エンドポイントで AI 関数を使用するには、管理者は、Copilot と Azure OpenAI を利用するその他の機能のテナントスイッチを有効にする必要があります。
場所によっては、クロス geo 処理のテナント設定を有効にする必要がある場合があります。 Azure OpenAI Service で使用可能なリージョンの詳細について説明します。
有料のファブリック容量 (F2 以上、または任意の P エディション) が必要です。

Note

AI 関数は、 Fabric Runtime 1.3 以降でサポートされています。
別のモデルを構成しない限り、AI 関数は既定で gpt-4.1-mini に設定されます。課金と消費率の詳細について説明します。
基になるモデルは複数の言語を処理できますが、ほとんどの AI 関数は英語のテキストで使用できるように最適化されています。"

モデルとプロバイダー

AI 関数では、既定の Azure OpenAI モデルを超える広範なモデルとプロバイダーがサポートされるようになりました。次を使用するように AI 関数を構成できます。

Azure OpenAI のモデル
Azure AI Foundry リソース (Claude や LLaMA などのモデルを含む)

モデルとプロバイダーの選択は、AI 関数の構成によって構成できます。さまざまなモデルとプロバイダーを設定および構成する方法の詳細については、 pandas と PySpark の構成ドキュメントを参照してください。

AI 関数の概要

AI Functions は pandas (Python および PySpark ランタイム)、PySpark (PySpark ランタイム) で使用できます。それぞれの必要なインストールとインポートの手順については、次のセクションで説明し、その後に対応するコマンドを示します。

パフォーマンスとコンカレンシー

AI 関数は既定のコンカレンシーが 200 に増えた状態で実行されるようになり、AI 操作の並列処理を高速化できるようになりました。ワークロードごとのコンカレンシー設定を調整して、特定の要件に基づいてパフォーマンスを最適化できます。コンカレンシーとその他のパフォーマンス関連の設定の構成の詳細については、 pandas と PySpark の構成ドキュメントを参照してください。

依存関係のインストール

Pandas (Python ランタイム)
- synapseml_internal および synapseml_core whl ファイルのインストールが必要です (次のコードセルで提供されるコマンド)
- openai パッケージのインストールが必要です (次のコードセルで提供されるコマンド)
Pandas (PySpark ランタイム)
- openai パッケージのインストールが必要です (次のコードセルで提供されるコマンド)
PySpark (PySpark ランタイム)
- インストールは不要

pandas (PySpark ランタイム)
pandas (Python ランタイム)

# The pandas AI functions package requires OpenAI version 1.99.5 or later
%pip install -q --force-reinstall openai==1.99.5 2>/dev/null

# Install latest versions of AI functions library whl
!wget -q https://aka.ms/fabric-aifunctions-whl -O synapseml_internal-latest-py3-none-any.whl
!wget -q https://aka.ms/fabric-synapseml-core-whl -O synapseml_core-latest-py3-none-any.whl

# The pandas AI functions package requires OpenAI version 1.99.5 or later
%pip install -q --force-reinstall openai==1.99.5 synapseml_internal-latest-py3-none-any.whl synapseml_core-latest-py3-none-any.whl

必要なライブラリをインポートする

次のコードセルは、AI 関数ライブラリとその依存関係をインポートします。

pandas
PySpark

# Required imports
import synapse.ml.aifunc as aifunc
import pandas as pd

import synapse.ml.spark.aifunc as aifunc

# SparkSession with accessor `spark` in PySpark environments is pre-setup and available for use

AI 関数を適用する

次の各関数を使用すると、Fabric で組み込みの AI エンドポイントを呼び出して、1 行のコードでデータを変換および強化できます。 AI 関数を使用して、pandas DataFrames または Spark DataFrames を分析できます。

Tip

AI 関数の構成をカスタマイズする方法について説明します。

高度な構成: gpt-5 ファミリモデルを使用する場合は、 reasoning_effort や verbosityなどの高度なオプションを構成できます。これらのオプションを設定する方法の詳細については、 pandas と PySpark の構成ページを参照してください。

ai.analyze_sentimentを使用してセンチメントを検出する

ai.analyze_sentiment 関数は AI を呼び出して、入力テキストによって表される感情状態が肯定的、否定的、混合、または中立であるかどうかを識別します。 AI がこの決定を行えない場合、出力は空白のままです。 pandas での ai.analyze_sentiment の使用に関する詳細な手順については、この記事を参照してください。 PySpark の ai.analyze_sentiment については、この記事を参照してください。

省略可能なパラメーター

ai.analyze_sentiment関数では、センチメント分析の動作をカスタマイズできる追加の省略可能なパラメーターがサポートされるようになりました。これらのパラメーターは、センチメントの検出と報告方法をより詳細に制御します。使用可能なパラメーター、その説明、既定値の詳細については、 pandas と PySpark の関数固有のドキュメントを参照してください。

pandas
PySpark

# This code uses AI. Always review output for mistakes. 

df = pd.DataFrame([
        "The cleaning spray permanently stained my beautiful kitchen counter. Never again!",
        "I used this sunscreen on my vacation to Florida, and I didn't get burned at all. Would recommend.",
        "I'm torn about this speaker system. The sound was high quality, though it didn't connect to my roommate's phone.",
        "The umbrella is OK, I guess."
    ], columns=["reviews"])

df["sentiment"] = df["reviews"].ai.analyze_sentiment()
display(df)

# This code uses AI. Always review output for mistakes. 

df = spark.createDataFrame([
        ("The cleaning spray permanently stained my beautiful kitchen counter. Never again!",),
        ("I used this sunscreen on my vacation to Florida, and I didn't get burned at all. Would recommend.",),
        ("I'm torn about this speaker system. The sound was high quality, though it didn't connect to my roommate's phone.",),
        ("The umbrella is OK, I guess.",)
    ], ["reviews"])

sentiment = df.ai.analyze_sentiment(input_col="reviews", output_col="sentiment")
display(sentiment)

ai.classify を使用してテキストを分類する

ai.classify 関数は AI を呼び出し、選択したカスタムラベルに従って入力テキストを分類します。 pandas での ai.classify の使用の詳細については、この記事を参照してください。 PySpark の ai.classify については、この記事を参照してください。

pandas
PySpark

# This code uses AI. Always review output for mistakes. 

df = pd.DataFrame([
        "This duvet, lovingly hand-crafted from all-natural fabric, is perfect for a good night's sleep.",
        "Tired of friends judging your baking? With these handy-dandy measuring cups, you'll create culinary delights.",
        "Enjoy this *BRAND NEW CAR!* A compact SUV perfect for the professional commuter!"
    ], columns=["descriptions"])

df["category"] = df['descriptions'].ai.classify("kitchen", "bedroom", "garage", "other")
display(df)

# This code uses AI. Always review output for mistakes. 

df = spark.createDataFrame([
        ("This duvet, lovingly hand-crafted from all-natural fabric, is perfect for a good night's sleep.",),
        ("Tired of friends judging your baking? With these handy-dandy measuring cups, you'll create culinary delights.",),
        ("Enjoy this *BRAND NEW CAR!* A compact SUV perfect for the professional commuter!",)
    ], ["descriptions"])
    
categories = df.ai.classify(labels=["kitchen", "bedroom", "garage", "other"], input_col="descriptions", output_col="categories")
display(categories)

ai.embed を使用してベクター埋め込みを生成する

ai.embed関数は AI を呼び出して、入力テキストのベクター埋め込みを生成します。ベクター埋め込みとは、セマンティックな意味をキャプチャするテキストの数値表現であり、類似性検索、取得ワークフロー、およびその他の機械学習タスクに役立ちます。埋め込みベクトルの次元は、選択したモデルによって異なります。 pandas での ai.embed の使用に関する詳細な手順については、この記事を参照してください。 PySpark の ai.embed については、この記事を参照してください。

pandas
PySpark

# This code uses AI. Always review output for mistakes. 

df = pd.DataFrame([
        "This duvet, lovingly hand-crafted from all-natural fabric, is perfect for a good night's sleep.",
        "Tired of friends judging your baking? With these handy-dandy measuring cups, you'll create culinary delights.",
        "Enjoy this *BRAND NEW CAR!* A compact SUV perfect for the professional commuter!"
    ], columns=["descriptions"])
    
df["embed"] = df["descriptions"].ai.embed()
display(df)

# This code uses AI. Always review output for mistakes. 

df = spark.createDataFrame([
        ("This duvet, lovingly hand-crafted from all-natural fabric, is perfect for a good night's sleep.",), 
        ("Tired of friends judging your baking? With these handy-dandy measuring cups, you'll create culinary delights.",), 
        ("Enjoy this *BRAND NEW CAR!* A compact SUV perfect for the professional commuter!",) 
    ], ["descriptions"])

embed = df.ai.embed(input_col="descriptions", output_col="embed")
display(embed)

ai.extract を使用してエンティティを抽出する

ai.extract関数は、AI を呼び出して入力テキストをスキャンし、選択したラベル (場所や名前など) によって指定された特定の種類の情報を抽出します。 pandas での ai.extract の使用に関する詳細な手順については、この記事を参照してください。 PySpark の ai.extract については、この記事を参照してください。

構造化ラベル

ai.extract関数は、ExtractLabel スキーマを使用した構造化ラベル定義をサポートします。ラベルには、ラベル名だけでなく、型情報や属性も含む構造化された定義を指定できます。この構造化アプローチにより、抽出の一貫性が向上し、関数はそれに対応して構造化された出力列を返すことができます。たとえば、抽出プロセスをより正確にガイドするために、追加のメタデータを含むラベルを指定できます。構造化ラベルの使用例については、 pandas と PySpark の詳細なドキュメントを参照してください。

pandas
PySpark

# This code uses AI. Always review output for mistakes. 

df = pd.DataFrame([
        "MJ Lee lives in Tucson, AZ, and works as a software engineer for Microsoft.",
        "Kris Turner, a nurse at NYU Langone, is a resident of Jersey City, New Jersey."
    ], columns=["descriptions"])

df_entities = df["descriptions"].ai.extract("name", "profession", "city")
display(df_entities)

# This code uses AI. Always review output for mistakes. 

df = spark.createDataFrame([
        ("MJ Lee lives in Tucson, AZ, and works as a software engineer for Microsoft.",),
        ("Kris Turner, a nurse at NYU Langone, is a resident of Jersey City, New Jersey.",)
    ], ["descriptions"])

df_entities = df.ai.extract(labels=["name", "profession", "city"], input_col="descriptions")
display(df_entities)

ai.fix_grammarを使用して文法を修正する

ai.fix_grammar 関数は AI を呼び出して、入力テキストのスペル、文法、句読点を修正します。 pandas での ai.fix_grammar の使用に関する詳細な手順については、この記事を参照してください。 PySpark の ai.fix_grammar については、この記事を参照してください。

pandas
PySpark

# This code uses AI. Always review output for mistakes. 

df = pd.DataFrame([
        "There are an error here.",
        "She and me go weigh back. We used to hang out every weeks.",
        "The big picture are right, but you're details is all wrong."
    ], columns=["text"])

df["corrections"] = df["text"].ai.fix_grammar()
display(df)

# This code uses AI. Always review output for mistakes. 

df = spark.createDataFrame([
        ("There are an error here.",),
        ("She and me go weigh back. We used to hang out every weeks.",),
        ("The big picture are right, but you're details is all wrong.",)
    ], ["text"])

corrections = df.ai.fix_grammar(input_col="text", output_col="corrections")
display(corrections)

ai.generate_responseを使用してカスタムユーザープロンプトに応答する

ai.generate_response 関数は、AI を呼び出して、独自の指示に基づいてカスタムテキストを生成します。 pandas での ai.generate_response の使用に関する詳細な手順については、この記事を参照してください。 PySpark の ai.generate_response については、この記事を参照してください。

省略可能なパラメーター

ai.generate_response関数では、構造化された JSON 出力を要求できるresponse_format パラメーターがサポートされるようになりました。 JSON 形式で応答を受信する response_format='json' を指定できます。さらに、JSON スキーマを指定して特定の出力構造を適用し、生成された応答が予想されるデータ形状に準拠していることを確認できます。これは、AI 関数から予測可能でマシンが読み取り可能な出力が必要な場合に特に便利です。詳細な例と使用パターンについては、 pandas と PySpark のドキュメントを参照してください。

pandas
PySpark

# This code uses AI. Always review output for mistakes. 

df = pd.DataFrame([
        ("Scarves"),
        ("Snow pants"),
        ("Ski goggles")
    ], columns=["product"])

df["response"] = df.ai.generate_response("Write a short, punchy email subject line for a winter sale.")
display(df)

# This code uses AI. Always review output for mistakes. 

df = spark.createDataFrame([
        ("Scarves",),
        ("Snow pants",),
        ("Ski goggles",)
    ], ["product"])

responses = df.ai.generate_response(prompt="Write a short, punchy email subject line for a winter sale.", output_col="response")
display(responses)

ai.similarity を使用して類似性を計算する

ai.similarity関数は、各入力テキスト値を 1 つの共通参照テキストまたは別の列の対応する値 (ペアワイズモード) と比較します。出力類似性スコアの値は相対値であり、 -1 (反対) から 1 (同一) までの範囲で指定できます。 0のスコアは、値が意味に無関係であることを示します。 pandas での ai.similarity の使用に関する詳細な手順については、この記事を参照してください。 PySpark の ai.similarity については、この記事を参照してください。

pandas
PySpark

# This code uses AI. Always review output for mistakes. 

df = pd.DataFrame([ 
        ("Bill Gates", "Technology"), 
        ("Satya Nadella", "Healthcare"), 
        ("Joan of Arc", "Agriculture") 
    ], columns=["names", "industries"])
    
df["similarity"] = df["names"].ai.similarity(df["industries"])
display(df)

# This code uses AI. Always review output for mistakes. 

df = spark.createDataFrame([
        ("Bill Gates", "Technology"), 
        ("Satya Nadella", "Healthcare"), 
        ("Joan of Arc", "Agriculture")
    ], ["names", "industries"])

similarity = df.ai.similarity(input_col="names", other_col="industries", output_col="similarity")
display(similarity)

ai.summarize を使用してテキストを集計する

ai.summarize 関数は AI を呼び出して、入力テキストの概要を生成します (DataFrame の 1 つの列の値またはすべての列の行値)。 pandas での ai.summarize の使用に関する詳細な手順については、この記事を参照してください。 PySpark の ai.summarize については、この記事を参照してください。

指示を用いて概要をカスタマイズ

ai.summarize関数では、生成されたサマリーのトーン、長さ、フォーカスを操作できるinstructions パラメーターがサポートされるようになりました。特定のスタイル、対象ユーザー、詳細レベルの指定など、概要の作成方法をガイドするカスタム手順を提供できます。命令が指定されていない場合、関数は既定の集計動作を使用します。 instructions パラメーターの使用例については、pandas と PySpark の詳細なドキュメントを参照してください。

pandas
PySpark

# This code uses AI. Always review output for mistakes.

df= pd.DataFrame([
        ("Microsoft Teams", "2017",
        """
        The ultimate messaging app for your organization—a workspace for real-time 
        collaboration and communication, meetings, file and app sharing, and even the 
        occasional emoji! All in one place, all in the open, all accessible to everyone.
        """),
        ("Microsoft Fabric", "2023",
        """
        An enterprise-ready, end-to-end analytics platform that unifies data movement, 
        data processing, ingestion, transformation, and report building into a seamless, 
        user-friendly SaaS experience. Transform raw data into actionable insights.
        """)
    ], columns=["product", "release_year", "description"])

df["summaries"] = df["description"].ai.summarize()
display(df)

# This code uses AI. Always review output for mistakes. 

df = spark.createDataFrame([
        ("Microsoft Teams", "2017",
        """
        The ultimate messaging app for your organization—a workspace for real-time 
        collaboration and communication, meetings, file and app sharing, and even the 
        occasional emoji! All in one place, all in the open, all accessible to everyone.
        """,),
        ("Microsoft Fabric", "2023",
        """
        An enterprise-ready, end-to-end analytics platform that unifies data movement, 
        data processing, ingestion, transformation, and report building into a seamless, 
        user-friendly SaaS experience. Transform raw data into actionable insights.
        """,)
    ], ["product", "release_year", "description"])

summaries = df.ai.summarize(input_col="description", output_col="summary")
display(summaries)

ai.translate を使用してテキストを翻訳する

ai.translate 関数は AI を呼び出して、入力テキストを任意の新しい言語に翻訳します。 pandas での ai.translate の使用に関する詳細な手順については、この記事を参照してください。 PySpark の ai.translate については、この記事を参照してください。

pandas
PySpark

# This code uses AI. Always review output for mistakes. 

df = pd.DataFrame([
        "Hello! How are you doing today?", 
        "Tell me what you'd like to know, and I'll do my best to help.", 
        "The only thing we have to fear is fear itself."
    ], columns=["text"])

df["translations"] = df["text"].ai.translate("spanish")
display(df)

# This code uses AI. Always review output for mistakes. 

df = spark.createDataFrame([
        ("Hello! How are you doing today?",),
        ("Tell me what you'd like to know, and I'll do my best to help.",),
        ("The only thing we have to fear is fear itself.",),
    ], ["text"])

translations = df.ai.translate(to_lang="spanish", input_col="text", output_col="translations")
display(translations)

ai.stats を使用して使用状況の統計情報を表示する

Fabric AI 関数は、AI によって生成されたシリーズまたは DataFrame の使用状況と実行の統計情報を検査する組み込みの方法を提供します。これらのメトリックにアクセスするには、AI 関数によって返された結果に対して ai.stats を呼び出します。

ai.stats は、次の列を持つ DataFrame を返します。

num_successful – AI 関数によって正常に処理された行の数。
num_exceptions – 実行中に例外が発生した行の数。これらの行は、 aifunc.ExceptionResultのインスタンスとして表されます。
num_unevaluated – 以前の例外によって評価を続行できなかったために処理されなかった行の数。これらの行は aifunc.NotEvaluatedResult のインスタンスです。
num_harmful – Azure OpenAI コンテンツフィルターによってブロックされた行の数。これらの行は、 aifunc.FilterResultのインスタンスです。
prompt_tokens – AI 関数呼び出しに使用された入力トークンの合計数。
completion_tokens – モデルによって生成された出力トークンの合計数。

Tip

AI 関数によって返された任意の系列または DataFrame で ai.stats を呼び出すことができます。これは、使用状況の追跡、エラーパターンの理解、トークンの使用量の監視に役立ちます。

ai.analyze_sentiment in pandasまたはai.analyze_sentiment in pysparkを使用してセンチメントを検出します。
ai.classify in pandasまたはai.classify in PySparkでテキストを分類します。
ai.embed in pandasまたはai.embed in PySparkを使用してベクター埋め込みを生成します。
ai.extract in pandasまたはai.extract in PySparkを使用してエンティティを抽出します。
ai.fix_grammar in pandasまたはai.fix_grammar in PySparkで文法を修正します。
ai.generate_response in pandasまたはai.generate_response in PySparkを使用してカスタムユーザープロンプトに応答します。
ai.similarity in pandasまたはai.similarity in PySparkを使用して類似性を計算します。
テキストを ai.summarize in pandas または ai.summarize in PySparkで集計します。
ai.translate in pandasまたはai.translate in PySparkを使用してテキストを翻訳します。
Pandas での AI 関数の構成または PySpark での AI 関数の構成をカスタマイズします。
必要な機能が見逃されましたか? ファブリックアイデアフォーラムでそれを提案.

フィードバック

このページはお役に立ちましたか?

Last updated on 2025-12-04

次の方法で共有

AI 関数を使用してデータを変換およびエンリッチする

Prerequisites

モデルとプロバイダー

AI 関数の概要

パフォーマンスとコンカレンシー

依存関係のインストール

必要なライブラリをインポートする

AI 関数を適用する

ai.analyze_sentimentを使用してセンチメントを検出する

省略可能なパラメーター

ai.classify を使用してテキストを分類する

ai.embed を使用してベクター埋め込みを生成する

ai.extract を使用してエンティティを抽出する

構造化ラベル

ai.fix_grammarを使用して文法を修正する

ai.generate_responseを使用してカスタム ユーザー プロンプトに応答する

省略可能なパラメーター

ai.similarity を使用して類似性を計算する

ai.summarize を使用してテキストを集計する

指示を用いて概要をカスタマイズ

ai.translate を使用してテキストを翻訳する

ai.stats を使用して使用状況の統計情報を表示する

関連コンテンツ

フィードバック

その他のリソース

ai.generate_responseを使用してカスタムユーザープロンプトに応答する