Azure AI をターゲットにした言語処理テクノロジを選択する

Foundry Tools は、開発者や組織が、すぐに使用できる、事前構築済みのカスタマイズ可能な API とモデルを使用して、責任ある AI プラクティスに合わせた AI ベースの高度な運用対応アプリケーションを作成するのに役立ちます。

この記事では、自然言語処理、テキスト分析、言語理解、翻訳、ドキュメントデータ抽出など、Tools が提供する対象言語処理機能について説明します。これには、次のサービスが含まれます。

Foundry Tools の Azure 言語は、名前付きエンティティ認識 (NER)、センチメント分析、言語検出、要約、質問の回答など、テキストを理解および分析するための自然言語処理機能を提供するクラウドベースのサービスです。
Foundry Tools の Azure Translator は機械翻訳サービスです。リアルタイムのテキスト翻訳、バッチおよび単一ファイルのドキュメント翻訳、およびカスタム翻訳を提供します。これを使用して、ユースケースに特化した用語や業界固有の言語を組み込むことができます。 Azure Translator では、複数の言語がサポートされています。
Foundry Tools の Azure ドキュメントインテリジェンスは、画像を電子形式に直接変換するサービスです。ユーザーの介入なしにそれらのフィールドをキャプチャするために指定する、予期されるフィールドと検索イメージを指定できます。 Azure Document Intelligence では、多くの事前構築済みモデルがホストされています。これを使用して、独自のカスタムモデルを構築することもできます。
Foundry Tools の Azure Content Understanding は、自然言語の説明を使用して、生成 AI を使用してドキュメントからスキーマ定義フィールドを抽出するサービスです。ドキュメントの種類に事前構築済みの Azure ドキュメントインテリジェンスモデルがない場合、自動化されたワークフローの信頼度スコアと接地が必要な場合、または取得拡張生成 (RAG) 対応の Markdown 出力が必要な場合は、Azure Content Understanding を使用します。
Foundry Models は、コンテンツの生成、要約、翻訳などの言語タスクに API を介して直接使用できる AI モデルを提供するサービスです。

Azure言語

Azure Language には、標準化されたプロトコルを使用してエージェントを言語処理サービスに接続する特殊なツールが用意されています。

これらのタスクに Azure 言語を使用する	これらのタスクには Azure 言語を使用しないでください
Web ベースの Microsoft Foundry、REST API、クライアントライブラリを使用してインテリジェントなアプリケーションを構築します。	チャットを使用してドキュメントを検索します。代わりに Azure AI Search を使用してください。
この記事で説明するさまざまな言語関連のタスクについては、構造化ドキュメントまたは非構造化ドキュメントを操作します。	ドキュメントでコンテンツの安全性を確認します。代わりに Foundry コントロールプレーンのコンテンツ安全性を利用してください。
	ドキュメントを翻訳します。翻訳には、 Azure Translator を使用します。

使用可能な Azure 言語ツール

Azure 言語モデルコンテキストプロトコル (MCP) サーバーは、MCP を介してエージェントを Azure 言語サービスに直接接続します。この統合により、開発者は、AI ワークフロー全体でエンタープライズレベルのコンプライアンス、データ保護、および処理の精度を確保しながら、信頼性の高い自然言語処理機能を備える会話型アプリケーションを構築できます。 Azure Language には、リモートとローカルの両方の MCP サーバーオプションが用意されています。

リモートサーバー: クラウドでホストされるデプロイのツールカタログから使用できます。
ローカルサーバー: 独自の環境でサーバーをホストすることを好む開発者が利用できます。

使用可能な Azure 言語エージェント

次の表に、会話型 AI シナリオで Azure Language で使用できるエージェントの一覧を示します。

エージェント	説明
インテントルーティングエージェント	ユーザーの意図を理解し、会話型 AI アプリケーションで正確な応答を提供することで、会話フローを管理します。予測可能な意思決定プロセスと制御された応答生成を組み合わせて使用し、一貫性のある信頼性の高い対話を保証します。
正確な質問の回答エージェント	重要なビジネスの質問に対する信頼性の高い単語単位の応答を提供します。正確性とコンプライアンスを確保するために、人間の監視と品質管理を維持しながら、よく寄せられる質問を自動化します。

使用可能な Azure 言語機能

次の表に、Azure 言語で使用できる機能の一覧を示します。

特徴	説明
NER	テキスト内のさまざまなエントリを識別し、ユーザー、イベント、場所、日付などの定義済みの種類に分類します。
個人データと健康データの検出	個人に関連付けられたチャットやトランスクリプトを含む、テキストと会話のエンティティを識別します。電話番号、メールアドレス、ID の形式などの機密情報を検出して編集します。
言語検出	テキストを評価し、さまざまな言語と方言を検出します。
感情分析とオピニオンマイニング	肯定的または否定的な感情の兆候をテキストで分析し、コンテンツの特定の側面にリンクすることで、ブランドやトピックに対する一般の認識を理解するのに役立ちます。
概要	テキストと会話の情報を圧縮します。主要な文を選択する抽出要約、簡潔な新しい文を生成する抽象的な要約、タイムスタンプを使用して会議を要約する会話の要約、およびコールセンターの要約をサポートします。
キーフレーズ抽出	非構造化テキストの主な概念を評価し、リストとして返します。
エンティティリンク設定	非構造化テキストで見つかった単語やフレーズなどのエンティティ ID を明確に区別し、Wikipedia へのリンクを返します。エンティティリンクは、2028 年 9 月 1 日に廃止されます。既存のワークロードを NER に移行することをお勧めします。
健康向けテキスト分析	医師のメモ、退院概要、臨床文書、電子健康記録などの非構造化テキストから関連する医療情報を抽出してラベル付けします。ワークロードを設計するときは、このクラウドホスト型機能の処理場所とデータ所在地を評価して、コンプライアンスの期待に合致していることを確認します。一部のワークロードでは、クラウドでホストされるプラットフォームに医療データを送信する容量を制限する制限に直面する場合があります。この API を Docker コンテナーとして使用して、クラウドまたはオンプレミスの独自のコンピューティングでホストできます。このプロセスは、サービスとしてのプラットフォーム (PaaS) オファリングの使用に関連するコンプライアンス上の問題に対処するのに役立ちます。詳細については、ヘルス用コンテナーに対するテキスト分析の利用をご参照ください。
カスタムテキスト分類	カスタム AI モデルを構築して、非構造化テキストドキュメントを定義したカスタムクラスに分類します。
カスタム NER	指定した非構造化テキストを使用して、単語やフレーズのラベルなどのカスタムエンティティカテゴリを抽出するカスタム AI モデルを構築します。
会話言語理解 (CLU)	各入力からユーザーの意図を予測し、そこから重要な情報を抽出するカスタム自然言語処理モデルを構築します。
オーケストレーションワークフロー	CLU と質問応答アプリケーションを接続します。
質問応答	ユーザー入力に最も適した回答を識別します。ソーシャルメディアアプリケーション、チャットボット、音声対応デスクトップアプリケーションなどの会話型クライアントアプリケーションを構築するために一般的に使用されます。

Azure 言語機能を選択する

次の表に、Azure 言語で使用できるユースケースの一覧を示します。機能がカスタマイズ可能な場合は、特定のデータに合わせて Microsoft ツールを使用して AI モデルをトレーニングできます。それ以外の場合、機能は事前設定されているため、AIモデルは変更されません。データを提供し、機能の出力をアプリケーションで使用します。

ユースケース	カスタマイズ可能
ユーザー入力の意図を予測し、そこから情報を抽出します。	はい
個人データなどの機密情報を特定して編集します。	いいえ
テキストが書き込まれる言語を特定します。	いいえ
モデルを作成せずに、臨床ドキュメントまたは医療ドキュメントから医療情報を抽出します。	いいえ
データでトレーニングされたモデルを使用して、臨床ドキュメントまたは医療ドキュメントから医療情報を抽出します。	はい
カスタムモデルを作成せずに、情報のカテゴリを抽出します。	いいえ
データに固有のモデルを使用して、情報のカテゴリを抽出します。	はい
主なトピックと重要なフレーズを抽出します。	いいえ
ドキュメントを要約します。	いいえ
感情分析を使用してテキストを分類します。	はい
カスタムクラスを使用してテキストを分類します。	はい
推論時に提供されたカテゴリに項目を分類します。	いいえ
エンティティをナレッジベースの記事にリンクします。	いいえ
一般的な質問と回答を理解する。	はい
ユーザー入力に応答する会話型アプリケーションを作成する。	いいえ
CLUからアプリを接続して質問応答を行います。	はい

アジュールトランスレーター

Azure Translator は、クラウドベースのニューラル機械翻訳 (NMT) サービスです。 Azure Translator は、世界中の企業が言語翻訳やその他の言語関連のタスクに使用する多くの Microsoft 製品とサービスを提供しています。

これらのタスクに Azure Translator を使用する	これらのタスクには Azure Translator を使用しないでください
具体的には翻訳を行います。 Azure Translator は、対象となる翻訳モデルのため、汎用基盤言語モデルよりも効果的でコスト効率が高くなります。	チャットに参加する。
	センチメントのコンテンツを分析します。感情分析には、 Azure 言語を使用します。
	コンテンツをモデレートします。コンテンツモデレーションには、コンテンツの安全性を使用します。

機能と開発オプション

次の表に、Azure Translator で使用できる機能の一覧を示します。

特徴	説明
テキスト翻訳 (プレビュー)	2025-10-01-preview バージョンを使用して、標準の NMT または言語モデルのデプロイ (GPT-4o-mini または GPT-4o) を選択してテキストを翻訳します。言語モデルのデプロイを使用するには、Foundry リソースが必要です。
テキスト翻訳 v3 (GA)	サポートされているソース言語とターゲット言語の間でテキストをリアルタイムで翻訳します。動的ディクショナリを作成し、Azure Translator API を使用して翻訳を防止する方法について説明します。
非同期ドキュメント変換	元のドキュメントの構造と形式を維持しながら、バッチファイルと複雑なファイルを翻訳します。バッチ翻訳プロセスには、ソースドキュメントと翻訳済みドキュメントのコンテナを持つ Azure Blob Storage アカウントが必要です。
同期ドキュメント翻訳	元のドキュメントの構造と形式を維持しながら、単一のドキュメントファイルのみを翻訳するか、用語集ファイルを使用して翻訳します。ファイル変換プロセスには、Blob Storage アカウントは必要ありません。最後の応答に翻訳されたドキュメントが含まれており、それが呼び出し元のクライアントに直接返されます。
カスタムトランスレータ	カスタマイズされたモデルを構築して、ドメイン固有および業界固有の言語、用語、スタイルを翻訳します。カスタム翻訳の語句または文の辞書を作成します。

ヒント

コードなしのインターフェイスを使用して、テキストおよび同期ドキュメント変換タスクに Foundry を使用します。

使用例

次の表に、Azure Translator で使用できるユースケースの一覧を示します。

ユースケース	ドキュメント
業界固有のテキストを翻訳します。	カスタムトランスレータ
業界に特化しない一般的なテキストを翻訳します。	テキスト翻訳

Azure ドキュメントインテリジェンス

Azure Document Intelligence を使用して、アプリケーションとワークフローでのドキュメント処理を自動化し、データドリブン戦略を強化し、ドキュメント検索機能を強化します。

これらのタスクに Azure ドキュメントインテリジェンスを使用する	これらのタスクに Azure ドキュメントインテリジェンスを使用しない
請求書、領収書、W-2、ID ドキュメントなど、事前構築済みのモデルを持つ既知のドキュメントの種類から特定のフィールドを抽出します。	事前構築済みのモデルがなく、スキーマ定義の柔軟な抽出が必要なカスタムドキュメント型からフィールドを抽出します。代わりに Azure Content Understanding を使用してください。
確定的でばらつきの少ない抽出が必要な場合は、大量の構造化ドキュメントまたは半構造化ドキュメントを処理します。	図、セクション階層、チャンク対応構造が埋め込まれた Markdown 形式の出力を必要とする RAG パイプラインを構築します。代わりに Azure Content Understanding を使用してください。
ビジネスに固有のドキュメントの種類に対して、ラベル付けされたデータセットに対してカスタムニューラルモデルまたはテンプレートモデルをトレーニングします。	人間を介したレビューワークフローを促進するには、抽出された各フィールドに対して信頼度スコアと根拠が必要です。代わりに Azure Content Understanding を使用してください。
ドキュメントをさらにプログラムで操作するために、ドキュメントのさまざまなコレクション内のヘッダー、フッター、章区切りなどの主要な構造を特定します。

ドキュメント分析モデル

ドキュメント分析モデルは、フォームやドキュメントからテキストを抽出し、構造化されたビジネス向けコンテンツを返します。

Model	説明
読み取り	文書から印刷されたテキストと手書きのテキストを抽出します。ドキュメントのデジタル化、コンプライアンスと監査のタスク、手書きのメモの処理に使用します。
レイアウト	テキスト、テーブル、およびドキュメント構造を抽出します。構造別のドキュメントのインデックス作成と取得、および財務および医療レポート分析に使用します。

事前構築済みモデルを文書化する

事前構築済みのモデルでは、独自のモデルをトレーニングして構築しなくても、インテリジェントなドキュメント処理がアプリとフローに追加されます。

Model	説明
請求書	請求書から顧客と仕入先の詳細を抽出します。買掛金勘定処理および自動税記録およびレポートに使用します。
領収書	レシートから販売トランザクションの詳細を抽出します。経費管理、消費者行動データ分析、商品返品処理に使用します。
アイデンティティ	パスポート、ID カード、運転免許証から重要な情報を抽出します。顧客の把握 (KYC) コンプライアンス、医療アカウント管理、ID チェックポイントに使用します。
医療保険カード	保険者、会員、グループ番号など、米国の健康保険証から重要な情報を抽出します。カバレッジと適格性の検証と価値ベースの分析に使用します。
契約	さまざまな形式の契約書から、スキャン文書や電子 PDF を含む、契約および関係者の詳細を抽出します。
クレジットカード	カード番号、発行銀行、有効期限など、クレジットカードとデビットカードからキーフィールドを抽出します。
銀行取引明細書	口座情報と取引の詳細を銀行明細書から抽出します。税務処理、会計管理、ローン書類処理に使用します。
銀行小切手	チェックから関連情報を抽出します。信用管理と自動貸し手管理に使用します。
給与明細	給与明細の詳細を抽出します。従業員の給与明細の確認と不正行為の検出に使用します。
結婚証明書	米国の結婚証明書から認定結婚情報を抽出します。
米国の住宅ローンドキュメント	1003、1004、1005、1008 のフォームからローン申請の詳細を抽出し、開示を終了します。 Fannie Mae と Freddie Mac のドキュメント要件に使用します。
米国の税務書類	W-2、1098、1099、1040 の税フォームのバリエーションから情報を抽出します。自動税務書類管理および住宅ローン申請処理に使用します。

カスタムモデル

ラベル付きデータセットを使用してカスタムモデルをトレーニングし、ユースケースに固有のフォームやドキュメントから個別のデータを抽出します。

Model	説明
カスタムニューラル	アンケートやアンケートなどの構造化されたドキュメント、請求書や発注書などの半構造化ドキュメント、契約や手紙などの非構造化ドキュメントなど、混合タイプのドキュメントからデータを抽出します。
カスタムテンプレート	ビジュアルテンプレートまたは一般的なビジュアルレイアウトを定義した構造化ドキュメントと半構造化ドキュメントから、ラベル付き値とフィールドを抽出します。
カスタム構成済み	カスタムモデルのコレクションを組み合わせて、発注書などの同様のフォームの種類を分析します。
カスタム分類子	抽出モデルを呼び出す前に、指定されたドキュメントの種類またはクラスを識別します。申請フォーム、支払伝票、銀行明細書を含むローン申請パッケージに使用します。

アドオン機能

Azure Document Intelligence では、ドキュメント抽出シナリオに応じて有効または無効にできる次のオプション機能がサポートされています。

高解像度の抽出
数式の抽出
Font プロパティの抽出
バーコードプロパティの抽出
検索可能な PDF
クエリフィールド
キー/値ペア

モデルシナリオの詳細については、「 Azure ドキュメントインテリジェンスモデルの選択」を参照してください。

Azure コンテンツ理解

Azure Content Understanding では、生成 AI を使用して、自然言語で定義したスキーマに基づいてドキュメントから構造化フィールドを抽出します。 Azure Document Intelligence は、特定のドキュメントレイアウトに関連付けられた事前トレーニング済みまたはカスタムトレーニング済みの機械学習モデルに依存する場合とは異なり、Azure Content Understanding では生成モデルを使用してドキュメントコンテンツを推論し、スキーマアライン JSON または RAG 対応 Markdown 出力を生成します。また、フィールドごとの信頼度スコアと根拠も提供されます。これらの機能を使用して、対象となる人間のレビューを使用してワークフローを自動化します。

これらのタスクに Azure Content Understanding を使用する	これらのタスクには Azure Content Understanding を使用しないでください
自然言語で記述されたスキーマ定義を使用して、Azure Document Intelligence の事前構築済みモデルがないドキュメントの種類からフィールドを抽出します。	既存の Azure ドキュメントインテリジェンス事前構築済みモデルを持つ標準ドキュメントの種類からフィールドを抽出します。これらのシナリオでは、Azure ドキュメントインテリジェンスの方がコスト効率が高く、決定論的です。
ベクターインデックス作成用のレイアウト、見出し、テーブル、図表、注釈を保持する Markdown 出力を必要とする RAG パイプラインを構築します。	言語モデルの変動とコストを最小限に抑える必要がある場合に、大量のシンプルで構造化されたドキュメントを処理します。代わりに Azure ドキュメントインテリジェンスを使用してください。
フィールドごとの信頼度スコアと接地を必要とする自動化ワークフローを推進し、信頼性の低いレコードを人間のレビューにルーティングします。	集計や感情分析などの汎用言語タスクを実行します。代わりに Azure 言語またはモデルを使用してください。
混合ドキュメントパイプライン内の適切なアナライザーにドキュメントの種類をルーティングする前に、ドキュメントの種類を分類します。

ドキュメントで使用可能な Azure Content Understanding 機能

次の表に、Azure Content Understanding で使用できるドキュメント機能の一覧を示します。

特徴	説明
コンテンツ抽出	非構造化ドキュメントを、マシンが読み取り可能な構造化データに変換します。印刷されたテキスト、手書きのテキスト、選択マーク、バーコード、数式、画像要素、ハイパーリンク、注釈をキャプチャします。段落、テーブル、階層セクション、図形要素など、ドキュメント構造を保持します。
フィールド抽出	定義したスキーマに基づいて、ドキュメントから構造化キーと値のペアを抽出します。ソースからフィールドを直接抽出し、定義済みのカテゴリセットから分類するか、生成モデルを使用して生成します。信頼度スコアと情報の根拠は、オプトイン機能として各フィールドで利用可能です。
事前構築済みのドキュメントアナライザー	契約ライフサイクル管理、ローンと住宅ローンのアプリケーション、財務レポート、経費管理、ナレッジベースのシナリオなど、一般的なエンタープライズシナリオ用のすぐに使用できるアナライザー。
RAG 出力	ベクターストアおよび検索インデックスで使用するためにドキュメント構造を保持する Markdown 形式の出力を生成します。取得ワークフローが標準のチャンクで見落とすコンテンツにアクセスできるように、図の説明、レイアウト分析、および注釈の検出をサポートします。

使用例

次の表に、ドキュメントの Azure Content Understanding で使用できるユースケースの一覧を示します。

ユースケース	説明
契約ライフサイクル管理	レイアウト固有のモデルをトレーニングせずに、さまざまなコントラクトの種類から主要なフィールド、句、義務を抽出します。
ローン・住宅ローン申請処理	Azure Document Intelligence の住宅ローンの事前構築済みモデルでサポートされているものを超えるさまざまな形式とテンプレートからの補足サポートドキュメントの処理を自動化します。
経費管理	信頼度スコアを持つスキーマ定義抽出を使用して、さまざまな小売業者や形式からの領収書と請求書を解析し、人によるレビューを必要とするレコードにフラグを設定します。
RAG ドキュメント取り込み	RAG 検索パイプラインやエージェントワークフローで使用するために、レイアウトを保持する Markdown 出力を使用して、非構造化ドキュメントを構造化された検索可能なデータ資産に変換します。
ドキュメントの分類とルーティングの混在	受信ドキュメントを種類別に分類し、各種類を適切なアナライザーにルーティングします。この方法では、複数のドキュメントの種類を受け取るパイプラインをエンドツーエンドで自動化できます。

モデル

モデルは、Microsoft、OpenAI、およびその他の主要なプロバイダーから基礎モデルのカタログにアクセスできます。これらのモデルでは、コンテンツ生成、要約、翻訳、会話操作などの汎用言語タスクを実行できます。

これらのタスクにモデルを使用する	これらの機能が必要な場合は、特殊なサービスを検討してください
クリエイティブコンテンツ、下書き、テキストのバリエーションを生成します。	大規模に実行可能な一貫性のある反復的な自然言語処理タスク、例えば名前付きエンティティ認識 (NER) や感情分析。 Azure Language には、これらの特定のタスクに対して最適化されたコスト効率の高い API が用意されています。
長いドキュメントまたは会話を要約します。	書式設定を維持しながら大量のドキュメントを翻訳する。 Azure Translator は、翻訳品質とドキュメント構造の保持に最適化されています。
会話型 AI エクスペリエンスとチャットボットを構築します。	フォームと請求書からの構造化されたデータ抽出を高精度で行います。 Azure ドキュメントインテリジェンスには、ドキュメントの種類専用にトレーニングされた事前構築済みモデルが用意されています。
提供されたコンテキストに基づいて、一般的な質問に回答します。
柔軟なプロンプトを表示して、計画外の言語タスクを実行します。

使用可能なモデル

モデルには、複数のプロバイダーからの次の AI モデルが含まれています。

モデルファミリ	説明
GPT-4o および GPT-4o mini	英語のテキストおよびコーディングタスクの精度と応答性を高め、テキストと画像の両方を処理できる OpenAI マルチモーダルモデル。
GPT-4.1 シリーズ	大規模なドキュメントを処理するための大きなコンテキストウィンドウ (最大 100 万トークン) を持つ OpenAI テキストおよび画像処理モデル。
GPT-5 ファミリ	OpenAIの最新世代のフラッグシップモデルは、高度な推論、マルチモーダル機能、および改善された命令フォローを備えています。これらのモデルは、高い精度を必要とする複雑な複数ステップの言語タスクに適しています。
o シリーズ (o3、o4-mini)	科学、コーディング、数学などの分野でのフォーカスと能力の向上を必要とする高度な問題解決タスク用に設計された OpenAI 推論モデル。
Phi-4 ファミリー	複雑な推論のために最適化された Microsoft の小さな言語モデル (SLB)。 Phi-4 (14B パラメーター) は待機時間の短いシナリオで優れていますが、Phi-4-reasoning と Phi-4-mini-reasoning は、リソースの少ない複数ステップの問題解決タスクに特化した推論機能を提供します。 40 を超える言語をサポートします。
ディープシーク	タスクを推論するための DeepSeek-R1 や汎用言語の理解のための DeepSeek-V3 シリーズを含む、オープンウェイトモデル。コーディングと数学的推論ベンチマークの強力なパフォーマンスで知られています。
Grok	xAI モデル (Grok-3、Grok-4、推論タスクとコーディングタスク用の特殊なバリアントを含む)。高速推論および非推論の構成が利用可能です。
ラマ	汎用言語タスク用の Llama-3.3-70B-Instruct や Llama-4-Maverick など、Meta のオープンモデル。
Mistral	ドキュメント処理シナリオ用の Mistral-Large-3 や mistral-document-ai など、ヨーロッパの AI モデル。
埋め込みモデル	テキストの類似性とセマンティック検索を容易にするために、テキストを数値ベクトル形式に変換する複数のプロバイダーのモデル。

使用可能なモデルとリージョンの可用性の完全な一覧については、「 Azure によって直接販売されるモデル」を参照してください。

概要

言語タスクにモデルの使用を開始するには、次のいずれかの方法を使用します。

コードなしアプローチ: Foundry ポータルのチャットプレイグラウンドを使用して、モデルをデプロイし、プロンプトを対話形式でテストします。
コードベースのアプローチ:Foundry SDK を使用して、Python、C#、TypeScript、または Java を使用してモデルをアプリケーションに統合します。

フィードバック

このページはお役に立ちましたか?

Last updated on 2026-03-24