Azure AI サービス は、開発者や組織が、すぐに使用できる、構築済みでカスタマイズ可能な API とモデルを使用して、インテリジェントで最先端の、市場対応型の責任あるアプリケーションを迅速に作成するのに役立ちます。
この記事では、自然言語処理 (NLP)、テキスト分析、言語理解、翻訳、ドキュメント データ抽出など、ターゲットを絞った言語処理機能を提供する AI サービスについて説明します。 Microsoft Azure AI 言語は、AI サービスで最も広範なカテゴリの 1 つです。 ワークロードで API を使用して、名前付きエンティティ認識 (NER)、感情分析、言語検出、テキスト要約などの言語機能を組み込むことができます。
サービス
次のサービスは、AI サービスにターゲットを絞った言語処理機能を提供します。
言語 は、テキスト分析のためのNLPを提供します。
使う 言語 : この記事で説明するさまざまな言語関連タスクで、構造化ドキュメントまたは非構造化ドキュメントを操作する必要がある場合。
使用しないでください チャットでドキュメントを検索したり、コンテンツの安全性を確認したり、翻訳したりする必要がある場合は、言語を使用します。
Microsoft Azure AI Translator は機械翻訳サービスです。 リアルタイムのテキスト翻訳、バッチおよび単一ファイルのドキュメント翻訳、およびシナリオに専門的な用語や業界固有の言語を組み込むために使用できるカスタム翻訳を実行できます。 Translator は複数の言語をサポートしています。
使う 翻訳を具体的に行う必要がある場合に翻訳者。 他の汎用基盤言語モデルを使用して翻訳を実行できます。 しかし、Translator を特殊な目的に使用すると、ターゲットを絞った翻訳モデルにより、より効果的でコスト効率が高くなります。
使用しないでください チャットに参加したり、コンテンツのセンチメントを分析したり、コンテンツをモデレートしたりする必要がある場合は、翻訳者です。 感情分析の場合は、代わりに [言語] を使用します。 コンテンツ モデレーションには、Microsoft Azure AI Content Safety を使用します。
Azure AI Document Intelligence は、画像を直接電子フォームに変換できるサービスです。 必要なフィールドを指定し、指定した画像を検索して、人間の介入なしにそれらのフィールドをキャプチャできます。 Document Intelligence は、多くの事前構築済みモデルをホストし、独自のカスタム モデルを構築することもできます。
使う Document Intelligenceは、スキャンしたドキュメントから抽出して電子フォームに適切に入力する必要があるフィールドを正確に把握している場合です。
使う Document Intelligence は、さまざまなドキュメントのコレクション内のヘッダー、フッター、章区切りなどの主要な構造を識別し、Retrieval Augmented Generation (RAG) の実装など、プログラムによってドキュメントとさらに対話します。
使用しないでください リアルタイム検索APIとしてのドキュメントインテリジェンス。
Azure OpenAI サービス
Azure OpenAI Service は、OpenAI の強力な言語モデルへの REST API アクセスを提供します。 これらのモデルには、O3-Mini、O1、O1-Mini、GPT-4o、GPT-4o Mini、GPT-4 Turbo with Vision、GPT-4、GPT-3.5-Turbo、およびEmbeddingsモデルシリーズが含まれます。 これらのモデルは適応性が高いため、コンテンツ生成、要約、画像分析、セマンティック検索などのタスクに合わせて調整できます。 また、自然言語からコードへの翻訳もサポートしているため、さまざまなアプリケーションに用途が広くなります。
機能
次の表に、Azure OpenAI で使用できる機能の一覧を示します。
机能 | 説明 |
---|---|
テキストの生成と補完 | プロンプトに基づいて人間のようなテキストを生成し、文や段落を自動的に補完し、長いドキュメントを簡潔な要約に要約し、コンテキストに基づいて質問に答えます。 |
チャット | チャットボットやバーチャルアシスタントを構築し、複数ターンの会話でコンテキストを維持し、ユーザーのインタラクションに基づいて応答をパーソナライズします。 |
アシスタント | コパイロットのようなエクスペリエンスを作成し、ユーザーとの対話を通じて一貫したパーソナリティを維持します。 コードの実装やナレッジ検索など、複数のツールを同時に使用できるようにします。 |
埋め込み | テキストを数値ベクトルに変換し、ベクトル空間で類似の意味が近接して配置されます。 このプロセスにより、Azure AI Search、Azure Cosmos DB、Azure SQL Database、Azure Database for PostgreSQL などのサービスで強力な類似性検索が可能になります。 |
コンテンツのフィルター処理 | ユーザー入力と AI 出力の両方を選別し、ヘイト、性的なコンテンツ、暴力、自傷行為などのカテゴリの有害なコンテンツを検出し、複数の言語をサポートします。 また、使用パターンを監視して、コンプライアンスを確保します。 |
LLMのカスタマイズ | 迅速な調整のためのプロンプトエンジニアリング、外部情報を組み込むためのRAG、特殊なタスクでモデルをトレーニングするための微調整など、モデル適応技術を提供します。 これらの方法を組み合わせて、特定のユースケースでパフォーマンスを最適化できます。 |
言語
言語 は、テキストを理解し分析するためのNLP機能を提供するクラウドベースのサービスです。 このサービスを使用すると、Web ベースの Language Studio、REST API、およびクライアント ライブラリを使用してインテリジェントなアプリケーションを構築できます。
機能
次の表に、Language で使用できる機能の一覧を示します。
机能 | 説明 |
---|---|
カスタムの質問応答 | ユーザーからの入力に対して最も適切な回答を見つけます。 これは、ソーシャル メディア アプリケーション、チャット ボット、音声対応デスクトップ アプリケーションなど、会話型クライアント アプリケーションの構築によく使用されます。 |
カスタム テキスト分類 | カスタム AI モデルを構築して、非構造化テキストドキュメントを定義したカスタムクラスに分類します。 |
会話言語理解 (CLU) | カスタム自然言語理解モデルを構築して、受信メッセージの全体的な意図を予測し、そこから重要な情報を抽出します。 |
エンティティ リンク設定 | 非構造化テキストで見つかった単語やフレーズのアイデンティティを明確にし、ウィキペディアへのリンクを返します。 |
言語検出 | ドキュメントが記述されている言語を検出し、さまざまな言語、バリアント、方言、および一部の地域言語または文化言語の言語コードを返します。 |
キー フレーズ抽出 | 非構造化テキストの主要な概念を評価して返し、それらをリストとして返します。 |
NERの | 非構造化テキスト内の単語や語句を、人、イベント、場所、日付など、事前定義された 複数のカテゴリグループに分類します。 |
オーケストレーション ワークフロー | CLU の接続に使用します。 |
個人を特定できる情報(PII)と個人を特定できる健康情報の検出 | 非構造化テキストドキュメントと会話トランスクリプト(電話番号、メールアドレス、身分証明書など)の両方から、機密情報を特定、分類、編集します。 詳細については、「 サポートされている PII エンティティ カテゴリ」を参照してください。 |
感情分析とオピニオン マイニング | ブランドやトピックに対するユーザーの感想を理解するために、テキストを分析して肯定的または否定的な感情の兆候を探し、それらをコンテンツの特定の側面にリンクします。 |
概要 | 抽出テキスト要約を使用して、ドキュメントと会話の文字起こしの要約を作成します。 元のコンテンツ内で最も重要または関連性が高い情報をまとめて表す文を抽出します。 |
健康のためのテキスト分析 | 医師の診断書、退院サマリー、臨床文書、電子健康記録などの非構造化テキストから関連する医療情報を抽出し、ラベル付けします。 ワークロードを設計するときは、このクラウドホスト型機能の処理場所とデータ所在地を評価して、コンプライアンスの期待に合致していることを確認します。 一部のワークロードは、クラウドでホストされているプラットフォームに医療データを送信するために容量が制限される場合があります。 この API を Docker コンテナーとして使用して、クラウドまたはオンプレミスの独自のコンピューティングでホストできます。 このプロセスは、サービスとしてのプラットフォームを含むコンプライアンスの問題に対処するのに役立つ場合があります。 詳細については、「 Text Analytics for Health コンテナーを使用する」を参照してください。 |
使用例
次の表に、言語の可能なユースケースのリストを示します。
機能がカスタマイズ可能な場合は、特定のデータに合わせて Microsoft のツールを使用して AI モデルをトレーニングできます。 それ以外の場合、機能は事前設定されているため、AIモデルは変更されません。 データを提供し、機能の出力をアプリケーションで使用します。
翻訳者
Translator は、AIサービスの一部である機械翻訳サービスです。 Translator は、多くの Microsoft 製品およびサービスに採用されています。
機能
次の表に、Translator で使用できる機能の一覧を示します。
机能 | 説明 |
---|---|
Azure テキスト翻訳 | サポートされているソース言語とターゲット言語間のテキスト翻訳をリアルタイムで実行します。 動的ディクショナリを作成し、Translator API を使用して翻訳を防ぐ方法を学習します。 |
ドキュメントの翻訳 |
非同期バッチ翻訳: バッチファイルや複雑なファイルを、元のドキュメントの構造と形式を維持しながら翻訳します。 バッチ翻訳プロセスには、ソースドキュメントと翻訳済みドキュメントのコンテナを持つ Azure Blob Storage アカウントが必要です。
同期単一ファイル変換: 1 つの文書ファイルを単独で翻訳するか、用語集ファイルと一緒に翻訳するが、元の文書の構造と形式は維持する。 ファイル変換プロセスには、Blob Storage アカウントは必要ありません。 最後の応答に翻訳されたドキュメントが含まれており、それが呼び出し元のクライアントに直接返されます。 |
カスタムトランスレータ | ドメインおよび業界固有の言語、用語、スタイルを翻訳するために、カスタマイズされたモデルを作成します。 カスタム翻訳用の辞書 (フレーズまたは文) を作成 します。 |
使用例
次の表に、Translator の可能な使用例の一覧を示します。
ユース ケース | ドキュメント |
---|---|
業界固有のテキストを翻訳します。 | カスタムトランスレータ |
業界に特化しない一般的なテキストを翻訳します。 | Azure テキスト翻訳 |
ドキュメントインテリジェンス
言語 は、テキストを理解し分析するためのNLP機能を提供するクラウドベースのサービスです。 このサービスを使用すると、Web ベースの Language Studio、REST API、およびクライアント ライブラリを使用してインテリジェントなアプリケーションを構築できます。
機能
次の表に、Document Intelligence で使用できる一部の機能の一覧を示します。
机能 | 説明 |
---|---|
名刺読み取り | Document Intelligence 名刺モデルは、光学式文字認識 (OCR) 機能とディープラーニング モデルを組み合わせて、名刺画像からデータを分析および抽出します。 この API は、印刷された名刺を分析し、名、姓、会社名、電子メール アドレス、電話番号などの重要な情報を抽出し、構造化された JSON データ表現を返します。 |
契約モデル抽出 | Document Intelligence 契約モデルは、OCR 機能を使用して、重要な契約エンティティの選択したグループから主要なフィールドと品目を分析および抽出します。 契約には、電話でキャプチャした画像、スキャンしたドキュメント、デジタルPDFなど、さまざまな形式と品質があります。 この API は、ドキュメント テキストを分析し、当事者、管轄区域、契約 ID、タイトルなどの重要な情報を抽出し、構造化された JSON データ表現を返します。 このモデルは現在、英語のドキュメント形式をサポートしています。 |
クレジットカード情報の抽出 | Document Intelligence クレジット/デビット カード モデルは、OCR 機能を使用して、クレジット カードとデビット カードの主要なフィールドを分析および抽出します。 クレジット カードとデビット カードは、電話でキャプチャした画像、スキャンしたドキュメント、デジタル PDF など、さまざまな形式と品質で表示される場合があります。 この API は、ドキュメントのテキストを分析し、カード番号、発行銀行、有効期限などの主要な情報を抽出し、構造化された JSON データ表現を返します。 このモデルは現在、英語のドキュメント形式をサポートしています。 |
健康保険証の抽出 | Document Intelligence の健康保険カード モデルは、OCR 機能とディープ ラーニング モデルを組み合わせて、米国の健康保険カードから重要な情報を分析および抽出します。 医医療保険カードは、医療処理の重要なドキュメントであり、患者のオンボーディング、財務カバレッジ情報、キャッシュレス支払い、および保険金請求処理についてデジタル分析することができます。 健康保険カード モデルは、健康保険カードの画像を分析し、保険会社、メンバー、処方箋、グループ番号などの重要な情報を抽出し、構造化された JSON 表現を返します。 健康保険証は、電話でキャプチャした画像、スキャンしたドキュメント、デジタルPDFなど、さまざまな形式と品質で表示できます。 |
米国の税務書類の抽出 | Document Intelligence 契約モデルでは、OCR 機能を使用して、選択した税務書類のグループから主要なフィールドと品目を分析および抽出します。 税務書類は、電話でキャプチャした画像、スキャンしたドキュメント、デジタルPDFなど、さまざまな形式と品質にすることができます。 この API は、ドキュメント テキストを分析し、顧客名、請求先住所、期日、支払額などの重要な情報を抽出して、構造化された JSON データ表現を返します。 このモデルでは現在、英語の特定の税務書類形式がサポートされています。 |
クライアント ライブラリ | Document Intelligence は、アプリやフローにインテリジェントなドキュメント処理を追加できるさまざまなモデルをサポートしています。 事前構築済みのドメイン固有のモデルを使うか、特定のビジネス ニーズとユース ケースに合わせてカスタム モデルをトレーニングできます。 Document Intelligence は、REST API または Python、C#、Java、JavaScript の各クライアント ライブラリで使用できます。 |
モデル シナリオの詳細については、「 どのモデルを選択すべきか」を参照してください。