Azure AI Document Intelligence とは?
- [アーティクル]
-
-
Azure AI Document Intelligence は、クラウドベースの Azure AI サービスで、インテリジェントなドキュメント処理ソリューションの構築を可能とします。 さまざまなデータ型にまたがる大量のデータが、フォームとドキュメントに格納されます。 Document Intelligence は、データの収集と処理の速度を効果的に管理することを可能とし、運用の改善、情報に基づくデータ主導の意思決定、知見に基づくイノベーションの鍵となります。
|✔️ ドキュメント分析モデル |✔️ 事前構築済みモデル |✔️ カスタム モデル |
汎用抽出モデルを使用すると、フォームやドキュメントからテキストを抽出し、組織でのアクション、運用、開発などに利用できる、構造化されたビジネス対応コンテンツを返すことができます。
読み取り | 印刷されたテキストや手書きテキストを抽出します。
レイアウト | テキスト、テーブル、ドキュメントの構造を抽出します。
読み取り | 印刷されたテキスト
や手書きテキストを抽出します。
レイアウト | テキスト、テーブル、
ドキュメントの構造を抽出します。
事前構築済みモデルを使用して、独自モデルのトレーニングや構築をしなくても、インテリジェントなドキュメント処理をアプリやフローに追加できます。
領収書 | 販売 トランザクションの詳細を抽出します。
米国統一税 | サポートされている米国税フォームから抽出します。
健康保険証 | 保険のカバレッジ詳細を抽出します。
領収書 | 販売
トランザクションの詳細を抽出します。
カスタム モデルは、ラベル付きデータセットを使用してトレーニングされ、ユース ケースに固有のフォームとドキュメントから個別のデータを抽出します。 スタンドアロンのカスタム モデルを組み合わせて、作成済みモデルを作成できます。
✔️ ドキュメント フィールド抽出モデルをトレーニングして、ドキュメントからラベル付きフィールドを抽出します。
カスタム構成 | モデルのコレクションを使用してデータを抽出します。
✔️ カスタム分類器は、抽出モデルを呼び出す前に、ドキュメントの種類を特定します。
カスタム分類器 | 抽出モデルを呼び出す前に、指定されたドキュメントの種類 (クラス) を特定します。
Document Intelligence では、ドキュメント抽出シナリオに応じて有効または無効にできるオプションの機能がサポートされています。
モデル ID |
テキストの抽出 |
クエリ フィールド |
段落 |
段落の役割 |
選択マーク |
テーブル |
キーと値のペア |
言語 |
バーコード |
ドキュメント分析 |
数式* |
スタイルのフォント* |
高解像度* |
検索可能な PDF |
prebuilt-read |
✓ |
|
✓ |
|
|
|
|
O |
O |
|
O |
O |
O |
O |
事前構築済みレイアウト |
✓ |
✓ |
✓ |
✓ |
✓ |
✓ |
O |
O |
O |
|
O |
O |
O |
|
prebuilt-contract |
✓ |
✓ |
✓ |
✓ |
✓ |
|
|
O |
O |
✓ |
O |
O |
|
|
prebuilt-healthInsuranceCard.us |
✓ |
✓ |
|
|
|
|
|
O |
O |
✓ |
O |
O |
O |
|
prebuilt-idDocument |
✓ |
✓ |
|
|
|
|
|
O |
O |
✓ |
O |
O |
O |
|
prebuilt-invoice |
✓ |
✓ |
|
|
✓ |
✓ |
O |
O |
O |
✓ |
O |
O |
O |
|
prebuilt-receipt |
✓ |
✓ |
|
|
|
|
|
O |
O |
✓ |
O |
O |
O |
|
prebuilt-marriageCertificate.us |
✓ |
✓ |
|
|
✓ |
|
|
O |
O |
✓ |
O |
O |
O |
|
prebuilt-creditCard |
✓ |
✓ |
|
|
|
|
|
O |
O |
✓ |
O |
O |
O |
|
prebuilt-check.us |
✓ |
✓ |
|
|
|
|
|
O |
O |
✓ |
O |
O |
O |
|
prebuilt-payStub.us |
✓ |
✓ |
|
|
|
|
|
O |
O |
✓ |
O |
O |
O |
|
prebuilt-bankStatement |
✓ |
✓ |
|
|
|
|
|
O |
O |
✓ |
O |
O |
O |
|
prebuilt-mortgage.us.1003 |
✓ |
✓ |
|
|
✓ |
|
|
O |
O |
✓ |
O |
O |
O |
|
prebuilt-mortgage.us.1004 |
✓ |
✓ |
|
|
✓ |
|
|
O |
O |
✓ |
O |
O |
O |
|
prebuilt-mortgage.us.1005 |
✓ |
✓ |
|
|
✓ |
|
|
O |
O |
✓ |
O |
O |
O |
|
prebuilt-mortgage.us.1008 |
✓ |
✓ |
|
|
✓ |
|
|
O |
O |
✓ |
O |
O |
O |
|
prebuilt-mortgage.us.closingDisclosure |
✓ |
✓ |
|
|
✓ |
|
|
O |
O |
✓ |
O |
O |
O |
|
prebuilt-tax.us |
✓ |
✓ |
|
|
✓ |
|
|
O |
O |
✓ |
O |
O |
O |
|
prebuilt-tax.us.w2 |
✓ |
✓ |
|
|
✓ |
|
|
O |
O |
✓ |
O |
O |
O |
|
prebuilt-tax.us.w4 |
✓ |
✓ |
|
|
|
|
|
O |
O |
✓ |
O |
O |
O |
|
prebuilt-tax.us.1040 (各種) |
✓ |
✓ |
|
|
✓ |
|
|
O |
O |
✓ |
O |
O |
O |
|
prebuilt-tax.us.1095A |
✓ |
✓ |
|
|
|
|
|
O |
O |
✓ |
O |
O |
O |
|
prebuilt-tax.us.1095C |
✓ |
✓ |
|
|
|
|
|
O |
O |
✓ |
O |
O |
O |
|
prebuilt-tax.us.1098 |
✓ |
✓ |
|
|
✓ |
|
|
O |
O |
✓ |
O |
O |
O |
|
prebuilt-tax.us.1098E |
✓ |
✓ |
|
|
✓ |
|
|
O |
O |
✓ |
O |
O |
O |
|
prebuilt-tax.us.1098T |
✓ |
✓ |
|
|
✓ |
|
|
O |
O |
✓ |
O |
O |
O |
|
prebuilt-tax.us.1099 (各種) |
✓ |
✓ |
|
|
✓ |
|
|
O |
O |
✓ |
O |
O |
O |
|
prebuilt-tax.us.1099SSA |
✓ |
✓ |
|
|
|
|
|
O |
O |
✓ |
O |
O |
O |
|
{ customModelName } |
✓ |
✓ |
✓ |
✓ |
✓ |
✓ |
|
O |
O |
✓ |
O |
O |
O |
|
✓ - 有効
O - 省略可能
* - 追加コストが発生する Premium 機能
注意
以下のドキュメント解釈モデルと開発オプションは Document Intelligence サービス v3.0 でサポートされています。
Document Intelligence を使用して、アプリケーションとワークフローでのドキュメント処理を自動化し、データ主導戦略を強化し、ドキュメント検索機能を強化することができます。 表のリンクから、各モデルの詳細や開発のオプションを参照できます。
一般的なドキュメント (2023-10-31 プレビューで非推奨)
注意
カスタム ニューラル モデルをトレーニングするには、buildMode
プロパティを neural
に設定します。
詳細については、「ニューラル モデルのトレーニング」を参照してください。
注意
カスタム テンプレート モデルをトレーニングするには、buildMode
プロパティを template
に設定します。
詳細については、「テンプレート モデルのトレーニング」を参照してください。
Azure AI Document Intelligence は、開発者がインテリジェントなドキュメント処理ソリューションを構築することを可能とするクラウドベースの Azure AI サービスです。 Document Intelligence は、機械学習ベースの光学式文字認識 (OCR) およびドキュメント解釈テクノロジを適用して、ドキュメントからテキスト、テーブル、構造、キーと値のペアを抽出します。 また、カスタム モデルにラベルを付けてトレーニングし、構造化ドキュメント、半構造化ドキュメント、非構造化ドキュメントからのデータ抽出を自動化することもできます。 各モデルについて詳しくは、概念に関する記事を "ご覧ください"。
このコンテンツの適用対象: v2.1 | 最新バージョン: v4.0 (GA)
Document Intelligence のモデルおよび開発オプション
ヒント
- 強化されたエクスペリエンスと高度なモデル品質のためには、Document Intelligence v3.0 Studio をお試しください。
- v3.0 Studio では、v2.1 ラベル付きデータでトレーニングされたすべてのモデルがサポートされます。
- v2.1 から v3.0 への移行の詳細については、API 移行ガイドを参照してください。
注意
以下のモデルと開発オプションは Document Intelligence サービス v2.1 でサポートされています。
表のリンクを使用して、各モデルの詳細を確認したり、API リファレンスを参照したりしてください。
AI サービス全般に言えることですが、Document Intelligence サービスを使用する開発者は、顧客データに関する Microsoft のポリシーに留意する必要があります。 Document Intelligence のデータ、プライバシー、セキュリティに関するページを参照してください。