Azure AI Document Intelligence の新機能
このコンテンツの適用対象: v4.0 (プレビュー) v3.1 (GA) v3.0 (GA) v2.1 (GA)
Document Intelligence サービスは、継続的に更新されます。 このページをブックマークして、リリースノート、機能強化、最新のドキュメントを入手してください。
重要
GA API がリリースされると、プレビュー API バージョンが廃止されます。 2023-02-28-preview API バージョンは廃止処理中です。このプレビュー API または関連する SDK バージョンをまだ使用している場合は、最新の API バージョンである 2023-07-31 (GA) をターゲットにするようにコードを更新してください。
2024 年 8 月
Document Intelligence 2024-07-31-preview REST API を使用できるようになりました。 このプレビュー版の API には、次の新機能と更新機能が導入されています。
パブリック プレビュー バージョン 2024-07-31-preview は、現在、次の Azure リージョンでのみ使用できます。 AI Studio の新しいドキュメント フィールド抽出モデルは、米国中北部リージョンでのみ使用できます。
米国東部
米国西部 2
"西ヨーロッパ"
米国中北部
-
- Generative AI を使用して、ドキュメントやフォームからフィールドを抽出します。 Document Intelligence は、大規模な言語モデル (LLM) を使用して、さまざまなビジュアル テンプレートで非構造化ドキュメントまたは構造化フォームからフィールドを抽出する新しいドキュメント フィールド抽出モデルを提供するようになりました。 基底値と信頼度スコアにより、新しい Generative AI ベースの抽出は既存のプロセスに適合します。
-
- Document Intelligence は、明示的なカスタム分類モデルを使用したモデルの作成のサポートを追加しました。 新しい作成機能を使用する利点の詳細について説明します。
-
- カスタム分類モデルは、モデルのインプレース更新もサポートするようになりました。
- カスタム分類モデルは、バックアップとディザスター リカバリーを有効にするモデル コピー操作のサポートを追加しました。
- カスタム分類モデルは、入力ドキュメントから分類するページを明示的に指定する操作をサポートするようになりました。
-
- 査定 (フォーム 1004) から情報を抽出します。
- 在籍証明書 (フォーム 1005) から情報を抽出します。
-
- 支払い先、金額、日付、およびその他の関連情報を小切手から抽出します。
-
- 給与明細を処理して賃金、時間、控除、純賃金などを抽出する新しい事前構築。
-
- 期首と期末の残高、取引の詳細を含む口座情報を銀行明細書から抽出する新しい事前構築。
-
- W-2、1098、1099、1040 などの納税申告書から抽出できる新しい統合米国税務書類モデル。
🆕 検索可能な PDF。 事前構築済みの読み取りモデルは、抽出結果から埋め込まれたテキストを含む PDF をダウンロードする PDF 出力をサポートするようになりました。これにより、目次の検索コピーなどのシナリオで PDF を利用できるようになりました。
レイアウト モデルは、向上した図形の検出機能をサポートするようになりました。これにより、ドキュメントの図形を画像ファイルとしてダウンロードして、さらに図形を理解するために使用できるようになりました。 また、レイアウト モデルでは、単一文字、ボックス化されたテキスト、および高密度のテキスト ドキュメントの向上を目的としたスキャン テキストの OCR モデルに対する機能強化も備えています。
-
- Document Intelligence は、一連のドキュメントの分析を支援するバッチ分析操作のサポートを追加したため、開発者エクスペリエンスが簡素化され、効率が向上しました。
-
- クエリ フィールド AI の抽出の品質は、最新のモデルで改善されています。
2024 年 5 月
Document Intelligence Studio では、Microsoft Entra (旧称 Azure Active Directory) 認証のサポートが追加されました。 詳細については、「Document Intelligence Studio の概要」を参照してください。
2024 年 2 月
Document Intelligence 2024-07-31-preview REST API を使用できるようになりました。 このプレビュー版の API には、次の新機能と更新機能が導入されています。
パブリック プレビュー バージョン 2024-07-31-preview は、現在、次の Azure リージョンでのみ使用できます。
- 米国東部
- 米国西部 2
- "西ヨーロッパ"
レイアウト モデル では、図の検出 がサポートされ、階層型ドキュメント構造分析 (セクションとサブセクション) ができるようになりました。 読み取り順序と論理ロール検出の AI 品質も向上しています。
-
- カスタム抽出モデルで、セル、行、テーブル レベルの信頼度スコアがサポートされるようになりました。 テーブル、行、セルの信頼度についての詳細情報。
- カスタム抽出モデルでは、フィールド抽出の AI 品質が向上しています。
- カスタム テンプレート抽出モデルで、重複するフィールドの抽出がサポートされるようになりました。 重複するフィールドとその使用方法の詳細情報。
-
- カスタム分類モデルでは、追加されたサンプルまたはクラスで分類子モデルを更新する必要があるシナリオでの、増分トレーニングをサポートするようになりました。 増分トレーニングについての詳細情報。
- カスタム分類モデルに、Office ドキュメントの型 (.docx、.pptx、.xls) のサポートが追加されました。 ドキュメントの型のサポート拡張についての詳細情報。
-
- 以下の新しいロケールをサポートします。
ロケール コード アラビア語 ( ar
)ブルガリア語 ( bg
)ギリシャ語 ( el
)ヘブライ語 ( he
)マケドニア語 ( mk
)ロシア語 ( ru
)セルビア系キリル語 ( sr-cyrl
)ウクライナ語 ( uk
)タイ語 ( th
)トルコ語 ( tr
)ベトナム語 ( vi
)- 新しい通貨コードをサポート:
通貨 Locale コード BAM
ボスニア兌換マルク ( ba
)BGN
ブルガリア レフ ( bg
)ILS
イスラエル新シェケル ( il
)MKD
マケドニア ディナール ( mk
)RUB
ロシア ルーブル ( ru
)THB
タイ バーツ ( th
)TRY
トルコ リラ ( tr
)UAH
ウクライナ フリヴニャ ( ua
)VND
ベトナム ドン ( vn
)- 税項目で、ドイツ (
de
)、スペイン (es
)、ポルトガル (pt
)、英語圏カナダen-CA
を拡張サポートしました。
-
- 欧州連合 ID と運転免許証のフィールド サポートが拡張されました。
-
- 統一住宅ローン申請書 (フォーム 1003) から情報を抽出します。
- 統一引受転送概要書またはフォーム 1008 から、情報を抽出します。
- 住宅ローンの決算開示から情報を抽出します。
-
- 銀行カードから情報を抽出します。
-
- 結婚証明書から情報を抽出するため新たに事前構築。
2023 年 12 月
REST API 2023-10-31-preview を対象とした Document Intelligence クライアント ライブラリを使用できるようになりました。
2023 年 11 月
Document Intelligence 2023-10-31-preview REST API を使用できるようになりました。 このプレビュー版の API には、次の新機能と更新機能が導入されています。
パブリック プレビュー バージョン 2023-10-31-preview は、現在、次の Azure リージョンでのみ使用できます。
- 米国東部
- 米国西部 2
- "西ヨーロッパ"
-
- 手書き入力用の言語の拡大: ロシア語 (
ru
)、アラビア語 (ar
)、タイ語 (th
)。 - サイバー エグゼクティブ オーダー (EO) へのコンプライアンス。
- 手書き入力用の言語の拡大: ロシア語 (
-
- Office ファイルと HTML ファイルをサポートします。
- マークダウンでの出力のサポート。
- テーブルの抽出、読み取り順序、セクション見出し検出の機能強化。
- Document Intelligence 2023-10-31-preview では、一般的なドキュメント モデル (事前構築済みドキュメント) が非推奨になりました。 今後、キーと値のペアを抽出するには、オプションのクエリ文字列パラメーター
features=keyValuePairs
が有効になっているprebuilt-layout
モデルを使用してください。
-
- すべての価格関連フィールドの通貨が抽出されるようになりました。
-
- メディケアとメディケイド情報の新しいフィールドのサポート。
-
- 新しい 1099 税モデル。 ベース 1099 フォームと、バリエーション (A、B、C、CAP、DIV、G、H、INT、K、LS、LTC、MISC、NEC、OID、PATR、Q、QA、R、S、SA、SB) 。
-
KVK
フィールドのサポート。BPAY
フィールドのサポート。- フィールドに関する多くの微調整。
-
- 多言語ドキュメントのサポート。
- 新しいページ分割オプション: 自動分割、常にページごとに分割、分割なし。
Note
2022-08-31 API の一般提供 (GA) リリースに伴い、関連するプレビュー API は非推奨とされます。 2021-09-30-preview、2022-01-30-preview、または 2022-06-30-preview API バージョンを使用している場合は、2022-08-31 API バージョンをターゲットとするようにアプリケーションを更新してください。 いくつかのマイナー変更が必要です。詳細については、「移行ガイド」を参照してください。
2023 年 7 月
Note
Form Recognizer は Azure AI Document Intelligence になりました。
- ドキュメント、Azure AI サービスには、以前 Cognitive Services および Azure Applied AI Services と呼ばれていたものすべてが含まれています。
- 価格に変更はありません。
- Cognitive Services および Azure Applied AI という名前は、Azure の課金、コスト分析、価格表、および Price API で引き続き使用されます。
- アプリケーション プログラミング インターフェイス (API) やクライアント ライブラリに破壊的変更はありません。
- 一部のプラットフォームでは、まだ名前が更新されていません。 ドキュメントで Form Recognizer または Document Intelligence に言及している場合は、同じ Azure サービスを参照しています。
Document Intelligence v3.1 (GA)
Document Intelligence バージョン 3.1 API が一般提供 (GA) されました。 API のバージョンは 2023-07-31
に対応しています。
v3.1 API には、新機能と更新機能が導入されています。
- Document Intelligence API ではモジュール性が高まり、オプション機能がサポートされています。 必要な機能を具体的に含むように出力をカスタマイズできるようになりました。 省略可能なパラメーターの詳細を参照してください。
- 1 つのファイルを個々のドキュメントに分割するためのドキュメント分類 API。 ドキュメント分類に関する詳細情報。
- 事前構築済みコントラクト モデル。
- 事前構築済みの米国 1098 税フォーム モデル。
- Read API を使用した Office ファイルの種類のサポート。
- ドキュメント内のバーコード認識。
- 数式認識アドオン機能。
- フォント認識アドオン機能。
- 高解像度ドキュメントのサポート。
- カスタム ニューラル モデルでは、トレーニングにラベル付けされたサンプルが 1 つ必要になりました。
- カスタム ニューラル モデルの言語の増加。 30 の言語でドキュメントのニューラル モデルをトレーニングします。 サポートされている言語の完全な一覧については、言語サポートを参照してください。
- 🆕 事前構築済みの医療保険カード モデル
- 事前構築済みの請求書モデルのロケールの増加。
- 100 を超える言語がサポートされている事前構築済みのレシート モデルの言語とロケールの増加。
- 事前構築済み ID モデルで、ヨーロッパの ID がサポートされるようになりました。
Document Intelligence Studio UX 更新プログラム
✔️ 分析オプション
Document Intelligence では、より高度な分析機能がサポートされるようになりました。Studio では、アドオン機能を簡単に構成するための 1 つのエントリ ポイント ([分析オプション] ボタン) を使用できます。
ドキュメント抽出シナリオに応じて、分析範囲、ドキュメント ページ範囲、オプションの検出、プレミアム検出機能を構成します。
Note
Document Intelligence Studio では、フォントの抽出は視覚化されません。 ただし、フォントの検出結果については JSON 出力のスタイル セクションで確認できます。
✔️ 事前構築済みモデルまたは独自のモデルのいずれかを使用してドキュメントに自動ラベル付けする
カスタム抽出モデル ラベル付けページで、Document Intelligent Service の事前構築済みモデルまたは自分が以前にトレーニングしたモデルのいずれかを使用して、ドキュメントの自動ラベル付けが行えるようになりました。
一部のドキュメントでは、自動ラベル付けを実行した後に重複ラベルが存在する場合があります。 後でラベル付けページでラベルが重複しないように、ラベルを変更してください。
✔️ 自動ラベル付けテーブル
カスタム抽出モデルのラベル付けページで、手動でテーブルにラベル付けしなくても、ドキュメント内のテーブルに自動ラベル付けできるようになりました。
✔️ テスト ファイルをトレーニング データセットに直接追加する
カスタム抽出モデルをトレーニングしたら、テスト ページを使用して、必要に応じてテスト ドキュメントをトレーニング データセットにアップロードすることで、モデルの品質を改善します。
一部のラベルに対して低い信頼度スコアが返される場合は、ラベルが正しいことを確認します。 正しくない場合は、モデルの品質を改善するために、それらをトレーニング データセットに追加し再ラベル付けを行います。
✔️ カスタム プロジェクトでドキュメント リスト オプションとフィルターを使用する
カスタム抽出モデルのラベル付けページを使用します。 検索、フィルター、並べ替えを使用することで、トレーニング ドキュメント間を簡単に移動できるようになりました。
グリッド ビューを使用してドキュメントをプレビューするか、リスト ビューを使用してドキュメント内をより簡単にスクロールできます。
✔️ プロジェクト共有
- カスタム抽出プロジェクトを簡単に共有できます。 詳細については、「プロジェクト共有とカスタム モデル」を参照してください。
2023 年 5 月
Build 2023 で更新されたドキュメントの紹介
🆕 Document Intelligence の概要では、ナビゲーションが強化され、アクセス ポイントが体系化され、イメージがエンリッチされました。
🆕 Document Intelligence モデルの選択は、プロジェクトとワークフローに最適な Document Intelligence ソリューションを選ぶためのガイダンスを提供します。
2023 年 4 月
最新の Document Intelligence クライアント ライブラリのパブリック プレビュー リリースの発表
Document Intelligence REST API バージョン 2023-02-28-preview では、パブリック プレビュー リリースのクライアント ライブラリがサポートされています。 このリリースには、.NET/C# (4.1.0-beta-1)、Java (4.1.0-beta-1)、JavaScript (4.1.0-beta-1)、Python (3.3.0b.1) クライアント ライブラリ で使用できる次の新機能が含まれています。
詳細については、Document Intelligence SDK (パブリック プレビュー)、および 2023 年 3 月リリースのノートを参照してください
2023 年 3 月
重要
2023-02-28-preview
機能は現在、次のリージョンでのみご利用いただけます:
- 西ヨーロッパ
- 米国西部 2
- 米国東部
- カスタム分類モデルは、
2023-02-28-preview
API 以降の Document Intelligence の新機能です。 - 一般ドキュメント モデルに追加されたクエリ フィールド機能では、Azure OpenAI モデルを使用して、ドキュメントから特定のフィールドを抽出します。 Document Intelligence Studio を使用して、クエリ フィールドを含む一般ドキュメント機能をお試しください。 クエリ フィールドは現在、
East US
リージョンのリソースに対してのみアクティブです。 - アドオン機能:
- カスタム抽出モデルの更新:
- カスタム ニューラル モデルで、トレーニングと分析用に追加された言語がサポートされるようになりました。 オランダ語、フランス語、ドイツ語、イタリア語、スペイン語のニューラル モデルをトレーニングします。
- カスタム テンプレート モデルの署名検出機能が強化されました。
- Document Intelligence Studio 更新プログラム:
- 分類やクエリ フィールドなどのすべての新機能のサポートに加えて、Studio ではカスタム モデル プロジェクトのプロジェクト共有が可能になりました。
- 限定的なプレビューの新しいモデルとして、ワクチン接種カード、契約、米国税 1098、米国税 1098-E、米国税 1098-T が追加されました。 限定的なプレビュー モデルのアクセスを要求するには、Document Intelligence プライベート プレビュー要求フォームに入力して送信してください。
- レシート モデルの更新:
- レシート モデルでは、熱レシートのサポートが追加されました。
- レシート モデルでは、18 言語と 3 つのリージョン言語 (英語、フランス語、ポルトガル語) の言語サポートが追加されました。
- レシート モデルで
TaxDetails
抽出がサポートされるようになりました。
- レイアウト モデルでテーブル認識が改善されました。
- 読み取りモデルで、1 桁の文字認識が改善されました。
2023 年 2 月
v3.0 用の Document Intelligence コンテナーを選択できるようになりました。
現在、Read v3.0 と Layout v3.0 のコンテナーを使用できます。
詳細については、Document Intelligence コンテナーのインストールと実行に関するページを参照してください。
2023 年 1 月
事前構築済みのレシート モデル - サポートされている言語が追加されました。 レシート モデルで、これらの追加された言語とロケールがサポートされるようになりました
- 日本語 - 日本 (ja-JP)
- フランス語 - カナダ: (fr-CA)
- オランダ語 - オランダ (nl-NL)
- 英語 - アラブ首長国連邦 (en-AE)
- ポルトガル語 - ブラジル (pt-BR)
事前構築済みの請求書モデル - サポートされている言語が追加されました。 請求書モデルで、これらの追加された言語とロケールがサポートされるようになりました
- 英語 - 米国 (en-US)、オーストラリア (en-AU)、カナダ (en-CA)、英国 (en-GB)、インド (en-IN)
- スペイン語 - スペイン (es-ES)
- フランス語 - フランス (fr-FR)
- イタリア語 - イタリア (it-IT)
- ポルトガル語 - ポルトガル (pt-PT)
- オランダ語 - オランダ (nl-NL)
事前構築済みの請求書モデル - 認識されるフィールドが追加されました。 請求書モデルで、これらの追加されたフィールドが認識されるようになりました
- Currency code
- 支払いオプション
- 割引合計
- 税目 (en-IN のみ)
事前構築済みの ID モデル - サポートされているドキュメントの種類が追加されました。 ID モデルで、これらの追加されたドキュメントの種類がサポートされるようになりました
- 米国の軍 ID
ヒント
2023 年 1 月のすべての更新プログラムは、REST API バージョン 2022-08-31 (GA) で入手できます。
事前構築済みのレシート モデル — 追加の言語サポート:
事前構築済みのレシート モデルで、次の言語のサポートが追加されました。
- 英語 - アラブ首長国連邦 (en-AE)
- オランダ語 - オランダ (nl-NL)
- フランス語 - カナダ: (fr-CA)
- ドイツ語 - (de-DE)
- イタリア語 - (it-IT)
- 日本語 - 日本 (ja-JP)
- ポルトガル語 - ブラジル (pt-BR)
事前構築済みの請求書モデル - 追加の言語サポートとフィールド抽出
事前構築済みの請求書モデルで、次の言語のサポートが追加されました。
- 英語 - オーストラリア (en-AU)、カナダ (en-CA)、英国 (en-UK)、インド (en-IN)
- ポルトガル語 - ブラジル (pt-BR)
事前構築済みの請求書モデルで、次のフィールド抽出のサポートが追加されました。
- Currency code
- 支払いオプション
- 割引合計
- 税目 (en-IN のみ)
事前構築済みの身分証明書モデル - 追加の証明書の種類のサポート
事前構築済みの身分証明書モデルで、次の証明書の種類のサポートが追加されました。
- インド、カナダ、英国、オーストラリアをサポートする運転免許証の拡張
- 米国の軍 ID カードと証明書
- インドの ID カードと証明書 (PAN および Aadhaar)
- オーストラリアの ID カードと証明書 (フォト カード、Key-pass ID)
- カナダの ID カードと証明書 (ID カード、メープル カード)
- 英国の ID カードと証明書 (国/地域の ID カード)
2022 年 12 月
Document Intelligence Studio 更新プログラム
12 月の Document Intelligence Studio リリースには、Document Intelligence Studio の最新の更新プログラムが含まれています。 カスタム モデルのラベル付けサポートを中心に、ユーザー エクスペリエンスが大幅に改善されています。
ページ範囲。 Studio で、ドキュメントの指定ページの分析がサポートされるようになりました。
カスタム モデルのラベル付け
Layout API の自動実行。 カスタム モデルのセットアップ プロセスで、BLOB ストレージ内のすべてのドキュメントに対して Layout API を自動的に実行するように選択できます。
検索。 Studio に、ドキュメント内の単語を検索する検索機能が追加されました。 この改良により、ラベル付けしながらの操作が容易になります。
ナビゲーション。 ラベルを選択して、ドキュメント内のラベル付き単語をターゲットにすることができます。
テーブルの自動ラベル付け。 ドキュメント内のテーブル アイコンを選択すると、ラベル付けビューで、抽出されたテーブルの自動ラベル付けを選択できます。
ラベルのサブタイプと第 2 レベルのサブタイプ Studio で、テーブル列、テーブル行のサブタイプ、および日付や数値などの型の第 2 レベルのサブタイプがサポートされるようになりました。
カスタム ニューラル モデルの構築が、US Gov バージニア リージョンでサポートされるようになりました。
プレビュー API バージョン
2022-01-30-preview
および2021-09-30-preview
が、2023 年 1 月 31 日に廃止されます。 サービスの中断を避けるために、2022-08-31
API バージョンに更新してください。
2022 年 11 月
- Azure AI Document Intelligence ライブラリの最新の安定したリリースを発表
- このリリースには、.NET、Java、JavaScript、Python クライアント ライブラリの重要な変更と更新が含まれています。 詳細については、「Azure SDK DevBlog」を参照してください。
- 最も重要な機能強化は、
DocumentAnalysisClient
とDocumentModelAdministrationClient
の 2 つの新しいクライアントの導入です。
2022 年 10 月
Document Intelligence のバージョン管理されたコンテンツ
Document Intelligence ドキュメントが更新され、バージョン管理されたエクスペリエンスが提供されるようになりました。 これで、
v3.0 GA
エクスペリエンスまたはv2.1 GA
エクスペリエンスを対象とするコンテンツを表示することを選択できます。 v3.0 エクスペリエンスが既定です。
Document Intelligence Studio のサンプル コード
- Document Intelligence Studio ラベル付けエクスペリエンスのサンプル コードは、GitHub で使用できるようになりました。 顧客は、Document Intelligence を開発して独自の UX に統合したり、Document Intelligence Studio サンプル コードを使用して独自の新しい UX を構築したりすることができます。
言語の増加
- 最新のプレビュー リリースでは、Document Intelligence の Read (OCR)、Layout、Custom テンプレート モデルで 134 の新しい言語がサポートされています。 これらの言語の追加には、ギリシャ語、ラトビア語、セルビア語、タイ語、ウクライナ語、ベトナム語、いくつかのラテン語とキリル語が含まれます。 Document Intelligence の最新の GA と新しいプレビュー バージョンでサポートされる言語は、合計 299 個になりました。 サポートされているすべての言語については、サポートされている言語のページを参照してください。
- API または対応する SDK を使用してアプリケーションで新しい言語をサポートする場合は、REST API パラメーター
api-version=2022-06-30-preview
を使用します。
新しい事前構築済みコントラクト モデル
- パーティ、タイトル、コントラクト ID、実行日などの情報をコントラクトから抽出する新しい事前構築。 コントラクトは現在プレビュー段階です。こちらからアクセスを要求してください。
カスタム ニューラル モデルをトレーニングするためのリージョンの拡大
- カスタム ニューラル モデルのトレーニングは、追加リージョンでサポートされるようになりました。
- 米国東部
- 米国東部 2
- US Gov アリゾナ
- カスタム ニューラル モデルのトレーニングは、追加リージョンでサポートされるようになりました。
2022 年 9 月
Note
バージョン 4.0.0 以降、Document Intelligence サービスの最新機能を活用するために、新しいクライアント セットが導入されています。
SDK バージョン 4.0.0 GA リリースには、次の更新が含まれています。
- バージョン 4.0.0 GA (2022-09-08)
- REST API v3.0 および v2.0 クライアントをサポート
カスタム ニューラル モデルをトレーニングするための領域拡張が、6 つの新しい領域でサポートされるようになりました
- オーストラリア東部
- 米国中部
- 東アジア
- フランス中部
- 英国南部
- 米国西部 2
トレーニングがサポートされているリージョンの完全な一覧については、カスタム ニューラル モデルに関する記事を参照してください。
Document Intelligence SDK のバージョン
4.0.0 GA
リリース:- Document Intelligence クライアント ライブラリ バージョン 4.0.0 (.NET/C#、Java、JavaScript) とバージョン 3.2.0 (Python) が一般公開され、実稼働アプリケーションで使用できます。
- Document Intelligence クライアント ライブラリの詳細については、SDK の概要に関するページを参照してください。
- プログラミング言語の移行ガイドを使用してアプリケーションを更新します。
2022 年 8 月
Document Intelligence SDK ベータ版 2022 年 8 月のプレビュー リリースには、次の更新が含まれています。
バージョン 4.0.0-beta.5 (2022-08-09)
Document Intelligence v3.0 の一般提供
- Document Intelligence REST API v3.0 が一般公開され、運用アプリケーションで使用できるようになりました。 REST API バージョン 2022-08-31 でアプリケーションを更新してください。
Document Intelligence Studio 更新プログラム
- 次の手順。 Studio の各モデル ページの下に、[次の手順] セクションが追加されました。 ユーザーは、サンプル コード、トラブルシューティング ガイドライン、価格情報をすばやく参照できます。
- カスタム モデル。 Studio には、ラベル付けの効率を向上させるために、カスタム モデル プロジェクトでラベルを並べ替える機能が含まれるようになりました。
- モデルのコピー: カスタム モデルは、Studio 内から Document Intelligence サービス間でコピーできます。 この操作により、トレーニング済みのモデルを他の環境やリージョンに昇格できます。
- ドキュメントの削除。 Studio では、カスタム プロジェクト内のラベル付きデータセットからドキュメントを削除できるようになりました。
Document Intelligence サービス更新プログラム
- prebuilt-read。 Read OCR モデルは Document Intelligence でも使用できるようになり、2 つの新機能として、段落と言語検出を備えています。 Document Intelligence の読み取りは、Document Intelligence のより広範なドキュメント インテリジェンス機能に合わせた高度なドキュメント シナリオを対象とします。
- 事前構築済みレイアウト。 レイアウト モデルでは、段落が抽出され、抽出されたテキストが段落、タイトル、セクション見出し、脚注、ページ ヘッダー、ページ フッター、またはページ番号のいずれであるかが抽出されます。
- 事前構築済みの請求書。 TotalVAT フィールドと Line/VAT フィールドが、それぞれ既存のフィールド TotalTax と Line/Tax に解決されるようになりました。
- 事前構築済みの ID ドキュメント。 データ抽出で、米国の州 ID、社会保障、グリーン カードがサポートされます。 パスポート ビザ情報がサポートされます。
- 事前構築済みのレシート。 フランス語 (fr-FR)、スペイン語 (es-ES)、ポルトガル語 (pt-PT)、イタリア語 (it-IT)、ドイツ語 (de-DE) のロケール サポートが拡張されました。
- 事前構築済みの名刺。 住所、市区町村、都道府県、国および地域、郵便番号などの住所コンポーネントのサブフィールドを抽出するためのアドレス解析のサポート。
AI 品質の改善
- prebuilt-read。 単一文字、手書きの日付、金額、名前、領収書や請求書でよく見られるその他キー データのサポートが強化され、デジタル PDF ドキュメントの処理が改善されました。
- 事前構築済みレイアウト。 トリミングされたテーブルの検出、罫線のないテーブルの検出、長いスパンセルの認識の向上をサポートします。
- 事前構築済みドキュメント。 値とチェック ボックスの検出が改善されました。
- カスタム ニューラル。 テーブルの検出と抽出の精度が向上しました。
2022 年 6 月
- Document Intelligence SDK ベータ版 2022 年 6 月のプレビュー リリースには、次の更新プログラムが含まれています。
バージョン 4.0.0-beta.4 (2022-06-08)
6 月の Document Intelligence Studio のリリースは、Document Intelligence Studio の最新の更新プログラムです。 この更新プログラムでは、ユーザー エクスペリエンスとユーザー補助に関するかなりの機能強化が行われました。
- JavaScript と C# のコード サンプル。 既にある Python のコード サンプルに加え、JavaScript と C# コード サンプルが Studio の [コード] タブに追加されました。
- 新しいドキュメント アップロード UI。 Studio では、ドキュメントを新しいアップロード ユーザー インターフェイスにドラッグ アンド ドロップしてアップロードできるようになりました。
- カスタム プロジェクトの新機能。 カスタム プロジェクトでは、プロジェクトの構成時にストレージ アカウントと BLOB の作成ができるようになりました。 さらに、カスタム プロジェクトでは、Studio 内でのトレーニング ファイルの直接アップロードや、既存のカスタム モデルのコピーができるようになりました。
Document Intelligence v3.0 2022 年 6 月 30 日プレビュー リリースでは、機能 API 全体に広範な更新が行われています。
- レイアウトでは、構造の抽出が拡張されています。 レイアウトに、セクション、セクション ヘッダー、段落などの構造要素が追加されています。 この更新プログラムを使用すると、ドキュメントのセグメント化シナリオをより詳細に設定できます。 識別された構造要素の完全な一覧については、拡張構造に関するページを参照してください。
- カスタム ニューラル モデルの表形式フィールドがサポートされます。 カスタム ドキュメント モデルで表形式フィールドがサポートされるようになりました。 既定では、表形式フィールドも複数ページです。 カスタム ニューラル モデルの表形式フィールドの詳細については、表形式フィールドに関するページを参照してください。
- カスタム テンプレート モデルの表形式フィールドでは、ページ間テーブルがサポートされます。 カスタム フォーム モデルで、ページ間の表形式フィールドがサポートされるようになりました。 カスタム テンプレート モデルの表形式フィールドの詳細については、表形式フィールドに関するページを参照してください。
- 請求書モデルの出力に、一般的なドキュメントのキーと値のペアが含まれるようになりました。 請求書に、事前構築済みモデルに含まれるフィールド以外の必須フィールドが含まれている場合、一般的なドキュメント モデルでは、キーと値のペアで出力が補完されます。 「キーと値のペア」を参照してください。
- 請求書言語の拡張。 請求書モデルには、拡張された言語サポートが含まれています。 サポートされている言語に関するページを参照してください。
- 事前構築済みの名刺に、日本語サポートが含まれるようになりました。 サポートされている言語に関するページを参照してください。
- 事前構築済みの ID ドキュメント モデル。 ID ドキュメント モデルで、米国の運転免許証から DateOfIssue、Height、Weight、EyeColor、HairColor、DocumentDiscriminator が抽出されるようになりました。 「フィールドの抽出」を参照してください。
- 読み取りモデルで、一般的な Microsoft Office ドキュメントの種類がサポートされるようになりました。 Word (docx)、Excel (xlsx)、PowerPoint (pptx) などのドキュメントの種類が、Read API でサポートされるようになりました。 読み取りデータ抽出に関するページを参照してください。
2022 年 2 月
バージョン 4.0.0-beta.3 (2022-02-10)
Document Intelligence v3.0 プレビュー リリースでは、いくつかの新機能、機能と機能強化が導入されています。
- カスタム ニューラル モデルまたはカスタム ドキュメント モデルは、構造化フォーム、半構造化ドキュメント、非構造化ドキュメントからテキストと選択マークを抽出する、新しいカスタム モデルです。
- W-2 事前構築済みモデル は、税務報告および所得検証シナリオのために W-2 フォームからフィールドを抽出するための新しい事前構築モデルです。
- 読み取り API は、印刷されたテキスト行、単語、テキスト位置、検出された言語、および手書きテキストを抽出します (検出された場合)。
- 一般的なドキュメント事前トレーニング済みモデルが更新され、フォームとドキュメントからの API テキスト、テーブル、構造、キーと値のペアに加えて、選択マークがサポートされます。
- Invoice API 請求書の事前構築済みモデルは、スペイン語の請求書もサポートするように拡張されています。
- Document Intelligence Studio では、Read、W2、Hotel のレシート サンプルの新しいデモと、新しいカスタム ニューラル モデルのトレーニングのサポートが追加されます。
- 言語拡張: Document Intelligence の読み取り、レイアウト、カスタム フォームでは、アラビア語、ヒンディ語、およびアラビア文字とデーヴァナーガリー文字を使用したその他の言語を含む 42 の新しい言語のサポートが追加され、164 の言語に範囲が広がっています。 手書き言語のサポートが、日本語と韓国語に拡張されています。
新しい v3.0 プレビュー API の使用を開始します。
Document Intelligence モデルのデータ抽出:
モデル テキストの抽出 キーと値のペア 選択マーク テーブル シグネチャ Read ✓ 一般ドキュメント ✓ ✓ ✓ ✓ Layout ✓ ✓ ✓ 請求書 ✓ ✓ ✓ ✓ Receipt ✓ ✓ ✓ 身分証明書 ✓ ✓ 名刺 ✓ ✓ カスタム テンプレート ✓ ✓ ✓ ✓ ✓ カスタム ニューラル ✓ ✓ ✓ ✓ Document Intelligence SDK ベータ版のプレビュー リリースには、次の更新プログラムが含まれています。
-
- カスタム テンプレート (以前のカスタム フォーム)。
- カスタム ニューラル
- カスタム モデル - ビルド モード
W-2 事前構築済みモデル (prebuilt-tax.us.w2)。
読み取り事前構築済みモデル (prebuilt-read)。
請求書の事前構築済みモデル (スペイン語) (prebuilt-invoice)。
-
2021 年 11 月
バージョン 4.0.0-beta.2 (2021-11-09)
- Document Intelligence v3.0 プレビュー SDK リリース更新プログラム (ベータ 2) には、バグ修正とマイナーな機能更新プログラムが組み込まれています。
2021 年 10 月
Document Intelligence v3.0 プレビュー リリース バージョン 4.0.0-beta.1 (2021 年 10 月 7 日) では、いくつかの新機能が導入されています
一般的なドキュメント モデルは新しい API であり、事前トレーニング済みのモデルを使用して、フォームとドキュメントからテキスト、テーブル、構造、キーと値のペアを抽出します。
ホテルの領収書モデルが、構築済みの受信確認処理に追加されました。
身分証明書の展開されたフィールド ID モデルでは、米国の運転免許証からの署名、制限、車両分類の抽出がサポートされています。
署名フィールドは、フォーム フィールド内の署名の有無を検出するカスタム フォームの新しいフィールドの種類です。
言語の展開 122 言語 (印刷) と 7 言語 (手書き) のサポート。 Document Intelligence のレイアウトとカスタム フォームでは、最新のプレビューでサポートされる言語が 122 個に拡大されました。 このプレビューには、49 個の新しい言語 (ロシア語、ブルガリア語、その他のキリル語系やラテン語系など) での印刷テキストに対するテキスト抽出が含まれています。 また、手書きテキストの抽出では、英語を含む 7 個の言語と、新たに簡体字中国語、フランス語、ドイツ語、イタリア語、ポルトガル語、スペイン語の新しいプレビューがサポートされるようになりました。
テーブルとテキスト抽出の機能強化 レイアウトは、キーと値のテーブルとも呼ばれる単一行テーブルの抽出をサポートするようになりました。 テキスト抽出の機能強化には、デジタル PDF や身分証明書内の機械可読ゾーン (MRZ) テキストの処理の向上、全般的なパフォーマンスの向上が含まれます。
Document Intelligence Studio サービスの使用を簡単にするために、Document Intelligence Studio にアクセスして、さまざまな事前構築済みモデルをテストしたり、カスタム モデルにラベルを付けてトレーニングしたりすることができるようになりました。
Document Intelligence モデルのデータ抽出
モデル テキストの抽出 キーと値のペア 選択マーク テーブル 一般ドキュメント ✓ ✓ ✓ ✓ Layout ✓ ✓ ✓ 請求書 ✓ ✓ ✓ ✓ Receipt ✓ ✓ 身分証明書 ✓ ✓ 名刺 ✓ ✓ Custom ✓ ✓ ✓ ✓
2021 年 9 月
Azure portal の Document Intelligence リソースの概要ページで、Azure メトリックス エクスプローラーの高度な機能を使用できます。
監視メニュー:
グラフ:
身分証明書モデルの更新: サフィックスを含む名前がある場合、ピリオド (フル ストップ) の有無にかかわらず、正常に処理されます。
入力テキスト 更新された結果 William Isaac Kirby Jr. FirstName: William Isaac
LastName: Kirby Jr.Henry Caleb Ross Sr FirstName: Henry Caleb
LastName: Ross Sr.
2021 年 7 月
- システム割り当てマネージド ID のサポート: システム割り当てマネージド ID を有効にして、プライベート ストレージ アカウントへの制限付きアクセスを Document Intelligence に許可できるようになりました。これには、Virtual Network またはファイアウォールで保護されているアカウントや、BYOS (Bring Your Own Storage) が有効になっているアカウントが含まれます。 詳細については、Document Intelligence リソース用のマネージド ID を作成して使用する方法に関するページを参照してください。
2021 年 6 月
Document Intelligence コンテナー v2.1 はゲート プレビューでリリースされ、レイアウト、名刺、ID ドキュメント、領収書、請求書、カスタムの 6 つの機能コンテナーでサポートされるようになりました。 これらを使用するには、オンライン リクエストを送信し、承認を受ける必要があります。
プレビューでリリースされた Document Intelligence コネクタ: Document Intelligence コネクタは、Azure Logic Apps、Microsoft Power Automate、および Microsoft Power Apps と統合されます。 このコネクタは、カスタムおよび事前構築済みのフォーム、請求書、レシート、名刺、身分証明書から、ドキュメントのデータと構造を抽出および分析するワークフローのアクションとトリガーをサポートしています。
Document Intelligence SDK v3.1.0 に、C#、Java、Python 用のパッチが適用され、v3.1.1 になりました このパッチは、
FormField
にText
があるがBoundingBox
やPage
の情報がないなど、サブ行項目フィールドが検出されない請求書に対処しています。
2021 年 5 月
- バージョン 3.1.0 (2021-05-26)
Document Intelligence 2.1 は一般提供されています。 GA リリースは、以前の 2.1 プレビュー パッケージ バージョンで導入された変更の安定性を示しています。 このリリースでは、次の種類のドキュメントから情報とデータを検出して抽出することができます。
開始するには、Document Intelligence サンプル ツールを試し、クイック スタートに従ってください。
更新された Layout API テーブル機能では、複数の行にまたがることができる列ヘッダーを使用してヘッダーが認識されます。 各テーブル セルには、ヘッダーの一部であるかどうかを示す属性があります。 この更新は、テーブル ヘッダーを構成する行を識別するために使用できます。
2021 年 4 月
NuGet パッケージ バージョン 3.1.0-ベータ.4
身分証明書のデータ分析用の新しいメソッド:
StartRecognizeIdDocumentsFromUriAsync
StartRecognizeIdDocumentsAsync
フィールド値の一覧については、Document Intelligence ドキュメントの抽出されるフィールドに関するセクションを参照してください。
StartRecognizeContent メソッドに指定できるドキュメント言語のセットが拡大されました。
新しいプロパティ
Pages
が次のクラスでサポートされました:RecognizeBusinessCardsOptions
RecognizeCustomFormsOptions
RecognizeInvoicesOptions
RecognizeReceiptsOptionsPages
プロパティを使用すると、複数のページがある PDF および TIFF ドキュメントの個々のページまたはページの範囲を選択できます。 個々のページの場合は、「3
」のようにページ番号を入力します。 ページの範囲 (ページ 2 とページ 5 - 7 など) の場合は、「2, 5-7
」のようにページ番号と範囲をコンマで区切って入力します。新しいプロパティ
ReadingOrder
が次のクラスでサポートされました:ReadingOrder
プロパティは省略可能なパラメーターであり、これを使用すると、テキスト要素の抽出順序を決めるために、basic
またはnatural
のどちらの読み取り順序アルゴリズムを適用するかを指定できます。 指定しない場合は、既定値のbasic
が使用されます。
- API バージョン
2.1-preview.3
の SDK プレビューの更新では、機能の更新と機能強化が導入されています。
2021 年 3 月
Document Intelligence v2.1 パブリック プレビュー v2.1-preview.3 がリリースされ、次の機能が含まれています。
新しい事前構築済み ID モデル 新しい事前構築済み ID モデルを使用すると、お客様は ID を取得して構造化データを返し、処理を自動化できます。 強力な光学式文字認識 (OCR) 機能と ID 理解モデルを組み合わせて、パスポートと米国の運転免許証から重要な情報を抽出します。
請求書モデルの品目抽出 - 事前構築済み請求書モデルは品目抽出をサポートするようになりました。完全な項目とその一部 (説明、金額、数量、製品 ID、日付など) が抽出されるようになりました。 簡単な API または SDK の呼び出しにより、請求書から有用なデータ (テキスト、テーブル、キーと値のペア、品目) を抽出できます。
監視対象テーブルのラベル付けとトレーニング、空の値のラベル付け - Document Intelligence の最先端のディープ ラーニング自動テーブル抽出機能に加えて、お客様がテーブルに対してラベル付けとトレーニングを行えるようになりました。 この新しいリリースには、品目とテーブル (動的と固定) にラベルを付けてトレーニングし、キーと値のペアと品目を抽出するカスタム モデルをトレーニングする機能が含まれています。 モデルのトレーニングが完了すると、モデルにより documentResults セクションの JSON 出力の一部として品目が抽出されます。
テーブルにラベルを付けるだけでなく、空の値と領域にラベルを付けることができるようになりました。 トレーニング セット内の一部のドキュメントに特定のフィールドの値がない場合、それらにラベルを付けることで、分析対象のドキュメントから値を適切に抽出するようにモデルに認識させることができます。
66 の新しい言語のサポート - Document Intelligence の Layout API とカスタム モデルは 73 の言語をサポートするようになりました。
自然な読み取り順序、手書きの分類、およびページ選択 - この更新により、既定の左から右、また上から下の順序ではなく、自然な読み取り順序でテキスト行の出力を取得することを選択できます。 新しい readingOrder クエリ パラメーターを使用して "自然な" 値に設定すると、より人間にとってわかりやすい読み取り順序の出力が得られます。 さらに、ラテン系言語の場合、Document Intelligence により、テキスト行が手書きスタイルかどうかが分類され、信頼スコアが与えられます。
事前構築済み領収書モデルの品質改善 この更新には、特に品目の抽出に関する、事前構築済み領収書モデルの品質改善が多数含まれています。
2020 年 11 月
Document Intelligence v2.1-preview.2 がリリースされ、次の機能が含まれています。
新しい事前構築済み請求書モデル - 新しい事前構築済み請求書モデルにより、お客様はさまざまな形式で請求書を取得し、構造化されたデータを返して、請求書の処理を自動化することができます。 強力な光学式文字認識 (OCR) 機能と、請求書を解釈するディープ ラーニング モデルを組み合わせて、英語の請求書から重要な情報を抽出します。 顧客、仕入先、請求書 ID、請求書の期限、合計、請求額、課税額、出荷先、請求先などの重要なテキスト、テーブル、情報が抽出されます。
強化されたテーブル抽出 - Document Intelligence によって、強力な光学式文字認識 (OCR) 機能とディープ ラーニング テーブル抽出モデルを組み合わせた拡張テーブル抽出が提供されるようになりました。 Document Intelligence では、テーブル (結合された列、行、境界線を含む複雑なテーブルなど) からデータを抽出できます。
クライアント ライブラリの更新 - .NET、Python、Java、JavaScript 用のクライアント ライブラリの最新バージョンでは、Document Intelligence 2.1 API がサポートされています。
新たに日本語をサポート -
AnalyzeLayout
とAnalyzeCustomForm
で新たに日本語 (ja
) がサポートされます。 言語サポート。テキスト行のスタイルの表示 (手書き/その他) (ラテン言語のみ) - Document Intelligence では、信頼度スコアと共に、各テキスト行が手書きスタイルであるかどうかを分類する
appearance
オブジェクトが出力されるようになりました。 この機能は、ラテン語系の言語でのみサポートされています。品質の向上 - 1 桁の抽出の改善を含め、抽出の品質が向上しました。
Document Intelligence のサンプル ラベル付けツールの新しい試用機能 - Document Intelligence サンプル ラベル付けツールを使用して、事前作成された請求書、領収書、およびビジネス カード モデルと Layout API を試すことができます。 コードを記述することなく、データがどのように抽出されるかを確認してください。
Document Intelligence サンプル ラベル付けツールを試す
- フィードバック ループ - サンプル ラベル付けツールを使用してファイルを分析するときに、それをトレーニング セットに追加し、必要に応じてラベルを調整して、モデルを改善するためにトレーニングできるようになりました。
- ドキュメントの自動ラベル付け - プロジェクト内のラベル付けされた以前のドキュメントに基づいて、追加のドキュメントが自動的にラベル付けされます。
2020 年 8 月
**Document Intelligence
v2.1-preview.1
には、次の機能が含まれています。- REST API リファレンスが利用可能です。
v2.1-preview.1 reference
を参照。 - 英語の他に新たに言語をサポート。
Layout
とTrain Custom Model
で新たに、英語 (en
)、簡体中国語 (zh-Hans
)、オランダ語 (nl
)、フランス語 (fr
)、ドイツ語 (de
)、イタリア語 (it
)、ポルトガル語 (pt
)、スペイン語 (es
) の各言語がサポートされます。 - チェックボックス、選択マークの検出 – Document Intelligence では、チェックボックスやオプション ボタンなどの選択マークの検出および抽出がサポートされています。 選択マークは
Layout
で抽出されます。また、Train Custom Model
- [ラベルを使用したトレーニング] でラベル付けおよびトレーニングを行って、選択マーク用のキーと値のペアを抽出することもできるようになりました。 - [モデルの作成] を使用すると、1 つのモデル ID で複数のモデルを構成して呼び出すことができます。 作成済みのモデル ID を使用して分析するドキュメントを送信すると、分類ステップが最初に実行され、適切なカスタム モデルにルーティングされます。 モデルの作成は、
Train Custom Model
-Train Custom Model
で使用できます。 - モデル名。管理と追跡が容易になるように、カスタム モデルにわかりやすい名前を追加します。
- 新しく事前に構築された名刺のモデル。英語の名刺内の共通のフィールドを抽出するためのものです。
- 事前構築レシートの新しいロケールが、EN-US に加えて、en-au、en-ca、en-gb、en-in でもサポートされ、利用が可能になりました。
- 品質向上。
Layout
、Train Custom Model
- [ラベルを使用しないトレーニング]、および [ラベルを使用したトレーニング] が対象となります。
- REST API リファレンスが利用可能です。
v2.0 には、次の更新が含まれています。
- NET、Python、Java、JavaScript 用のクライアント ライブラリは一般提供されています。
新しいサンプルは GitHub で入手できます。
- 知識抽出レシピ - Forms Playbook では、Document Intelligence の実際のカスタマー エンゲージメントからベスト プラクティスが収集され、これらのプロジェクトの開発時に使用する便利なコード サンプル、チェックリスト、およびサンプル パイプラインが提供されます。
- サンプル ラベル付けツールが更新され、新しい v2.1 機能がサポートされるようになりました。 ツールの概要については、こちらのクイックスタートを参照してください。
- インテリジェント キオスク Document Intelligence サンプルでは、
Analyze Receipt
とTrain Custom Model
- [ラベルを使用しないトレーニング] を統合する方法について示します。
2020 年 7 月
- Document Intelligence v2.0 リファレンスが使用可能 - v2.0 API リファレンスと、.NET、Python、Java、および JavaScript 用のアップデートされたクライアント ライブラリを参照できます。
テーブルの機能強化と抽出の機能強化には、精度の向上とテーブル抽出の機能強化が含まれています。特に、"ラベルのないカスタム トレーニング" でテーブルのヘッダーと構造を学習する機能が追加されています。
通貨のサポート - グローバル通貨記号の検出と抽出。
Azure Gov - Document Intelligence が、Azure Gov でも使用できるようになりました。
強化されたセキュリティ機能:
- Bring Your Own Key - Document Intelligence は、クラウドに永続化されたときにデータを自動的に暗号化して保護し、セキュリティとコンプライアンスに関する組織のコミットメントを満たすのに役立つようにします。 サブスクリプションでは、Microsoft が管理する暗号化キーが既定で使用されます。 ユーザー独自の暗号化キーを使用してサブスクリプションを管理することもできるようになりました。 カスタマー マネージド キー (Bring Your Own Key (BYOK) とも呼ばれます) を使用すると、アクセス制御の作成、ローテーション、無効化、取り消しを、いっそう柔軟に行うことができます また、データを保護するために使われる暗号化キーを監査することもできます。
- プライベート エンドポイント – 仮想ネットワークを使用して、Private Link を介してデータに安全にアクセスできるようになります。
2020 年 6 月
- クライアント ライブラリへの CopyModel API の追加 - クライアント ライブラリを使用して、サブスクリプション間でモデルをコピーできるようになりました。 この機能の全般的な情報については、モデルのバックアップと復旧に関する記事を参照してください。
- Azure Active Directory の統合 - Azure AD の資格情報を使用して、クライアント ライブラリで Document Intelligence クライアント オブジェクトを認証できるようになりました。
- SDK 固有の変更 - この変更には、小さな機能追加と破壊的な変更の両方が含まれます。 詳細については、SDK の変更ログを参照してください。
2020 年 4 月
- Document Intelligence API v2.0 パブリック プレビューの SDK サポート - 今月、サービス サポートが拡張され、Document Intelligence v2.0 リリースのプレビュー SDK が含まれるようになりました。 以下のリンクを使用して、任意の言語で作業を開始してください。
- .NET SDK
- Java SDK
- Python SDK
- JavaScript SDK
新しい SDK では、Document Intelligence 用の v2.0 REST API のすべての機能がサポートされています。 クライアント ライブラリに関するフィードバックは、SDK フィードバック フォームを通じて共有できます。
カスタム モデルのコピー 新しいカスタム モデルのコピー機能を使用して、リージョン間やサブスクリプション間でモデルをコピーできるようになりました。 Copy Custom Model API を呼び出す前に、まずターゲット リソースにコピーするための認可を取得する必要があります。 この認可は、ターゲット リソース エンドポイントに対してコピー認可操作を呼び出すとセキュリティ保護されます。
コピー承認 REST API の生成。
カスタム モデル REST API のコピー。
セキュリティの強化。
FormRecognizer でカスタマー マネージド キーが利用できるようになりました。 詳細については、「Document Intelligence による保存データの暗号化」を参照してください。
Azure Active Directory を使用した Azure リソースへのアクセスにマネージド ID を使用します。 詳細については、マネージド ID に対するアクセスの承認に関するページを参照してください。
2020 年 3 月
- ラベル付けの値の種類 Document Intelligence サンプル ラベル付けツールを使用して、ラベル付けする値の種類を指定できるようになりました。 現在、次の値の型とバリエーションがサポートされています。
string
- 既定値、
no-whitespaces
、alphanumeric
- 既定値、
number
- 既定値、
currency
- 既定値、
date
- 既定値、
dmy
、mdy
、ymd
- 既定値、
time
integer
この機能の使用方法については、サンプル ラベル付けツール ガイドを参照してください。
テーブルの視覚化 サンプル ラベル付けツールで、ドキュメントで認識されたテーブルが表示されるようになりました。 この機能により、ラベル付けおよび分析を行う前に、ドキュメントから認識されて抽出されたテーブルを表示できます。 この機能は、レイヤー オプションを使用してオンとオフを切り替えることができます。
次の図に、テーブルが認識されて抽出される方法の例を示します。
抽出されたテーブルは、
"pageResults"
の JSON 出力で使用できます。重要
テーブルのラベル付けはサポートされていません。 テーブルの認識と抽出が自動的に行われない場合は、キーと値のペアとしてのみラベルを付けることができます。 キーと値のペアとしてテーブルのラベル付けを行うときは、各セルに固有の値としてラベルを付けます。
抽出機能の強化。
このリリースでは、抽出の機能強化と精度の向上が行われています。具体的には、テキストの同じ行に複数のキーと値のペアが含まれる場合の、ラベル付けと抽出の機能です。
サンプルのラベル付けツールがオープンソースになりました。
Document Intelligence のサンプル ラベル付けツールが、オープンソース プロジェクトとして使用できるようになりました。 ソリューションにそれを統合し、ニーズに合わせて顧客固有の変更を行うことができます。
Document Intelligence のサンプル ラベル付けツールの詳細については、GitHub で入手できるドキュメントを参照してください。
TLS
1.2 の適用。TLS
1.2 は現在、このサービスへのすべての HTTP 要求に適用されるようになりました。 詳しくは、Azure AI サービスのセキュリティをご覧ください。
2020 年 1 月
このリリースでは、Document Intelligence 2.0 が導入されています。 次のセクションでは、新機能、機能強化、および変更の詳細について説明します。
新機能
カスタム モデル
- ラベルを使用したトレーニング 手動でラベル付けされたデータを使用して、カスタム モデルをトレーニングできるようになりました。 この方法より、性能の高いモデルが得られ、複雑なフォームやキーのない値を含んだフォームでも機能するモデルを作成することが可能です。
- 非同期 API 非同期 API 呼び出しを使用して、大規模なデータ セットおよびファイルをトレーニングして分析できます。
- TIFF ファイルのサポート TIFF ドキュメントからのデータをトレーニングして、抽出できるようになりました。
- 抽出精度の向上。
構築済みのレシート モデル
- チップの金額 チップの金額とその他の手書きの値を抽出できるようになりました。
- 品目の抽出 レシートから品目の値を抽出できます。
- 信頼値 抽出された各値のモデルの信頼度を表示できます。
- 抽出精度の向上。
- レイアウトの抽出 レイアウト API を使用して、フォームからテキスト データとテーブル データを抽出できるようになりました。
カスタム モデル API の変更点
カスタム モデルのトレーニングと使用のための API 名がすべて変更され、一部の同期メソッドは非同期になりました。 主な変更点は次のとおりです。
- モデルのトレーニング プロセスが非同期になりました。 /custom/models API 呼び出し経由で、トレーニングを開始します。 この呼び出しでは、操作 ID が返されます。この ID を custom/models/{modelID} に渡すと、トレーニング結果を返すことができます。
- キー/値の抽出は、 /custom/models/{modelID}/analyze API 呼び出しによって開始されるようになりました。 この呼び出しでは操作 ID が返され、それを custom/models/{modelID}/analyzeResults/{resultID} に渡すと、抽出結果を返すことができます。
- トレーニング操作の操作 ID は、Operation-Location ヘッダーではなく、HTTP 応答の Location ヘッダー内に配置されるようになりました。
レシート API の変更点
販売レシートを読み取るための API の名前が変更されました。
レシート データの抽出は、 /prebuilt/receipt/analyze API 呼び出しによって開始されるようになりました。 この呼び出しでは操作 ID が返され、それを /prebuilt/receipt/analyzeResults/{resultID} に渡すと、抽出結果を返すことができます。
出力形式の変更点
- すべての API 呼び出しへの JSON 応答には、新しい形式が用意されています。 一部のキーと値が追加、削除、または名前変更されました。 現在の JSON 形式の例については、クイックスタートを参照してください。
次のステップ
Document Intelligence Studio を使用して独自のフォームとドキュメントの処理を試す。
Document Intelligence クイックスタートを完了し、選択した開発言語でドキュメント処理アプリの作成を開始します。
Document Intelligence サンプル ラベル付けツールを使用して独自のフォームとドキュメントの処理を試す。
Document Intelligence クイックスタートを完了し、選択した開発言語でドキュメント処理アプリの作成を開始します。