このコンテンツの適用対象:v4.0 (GA)
v3.1 (GA)
v3.0 (GA)
v2.1 (GA)
Document Intelligence サービスは、継続的に更新されます。 このページをブックマークして、リリースノート、機能強化、最新のドキュメントを入手してください。
重要
GA API がリリースされると、プレビュー API バージョンが廃止されます。 2023-02-28-preview API バージョンは廃止されます。 このプレビュー API または関連する SDK バージョンをまだ使用している場合は、最新の API バージョンである 2024-11-30 (GA)
をターゲットにするようにコードを更新してください。
2025 年 6 月
ドキュメント インテリジェンス v4.0 読み取りコンテナーが利用可能になりました。
このコンテナー イメージには、検索可能な PDF などの高度に要求された読み取り機能が含まれています。 詳細については、 以下を参照してください。
2025 年 4 月
ドキュメント インテリジェンス v4.0 レイアウト コンテナーが利用可能になりました。
詳細については、 以下を参照してください。
2024 年 12 月
Document Intelligence v4.0 プログラミング言語 SDK が一般提供 (GA) されるようになりました。
最新のクライアント ライブラリは、既定で 2024-11-30 REST API (GA) バージョンのサービスに設定されます。
詳細については、次のサポートされているプログラミング言語のクライアント ライブラリを参照してください。
2024 年 11 月
Document Intelligence REST API v4.0: 2024-11-30 REST API (GA) が一般提供 (GA) されるようになりました。 v4.0 REST API には、次の変更が含まれています。
-
- Batch API では、読み取りモデル、レイアウト モデル、事前構築済みの垂直モデル、カスタム モデルを含む、すべてのモデルがサポートされるようになりました。
- Batch API では、過去 7 日以内のバッチ ジョブを一覧表示できるようにする LIST 関数がサポートされています。
- Batch API では、GDPR およびプライバシー要件に準拠するために、バッチ ジョブを明示的に削除するための DELETE 関数がサポートされています。
- GetAnalyzeBatchResult では、LIST で返されるすべての resultId を利用できます。
🆕 検索可能な PDF。 事前構築済みの読み取りモデルでは、画像形式 (JPEG/JPG、PNG、BMP、TIFF、HEIF) と言語拡張がサポートされ、PDF 出力に中国語、日本語、韓国語が含まれるようになりました。
-
- カスタム分類モデルでは、増分トレーニングがサポートされています。 新しいサンプルを既存のクラスに追加したり、既存の分類子を参照して新しいクラスを追加したりできます。
- v4.0 では、カスタム分類モデルで、分析中にドキュメントがデフォルトで分割されなくなりました。 以前の動作を保持するには、'splitMode' プロパティを auto に明示的に設定する必要があります。
- カスタム分類モデルで、トレーニング ページの制限が新たに 25,000 ページまで拡大されました。
-
- カスタム ニューラル モデルで署名検出がサポートされるようになりました。
- カスタム ニューラル モデルでは、ラベル付けされたデータセットを大きくしてモデルをトレーニングする必要がある場合に、長期間の有料トレーニングがサポートされます。 カレンダー月の最初の 20 回のトレーニング実行は、引き続き無料です。 20 を超えるトレーニング操作は、有料レベルで行われます。 の詳細については、「請求先」をご覧ください。
-
- 米国口座取引明細書モデルで、チェック テーブルの抽出がサポートされるようになりました。
-
- 支払人の署名抽出をサポートしています。
-
- 住宅ローン モデルでは、フォーム 1003、1004、1005、およびクロージング開示書での署名検出がサポートされるようになりました。
-
- 領収書モデルでは、領収書の種類、税率、国または地域、正味金額、説明など、新たなフィールドがサポートされるようになりました。
-
- 1095A、1095C、1099SSA、W4 用に追加された新しい事前構築済み税モデル。
-
- 分析応答は、取得の操作が完了した時点から 24 時間保存されます。 応答をより早く削除したいシナリオの場合は、分析応答削除 API を使用して応答を削除します。
v4.0 API には、次のようなプレビュー リリースからの累積的な更新プログラムが含まれています。
2024 年 8 月
Document Intelligence 2024-07-31-preview REST API を使用できるようになりました。 このプレビュー版の API には、次の新機能と更新機能が導入されています。
パブリック プレビュー バージョン 2024-07-31-preview は、現在、次の Azure リージョンでのみ使用できます。 Azure AI Foundry ポータルの新しいドキュメント フィールド抽出モデルは、米国中北部リージョンでのみ使用できます。
米国東部
米国西部 2
"西ヨーロッパ"
米国中北部
-
- Document Intelligence は、明示的なカスタム分類モデルを使用したモデルの作成のサポートを追加しました。 新しい作成機能を使用する利点の詳細について説明します。
-
- カスタム分類モデルは、モデルのインプレース更新もサポートするようになりました。
- カスタム分類モデルは、バックアップとディザスター リカバリーを有効にするモデル コピー操作のサポートを追加しました。
- カスタム分類モデルは、入力ドキュメントから分類するページを明示的に指定する操作をサポートするようになりました。
-
- 査定 (フォーム 1004) から情報を抽出します。
- 在籍証明書 (フォーム 1005) から情報を抽出します。
-
- 支払い先、金額、日付、およびその他の関連情報を小切手から抽出します。
-
- 給与明細を処理して賃金、時間、控除、純賃金などを抽出する新しい事前構築。
-
- 期首と期末の残高、取引の詳細を含む口座情報を銀行明細書から抽出する新しい事前構築。
-
- W-2、1098、1099、1040 などの納税申告書から抽出できる新しい統合米国税務書類モデル。
🆕 検索可能な PDF。 事前構築済みの読み取りモデルは、抽出結果から埋め込まれたテキストを含む PDF をダウンロードする PDF 出力をサポートするようになりました。これにより、目次の検索コピーなどのシナリオで PDF を利用できるようになりました。
レイアウト モデルは、向上した図形の検出機能をサポートするようになりました。これにより、ドキュメントの図形を画像ファイルとしてダウンロードして、さらに図形を理解するために使用できるようになりました。 また、レイアウト モデルでは、単一文字、ボックス化されたテキスト、および高密度のテキスト ドキュメントの向上を目的としたスキャン テキストの OCR モデルに対する機能強化も備えています。
-
- Document Intelligence は、一連のドキュメントの分析を支援するバッチ分析操作のサポートを追加したため、開発者エクスペリエンスが簡素化され、効率が向上しました。
-
- クエリ フィールド AI の抽出の品質は、最新のモデルで改善されています。
2024 年 5 月
Document Intelligence Studio では、Microsoft Entra (旧称 Azure Active Directory) 認証のサポートが追加されました。 詳細については、Document Intelligence Studio での認証に関するページを参照してください。
2024 年 2 月
Document Intelligence 2024-07-31-preview REST API を使用できるようになりました。 このプレビュー版の API には、次の新機能と更新機能が導入されています。
パブリック プレビュー バージョン 2024-07-31-preview は、現在、次の Azure リージョンでのみ使用できます。
- 米国東部
- 米国西部 2
- "西ヨーロッパ"
レイアウト モデル では、図の検出 がサポートされ、階層型ドキュメント構造分析 (セクションとサブセクション) ができるようになりました。 読み取り順序と論理ロール検出の AI 品質も向上しています。
-
- カスタム抽出モデルで、セル、行、テーブル レベルの信頼度スコアがサポートされるようになりました。 テーブル、行、セルの信頼度についての詳細情報。
- カスタム抽出モデルでは、フィールド抽出の AI 品質が向上しています。
- カスタム テンプレート抽出モデルで、重複するフィールドの抽出がサポートされるようになりました。 重複するフィールドとその使用方法の詳細情報。
-
- カスタム分類モデルでは、追加されたサンプルまたはクラスで分類子モデルを更新する必要があるシナリオでの、増分トレーニングをサポートするようになりました。 増分トレーニングについての詳細情報。
- カスタム分類モデルに、Office ドキュメントの型 (.docx、.pptx、.xls) のサポートが追加されました。 ドキュメントの型のサポート拡張についての詳細情報。
-
- 以下の新しいロケールをサポートします。
ロケール Code アラビア語 ( ar
)ブルガリア語 ( bg
)ギリシャ語 ( el
)ヘブライ語 ( he
)マケドニア語 ( mk
)ロシア語 ( ru
)セルビア系キリル語 ( sr-cyrl
)ウクライナ語 ( uk
)タイ語 ( th
)トルコ語 ( tr
)ベトナム語 ( vi
)- 新しい通貨コードをサポート:
通貨 ロケール Code BAM
ボスニア兌換マルク ( ba
)BGN
ブルガリア レフ ( bg
)ILS
イスラエル新シェケル ( il
)MKD
マケドニア ディナール ( mk
)RUB
ロシア ルーブル ( ru
)THB
タイ バーツ ( th
)TRY
トルコ リラ ( tr
)UAH
ウクライナ フリヴニャ ( ua
)VND
ベトナム ドン ( vn
)- 税項目で、ドイツ (
de
)、スペイン (es
)、ポルトガル (pt
)、英語圏カナダen-CA
を拡張サポートしました。
-
- 欧州連合 ID と運転免許証のフィールド サポートが拡張されました。
-
- 統一住宅ローン申請書 (フォーム 1003) から情報を抽出します。
- 統一引受転送概要書またはフォーム 1008 から、情報を抽出します。
- 住宅ローンの決算開示から情報を抽出します。
-
- 銀行カードから情報を抽出します。
-
- 結婚証明書から情報を抽出するため新たに事前構築。
2023 年 12 月
REST API 2023-10-31-preview を対象とした Document Intelligence クライアント ライブラリを使用できるようになりました。
2023 年 11 月
Document Intelligence 2023-10-31-preview REST API を使用できるようになりました。 このプレビュー版の API には、次の新機能と更新機能が導入されています。
パブリック プレビュー バージョン 2023-10-31-preview は、現在、次の Azure リージョンでのみ使用できます。
- 米国東部
- 米国西部 2
- "西ヨーロッパ"
-
- 手書き入力用の言語の拡大: ロシア語 (
ru
)、アラビア語 (ar
)、タイ語 (th
)。 - サイバー エグゼクティブ オーダー (EO) へのコンプライアンス。
- 手書き入力用の言語の拡大: ロシア語 (
-
- Office ファイルと HTML ファイルをサポートします。
- マークダウンでの出力のサポート。
- テーブルの抽出、読み取り順序、セクション見出し検出の機能強化。
- Document Intelligence 2023-10-31-preview では、一般的なドキュメント モデル (事前構築済みドキュメント) が非推奨になりました。 今後、キーと値のペアを抽出するには、オプションのクエリ文字列パラメーター
prebuilt-layout
が有効になっているfeatures=keyValuePairs
モデルを使用してください。
-
- すべての価格関連フィールドの通貨が抽出されるようになりました。
-
- メディケアとメディケイド情報の新しいフィールドのサポート。
-
- 新しい 1099 税モデル。 サポートするのは、基礎1099フォームと以下のバリエーションです:A、B、C、CAP、DIV、G、H、INT、K、LS、LTC、MISC、NEC、OID、PATR、Q、QA、R、S、SA、SB。
-
KVK
フィールドのサポート。BPAY
フィールドのサポート。- フィールドに関する多くの微調整。
-
- 多言語ドキュメントのサポート。
- 新しいページ分割オプション: 自動分割、常にページごとに分割、分割なし。
注
2022-08-31
API の一般提供 (GA) リリースでは、関連するプレビュー API は非推奨とされます。 2021-09-30-preview、2022-01-30-preview、または 2022-06-30-preview API バージョンを使用している場合は、 2022-08-31
API バージョンをターゲットにするようにアプリケーションを更新します。 いくつかのマイナー変更が必要です。詳細については、「移行ガイド」を参照してください。