次の方法で共有


Azure AI Document Intelligence の新機能

このコンテンツの適用対象:checkmarkv4.0 (GA)checkmarkv3.1 (GA)checkmarkv3.0 (GA)checkmarkv2.1 (GA)

Document Intelligence サービスは、継続的に更新されます。 このページをブックマークして、リリースノート、機能強化、最新のドキュメントを入手してください。

重要

GA API がリリースされると、プレビュー API バージョンが廃止されます。 2023-02-28-preview API バージョンは廃止されます。 このプレビュー API または関連する SDK バージョンをまだ使用している場合は、最新の API バージョンである 2024-11-30 (GA) をターゲットにするようにコードを更新してください。

2025 年 6 月

ドキュメント インテリジェンス v4.0 読み取りコンテナーが利用可能になりました。
このコンテナー イメージには、検索可能な PDF などの高度に要求された読み取り機能が含まれています。 詳細については、 以下を参照してください。

2025 年 4 月

ドキュメント インテリジェンス v4.0 レイアウト コンテナーが利用可能になりました。
詳細については、 以下を参照してください。

2024 年 12 月

Document Intelligence v4.0 プログラミング言語 SDK が一般提供 (GA) されるようになりました

最新のクライアント ライブラリは、既定で 2024-11-30 REST API (GA) バージョンのサービスに設定されます。

詳細については、次のサポートされているプログラミング言語のクライアント ライブラリを参照してください。

2024 年 11 月

Document Intelligence REST API v4.0: 2024-11-30 REST API (GA) が一般提供 (GA) されるようになりました。 v4.0 REST API には、次の変更が含まれています。

  • 🆕 バッチ API

    • Batch API では、読み取りモデル、レイアウト モデル、事前構築済みの垂直モデル、カスタム モデルを含む、すべてのモデルがサポートされるようになりました。
    • Batch API では、過去 7 日以内のバッチ ジョブを一覧表示できるようにする LIST 関数がサポートされています。
    • Batch API では、GDPR およびプライバシー要件に準拠するために、バッチ ジョブを明示的に削除するための DELETE 関数がサポートされています。
    • GetAnalyzeBatchResult では、LIST で返されるすべての resultId を利用できます。
  • 🆕 検索可能な PDF。 事前構築済みの読み取りモデルでは、画像形式 (JPEG/JPG、PNG、BMP、TIFF、HEIF) と言語拡張がサポートされ、PDF 出力に中国語、日本語、韓国語が含まれるようになりました。

  • カスタム分類モデル

    • カスタム分類モデルでは、増分トレーニングがサポートされています。 新しいサンプルを既存のクラスに追加したり、既存の分類子を参照して新しいクラスを追加したりできます。
    • v4.0 では、カスタム分類モデルで、分析中にドキュメントがデフォルトで分割されなくなりました。 以前の動作を保持するには、'splitMode' プロパティを auto に明示的に設定する必要があります。
    • カスタム分類モデルで、トレーニング ページの制限が新たに 25,000 ページまで拡大されました。
  • カスタム ニューラル モデル

    • カスタム ニューラル モデルで署名検出がサポートされるようになりました。
    • カスタム ニューラル モデルでは、ラベル付けされたデータセットを大きくしてモデルをトレーニングする必要がある場合に、長期間の有料トレーニングがサポートされます。 カレンダー月の最初の 20 回のトレーニング実行は、引き続き無料です。 20 を超えるトレーニング操作は、有料レベルで行われます。 の詳細については、「請求先」をご覧ください。
  • 米国口座取引明細書モデル

    • 米国口座取引明細書モデルで、チェック テーブルの抽出がサポートされるようになりました。
  • モデルを確認

    • 支払人の署名抽出をサポートしています。
  • 住宅ローン ドキュメント モデル

    • 住宅ローン モデルでは、フォーム 1003、1004、1005、およびクロージング開示書での署名検出がサポートされるようになりました。
  • 領収書モデル

    • 領収書モデルでは、領収書の種類、税率、国または地域、正味金額、説明など、新たなフィールドがサポートされるようになりました。
  • 🆕 米国の税務書類モデル

    • 1095A、1095C、1099SSA、W4 用に追加された新しい事前構築済み税モデル。
  • 分析応答の削除

    • 分析応答は、取得の操作が完了した時点から 24 時間保存されます。 応答をより早く削除したいシナリオの場合は、分析応答削除 API を使用して応答を削除します。
  • v4.0 API には、次のようなプレビュー リリースからの累積的な更新プログラムが含まれています。

2024 年 8 月

Document Intelligence 2024-07-31-preview REST API を使用できるようになりました。 このプレビュー版の API には、次の新機能と更新機能が導入されています。

  • パブリック プレビュー バージョン 2024-07-31-preview は、現在、次の Azure リージョンでのみ使用できます。 Azure AI Foundry ポータルの新しいドキュメント フィールド抽出モデルは、米国中北部リージョンでのみ使用できます。

  • 米国東部

  • 米国西部 2

  • "西ヨーロッパ"

  • 米国中北部

  • 🆕 カスタム分類子を使用したモデル作成

    • Document Intelligence は、明示的なカスタム分類モデルを使用したモデルの作成のサポートを追加しました。 新しい作成機能を使用する利点の詳細について説明します
  • カスタム分類モデル

    • カスタム分類モデルは、モデルのインプレース更新もサポートするようになりました。
    • カスタム分類モデルは、バックアップとディザスター リカバリーを有効にするモデル コピー操作のサポートを追加しました。
    • カスタム分類モデルは、入力ドキュメントから分類するページを明示的に指定する操作をサポートするようになりました。
  • 🆕 住宅ローン ドキュメント モデル

    • 査定 (フォーム 1004) から情報を抽出します。
    • 在籍証明書 (フォーム 1005) から情報を抽出します。
  • 🆕 小切手モデル

    • 支払い先、金額、日付、およびその他の関連情報を小切手から抽出します。
  • 🆕 給与明細モデル

    • 給与明細を処理して賃金、時間、控除、純賃金などを抽出する新しい事前構築。
  • 🆕 口座取引明細書モデル

    • 期首と期末の残高、取引の詳細を含む口座情報を銀行明細書から抽出する新しい事前構築。
  • 🆕 米国の税務書類モデル

    • W-2、1098、1099、1040 などの納税申告書から抽出できる新しい統合米国税務書類モデル。
  • 🆕 検索可能な PDF。 事前構築済みの読み取りモデルは、抽出結果から埋め込まれたテキストを含む PDF をダウンロードする PDF 出力をサポートするようになりました。これにより、目次の検索コピーなどのシナリオで PDF を利用できるようになりました。

  • レイアウト モデルは、向上した図形の検出機能をサポートするようになりました。これにより、ドキュメントの図形を画像ファイルとしてダウンロードして、さらに図形を理解するために使用できるようになりました。 また、レイアウト モデルでは、単一文字、ボックス化されたテキスト、および高密度のテキスト ドキュメントの向上を目的としたスキャン テキストの OCR モデルに対する機能強化も備えています。

  • 🆕 バッチ API

    • Document Intelligence は、一連のドキュメントの分析を支援するバッチ分析操作のサポートを追加したため、開発者エクスペリエンスが簡素化され、効率が向上しました。
  • アドオン機能

2024 年 5 月

Document Intelligence Studio では、Microsoft Entra (旧称 Azure Active Directory) 認証のサポートが追加されました。 詳細については、Document Intelligence Studio での認証に関するページを参照してください。

2024 年 2 月

Document Intelligence 2024-07-31-preview REST API を使用できるようになりました。 このプレビュー版の API には、次の新機能と更新機能が導入されています。

2023 年 12 月

REST API 2023-10-31-preview を対象とした Document Intelligence クライアント ライブラリを使用できるようになりました。

2023 年 11 月

Document Intelligence 2023-10-31-preview REST API を使用できるようになりました。 このプレビュー版の API には、次の新機能と更新機能が導入されています。

  • パブリック プレビュー バージョン 2023-10-31-preview は、現在、次の Azure リージョンでのみ使用できます。

    • 米国東部
    • 米国西部 2
    • "西ヨーロッパ"
  • 読み取りモデル

    • 手書き入力用の言語の拡大: ロシア語 (ru)、アラビア語 (ar)、タイ語 (th)。
    • サイバー エグゼクティブ オーダー (EO) へのコンプライアンス。
  • レイアウト モデル

    • Office ファイルと HTML ファイルをサポートします。
    • マークダウンでの出力のサポート。
    • テーブルの抽出、読み取り順序、セクション見出し検出の機能強化。
    • Document Intelligence 2023-10-31-preview では、一般的なドキュメント モデル (事前構築済みドキュメント) が非推奨になりました。 今後、キーと値のペアを抽出するには、オプションのクエリ文字列パラメーター prebuilt-layout が有効になっている features=keyValuePairs モデルを使用してください。
  • レシート モデル

    • すべての価格関連フィールドの通貨が抽出されるようになりました。
  • 保険証モデル

    • メディケアとメディケイド情報の新しいフィールドのサポート。
  • 米国の税務書類モデル

    • 新しい 1099 税モデル。 サポートするのは、基礎1099フォームと以下のバリエーションです:A、B、C、CAP、DIV、G、H、INT、K、LS、LTC、MISC、NEC、OID、PATR、Q、QA、R、S、SA、SB。
  • 請求書モデル

    • KVK フィールドのサポート。
    • BPAY フィールドのサポート。
    • フィールドに関する多くの微調整。
  • カスタム分類

    • 多言語ドキュメントのサポート。
    • 新しいページ分割オプション: 自動分割、常にページごとに分割、分割なし。
  • アドオン機能

2022-08-31 API の一般提供 (GA) リリースでは、関連するプレビュー API は非推奨とされます。 2021-09-30-preview、2022-01-30-preview、または 2022-06-30-preview API バージョンを使用している場合は、 2022-08-31 API バージョンをターゲットにするようにアプリケーションを更新します。 いくつかのマイナー変更が必要です。詳細については、「移行ガイド」を参照してください。