Azure AI Document Intelligence の新機能

このコンテンツの適用対象: checkmarkv4.0 (プレビュー)checkmarkv3.1 (GA)checkmarkv3.0 (GA)checkmarkv2.1 (GA)

Document Intelligence サービスは、継続的に更新されます。 このページをブックマークして、リリースノート、機能強化、最新のドキュメントを入手してください。

重要

GA API がリリースされると、プレビュー API バージョンが廃止されます。 2023-02-28-preview API バージョンは廃止処理中です。このプレビュー API または関連する SDK バージョンをまだ使用している場合は、最新の API バージョンである 2023-07-31 (GA) をターゲットにするようにコードを更新してください。

2024 年 2 月

現在、Document Intelligence 2024-02-29-preview REST API をご利用になれます。 このプレビュー版の API には、次の新機能と更新機能が導入されています。

2023 年 12 月

REST API 2023-10-31-preview を対象とした Document Intelligence クライアント ライブラリを使用できるようになりました。

2023 年 11 月

Document Intelligence 2023-10-31-preview REST API を使用できるようになりました。 このプレビュー版の API には、次の新機能と更新機能が導入されています。

  • パブリック プレビュー バージョン 2023-10-31-preview は、現在、次の Azure リージョンでのみ使用できます。

    • 米国東部
    • 米国西部 2
    • "西ヨーロッパ"
  • 読み取りモデル

    • 手書き入力用の言語の拡大: ロシア語 (ru)、アラビア語 (ar)、タイ語 (th)。
    • サイバー エグゼクティブ オーダー (EO) へのコンプライアンス。
  • レイアウト モデル

    • Office ファイルと HTML ファイルをサポートします。
    • マークダウンでの出力のサポート。
    • テーブルの抽出、読み取り順序、セクション見出し検出の機能強化。
    • Document Intelligence 2023-10-31-preview では、一般的なドキュメント モデル (事前構築済みドキュメント) が非推奨になりました。 今後、キーと値のペアを抽出するには、オプションのクエリ文字列パラメーター features=keyValuePairs が有効になっている prebuilt-layout モデルを使用してください。
  • レシート モデル

    • すべての価格関連フィールドの通貨が抽出されるようになりました。
  • 保険証モデル

    • メディケアとメディケイド情報の新しいフィールドのサポート。
  • 米国の税務書類モデル

    • 新しい 1099 税モデル。 ベース 1099 フォームと、バリエーション (A、B、C、CAP、DIV、G、H、INT、K、LS、LTC、MISC、NEC、OID、PATR、Q、QA、R、S、SA、SB) 。
  • 請求書モデル

    • KVK フィールドのサポート。
    • BPAY フィールドのサポート。
    • フィールドに関する多くの微調整。
  • カスタム分類

    • 多言語ドキュメントのサポート。
    • 新しいページ分割オプション: 自動分割、常にページごとに分割、分割なし。
  • アドオン機能

Note

2022-08-31 API の一般提供 (GA) リリースに伴い、関連するプレビュー API は非推奨とされます。 2021-09-30-preview、2022-01-30-preview、または 2022-06-30-preview API バージョンを使用している場合は、2022-08-31 API バージョンをターゲットとするようにアプリケーションを更新してください。 いくつかのマイナー変更が必要です。詳細については、「移行ガイド」を参照してください。

2023 年 7 月

Note

Form Recognizer は Azure AI Document Intelligence になりました。

  • ドキュメント、Azure AI サービスには、以前 Cognitive Services および Azure Applied AI Services と呼ばれていたものすべてが含まれています。
  • 価格に変更はありません。
  • Cognitive Services および Azure Applied AI という名前は、Azure の課金、コスト分析、価格表、および Price API で引き続き使用されます。
  • アプリケーション プログラミング インターフェイス (API) やクライアント ライブラリに破壊的変更はありません。
  • 一部のプラットフォームでは、まだ名前が更新されていません。 ドキュメントで Form Recognizer または Document Intelligence に言及している場合は、同じ Azure サービスを参照しています。

Document Intelligence v3.1 (GA)

Document Intelligence バージョン 3.1 API が一般提供 (GA) されました。 API のバージョンは 2023-07-31 に対応しています。 v3.1 API には、新機能と更新機能が導入されています。

Document Intelligence Studio UX 更新プログラム

✔️ 分析オプション

  • Document Intelligence では、より高度な分析機能がサポートされるようになりました。Studio では、アドオン機能を簡単に構成するための 1 つのエントリ ポイント ([分析オプション] ボタン) を使用できます。

  • ドキュメント抽出シナリオに応じて、分析範囲、ドキュメント ページ範囲、オプションの検出、プレミアム検出機能を構成します。

    Animated screenshot showing use of the analyze-options button to configure options in Studio.

    Note

    Document Intelligence Studio では、フォントの抽出は視覚化されません。 ただし、フォントの検出結果については JSON 出力のスタイル セクションで確認できます。

✔️ 事前構築済みモデルまたは独自のモデルのいずれかを使用してドキュメントに自動ラベル付けする

  • カスタム抽出モデル ラベル付けページで、Document Intelligent Service の事前構築済みモデルまたは自分が以前にトレーニングしたモデルのいずれかを使用して、ドキュメントの自動ラベル付けが行えるようになりました。

    Animated screenshot showing auto labeling in Studio.

  • 一部のドキュメントでは、自動ラベル付けを実行した後に重複ラベルが存在する場合があります。 後でラベル付けページでラベルが重複しないように、ラベルを変更してください。

    Screenshot showing duplicate label warning after auto labeling.

✔️ 自動ラベル付けテーブル

  • カスタム抽出モデルのラベル付けページで、手動でテーブルにラベル付けしなくても、ドキュメント内のテーブルに自動ラベル付けできるようになりました。

    Animated screenshot showing auto table labeling in Studio.

✔️ テスト ファイルをトレーニング データセットに直接追加する

  • カスタム抽出モデルをトレーニングしたら、テスト ページを使用して、必要に応じてテスト ドキュメントをトレーニング データセットにアップロードすることで、モデルの品質を改善します。

  • 一部のラベルに対して低い信頼度スコアが返される場合は、それらが正しくラベル付けされていることを確認します。 正しくない場合は、モデルの品質を改善するために、それらをトレーニング データセットに追加し再ラベル付けを行います。

Animated screenshot showing how to add test files to training dataset.

✔️ カスタム プロジェクトでドキュメント リスト オプションとフィルターを使用する

  • カスタム抽出モデルのラベル付けページを使用します。 検索、フィルター、並べ替えを使用することで、トレーニング ドキュメント間を簡単に移動できるようになりました。

  • グリッド ビューを使用してドキュメントをプレビューするか、リスト ビューを使用してドキュメント内をより簡単にスクロールできます。

    Screenshot showing document list view options and filters.

✔️ プロジェクト共有

2023 年 5 月

Build 2023 で更新されたドキュメントの紹介

2023 年 4 月

最新の Document Intelligence クライアント ライブラリのパブリック プレビュー リリースの発表

2023 年 3 月

重要

2023-02-28-preview 機能は現在、次のリージョンでのみご利用いただけます:

  • 西ヨーロッパ
  • 米国西部 2
  • 米国東部
  • カスタム分類モデルは、2023-02-28-preview API 以降の Document Intelligence の新機能です。 Document Intelligence StudioREST API を使用した、ドキュメント分類機能をお試しください。
  • 一般ドキュメント モデルに追加されたクエリ フィールド機能では、Azure OpenAI モデルを使用して、ドキュメントから特定のフィールドを抽出します。 Document Intelligence Studio を使用して、クエリ フィールドを含む一般ドキュメント機能をお試しください。 クエリ フィールドは現在、East US リージョンのリソースに対してのみアクティブです。
  • アドオン機能:
    • フォント抽出2023-02-28-preview API で認識されるようになりました。
    • 数式抽出2023-02-28-preview API で認識されるようになりました。
    • 高解像度抽出2023-02-28-preview API で認識されるようになりました。
  • カスタム抽出モデルの更新:
  • Document Intelligence Studio 更新プログラム:
    • 分類やクエリ フィールドなどのすべての新機能のサポートに加えて、Studio ではカスタム モデル プロジェクトのプロジェクト共有が可能になりました。
    • 限定的なプレビューの新しいモデルとして、ワクチン接種カード契約米国税 1098米国税 1098-E米国税 1098-T が追加されました。 限定的なプレビュー モデルのアクセスを要求するには、Document Intelligence プライベート プレビュー要求フォームに入力して送信してください。
  • レシート モデルの更新:
    • レシート モデルでは、熱レシートのサポートが追加されました。
    • レシート モデルでは、18 言語と 3 つのリージョン言語 (英語、フランス語、ポルトガル語) の言語サポートが追加されました。
    • レシート モデルで TaxDetails 抽出がサポートされるようになりました。
  • レイアウト モデルでテーブル認識が改善されました。
  • 読み取りモデルで、1 桁の文字認識が改善されました。

2023 年 2 月


2023 年 1 月

  • 事前構築済みのレシート モデル - サポートされている言語が追加されました。 レシート モデルで、これらの追加された言語とロケールがサポートされるようになりました

    • 日本語 - 日本 (ja-JP)
    • フランス語 - カナダ: (fr-CA)
    • オランダ語 - オランダ (nl-NL)
    • 英語 - アラブ首長国連邦 (en-AE)
    • ポルトガル語 - ブラジル (pt-BR)
  • 事前構築済みの請求書モデル - サポートされている言語が追加されました。 請求書モデルで、これらの追加された言語とロケールがサポートされるようになりました

    • 英語 - 米国 (en-US)、オーストラリア (en-AU)、カナダ (en-CA)、英国 (en-GB)、インド (en-IN)
    • スペイン語 - スペイン (es-ES)
    • フランス語 - フランス (fr-FR)
    • イタリア語 - イタリア (it-IT)
    • ポルトガル語 - ポルトガル (pt-PT)
    • オランダ語 - オランダ (nl-NL)
  • 事前構築済みの請求書モデル - 認識されるフィールドが追加されました。 請求書モデルで、これらの追加されたフィールドが認識されるようになりました

    • Currency code
    • 支払いオプション
    • 割引合計
    • 税目 (en-IN のみ)
  • 事前構築済みの ID モデル - サポートされているドキュメントの種類が追加されました。 ID モデルで、これらの追加されたドキュメントの種類がサポートされるようになりました

    • 米国の軍 ID

ヒント

2023 年 1 月のすべての更新プログラムは、REST API バージョン 2022-08-31 (GA) で入手できます。

  • 事前構築済みのレシート モデル — 追加の言語サポート:

    事前構築済みのレシート モデルで、次の言語のサポートが追加されました。

    • 英語 - アラブ首長国連邦 (en-AE)
    • オランダ語 - オランダ (nl-NL)
    • フランス語 - カナダ: (fr-CA)
    • ドイツ語 - (de-DE)
    • イタリア語 - (it-IT)
    • 日本語 - 日本 (ja-JP)
    • ポルトガル語 - ブラジル (pt-BR)
  • 事前構築済みの請求書モデル - 追加の言語サポートとフィールド抽出

    事前構築済みの請求書モデルで、次の言語のサポートが追加されました。

    • 英語 - オーストラリア (en-AU)、カナダ (en-CA)、英国 (en-UK)、インド (en-IN)
    • ポルトガル語 - ブラジル (pt-BR)

    事前構築済みの請求書モデルで、次のフィールド抽出のサポートが追加されました。

    • Currency code
    • 支払いオプション
    • 割引合計
    • 税目 (en-IN のみ)
  • 事前構築済みの身分証明書モデル - 追加の証明書の種類のサポート

    事前構築済みの身分証明書モデルで、次の証明書の種類のサポートが追加されました。

    • インド、カナダ、英国、オーストラリアをサポートする運転免許証の拡張
    • 米国の軍 ID カードと証明書
    • インドの ID カードと証明書 (PAN および Aadhaar)
    • オーストラリアの ID カードと証明書 (フォト カード、Key-pass ID)
    • カナダの ID カードと証明書 (ID カード、メープル カード)
    • 英国の ID カードと証明書 (国/地域の ID カード)

2022 年 12 月

  • Document Intelligence Studio 更新プログラム

    12 月の Document Intelligence Studio リリースには、Document Intelligence Studio の最新の更新プログラムが含まれています。 カスタム モデルのラベル付けサポートを中心に、ユーザー エクスペリエンスが大幅に改善されています。

    • ページ範囲。 Studio で、ドキュメントの指定ページの分析がサポートされるようになりました。

    • カスタム モデルのラベル付け

      • Layout API の自動実行。 カスタム モデルのセットアップ プロセスで、BLOB ストレージ内のすべてのドキュメントに対して Layout API を自動的に実行するように選択できます。

      • 検索。 Studio に、ドキュメント内の単語を検索する検索機能が追加されました。 この改良により、ラベル付けしながらの操作が容易になります。

      • ナビゲーション。 ラベルを選択して、ドキュメント内のラベル付き単語をターゲットにすることができます。

      • テーブルの自動ラベル付け。 ドキュメント内のテーブル アイコンを選択すると、ラベル付けビューで、抽出されたテーブルの自動ラベル付けを選択できます。

      • ラベルのサブタイプと第 2 レベルのサブタイプ Studio で、テーブル列、テーブル行のサブタイプ、および日付や数値などの型の第 2 レベルのサブタイプがサポートされるようになりました。

  • カスタム ニューラル モデルの構築が、US Gov バージニア リージョンでサポートされるようになりました。

  • プレビュー API バージョン 2022-01-30-preview および 2021-09-30-preview が、2023 年 1 月 31 日に廃止されます。 サービスの中断を避けるために、2022-08-31 API バージョンに更新してください。


2022 年 11 月

  • Azure AI Document Intelligence ライブラリの最新の安定したリリースを発表
    • このリリースには、.NET、Java、JavaScript、Python クライアント ライブラリの重要な変更と更新が含まれています。 詳細については、「Azure SDK DevBlog」を参照してください。
    • 最も重要な機能強化は、 DocumentAnalysisClientDocumentModelAdministrationClient の 2 つの新しいクライアントの導入です。

2022 年 10 月

  • Document Intelligence のバージョン管理されたコンテンツ

    • Document Intelligence ドキュメントが更新され、バージョン管理されたエクスペリエンスが提供されるようになりました。 これで、v3.0 GA エクスペリエンスまたは v2.1 GA エクスペリエンスを対象とするコンテンツを表示することを選択できます。 v3.0 エクスペリエンスが既定です。

      Screenshot of the Document Intelligence landing page denoting the version dropdown menu.

  • Document Intelligence Studio のサンプル コード

    • Document Intelligence Studio ラベル付けエクスペリエンスのサンプル コードは、GitHub で使用できるようになりました。 顧客は、Document Intelligence を開発して独自の UX に統合したり、Document Intelligence Studio サンプル コードを使用して独自の新しい UX を構築したりすることができます。
  • 言語の増加

    • 最新のプレビュー リリースでは、Document Intelligence の Read (OCR)、Layout、Custom テンプレート モデルで 134 の新しい言語がサポートされています。 これらの言語の追加には、ギリシャ語、ラトビア語、セルビア語、タイ語、ウクライナ語、ベトナム語、いくつかのラテン語とキリル語が含まれます。 Document Intelligence の最新の GA と新しいプレビュー バージョンでサポートされる言語は、合計 299 個になりました。 サポートされているすべての言語については、サポートされている言語のページを参照してください。
    • API または対応する SDK を使用してアプリケーションで新しい言語をサポートする場合は、REST API パラメーター api-version=2022-06-30-preview を使用します。
  • 新しい事前構築済みコントラクト モデル

    • パーティ、タイトル、コントラクト ID、実行日などの情報をコントラクトから抽出する新しい事前構築。 コントラクトは現在プレビュー段階です。こちらからアクセスを要求してください。
  • カスタム ニューラル モデルをトレーニングするためのリージョンの拡大

    • カスタム ニューラル モデルのトレーニングは、追加リージョンでサポートされるようになりました。
      • 米国東部
      • 米国東部 2
      • US Gov アリゾナ

2022 年 9 月

Note

バージョン 4.0.0 以降、Document Intelligence サービスの最新機能を活用するために、新しいクライアント セットが導入されています。

SDK バージョン 4.0.0 GA リリースには、次の更新が含まれています

  • バージョン 4.0.0 GA (2022-09-08)
  • REST API v3.0 および v2.0 クライアントをサポート

パッケージ (NuGet)

変更ログ/リリース履歴

移行ガイド

ReadMe

サンプル

  • カスタム ニューラル モデルをトレーニングするための領域拡張が、6 つの新しい領域でサポートされるようになりました

    • オーストラリア東部
    • 米国中部
    • 東アジア
    • フランス中部
    • 英国南部
    • 米国西部 2
    • トレーニングがサポートされているリージョンの完全な一覧については、カスタム ニューラル モデルに関する記事を参照してください。

    • Document Intelligence SDK のバージョン 4.0.0 GA リリース:

      • Document Intelligence クライアント ライブラリ バージョン 4.0.0 (.NET/C#、Java、JavaScript) とバージョン 3.2.0 (Python) が一般公開され、実稼働アプリケーションで使用できます
      • Document Intelligence クライアント ライブラリの詳細については、SDK の概要に関するページを参照してください。
      • プログラミング言語の移行ガイドを使用してアプリケーションを更新します。

2022 年 8 月

Document Intelligence SDK ベータ版 2022 年 8 月のプレビュー リリースには、次の更新が含まれています

バージョン 4.0.0-beta.5 (2022-08-09)

変更ログ/リリース履歴

パッケージ (NuGet)

SDK のリファレンス ドキュメント

  • Document Intelligence v3.0 の一般提供

    • Document Intelligence REST API v3.0 が一般公開され、運用アプリケーションで使用できるようになりました。 REST API バージョン 2022-08-31 でアプリケーションを更新してください。
  • Document Intelligence Studio 更新プログラム

    • 次の手順。 Studio の各モデル ページの下に、[次の手順] セクションが追加されました。 ユーザーは、サンプル コード、トラブルシューティング ガイドライン、価格情報をすばやく参照できます。
    • カスタム モデル。 Studio には、ラベル付けの効率を向上させるために、カスタム モデル プロジェクトでラベルを並べ替える機能が含まれるようになりました。
    • モデルのコピー: カスタム モデルは、Studio 内から Document Intelligence サービス間でコピーできます。 この操作により、トレーニング済みのモデルを他の環境やリージョンに昇格できます。
    • ドキュメントの削除。 Studio では、カスタム プロジェクト内のラベル付きデータセットからドキュメントを削除できるようになりました。
  • Document Intelligence サービス更新プログラム

    • prebuilt-read。 Read OCR モデルは Document Intelligence でも使用できるようになり、2 つの新機能として、段落と言語検出を備えています。 Document Intelligence の読み取りは、Document Intelligence のより広範なドキュメント インテリジェンス機能に合わせた高度なドキュメント シナリオを対象とします。
    • 事前構築済みレイアウト。 レイアウト モデルでは、段落が抽出され、抽出されたテキストが段落、タイトル、セクション見出し、脚注、ページ ヘッダー、ページ フッター、またはページ番号のいずれであるかが抽出されます。
    • 事前構築済みの請求書。 TotalVAT フィールドと Line/VAT フィールドが、それぞれ既存のフィールド TotalTax と Line/Tax に解決されるようになりました。
    • 事前構築済みの ID ドキュメント。 データ抽出で、米国の州 ID、社会保障、グリーン カードがサポートされます。 パスポート ビザ情報がサポートされます。
    • 事前構築済みのレシート。 フランス語 (fr-FR)、スペイン語 (es-ES)、ポルトガル語 (pt-PT)、イタリア語 (it-IT)、ドイツ語 (de-DE) のロケール サポートが拡張されました。
    • 事前構築済みの名刺。 住所、市区町村、都道府県、国および地域、郵便番号などの住所コンポーネントのサブフィールドを抽出するためのアドレス解析のサポート。
  • AI 品質の改善

    • prebuilt-read。 単一文字、手書きの日付、金額、名前、領収書や請求書でよく見られるその他キー データのサポートが強化され、デジタル PDF ドキュメントの処理が改善されました。
    • 事前構築済みレイアウト。 トリミングされたテーブルの検出、罫線のないテーブルの検出、長いスパンセルの認識の向上をサポートします。
    • 事前構築済みドキュメント。 値とチェック ボックスの検出が改善されました。
    • カスタム ニューラル。 テーブルの検出と抽出の精度が向上しました。

2022 年 6 月

  • Document Intelligence SDK ベータ版 2022 年 6 月のプレビュー リリースには、次の更新プログラムが含まれています。

2022 年 2 月

  • Document Intelligence v3.0 プレビュー リリースでは、いくつかの新機能、機能と機能強化が導入されています。

    • カスタム ニューラル モデルまたはカスタム ドキュメント モデルは、構造化フォーム、半構造化ドキュメント、非構造化ドキュメントからテキストと選択マークを抽出する、新しいカスタム モデルです。
    • W-2 事前構築済みモデル は、税務報告および所得検証シナリオのために W-2 フォームからフィールドを抽出するための新しい事前構築モデルです。
    • 読み取り API は、印刷されたテキスト行、単語、テキスト位置、検出された言語、および手書きテキストを抽出します (検出された場合)。
    • 一般的なドキュメント事前トレーニング済みモデルが更新され、フォームとドキュメントからの API テキスト、テーブル、構造、キーと値のペアに加えて、選択マークがサポートされます。
    • Invoice API 請求書の事前構築済みモデルは、スペイン語の請求書もサポートするように拡張されています。
    • Document Intelligence Studio では、Read、W2、Hotel のレシート サンプルの新しいデモと、新しいカスタム ニューラル モデルのトレーニングのサポートが追加されます。
    • 言語拡張: Document Intelligence の読み取り、レイアウト、カスタム フォームでは、アラビア語、ヒンディ語、およびアラビア文字とデーヴァナーガリー文字を使用したその他の言語を含む 42 の新しい言語のサポートが追加され、164 の言語に範囲が広がっています。 手書き言語のサポートが、日本語と韓国語に拡張されています。
  • v3.0 プレビュー API の新しい REST APIPython、または .NET SDK を利用できます。

  • Document Intelligence モデルのデータ抽出:

    モデル テキストの抽出 キーと値のペア 選択マーク テーブル シグネチャ
    Read
    一般ドキュメント
    Layout
    請求書
    Receipt
    身分証明書
    名刺
    カスタム テンプレート
    カスタム ニューラル
  • Document Intelligence SDK ベータ版のプレビュー リリースには、次の更新プログラムが含まれています。


2021 年 11 月

  • Document Intelligence v3.0 プレビュー SDK リリース更新プログラム (ベータ 2) には、バグ修正とマイナーな機能更新プログラムが組み込まれています。

2021 年 10 月

  • Document Intelligence v3.0 プレビュー リリース バージョン 4.0.0-beta.1 (2021 年 10 月 7 日) では、いくつかの新機能が導入されています

    • 一般的なドキュメント モデルは新しい API であり、事前トレーニング済みのモデルを使用して、フォームとドキュメントからテキスト、テーブル、構造、キーと値のペアを抽出します。

    • ホテルの領収書モデルが、構築済みの受信確認処理に追加されました。

    • 身分証明書の展開されたフィールド ID モデルでは、米国の運転免許証からの署名、制限、車両分類の抽出がサポートされています。

    • 署名フィールドは、フォーム フィールド内の署名の有無を検出するカスタム フォームの新しいフィールドの種類です。

    • 言語の展開 122 言語 (印刷) と 7 言語 (手書き) のサポート。 Document Intelligence のレイアウトとカスタム フォームでは、最新のプレビューでサポートされる言語が 122 個に拡大されました。 このプレビューには、49 個の新しい言語 (ロシア語、ブルガリア語、その他のキリル語系やラテン語系など) での印刷テキストに対するテキスト抽出が含まれています。 また、手書きテキストの抽出では、英語を含む 7 個の言語と、新たに簡体字中国語、フランス語、ドイツ語、イタリア語、ポルトガル語、スペイン語の新しいプレビューがサポートされるようになりました。

    • テーブルとテキスト抽出の機能強化 レイアウトは、キーと値のテーブルとも呼ばれる単一行テーブルの抽出をサポートするようになりました。 テキスト抽出の機能強化には、デジタル PDF や身分証明書内の機械可読ゾーン (MRZ) テキストの処理の向上、全般的なパフォーマンスの向上が含まれます。

    • Document Intelligence Studio サービスの使用を簡単にするために、Document Intelligence Studio にアクセスして、さまざまな事前構築済みモデルをテストしたり、カスタム モデルにラベルを付けてトレーニングしたりすることができるようになりました。

    • v3.0 プレビュー API の新しい REST APIPython、または .NET SDK を利用できます。

  • Document Intelligence モデルのデータ抽出

    モデル テキストの抽出 キーと値のペア 選択マーク テーブル
    一般ドキュメント
    Layout
    請求書
    Receipt
    身分証明書
    名刺
    Custom

2021 年 9 月

  • Azure portal の Document Intelligence リソースの概要ページで、Azure メトリックス エクスプローラーの高度な機能を使用できます。

  • 監視メニュー:

    Screenshot showing the monitoring menu in the Azure portal.

  • グラフ:

    Screenshot showing an example metric chart in the Azure portal.

  • 身分証明書モデルの更新: サフィックスを含む名前がある場合、ピリオド (フル ストップ) の有無にかかわらず、正常に処理されます。

    入力テキスト 更新された結果
    William Isaac Kirby Jr. FirstName: William Isaac

    LastName: Kirby Jr.
    Henry Caleb Ross Sr FirstName: Henry Caleb

    LastName: Ross Sr.

2021 年 7 月

  • システム割り当てマネージド ID のサポート: システム割り当てマネージド ID を有効にして、プライベート ストレージ アカウントへの制限付きアクセスを Document Intelligence に許可できるようになりました。これには、Virtual Network またはファイアウォールで保護されているアカウントや、BYOS (Bring Your Own Storage) が有効になっているアカウントが含まれます。 詳細については、「Document Intelligence リソース用のマネージド ID を作成して使用する」を参照してください。

2021 年 6 月

  • Document Intelligence コンテナー v2.1 はゲート プレビューでリリースされ、レイアウト名刺ID ドキュメント領収書請求書カスタムの 6 つの機能コンテナーでサポートされるようになりました。 これらを使用するには、オンライン リクエストを送信し、承認を受ける必要があります。

  • プレビューでリリースされた Document Intelligence コネクタ: Document Intelligence コネクタは、Azure Logic AppsMicrosoft Power Automate、および Microsoft Power Apps と統合されます。 このコネクタは、カスタムおよび事前構築済みのフォーム、請求書、レシート、名刺、身分証明書から、ドキュメントのデータと構造を抽出および分析するワークフローのアクションとトリガーをサポートしています。

  • Document Intelligence SDK v3.1.0 に、C#、Java、Python 用のパッチが適用され、v3.1.1 になりました このパッチは、FormFieldText があるが BoundingBoxPage の情報がないなど、サブ行項目フィールドが検出されない請求書に対処しています。


2021 年 5 月

  • Document Intelligence 2.1 は一般提供されています。 GA リリースは、以前の 2.1 プレビュー パッケージ バージョンで導入された変更の安定性を示しています。 このリリースでは、次の種類のドキュメントから情報とデータを検出して抽出することができます。

  • 開始するには、Document Intelligence サンプル ツールを試し、クイック スタートに従ってください。

  • 更新された Layout API テーブル機能では、複数の行にまたがることができる列ヘッダーを使用してヘッダーが認識されます。 各テーブル セルには、ヘッダーの一部であるかどうかを示す属性があります。 この更新は、テーブル ヘッダーを構成する行を識別するために使用できます。


2021 年 4 月

  • NuGet パッケージ バージョン 3.1.0-ベータ.4

  • 変更ログ/リリース履歴

  • 身分証明書のデータ分析用の新しいメソッド:

    StartRecognizeIdDocumentsFromUriAsync

    StartRecognizeIdDocumentsAsync

    フィールド値の一覧については、Document Intelligence ドキュメントの「抽出されるフィールド」を参照してください。

  • StartRecognizeContent メソッドに指定できるドキュメント言語のセットが拡大されました。

  • 新しいプロパティ Pages が次のクラスでサポートされました:

    RecognizeBusinessCardsOptions
    RecognizeCustomFormsOptions
    RecognizeInvoicesOptions
    RecognizeReceiptsOptions

    Pages プロパティを使用すると、複数のページがある PDF および TIFF ドキュメントの個々のページまたはページの範囲を選択できます。 個々のページの場合は、「3」のようにページ番号を入力します。 ページの範囲 (ページ 2 とページ 5 - 7 など) の場合は、「2, 5-7」のようにページ番号と範囲をコンマで区切って入力します。

  • 新しいプロパティ ReadingOrder が次のクラスでサポートされました:

    RecognizeContentOptions

    ReadingOrder プロパティは省略可能なパラメーターであり、これを使用すると、テキスト要素の抽出順序を決めるために、basic または natural のどちらの読み取り順序アルゴリズムを適用するかを指定できます。 指定しない場合は、既定値の basic が使用されます。

  • API バージョン 2.1-preview.3 の SDK プレビューの更新では、機能の更新と機能強化が導入されています。

2021 年 3 月

Document Intelligence v2.1 パブリック プレビュー v2.1-preview.3 がリリースされ、次の機能が含まれています

  • 新しい事前構築済み ID モデル 新しい事前構築済み ID モデルを使用すると、お客様は ID を取得して構造化データを返し、処理を自動化できます。 強力な光学式文字認識 (OCR) 機能と ID 理解モデルを組み合わせて、パスポートと米国の運転免許証から重要な情報を抽出します。

    事前作成された ID モデルの詳細情報

    Screenshot of a sample passport.

  • 請求書モデルの品目抽出 - 事前構築済み請求書モデルは品目抽出をサポートするようになりました。完全な項目とその一部 (説明、金額、数量、製品 ID、日付など) が抽出されるようになりました。 簡単な API または SDK の呼び出しにより、請求書から有用なデータ (テキスト、テーブル、キーと値のペア、品目) を抽出できます。

    請求書モデルの詳細情報

  • 監視対象テーブルのラベル付けとトレーニング、空の値のラベル付け - Document Intelligence の最先端のディープ ラーニング自動テーブル抽出機能に加えて、お客様がテーブルに対してラベル付けとトレーニングを行えるようになりました。 この新しいリリースには、品目とテーブル (動的と固定) にラベルを付けてトレーニングし、キーと値のペアと品目を抽出するカスタム モデルをトレーニングする機能が含まれています。 モデルのトレーニングが完了すると、モデルにより documentResults セクションの JSON 出力の一部として品目が抽出されます。

    Screenshot of the table labeling feature.

    テーブルにラベルを付けるだけでなく、空の値と領域にラベルを付けることができるようになりました。 トレーニング セット内の一部のドキュメントに特定のフィールドの値がない場合、それらにラベルを付けることで、分析対象のドキュメントから値を適切に抽出するようにモデルに認識させることができます。

  • 66 の新しい言語のサポート - Document Intelligence の Layout API とカスタム モデルは 73 の言語をサポートするようになりました。

    Document Intelligence の言語サポートの詳細情報

  • 自然な読み取り順序、手書きの分類、およびページ選択 - この更新により、既定の左から右、また上から下の順序ではなく、自然な読み取り順序でテキスト行の出力を取得することを選択できます。 新しい readingOrder クエリ パラメーターを使用して "自然な" 値に設定すると、より人間にとってわかりやすい読み取り順序の出力が得られます。 さらに、ラテン系言語の場合、Document Intelligence により、テキスト行が手書きスタイルかどうかが分類され、信頼スコアが与えられます。

  • 事前構築済み領収書モデルの品質改善 この更新には、特に品目の抽出に関する、事前構築済み領収書モデルの品質改善が多数含まれています。


2020 年 11 月

  • Document Intelligence v2.1-preview.2 がリリースされ、次の機能が含まれています

    • 新しい事前構築済み請求書モデル - 新しい事前構築済み請求書モデルにより、お客様はさまざまな形式で請求書を取得し、構造化されたデータを返して、請求書の処理を自動化することができます。 強力な光学式文字認識 (OCR) 機能と、請求書を解釈するディープ ラーニング モデルを組み合わせて、英語の請求書から重要な情報を抽出します。 顧客、仕入先、請求書 ID、請求書の期限、合計、請求額、課税額、出荷先、請求先などの重要なテキスト、テーブル、情報が抽出されます。

      事前作成された請求書モデルの詳細情報

      Screenshot of a sample invoice.

    • 強化されたテーブル抽出 - Document Intelligence によって、強力な光学式文字認識 (OCR) 機能とディープ ラーニング テーブル抽出モデルを組み合わせた拡張テーブル抽出が提供されるようになりました。 Document Intelligence では、テーブル (結合された列、行、境界線を含む複雑なテーブルなど) からデータを抽出できます。

      Screenshot of tables analysis.

      レイアウト抽出の詳細情報

    • クライアント ライブラリの更新 - .NET、Python、Java、JavaScript 用のクライアント ライブラリの最新バージョンでは、Document Intelligence 2.1 API がサポートされています。

    • 新たに日本語をサポート - AnalyzeLayoutAnalyzeCustomForm で新たに日本語 (ja) がサポートされます。 言語サポート

    • テキスト行のスタイルの表示 (手書き/その他) (ラテン言語のみ) - Document Intelligence では、信頼度スコアと共に、各テキスト行が手書きスタイルであるかどうかを分類する appearance オブジェクトが出力されるようになりました。 この機能は、ラテン語系の言語でのみサポートされています。

    • 品質の向上 - 1 桁の抽出の改善を含め、抽出の品質が向上しました。

    • Document Intelligence のサンプル ラベル付けツールの新しい試用機能 - Document Intelligence サンプル ラベル付けツールを使用して、事前作成された請求書、領収書、およびビジネス カード モデルと Layout API を試すことができます。 コードを記述することなく、データがどのように抽出されるかを確認してください。

    • Document Intelligence サンプル ラベル付けツールを試す

      Screenshot of the Sample Labeling tool homepage.

      • フィードバック ループ - サンプル ラベル付けツールを使用してファイルを分析するときに、それをトレーニング セットに追加し、必要に応じてラベルを調整して、モデルを改善するためにトレーニングできるようになりました。
      • ドキュメントの自動ラベル付け - プロジェクト内のラベル付けされた以前のドキュメントに基づいて、追加のドキュメントが自動的にラベル付けされます。

2020 年 8 月

  • **Document Intelligence v2.1-preview.1 には、次の機能が含まれています。

    • REST API リファレンスが利用可能ですv2.1-preview.1 reference を参照。
    • 英語の他に新たに言語をサポートLayoutTrain Custom Model で新たに、英語 (en)、簡体中国語 (zh-Hans)、オランダ語 (nl)、フランス語 (fr)、ドイツ語 (de)、イタリア語 (it)、ポルトガル語 (pt)、スペイン語 (es) の各言語がサポートされます。
    • チェックボックス、選択マークの検出 – Document Intelligence では、チェックボックスやオプション ボタンなどの選択マークの検出および抽出がサポートされています。 選択マークは Layout で抽出されます。また、Train Custom Model - [ラベルを使用したトレーニング] でラベル付けおよびトレーニングを行って、選択マーク用のキーと値のペアを抽出することもできるようになりました。
    • [モデルの作成] を使用すると、1 つのモデル ID で複数のモデルを構成して呼び出すことができます。 作成済みのモデル ID を使用して分析するドキュメントを送信すると、分類ステップが最初に実行され、適切なカスタム モデルにルーティングされます。 モデルの作成は、Train Custom Model - Train Custom Model で使用できます。
    • モデル名。管理と追跡が容易になるように、カスタム モデルにわかりやすい名前を追加します。
    • 新しく事前に構築された名刺のモデル。英語の名刺内の共通のフィールドを抽出するためのものです。
    • 事前構築レシートの新しいロケールが、EN-US に加えて、EN-AU、EN-CA、EN-GB、EN-IN でもサポートされ、利用が可能になりました。
    • 品質向上LayoutTrain Custom Model - [ラベルを使用しないトレーニング]、および [ラベルを使用したトレーニング] が対象となります。
  • v2.0 には、次の更新が含まれています。

    新しいサンプルは GitHub で入手できます。

    • 知識抽出レシピ - Forms Playbook では、Document Intelligence の実際のカスタマー エンゲージメントからベスト プラクティスが収集され、これらのプロジェクトの開発時に使用する便利なコード サンプル、チェックリスト、およびサンプル パイプラインが提供されます。
    • サンプル ラベル付けツールが更新され、新しい v2.1 機能がサポートされるようになりました。 ツールの概要については、こちらのクイックスタートを参照してください。
    • インテリジェント キオスク Document Intelligence サンプルでは、Analyze ReceiptTrain Custom Model - [ラベルを使用しないトレーニング] を統合する方法について示します。

2020 年 7 月

  • Document Intelligence v2.0 リファレンスが使用可能 - v2.0 API リファレンスと、.NETPythonJava、および JavaScript 用のアップデートされたクライアント ライブラリを参照できます。
    • テーブルの機能強化と抽出の機能強化には、精度の向上とテーブル抽出の機能強化が含まれています。特に、"ラベルのないカスタム トレーニング" でテーブルのヘッダーと構造を学習する機能が追加されています。

    • 通貨のサポート - グローバル通貨記号の検出と抽出。

    • Azure Gov - Document Intelligence が、Azure Gov でも使用できるようになりました。

    • 強化されたセキュリティ機能:

      • Bring Your Own Key - Document Intelligence は、クラウドに永続化されたときにデータを自動的に暗号化して保護し、セキュリティとコンプライアンスに関する組織のコミットメントを満たすのに役立つようにします。 サブスクリプションでは、Microsoft が管理する暗号化キーが既定で使用されます。 ユーザー独自の暗号化キーを使用してサブスクリプションを管理することもできるようになりました。 カスタマー マネージド キー (Bring Your Own Key (BYOK) とも呼ばれます) を使用すると、アクセス制御の作成、ローテーション、無効化、取り消しを、いっそう柔軟に行うことができます また、データを保護するために使われる暗号化キーを監査することもできます。
      • プライベート エンドポイント – 仮想ネットワークを使用して、Private Link を介してデータに安全にアクセスできるようになります。

2020 年 6 月


2020 年 4 月

  • Document Intelligence API v2.0 パブリック プレビューの SDK サポート - 今月、サービス サポートが拡張され、Document Intelligence v2.0 リリースのプレビュー SDK が含まれるようになりました。 以下のリンクを使用して、任意の言語で作業を開始してください。
  • .NET SDK
  • Java SDK
  • Python SDK
  • JavaScript SDK

新しい SDK では、Document Intelligence 用の v2.0 REST API のすべての機能がサポートされています。 クライアント ライブラリに関するフィードバックは、SDK フィードバック フォームを通じて共有できます。

  • カスタム モデルのコピー 新しいカスタム モデルのコピー機能を使用して、リージョン間やサブスクリプション間でモデルをコピーできるようになりました。 Copy Custom Model API を呼び出す前に、まずターゲット リソースにコピーするための認可を取得する必要があります。 この認可は、ターゲット リソース エンドポイントに対してコピー認可操作を呼び出すとセキュリティ保護されます。

  • コピー承認 REST API の生成。

  • カスタム モデル REST API のコピー。

  • セキュリティの強化。

  • FormRecognizer でカスタマー マネージド キーが利用できるようになりました。 詳細については、「Document Intelligence による保存データの暗号化」を参照してください。

  • Azure Active Directory を使用した Azure リソースへのアクセスにマネージド ID を使用します。 詳細については、マネージド ID に対するアクセスの承認に関するページを参照してください。


2020 年 3 月

  • ラベル付けの値の種類 Document Intelligence サンプル ラベル付けツールを使用して、ラベル付けする値の種類を指定できるようになりました。 現在、次の値の型とバリエーションがサポートされています。
  • string
    • 既定値、no-whitespacesalphanumeric
  • number
    • 既定値、currency
  • date
    • 既定値、dmymdyymd
  • time
  • integer

この機能の使用方法については、サンプル ラベル付けツール ガイドを参照してください。

  • テーブルの視覚化 サンプル ラベル付けツールで、ドキュメントで認識されたテーブルが表示されるようになりました。 この機能により、ラベル付けおよび分析を行う前に、ドキュメントから認識されて抽出されたテーブルを表示できます。 この機能は、レイヤー オプションを使用してオンとオフを切り替えることができます。

  • 次の図に、テーブルが認識されて抽出される方法の例を示します。

    Screenshot of table visualization using the Sample Labeling tool.

  • 抽出されたテーブルは、"pageResults" の JSON 出力で使用できます。

    重要

    テーブルのラベル付けはサポートされていません。 テーブルの認識と抽出が自動的に行われない場合は、キーと値のペアとしてのみラベルを付けることができます。 キーと値のペアとしてテーブルのラベル付けを行うときは、各セルに固有の値としてラベルを付けます。

  • 抽出機能の強化。

  • このリリースでは、抽出の機能強化と精度の向上が行われています。具体的には、テキストの同じ行に複数のキーと値のペアが含まれる場合の、ラベル付けと抽出の機能です。

  • サンプルのラベル付けツールがオープンソースになりました。

  • Document Intelligence のサンプル ラベル付けツールが、オープンソース プロジェクトとして使用できるようになりました。 ソリューションにそれを統合し、ニーズに合わせて顧客固有の変更を行うことができます。

  • Document Intelligence のサンプル ラベル付けツールの詳細については、GitHub で入手できるドキュメントを参照してください。

  • TLS 1.2 の適用。

  • TLS 1.2 は現在、このサービスへのすべての HTTP 要求に適用されるようになりました。 詳しくは、Azure AI サービスのセキュリティをご覧ください。


2020 年 1 月

このリリースでは、Document Intelligence 2.0 が導入されています。 次のセクションでは、新機能、機能強化、および変更の詳細について説明します。

  • 新機能

    • カスタム モデル

      • ラベルを使用したトレーニング 手動でラベル付けされたデータを使用して、カスタム モデルをトレーニングできるようになりました。 この方法より、性能の高いモデルが得られ、複雑なフォームやキーのない値を含んだフォームでも機能するモデルを作成することが可能です。
      • 非同期 API 非同期 API 呼び出しを使用して、大規模なデータ セットおよびファイルをトレーニングして分析できます。
      • TIFF ファイルのサポート TIFF ドキュメントからのデータをトレーニングして、抽出できるようになりました。
      • 抽出精度の向上
    • 構築済みのレシート モデル

      • チップの金額 チップの金額とその他の手書きの値を抽出できるようになりました。
      • 品目の抽出 レシートから品目の値を抽出できます。
      • 信頼値 抽出された各値のモデルの信頼度を表示できます。
      • 抽出精度の向上
      • レイアウトの抽出 レイアウト API を使用して、フォームからテキスト データとテーブル データを抽出できるようになりました。
  • カスタム モデル API の変更点

    カスタム モデルのトレーニングと使用のための API 名がすべて変更され、一部の同期メソッドは非同期になりました。 主な変更点は次のとおりです。

    • モデルのトレーニング プロセスが非同期になりました。 /custom/models API 呼び出し経由で、トレーニングを開始します。 この呼び出しでは、操作 ID が返されます。この ID を custom/models/{modelID} に渡すと、トレーニング結果を返すことができます。
    • キー/値の抽出は、 /custom/models/{modelID}/analyze API 呼び出しによって開始されるようになりました。 この呼び出しでは操作 ID が返され、それを custom/models/{modelID}/analyzeResults/{resultID} に渡すと、抽出結果を返すことができます。
    • トレーニング操作の操作 ID は、Operation-Location ヘッダーではなく、HTTP 応答の Location ヘッダー内に配置されるようになりました。
  • レシート API の変更点

    • 販売レシートを読み取るための API の名前が変更されました。

    • レシート データの抽出は、 /prebuilt/receipt/analyze API 呼び出しによって開始されるようになりました。 この呼び出しでは操作 ID が返され、それを /prebuilt/receipt/analyzeResults/{resultID} に渡すと、抽出結果を返すことができます。

  • 出力形式の変更点

    • すべての API 呼び出しへの JSON 応答には、新しい形式が用意されています。 一部のキーと値が追加、削除、または名前変更されました。 現在の JSON 形式の例については、クイックスタートを参照してください。

次のステップ