Azure Form Recognizer の新機能

この記事の適用対象:Form Recognizer v2.1 チェックマークForm Recognizer v3.0Form Recognizer v2.1 チェックマークForm Recognizer v2.1

Form Recognizer サービスは、継続的に更新されます。 このページをブックマークして、リリースノート、機能強化、最新のドキュメントを入手してください。

注意

2022-08-31 GA API のリリースに伴い、関連するプレビュー API は非推奨とされます。 2021-09-30-preview または 2022-01-30-preview API バージョンを使用している場合は、2022-08-31 API バージョンをターゲットとするようにアプリケーションを更新してください。 いくつかのマイナー変更が必要です。詳細については、「移行ガイド」を参照してください。

2022 年 10 月


  • Form Recognizer のバージョン管理されたコンテンツ

    • Form Recognizer ドキュメントが更新され、バージョン管理されたエクスペリエンスが提供されました。 これで、v3.0 GA エクスペリエンスまたは v2.1 GA エクスペリエンスを対象とするコンテンツを表示することを選択できます。 v3.0 エクスペリエンスが既定です。

      バージョンドロップダウン メニューを表示する Form Recognizer ランディング ページのスクリーンショット。

  • Form Recognizer Studio サンプル コード

    • Form Recognizer Studio ラベル付けエクスペリエンスのサンプル コードは、GitHub で使用できるようになりました。 顧客は、Form Recognizer を開発して独自の UX に統合したり、Form Recognizer Studio サンプル コードを使用して独自の新しい UX を構築したりすることができます。
  • 言語の増加

    • 最新のプレビュー リリースでは、Form Recognizer の Read (OCR)、Layout、Custom テンプレート モデルで 134 の新しい言語がサポートされています。 これらの言語の追加には、ギリシャ語、ラトビア語、セルビア語、タイ語、ウクライナ語、ベトナム語、いくつかのラテン語とキリル語が含まれます。 Form Recognizer の最新の GA と新しいプレビュー バージョンでサポートされる言語は、合計 299 個になりました。 サポートされているすべての言語については、サポートされている言語のページを参照してください。
    • API または対応する SDK を使用してアプリケーションで新しい言語をサポートする場合は、REST API パラメーター api-version=2022-06-30-preview を使用します。
  • 新しい事前構築済みコントラクト モデル

    • パーティ、タイトル、コントラクト ID、実行日などの情報をコントラクトから抽出する新しい事前構築。 コントラクトは現在プレビュー段階です。こちらからアクセスを要求してください。
  • カスタム ニューラル モデルをトレーニングするためのリージョンの拡大

    • カスタム ニューラル モデルのトレーニングは、追加リージョンでサポートされるようになりました。
      • 米国東部
      • 米国東部 2
      • US Gov アリゾナ

2022 年 9 月

Note

バージョン 4.0.0 以降、Form Recognizer サービスの最新機能を活用するために、新しいクライアント セットが導入されています。

SDK バージョン 4.0.0 GA リリースには、次の更新が含まれています

  • バージョン 4.0.0 GA (2022-09-08)
  • REST API v3.0 および v2.0 クライアントをサポート

パッケージ (NuGet)

変更ログ/リリース履歴

移行ガイド

ReadMe

サンプル

  • カスタム ニューラル モデルをトレーニングするための領域拡張が、6 つの新しい領域でサポートされるようになりました

    • オーストラリア東部
    • 米国中部
    • 東アジア
    • フランス中部
    • 英国南部
    • 米国西部 2
    • トレーニングがサポートされているリージョンの完全な一覧については、カスタム ニューラル モデルに関する記事を参照してください。

    • Form Recognizer SDK バージョン 4.0.0 GA リリース

      • Form Recognizer SDK バージョン 4.0.0 (.NET/C#、Java、JavaScript) とバージョン 3.2.0 (Python) が一般公開され、実稼働アプリケーションで使用できます。
      • Form Recognizer SDK の詳細については、「SDK の概要」を参照してください。
      • プログラミング言語の移行ガイドを使用してアプリケーションを更新します(上記を参照)。

2022 年 8 月

Form Recognizer SDK ベータ版 2022 年 8 月のプレビュー リリースには、次の更新が含まれています

バージョン 4.0.0-beta.5 (2022-08-09)

変更ログ/リリース履歴

パッケージ (NuGet)

SDK のリファレンス ドキュメント

  • Form Recognizer 3.0 の一般提供

    • Form Recognizer REST API v3.0 が一般公開され、運用アプリケーションで使用できるようになりました。 REST API バージョン 2022-08-31 でアプリケーションを更新してください。
  • Form Recognizer Studio の更新プログラム

    • 次の手順。 Studio の各モデル ページの下に、[次の手順] セクションが追加されました。 ユーザーは、サンプル コード、トラブルシューティング ガイドライン、価格情報をすばやく参照できます。
    • カスタム モデル。 Studio には、ラベル付けの効率を向上させるために、カスタム モデル プロジェクトでラベルを並べ替える機能が含まれるようになりました。
    • モデルのコピー。カスタム モデルは、Studio 内から Form Recognizer サービス間でコピーできます。 この操作により、トレーニング済みのモデルを他の環境やリージョンに昇格できます。
    • ドキュメントの削除。 Studio では、カスタム プロジェクト内のラベル付きデータセットからドキュメントを削除できるようになりました。
  • Form Recognizer サービスの更新情報

    • prebuilt-read。 Read OCR モデルは Form Recognizer でも使用できるようになり、2 つの新機能として、段落と言語検出を備えています。 Form Recognizer の読み取りは、Form Recognizer のより広範なドキュメント インテリジェンス機能に合わせた高度なドキュメント シナリオを対象とします。
    • 事前構築済みレイアウト。 レイアウト モデルでは、段落が抽出され、抽出されたテキストが段落、タイトル、セクション見出し、脚注、ページ ヘッダー、ページ フッター、またはページ番号のいずれであるかが抽出されます。
    • 事前構築済みの請求書。 TotalVAT フィールドと Line/VAT フィールドが、それぞれ既存のフィールド TotalTax と Line/Tax に解決されるようになりました。
    • 事前構築済みの ID ドキュメント。 データ抽出で、米国の州 ID、社会保障、グリーン カードがサポートされます。 パスポート ビザ情報がサポートされます。
    • 事前構築済みのレシート。 フランス語 (fr-FR)、スペイン語 (es-ES)、ポルトガル語 (pt-PT)、イタリア語 (it-IT)、ドイツ語 (de-DE) のロケール サポートが拡張されました。
    • 事前構築済みの名刺。 住所、市区町村、都道府県、国、郵便番号などの住所コンポーネントのサブフィールドを抽出するためのアドレス解析のサポート。
  • AI 品質の改善

    • prebuilt-read。 1 文字、手書きの日付、金額、名前、領収書や請求書でよく見られるその他のエンティティのサポートが強化され、デジタル PDF ドキュメントの処理が改善されました。
    • 事前構築済みレイアウト。 トリミングされたテーブルの検出、罫線のないテーブルの検出、長いスパンセルの認識の向上をサポートします。
    • 事前構築済みドキュメント。 値とチェック ボックスの検出が改善されました。
    • カスタム ニューラル。 テーブルの検出と抽出の精度が向上しました。

2022 年 6 月

  • Form Recognizer SDK ベータ版 2022 年 6 月のプレビュー リリースには、次の更新プログラムが含まれています。

2022 年 2 月

  • Form Recognizer v3.0 プレビュー リリースでは、いくつかの新機能、機能と機能強化が導入されています。

    • カスタム ニューラル モデル またはカスタム ドキュメント モデルは、構造化フォーム、半構造化ドキュメント、非構造化ドキュメントからテキストと選択マークを抽出するための新しいカスタム モデルです。
    • W-2 事前構築済みモデル は、税務報告および所得検証シナリオのために W-2 フォームからフィールドを抽出するための新しい事前構築モデルです。
    • 読み取り API は、印刷されたテキスト行、単語、テキスト位置、検出された言語、および手書きテキストを抽出します (検出された場合)。
    • 一般的な ドキュメント 事前トレーニング済みモデルが更新され、API テキスト、テーブル、構造、キーと値のペア、およびフォームとドキュメントからの名前付きエンティティに加えて、選択マークがサポートされます。
    • Invoice API 請求書の事前構築済みモデルは、スペイン語の請求書もサポートするように拡張されています。
    • Form Recognizer Studio では、 Read、W2、Hotel のレシート サンプルの新しいデモと、新しいカスタム ニューラル モデルのトレーニングのサポートが追加されます。
    • 言語拡張 Form Recognizer の読み取り、レイアウト、カスタム フォームでは、アラビア語、ヒンディ語、およびアラビア文字とデーヴァナーガリー文字を使用したその他の言語を含む 42 の新しい言語のサポートが追加され、164 の言語に範囲が広がっています。 手書き言語のサポートが、日本語と韓国語に拡張されています。
  • v3.0 プレビュー API の新しい REST APIPython、または .NET SDK を利用できます。

  • Form Recognizer モデルのデータ抽出

    Model テキストの抽出 キーと値のペア 選択マーク テーブル シグネチャ
    Read
    一般ドキュメント
    Layout
    請求書
    Receipt
    身分証明書
    名刺
    カスタム テンプレート
    カスタム ニューラル
  • Form Recognizer SDK ベータ プレビュー リリースには、次の更新プログラムが含まれています。


2021 年 11 月

  • Form Recognizer v3.0 プレビュー SDK リリース更新プログラム (ベータ 2) には、バグ修正とマイナーな機能更新プログラムが組み込まれています。

2021 年 10 月

  • Form Recognizer v3.0 プレビュー リリース バージョン 4.0.0-beta.1 (2021 年 10 月 7 日) では、いくつかの新機能が導入されています

    • 一般的なドキュメント モデルは新しい API であり、事前トレーニング済みのモデルを使用して、テキスト、テーブル、構造、キーと値のペア、名前付きエンティティがフォームとドキュメントから抽出されます。

    • ホテルの領収書モデルが、構築済みの受信確認処理に追加されました。

    • 身分証明書の展開されたフィールド ID モデルでは、米国の運転免許証からの署名、制限、車両分類の抽出がサポートされています。

    • 署名フィールドは、フォーム フィールド内の署名の有無を検出するカスタム フォームの新しいフィールドの種類です。

    • 言語の展開 122 言語 (印刷) と 7 言語 (手書き) のサポート。 Form Recognizer のレイアウトとカスタム フォームでは、最新のプレビューでサポートされる言語が 122 個に拡大されました。 このプレビューには、49 個の新しい言語 (ロシア語、ブルガリア語、その他のキリル語系やラテン語系など) での印刷テキストに対するテキスト抽出が含まれています。 また、手書きテキストの抽出では、英語を含む 7 個の言語と、新たに簡体字中国語、フランス語、ドイツ語、イタリア語、ポルトガル語、スペイン語の新しいプレビューがサポートされるようになりました。

    • テーブルとテキスト抽出の機能強化 レイアウトは、キーと値のテーブルとも呼ばれる単一行テーブルの抽出をサポートするようになりました。 テキスト抽出の機能強化には、デジタル PDF や身分証明書内の機械可読ゾーン (MRZ) テキストの処理の向上、全般的なパフォーマンスの向上が含まれます。

    • Form Recognizer Studio サービスの使用を簡単にするために、Form Recognizer Studio にアクセスして、さまざまな事前構築済みモデルをテストしたり、カスタム モデルにラベルを付けてトレーニングしたりすることができるようになりました。

    • v3.0 プレビュー API の新しい REST APIPython、または .NET SDK を利用できます。

  • Form Recognizer モデルのデータ抽出

    Model テキストの抽出 キーと値のペア 選択マーク テーブル エンティティ
    一般ドキュメント
    Layout
    請求書
    Receipt
    身分証明書
    名刺
    Custom

2021 年 9 月

  • Azure portal の Form Recognizer リソースの概要ページで、Azure メトリックス エクスプローラーの高度な機能を使用できます。

  • 監視メニュー

    Azure portal の監視メニューを示すスクリーンショット

  • グラフ

    Azure portal のサンプルのメトリック グラフを示すスクリーンショット。

  • 身分証明書モデルの更新: サフィックスを含む名前がある場合、ピリオド (フル ストップ) の有無にかかわらず、正常に処理されます。

    入力テキスト 更新された結果
    William Isaac Kirby Jr. FirstName: William Isaac

    : Kirby Jr.
    Henry Caleb Ross Sr FirstName: Henry Caleb

    : Ross Sr

2021 年 7 月

  • システム割り当てマネージド ID のサポート: システム割り当てマネージド ID を有効にして、プライベート ストレージ アカウントへの制限付きアクセスを Form Recognizer に許可できるようになりました。これには、Virtual Network (VNet) またはファイアウォールで保護されているアカウントや、BYOS (Bring Your Own Storage) が有効になっているアカウントが含まれます。 詳細については、「Form Recognizer リソース用のマネージド ID を作成して使用する」を "参照" してください。

2021 年 6 月

| | | | |

  • Form Recognizer コンテナー v2.1 はゲート プレビューでリリースされ、レイアウト名刺ID ドキュメント領収書請求書カスタムの 6 つの機能コンテナーでサポートされるようになりました。 これらを使用するには、オンライン リクエストを送信し、承認を受ける必要があります。

  • プレビューでリリースされた Form Recognizer コネクタ: Form Recognizer コネクタは、Azure Logic AppsMicrosoft Power Automate、および Microsoft Power Apps と統合されます。 このコネクタは、カスタムおよび事前構築済みのフォーム、請求書、レシート、名刺、身分証明書から、ドキュメントのデータと構造を抽出および分析するワークフローのアクションとトリガーをサポートしています。

  • Form Recognizer SDK v3.1.0 は、C#、Java、Python 用の パッチが適用され、v3.1.1 になりました。 このパッチは、FormFieldText があるが BoundingBoxPage の情報がないなど、サブ行項目フィールドが検出されない請求書に対処しています。


2021 年 5 月

  • Form Recognizer 2.1 は、一般提供されています。 GA リリースは、以前の 2.1 プレビュー パッケージ バージョンで導入された変更の安定性を示しています。 このリリースでは、次の種類のドキュメントから情報とデータを検出して抽出することができます。

  • 開始するには、Form Recognizer サンプル ツール を試し、クイック スタートに従ってください。

  • 更新された Layout API テーブル機能では、複数の行にまたがることができる列ヘッダーを使用してヘッダーが認識されます。 各テーブル セルには、ヘッダーの一部であるかどうかを示す属性があります。 この更新は、テーブル ヘッダーを構成する行を識別するために使用できます。


2021 年 4 月

  • *NuGet パッケージ バージョン 3.1.0-ベータ.4

  • 変更ログ/リリース履歴

  • 身分証明書のデータ分析用の新しいメソッド:

    StartRecognizeIdDocumentsFromUriAsync

    StartRecognizeIdDocumentsAsync

    フィールド値の一覧については、Form Recognizer ドキュメントの「抽出されるフィールド」を "参照" してください。

  • StartRecognizeContent メソッドに指定できるドキュメント言語のセットが拡大されました。

  • 新しいプロパティ が次のクラスでサポートされました:

    RecognizeBusinessCardsOptionsRecognizeCustomFormsOptionsRecognizeInvoicesOptionsRecognizeReceiptsOptions

    Pages プロパティを使用すると、複数のページがある PDF および TIFF ドキュメントの個々のページまたはページの範囲を選択できます。 個々のページの場合は、「3」のようにページ番号を入力します。 ページの範囲 (ページ 2 とページ 5 - 7 など) の場合は、「2, 5-7」のようにページ番号と範囲をコンマで区切って入力します。

  • 新しいプロパティ が次のクラスでサポートされました:

    RecognizeContentOptions

    ReadingOrder プロパティは省略可能なパラメーターであり、これを使用すると、テキスト要素の抽出順序を決めるために、basic または natural のどちらの読み取り順序アルゴリズムを適用するかを指定できます。 指定しない場合は、既定値の basic が使用されます。

  • API バージョン 2.1-preview.3 の SDK プレビューの更新では、機能の更新と機能強化が導入されています。

2021 年 3 月

Form Recognizer v2.1 パブリック プレビュー v2.1-preview.3 がリリースされ、次の機能が含まれています

  • 新しい事前構築済み ID モデル 新しい事前構築済み ID モデルを使用すると、お客様は ID を取得して構造化データを返し、処理を自動化できます。 強力な光学式文字認識 (OCR) 機能と ID 理解モデルを組み合わせて、パスポートと米国の運転免許証から重要な情報を抽出します。

    事前作成された ID モデルの詳細情報

    サンプル パスポートのスクリーンショット。

  • 請求書モデルの品目抽出 - 事前構築済み請求書モデルは品目抽出をサポートするようになりました。完全な項目とその一部 (説明、金額、数量、製品 ID、日付など) が抽出されるようになりました。 簡単な API または SDK の呼び出しにより、請求書から有用なデータ (テキスト、テーブル、キーと値のペア、品目) を抽出できます。

    請求書モデルの詳細について確認してください

  • 監視対象テーブルのラベル付けとトレーニング、空の値のラベル付け - Form Recognizer の最先端のディープ ラーニング自動テーブル抽出機能に加えて、お客様がテーブルに対してラベル付けとトレーニングを行えるようになりました。 この新しいリリースには、品目とテーブル (動的と固定) にラベルを付けてトレーニングし、キーと値のペアと品目を抽出するカスタム モデルをトレーニングする機能が含まれています。 モデルのトレーニングが完了すると、モデルにより documentResults セクションの JSON 出力の一部として品目が抽出されます。

    テーブルのラベル付け機能のスクリーンショット.

    テーブルにラベルを付けるだけでなく、空の値と領域にラベルを付けることができるようになりました。 トレーニング セット内の一部のドキュメントに特定のフィールドの値がない場合、それらにラベルを付けることで、分析対象のドキュメントから値を適切に抽出するようにモデルに認識させることができます。

  • 66 の新しい言語のサポート - Form Recognizer の Layout API とカスタム モデルは 73 の言語をサポートするようになりました。

    Form Recognizer の言語サポートの詳細

  • 自然な読み取り順序、手書きの分類、およびページ選択 - この更新により、既定の左から右、また上から下の順序ではなく、自然な読み取り順序でテキスト行の出力を取得することを選択できます。 新しい readingOrder クエリ パラメーターを使用して "自然な" 値に設定すると、より人間にとってわかりやすい読み取り順序の出力が得られます。 さらに、ラテン語の場合、Form Recognizer により、テキスト行が手書きスタイルかどうかが分類され、信頼スコアが与えられます。

  • 事前構築済み領収書モデルの品質改善 この更新には、特に品目の抽出に関する、事前構築済み領収書モデルの品質改善が多数含まれています。


2020 年 11 月

  • Form Recognizer v2.1-preview.2 がリリースされ、次の機能が含まれています。

    • 新しい事前構築済み請求書モデル - 新しい事前構築済み請求書モデルにより、お客様はさまざまな形式で請求書を取得し、構造化されたデータを返して、請求書の処理を自動化することができます。 強力な光学式文字認識 (OCR) 機能と、請求書を解釈するディープ ラーニング モデルを組み合わせて、英語の請求書から重要な情報を抽出します。 顧客、仕入先、請求書 ID、請求書の期限、合計、請求額、課税額、出荷先、請求先などの重要なテキスト、テーブル、情報が抽出されます。

      事前作成された請求書モデルの詳細情報

      サンプルの請求書のスクリーンショット。

    • 強化されたテーブル抽出 - Form Recognizer によって、強力な光学式文字認識 (OCR) 機能とディープ ラーニング テーブル抽出モデルを組み合わせた拡張テーブル抽出が提供されるようになりました。 Form Recognizer では、テーブル (結合された列、行、境界線を含む複雑なテーブルなど) からデータを抽出できます。

      テーブル分析のスクリーンショット。

      レイアウト抽出の詳細情報

    • クライアント ライブラリの更新 - .NET、Python、Java、JavaScript 用のクライアント ライブラリの最新バージョンでは、Form Recognizer 2.1 API がサポートされています。

    • 新たに日本語をサポート - AnalyzeCustomForm で新たに日本語 (ja) がサポートされます。 言語サポート

    • テキスト行のスタイルの表示 (手書き/その他) (ラテン言語のみ) - Form Recognizer では、信頼度スコアと共に、各テキスト行が手書きスタイルであるかどうかを分類する オブジェクトが出力されるようになりました。 この機能は、ラテン語系の言語でのみサポートされています。

    • 品質の向上 - 1 桁の抽出の改善を含め、抽出の品質が向上しました。

    • Form Recognizer のサンプル ラベル付けツールの新しい試用機能 - Form Recognizer サンプル ラベル付けツールを使用して、事前作成された請求書、領収書、およびビジネス カード モデルと Layout API を試すことができます。 コードを記述せずにデータがどのように抽出されるかを確認してください。

    • Form Recognizer のサンプル ラベル付けツールをお試しください

      サンプル ラベル付けツールのホームページのスクリーンショット。

      • フィードバック ループ - サンプル ラベル付けツールを使用してファイルを分析するときに、それをトレーニング セットに追加し、必要に応じてラベルを調整して、モデルを改善するためにトレーニングできるようになりました。
      • ドキュメントの自動ラベル付け - プロジェクト内のラベル付けされた以前のドキュメントに基づいて、追加のドキュメントが自動的にラベル付けされます。

2020 年 8 月

  • **Form Recognizer v2.1-preview.1 がリリースされ、次の機能が含まれています。

    • REST API リファレンスが利用可能 - v2.1-preview.1 referenceを参照してください
    • 英語の他に新たに言語をサポート で新たに、英語 (en)、簡体中国語 (zh-Hans)、オランダ語 (nl)、フランス語 (fr)、ドイツ語 (de)、イタリア語 (it)、ポルトガル語 (pt)、スペイン語 (es) の各言語がサポートされます。
    • チェックボックス、選択マークの検出 – Form Recognizer では、チェックボックスやオプション ボタンなどの選択マークの検出および抽出がサポートされています。 選択マークは Layout で抽出されます。また、Train Custom Model - [ラベルを使用したトレーニング] でラベル付けおよびトレーニングを行って、選択マーク用のキーと値のペアを抽出することもできるようになりました。
    • [モデルの作成] を使用すると、1 つのモデル ID で複数のモデルを構成して呼び出すことができます。 作成済みのモデル ID を使用して分析するドキュメントを送信すると、分類ステップが最初に実行され、適切なカスタム モデルにルーティングされます。 モデルの作成は、Train Custom Model - Train Custom Model で使用できます。
    • モデル名。管理と追跡が容易になるように、カスタム モデルにわかりやすい名前を追加します。
    • 新しく事前に構築された名刺のモデル。英語の名刺内の共通のフィールドを抽出するためのものです。
    • 新しく事前に構築されたレシートのロケール。EN-US に加えて、EN-AU、EN-CA、EN-GB、EN-IN でもサポートを利用できるようになりました
    • 品質向上Train Custom Model - Train Custom Model、および - が対象となります。
  • v2.0 には、次の更新が含まれています。

    新しいサンプルは GitHub で入手できます。

    • 知識抽出レシピ - Forms Playbook では、Form Recognizer の実際のカスタマー エンゲージメントからベスト プラクティスが収集され、これらのプロジェクトの開発時に使用する便利なコード サンプル、チェックリスト、およびサンプル パイプラインが提供されます。
    • サンプルラベル付けツール が、v2.1 の新機能をサポートするように更新されました。 ツールの概要については、こちらのクイックスタートを参照してください。
    • インテリジェント キオスク Form Recognizer サンプルでは、Train Custom Model - Train Custom Model を統合する方法について示します。

2020 年 7 月

  • Form Recognizer v2.0 リファレンスが使用可能v2.0 API リファレンスと、.NETPythonJava、および JavaScript 用のアップデートされた SDK を参照できます。
    • テーブルの機能強化と抽出の機能強化には、精度の向上とテーブル抽出の機能強化が含まれています。特に、"ラベルのないカスタム トレーニング" でテーブルのヘッダーと構造を学習する機能が追加されています。

    • 通貨のサポート - グローバル通貨記号の検出と抽出。

    • Azure Gov - Form Recognizer が、Azure Gov でも使用できるようになりました。

    • 強化されたセキュリティ機能:

      • Bring Your Own Key - Form Recognizer は、クラウドに永続化されたときにデータを自動的に暗号化して保護し、セキュリティとコンプライアンスに関する組織のコミットメントを満たすのに役立つようにします。 サブスクリプションでは、Microsoft が管理する暗号化キーが既定で使用されます。 ユーザー独自の暗号化キーを使用してサブスクリプションを管理することもできるようになりました。 カスタマー マネージド キー (Bring Your Own Key (BYOK) とも呼ばれます) を使用すると、アクセス制御の作成、ローテーション、無効化、取り消しを、いっそう柔軟に行うことができます また、データを保護するために使われる暗号化キーを監査することもできます。
      • プライベート エンドポイント – 仮想ネットワークを使用して、Private Link を介してデータに安全にアクセスできるようになります。

2020 年 6 月


2020 年 4 月

  • Form Recognizer API v2.0 パブリック プレビューの SDK サポート - 今月、サービス サポートが拡張され、Form Recognizer v2.0 リリースのプレビュー SDK が含まれるようになりました。 以下のリンクを使用して、任意の言語で作業を開始してください。
  • .NET SDK
  • Java SDK
  • Python SDK
  • JavaScript SDK

新しい SDK では、Form Recognizer 用の v2.0 REST API のすべての機能がサポートされています。 SDK に関するフィードバックは、SDK フィードバック フォームを通じて共有できます。

  • カスタム モデルのコピー 新しいカスタム モデルのコピー機能を使用して、リージョン間やサブスクリプション間でモデルをコピーできるようになりました。 Copy Custom Model API を呼び出す前に、まずターゲット リソースにコピーするための認可を取得する必要があります。 この認可は、ターゲット リソース エンドポイントに対してコピー認可操作を呼び出すとセキュリティ保護されます。

  • コピー承認を生成する REST API

  • カスタム モデルをコピーする REST API

  • セキュリティの強化

  • FormRecognizer でカスタマー マネージド キーが利用できるようになりました。 詳細については、Form Recognizer による保存データの暗号化に関するページを参照してください。

  • Azure Active Directory を使用した Azure リソースへのアクセスにマネージド ID を使用します。 詳細については、マネージド ID に対するアクセスの承認に関するページを参照してください。


2020 年 3 月

  • ラベル付けの値の種類 Form Recognizer サンプル ラベル付けツールを使用して、ラベル付けする値の種類を指定できるようになりました。 現在、次の値の型とバリエーションがサポートされています。
  • string
    • 既定値、no-whitespacesalphanumeric
  • number
    • 既定値、currency
  • date
    • 既定値、dmymdyymd
  • time
  • integer

この機能の使用方法については、サンプル ラベル付けツール ガイドを参照してください。

  • テーブルの視覚化 サンプル ラベル付けツールで、ドキュメントで認識されたテーブルが表示されるようになりました。 この機能により、ラベル付けおよび分析を行う前に、ドキュメントから認識されて抽出されたテーブルを表示できます。 この機能は、レイヤー オプションを使用してオンとオフを切り替えることができます。

  • 次の図に、テーブルが認識されて抽出される方法の例を示します。

    サンプル ラベル付けツールを使用したテーブルの視覚化のスクリーンショット.

  • 抽出されたテーブルは、"pageResults" の JSON 出力で使用できます。

    重要

    テーブルのラベル付けはサポートされていません。 テーブルの認識と抽出が自動的に行われない場合は、キーと値のペアとしてのみラベルを付けることができます。 キーと値のペアとしてテーブルのラベル付けを行うときは、各セルに固有の値としてラベルを付けます。

  • 抽出の機能強化

  • このリリースでは、抽出の機能強化と精度の向上が行われています。具体的には、テキストの同じ行に複数のキーと値のペアが含まれる場合の、ラベル付けと抽出の機能です。

  • サンプル ラベル付けツールがオープンソースになりました

  • Form Recognizer のサンプル ラベル付けツールが、オープンソース プロジェクトとして使用できるようになりました。 ソリューションにそれを統合し、ニーズに合わせて顧客固有の変更を行うことができます。

  • Form Recognizer のサンプル ラベル付けツールの詳細については、GitHub で入手できるドキュメントを参照してください。

  • TLS 1.2 の適用

  • TLS 1.2 は現在、このサービスへのすべての HTTP 要求に適用されるようになりました。 詳細については、Azure Cognitive Services のセキュリティに関するページを参照してください。


2020 年 1 月

このリリースでは、Form Recognizer 2.0 が導入されています。 以下のセクションでは、新機能、機能強化、および変更の詳細について説明します。

  • 新機能

    • カスタム モデル

      • ラベルを使用したトレーニング 手動でラベル付けされたデータを使用して、カスタム モデルをトレーニングできるようになりました。 この方法より、性能の高いモデルが得られ、複雑なフォームやキーのない値を含んだフォームでも機能するモデルを作成することが可能です。
      • 非同期 API 非同期 API 呼び出しを使用して、大規模なデータ セットおよびファイルをトレーニングして分析できます。
      • TIFF ファイルのサポート TIFF ドキュメントからのデータをトレーニングして、抽出できるようになりました。
      • 抽出精度の向上
    • 構築済みのレシート モデル

      • チップの金額 チップの金額とその他の手書きの値を抽出できるようになりました。
      • 品目の抽出 レシートから品目の値を抽出できます。
      • 信頼値 抽出された各値のモデルの信頼度を表示できます。
      • 抽出精度の向上
    • レイアウトの抽出 レイアウト API を使用して、フォームからテキスト データとテーブル データを抽出できるようになりました。

  • カスタム モデル API の変更点

    カスタム モデルのトレーニングと使用のための API 名がすべて変更され、一部の同期メソッドは非同期になりました。 主な変更点は次のとおりです。

    • モデルのトレーニング プロセスが非同期になりました。 /custom/models API 呼び出し経由で、トレーニングを開始します。 この呼び出しでは、操作 ID が返されます。この ID を custom/models/{modelID} に渡すと、トレーニング結果を返すことができます。
    • キー/値の抽出は、 /custom/models/{modelID}/analyze API 呼び出しによって開始されるようになりました。 この呼び出しでは操作 ID が返され、それを custom/models/{modelID}/analyzeResults/{resultID} に渡すと、抽出結果を返すことができます。
    • トレーニング操作の操作 ID は、Operation-Location ヘッダーではなく、HTTP 応答の Location ヘッダー内に配置されるようになりました。
  • レシート API の変更点

    • 販売レシートを読み取る API の名前が変更されました。

    • レシート データの抽出は、 /prebuilt/receipt/analyze API 呼び出しによって開始されるようになりました。 この呼び出しでは操作 ID が返され、それを /prebuilt/receipt/analyzeResults/{resultID} に渡すと、抽出結果を返すことができます。

  • 出力形式の変更点

    • すべての API 呼び出しへの JSON 応答には、新しい形式が用意されています。 一部のキーと値は、追加、削除、または名前の変更が行われています。 現在の JSON 形式の例については、クイックスタートを参照してください。

次のステップ