Form Recognizer Studio
この記事の適用対象:Form Recognizer v3.0。
Form Recognizer Studio は、アプリケーションの Form Recognizer サービスの機能を視覚的に探索、理解、および統合するためのオンライン ツールです。 事前トレーニング済みモデルでドキュメントの分析を始めるには、Form Recognizer Studio のクイックスタートを使用してください。 Python SDK v3.0 や他のクイックスタートを使用して、カスタム テンプレート モデルを構築し、アプリケーションでモデルを参照します。
次の図は、請求書の事前構築済みモデルの機能の動きを示したものです。
Form Recognizer Studio の機能
Studio では、Form Recognizer サービスの次の機能を利用できます。
読み取り: Form Recognizer の読み取り機能を使用して、テキスト行、単語、検出された言語、および手書きのスタイル (検出された場合) を抽出します。 まずは、Studio の読み取り機能に関するページから開始します。 サンプル ドキュメントと独自のドキュメントを使用して探索します。 対話型の視覚化と JSON 出力を使用して、機能のしくみを理解します。 詳細については、読み取りの概要に関する記事を参照し、レイアウトに関する Python SDK クイックスタートで始めてください。
レイアウト: Form Recognizer のレイアウト機能を使用すると、テキスト、テーブル、選択マーク、および構造情報を抽出できます。 まずは、Studio のレイアウト機能に関するページから開始します。 サンプル ドキュメントと独自のドキュメントを使用して探索します。 対話型の視覚化と JSON 出力を使用して、機能のしくみを理解します。 詳細についてはレイアウトの概要に関する記事を参照し、レイアウトに関する Python SDK クイックスタートで始めてください。
一般ドキュメント: Form Recognizer の 一般ドキュメント機能を使用して、キーと値のペアを抽出します。 まずは、Studio の一般ドキュメント機能に関するページから開始します。 サンプル ドキュメントと独自のドキュメントを使用して探索します。 対話型の視覚化と JSON 出力を使用して、機能のしくみを理解します。 詳細については一般ドキュメントの概要に関する記事を参照し、レイアウトに関する Python SDK クイックスタートで始めてください。
事前構築済みモデル: Form Recognizer の事前構築済みモデルを使用すると、独自のモデルをトレーニングして構築しなくても、インテリジェントなドキュメント処理をアプリやフローに追加できます。 例として、Studio 請求書機能に関するページから開始します。 サンプル ドキュメントと独自のドキュメントを使用して探索します。 対話型の視覚化、抽出されたフィールドの一覧、JSON 出力を使用して、機能のしくみを理解します。 詳細についてはモデルの概要に関する記事を参照し、事前構築済みの請求書に関する Python SDK クイックスタートで始めてください。
カスタム モデル: Form Recognizer のカスタム モデルを使用すると、データでトレーニングされ、フォームやドキュメントに合わせて調整されたモデルから、フィールドと値を抽出できます。 スタンドアロン カスタム モデルを作成するか、2 つ以上のカスタム モデルを結合して、複数のフォームの種類からデータを抽出する作成済みモデルを作成します。 Studio のカスタム モデル機能から始めてください。 オンライン ウィザード、ラベル付けインターフェイス、トレーニング ステップ、視覚化を使用して、機能のしくみを理解します。 サンプル ドキュメントを使用してカスタム モデルをテストし、反復処理してモデルを改善します。 詳細についてはカスタム モデルの概要に関する記事を参照し、Form Recognizer v3.0 移行ガイドを使用して、新しいモデルとアプリケーションの統合を始めてください。
次の手順
- Form Recognizer v3.0 の移行ガイドに関するページで、REST API の以前のバージョンとの違いを確認してください。
- v3.0 SDK クイックスタートに関するページを探索し、新しい SDK を使用してアプリケーションで v3.0 の機能を試してください。
- v3.0 REST API クイックスタートに関するページを参照し、新しい REST API を使用して v3.0 の機能を試してください。