ドキュメントインテリジェンススタジオを使用する

6 分

Azure Document Intelligence Studio は、ドキュメントインテリジェンスサービスの機能を視覚的に調査、理解、統合するためのオンラインツールです。 Studio を使用すると、ビジュアルインターフェイスを使用して、フォームレイアウトの分析、事前構築済みモデルからのデータの抽出、カスタムモデルのトレーニングを行うことができます。

documentintelligence.ai.azure.com で Studio にアクセスできます。

Document Intelligence Studio のホームページを示すスクリーンショット。

Studio の機能

Document Intelligence Studio では、次の種類のプロジェクトがサポートされています。

ドキュメント分析モデル: 独自のドキュメントに対して読み取りモデルとレイアウトモデルをテストし、抽出されたテキスト、テーブル、構造を確認します。
事前構築済みモデル: 請求書、領収書、ID ドキュメント、税フォームなど、使用可能な事前構築済みモデルを使用してドキュメントを分析します。
カスタムモデル: カスタム抽出モデルとカスタム分類子を構築、ラベル付け、トレーニング、テストします。

事前構築済みモデルを使用してドキュメントを分析する

Studio で事前構築済みモデルを使用してドキュメントからデータを抽出するには:

Azure Portal で Azure ドキュメントインテリジェンスまたは Foundry Tools リソースを作成します。
Document Intelligence Studio を開き、事前構築済みのモデル (請求書、領収書、ID ドキュメントなど) を選択します。
リソースエンドポイントとキーを指定します。
分析するドキュメントの URL をアップロードまたは指定します。
抽出されたフィールドとその信頼度スコアを確認します。

カスタムモデルプロジェクトをビルドする

Studio を使用すると、JSON ファイルを手動で作成することなく、カスタムモデルのラベル付け、トレーニング、テストのプロセス全体を処理できます。 Studio によって、必要な ocr.json、 labels.json、および fields.json ファイルが自動的に生成されます。

高レベルのワークフローは次のとおりです。

Azure ドキュメントインテリジェンスまたは Foundry リソースを作成します。
少なくとも 5 ~ 6 個のサンプルフォームを Azure Blob Storage コンテナーにアップロードします。
Studio がストレージコンテナーにアクセスできるように、クロスオリジンリソース共有 (CORS) を構成します。
Studio でカスタムモデルプロジェクトを作成し、ストレージコンテナーとドキュメントインテリジェンスリソースをリンクします。
Studio のビジュアルインターフェイスを使用して、サンプルドキュメントのフィールドにラベルを付けます。
モデルをトレーニングし、精度メトリックを確認します。
トレーニング中に使用されなかった新しいドキュメントに対してモデルをテストします。

カスタムモデルの種類と代替 REST API/SDK トレーニングワークフローの詳細については、「 トレーニングとカスタムモデルの使用 」ユニットを参照してください。

アドオン機能

ドキュメントインテリジェンスでは、抽出シナリオに応じて有効にできるオプションの機能がサポートされています。

能力	説明
高解像度抽出	高い精度で高解像度ドキュメントからテキストを抽出します。
数式の抽出	ドキュメントから数式を検出して抽出します。
Font プロパティの抽出	スタイル、太さ、色などのフォント情報を抽出します。
バーコード抽出	ドキュメント内のバーコードを検出して読み取ります。
検索可能な PDF	スキャンしたドキュメントを検索可能な PDF ファイルに変換します。
クエリフィールド	自然言語クエリを使用して、ドキュメントから特定のフィールドを抽出します。
キー値ペア	レイアウトモデルを使用して、ドキュメントからキーと値のペアのリレーションシップを抽出します。

注

一部のアドオン機能は、追加コストが発生するプレミアム機能です。詳細については、価格ページを確認してください。

詳細情報

フィードバック

このページはお役に立ちましたか?

ドキュメント インテリジェンス スタジオを使用する