ドキュメント処理モデルのパフォーマンスを向上する

モデルのパフォーマンスが意図したとおりではない場合 (たとえば、悪い結果が得られたり、信頼度スコアが低いなど) は、いくつかのことを試してみてください。

モデルの精度スコアの解釈

精度スコアを解釈して、モデルが抽出に苦労しているものを特定します。 モデルの評価には、スコアを上げるための推奨事項が含まれます。

  1. Power Apps または Power Automate にサイン インします。

  2. 左のペインで ... その他>AI ハブ を選択します。

  3. AI 機能の検出AI モデル を選択します。

  4. (オプション) AI モデル をメニュー上に常時表示してアクセスしやすくするには、ピン アイコンを選択します。

  5. 調査するドキュメント処理モデルを開きます。 精度スコアが表示されます。

    Note

    次の場合、ドキュメント処理モデルの精度スコアは表示されません。

    • ドキュメントの種類として「汎用ドキュメント」を選択してモデルをトレーニングした場合。 現在、精度スコアは「固定テンプレート ドキュメント」タイプのモデルに対してのみ返されます。
    • モデルが別の環境からインポートされました。
    • モデルが 2022 年 1 月 1 日より前にトレーニングされた場合。 この場合、再トレーニングできます。
  6. モデルの詳細ページに、全体的な精度スコアが表示されます。

    精度スコアのスクリーンショット。

  7. 詳細を取得するには、完全な評価を確認するを選択します。

    [モデル評価] 画面の [概要] タブのスクリーンショット。

    このパネルでは、さまざまなタブ間を移動して、モデルが抽出に苦労しているものを特定できます。 コレクションフィル度テーブルチェックボックスタブを参照し、正しく処理されていないものを見つけることができます。

    フィールド タブの情報の例を次に示します。

    [モデル評価] 画面の [フィールド] タブのスクリーンショット。

    この例では、ベンダー 情報の精度を向上させる必要があります。

    [フィールド] タブの精度スコアが低いスクリーンショット。

    精度スコアの低いアイテムにカーソルを合わせることにより、モデルを改善するために何ができるかについての提案を参照してください。 たとえば、トレーニング用のより多くのサンプル ドキュメントを提供する推奨事項が表示される場合があります。

よく寄せられる質問

フィールド、テーブル、またはチェックボックスの精度スコアが低い場合はどうすればよいですか?

  1. すべてのドキュメントでフィールド、テーブル、またはチェックボックスが正しくタグ付けされていることを確認します。
  2. フィールド、テーブル、またはチェックボックスが存在するトレーニングにサンプル ドキュメントをさらに提供します。

コレクションの精度スコアが低い場合はどうすればよいですか?

コレクション内のドキュメントがすべて同じレイアウトになっていることを確認してください。 コレクションの詳細については、コレクションごとにドキュメントをグループ化する にアクセスしてください。

トレーニング データにさらにドキュメントを追加する

タグを付けるドキュメントが多いほど、AI Builder はフィールドをよりよく認識する方法を学習します。 さらにドキュメントを追加するには、ドキュメント処理モデルを編集して、ドキュメントをアップロードします。 モデルの詳細ページにモデルを編集するオプションがあります。

ドキュメント処理モデルを編集するオプションを含む詳細ページのスクリーンショット。

その他のヒント

  • 記入済みフォームの場合は、すべてのフィールドが記入されている例を使用します。
  • 各フィールドで異なる値のフォームを使用します。
  • フォーム画像の品質が低い場合は、より大きなデータ セット (たとえば、10-15 枚の画像) を使用します。
  • 可能であれば、画像ベースのドキュメントの代わりにテキスト ベースの PDF ドキュメントを使用します。 スキャンした PDF は画像として扱われます。
  • 新しいドキュメント処理モデルを作成する場合は、各ドキュメントが個別のインスタンスである同じレイアウトのドキュメントをアップロードします。 たとえば、異なる月からの請求書は、すべて同じドキュメントにあるのではなく、別々のドキュメントにある必要があります。
  • トレーニング用のサンプルをアップロードする場合、レイアウトが異なるドキュメントは異なるコレクションに移動します。
  • ドキュメント処理モデルが、モデルで抽出するフィールドの隣接するフィールドから値を抽出する場合は、モデルを編集し、誤って取得されている隣接する値を、別のフィールドとしてタグ付けします。 これを行うことにより、モデルは各フィールドの境界をより適切に学習します。

参照