ドキュメント処理モデルの要件と制限

サポートされている言語

構造化および半構造化ドキュメントのモデル

ドキュメント処理モデルをトレーニングし、ドキュメント タイプとして 構造化および半構造化ドキュメント を選択すると、次の言語がサポートされます: アバザ語、アブハズ語、アチェ語、アチョリ語、アダングメ語、アディゲ語、アファル語、アフリカーンス語、アカン語、アルバニア語、アルゴンキン語、アンギカ語(デーヴァナーガリー)、アラビア語、アストゥリアス語、アス語 (タンザニア)、アヴァル語、アワディー-ヒンディー語 (デーヴァナーガリー)、アイマラ語、アゼルバイジャン語 (ラテン)、バフィア語、バゲーリー語、バンバラ語、バシキール語、バスク語、ベラルーシ語 (キリル)、ベラルーシ語 (ラテン語)、ベンバ語 (ザンビア)、ベンバ語 (ザンビア)、ボージュプリー語-ヒンディー語 (デヴァナーガリー)、ビコール語、ビニ語、ビスラマ語、ボド語 (デヴァナーガリー)、ボスニア語 (ラテン)、ブラジュバー語、ブルトン語、ブルガリア語、ブンデーリー語、ブリヤート語 (キリル)、カタロニア語、セブアノ語、チャムリング語、チャモロ語、チェチェン語、チャッティースガリー語 (デーヴァナーガリー)、キガ語、簡体中国語、繁体中国語、チョクトー語、チュクチ語、チュヴァシ語、コーンウォール語、コルシカ語、クリー語、クリーク語、クリミア タタール語 (ラテン)、クロアチア語、クロウ語、チェコ語、デンマーク語、ダルグワ語、ダリー語、ディマール語 (デーヴァナーガリー)、ドーグリー語 (デーヴァナーガリー)、ドゥアラ語、ドンガン語、オランダ語、エフィク語、英語、エルジャ語 (キリル)、エストニア語、フェロー語、フィジー語、フィリピン語、フィンランド語、フォン語、フランス語、フリウリ語、ガ語、ガガウズ (ラテン語)、ガリシア語、ガンダ語、ガヨ語、ドイツ語、キリバス語、ゴーンディー語 (デーヴァナーガリー)、ギリシャ語、グリーンランド語、グアラニー語、グルン語 (デーヴァナーガリー)、グシイ語、ハイチ クレオール語、ハルビ語 (デーヴァナーガリー)、ハニ語、ハリヤーンウィー語、ハワイ語、ヘブライ語、ヘレロ語、ヒリガイノン語、ヒンディー語、ミャオ語 (ラテン)、ホー語 (デーヴァナーガリー)、ハンガリー語、イバン語、アイスランド語、イボ語、イロコ語、イナリ サーミ語、インドネシア語、イングーシ語、インターリングア、イヌクティトット語 (ラテン)、アイルランド語、イタリア語、日本語、ジャウンサーリー語 (デーヴァナーガリー)、ジャワ語、ジョラ-フォニィ語、カバルド語、カーボベルデ・クレオール語、カチン語 (ラテン)、カレンジン語、カルムイク語、カーングリー語 (デーヴァナーガリー)、カヌリ語、カラチャイ バルカル語、カラ カルパク語 (キリル)、カラ カルパク語 (ラテン)、カシュビア語、カザフ語 (キリル)、カザフ語 (ラテン)、ハカス語、カリン語、カシ語、キチェ語、キクユ語、キルディン サーミ語、ルワンダ語、コミ語、コンゴ語、韓国語、コルク語、コリャーク語、コスラエ語、クペレ語、クワニャマ語、クムク語 (キリル)、クルド語(アラビア語)、クルド語 (ラテン)、クルク語 (デーヴァナーガリー)、キルギス語 (キリル)、ラク語、ラコタ語、ラテン語、ラトビア語、レズギ語、リンガラ語、リトアニア語、低地ソルブ語、ロジ語、ルレ サーミ語、ルオ語 (ケニアとタンザニア)、ルクセンブルク語、ルイヤ ルイ、マケドニア語、マチャメ語、マドゥラ語、マハス パハリー語 (デーヴァナーガリー)、マクア ミート語、マコンデ語、マダガスカル語、マレー語 (ラテン)、マルタ語、マルト語 (デーヴァナーガリー)、マンディンカ語、マン語、マオリ語、マプチェ語、マラーティー語、マリ語 (ロシア)、マサイ語、メンデ語 (シエラレオネ)、メル語、メタ語、ミナンカバウ語、モホーク語、モンゴル語 (キリル)、モンゴンドウ語、モンテネグロ語 (キリル)、モンテネグロ語 (ラテン)、モーリシャス語、ムンダン語、ナワトル語、ナバホ語、ンドンガ語、ナポリ語、ネパール語、ンゴンバ語、ニウエ語、ノガイ語、北ンデベレ語、北部サーミ語 (ラテン)、ノルウェー語、ニャンジャ語、ニャンコレ語、ンジマ語、オクシタン語、オジブウェー語、オロモ語、オセット語、パンパンガ語、パンガシナン語、パピアメント語、パシュトウ語、ペディ語、ペルシア語、ポーランド語、ポルトガル語、パンジャーブ語 (アラビア)、ケチュア語、リプアーリ語、ルーマニア語、ロマンシュ語、ルンディ語、ロシア語、ルワ語、サドリ語 (デーヴァナーガリー)、サハ語、サンブル語、サモア語 (ラテン)、サンゴ語、サング語 (ガボン)、サンスクリット語 (デーヴァナーガリー)、サンタル語 (デーヴァナーガリー)、スコットランド語、スコットランド ゲール語、セナ語、セルビア語 (キリル)、セルビア語 (ラテン)、シャンバラ語、シェルパ語 (デーヴァナーガリー)、ショナ語、シクシカ語、スルマウリ語 (デーヴァナーガリー)、スコルト サーミ語、スロバキア語、スロベニア語、ソガ語、ソマリ語 (アラビア語)、ソマリ語 (ラテン)、ソンガイ語、南ンデベレ語、南アルタイ語、南部サーミ語、南ソト語、スペイン語、スンダ語、スワヒリ語 (ラテン)、スワティ語、スウェーデン語、タバサラン語、シルハ語、タヒチ語、タイタ語、タジク語 (キリル)、タミール語、タタール語 (キリル)、タタール語 (ラテン)、テソ語、テトゥン語、タイ語、タンミ語、トク ピシン語、トンガ語、ツォンガ語、ツワナ語、トルコ語、トルクメン語 (ラテン)、トゥヴァ語、ウドムルト語、ウイグル語 (キリル)、ウクライナ語、高地ソルブ語、ウルドゥ語、ウイグル語 (アラビア語)、ウズベク語 (アラビア語)、ウズベク語(キリル)、ウズベク語 (ラテン)、ベトナム語、ヴォラピュク語、ヴンジョ語、ヴァリス語、ウェールズ語、西フリジア語、ウォロフ語、コサ語、ユカテカ語、サポテク語、ザルマ語、チワン語、ズールー語

構造化されていない自由形式ドキュメントのモデル

ドキュメント処理モデルをトレーニングし、ドキュメント タイプとして 構造化されていない自由形式ドキュメント を選択すると、次の言語がサポートされます: アフリカーンス語、アルバニア語、アラビア語、ブルガリア語、中国語 (漢字 (簡体字))、中国語 (漢字 (繁体字))、クロアチア語、チェコ語、デンマーク語、オランダ語、エストニア語、フィンランド語、フランス語、ドイツ語、ヘブライ語、ヒンディー語、ハンガリー語、インドネシア語、イタリア語、日本語、韓国語、ラトビア語、リトアニア語、マケドニア語、マラーティー語、現代ギリシャ語 (1453-)、ネパール語 (マクロ言語)、ノルウェー語、パンジャーブ語、ペルシア語、ポーランド語、ポルトガル語、ルーマニア語、ロシア語、スロバキア語、スロベニア語、ソマリ語 (アラビア語)、ソマリ語 (ラテン)、スペイン語、スワヒリ語 (マクロ言語)、スウェーデン語、タミール語、タイ語、トルコ語、ウクライナ語、ウルドゥー語、ベトナム語

要件

ドキュメント処理は、次の要件を満たす入力ドキュメントで機能します:

  • JPG、PNG、または PDF 形式 (テキストまたはスキャン済み)。 文字の抽出と場所にエラーが生じないため、テキストが埋め込まれている PDF は、より推奨されています。
  • TIFF ファイルはトレーニングには使用できません。 モデルをトレーニングするには、PDF、JPG、または PNG 形式のドキュメントを使用する必要があります。 モデルがトレーニングされると、モデルが Power Automate クラウド フローで使用されるときに TIFF ファイルからデータを抽出できます。
  • PDF がパスワードでロックされている場合は、送信する前にロックを解除する必要があります。
  • 処理するドキュメントの最大サイズは 20 MB を超えることはできません。
  • 画像の場合、サイズは 50 × 50 から 10,000 × 10,000 ピクセルの間に収める必要があります。
  • 紙のドキュメントからスキャンする場合、スキャンは高品質の画像でなければなりません。
  • モデルごとに最大 200 のコレクションを作成できます。
  • クラウド フローでは、ドキュメント処理用にタグ付けできるフィールドの制限は 300 です。

注意

  • ドキュメントからの署名の抽出は現在サポートされていません。
  • ページの境界を越えて分割されるフィールドは、現在サポートされていません。
  • あるページから別のページに分割される行は現在サポートされていません。

最適化のヒント

ドキュメント処理モデルのパフォーマンスを向上させる方法を説明します。

次のステップ

フォーム処理モデルを作成する