テキスト認識事前構築済みモデル

テキスト認識事前構築済みモデルを使用すると、ドキュメントや画像から、コンピューターで読み取り可能な文字ストリームに単語を抽出できます。 そこでは、画像内の印刷されたテキストと手書きのテキストを検出するために、最新の光学式文字認識 (OCR) が使用されています。

このモデルでは、画像やドキュメント ファイルが処理され、印刷されたテキストや手書きのテキストの行が抽出されます。

Power Apps で使用する

テキスト認識の事前構築済みモデルは、Power Apps でテキスト認識エンジン コンポーネントを使用することで利用できます。 詳細:Power Apps でテキスト認識エンジン コンポーネントを使用する

Power Automate で使用する

Power Automate でのこのモデルの使用方法については、Power Automate でテキスト認識の事前構築済みモデルを使用する を参照してください。

サポートされている言語、形式、サイズ

テキスト認識モデルを使用してスキャンできるファイルは、次の特性が必要です:

  • 印刷テキストの言語: アフリカーンス語、アルバニア語、アンギカ語 (デヴァナギリ)、アラビア語、アストゥリアス語、アワディー語-ヒンディー語 (デーバナーガリー語)、アゼルバイジャン語 (ラテン)、バゲーリー語、バスク語、ベラルーシ語 (キリル)、ベラルーシ語 (ラテン)、ボージュプリー語-ヒンディー語 (デーバナーガリー語)、ビスラマ語、ボド語 (デヴァナギリ)、ボスニア語 (ラテン)、ヒンディー語、ブルトン語、ブルガリア語、ブンデーリー語、ブリヤート語 (キリル)、カタルニア語、セブアノ語、チャムリング語、チャモロ語、チャッティースガル語 (デーバナーガリー)、中国語 (簡体字)、中国語 (繁体字)、コーニッシュ語、コルシカ語、クリミア語、タタール語 (ラテン)、クロアチア語、チェコ語、デンマーク語、ダリー語、ディマル語 (デーバナーガリー)、ドーグリ語 (デーバナーガリー)、オランダ語、英語、エルジャ語 (キリル)、エストニア語、フェロー語、フィジー語、フィリピノ語、フィンランド語、フランス語、フリウリ語、ガガウズ語 (ラテン)、ガリシア語、ドイツ語、キリバス語、ゴーンディー語 (デーバナーガリー)、グリーンランド語、グルン語 (デーバナーガリー)、ハイチクレオール語、ハルビ語 (デーバナーガリー)、ハニ語、ハリヤーンウィー語、ハワイ語、ヒンディー語、モン語 (ラテン)、ホー語 (デーバナーガリー)、ハンガリー語、アイスランド語、イナリ サーミ語、インドネシア語、インターリングア語、イヌクティトット語 (ラテン)、アイルランド語、イタリア語、日本語、ジャウンサリ語 (デーバナーガリー)、ジャワ語、カブベルディアヌ語、カチン語 (ラテン)、カングリ語 (デーバナーガリー)、カラチャイ・バルカル語、カラカルパク語 (キリル)、カラカルパク語 (ラテン)、カシュブ語、カザフ語 (キリル)、カザフ語 (ラテン)、カリン語、カーシ語、キチェ語、韓国語、コルク語、コリャーク語、コスラエ語、クムク語 (キリル)、クルド語 (アラビア)、クルド語 (ラテン)、クルド語 (デーバナーガリー)、キルギス語 (キリル)、ラコタ語、ラテン語、リトアニア語、下ソルブ語、ルレ サーミ語、ルクセンブルク語、マハス・パハリー語 (デーバナーガリー)、マレー語 (ラテン)、マルタ語、マルト語 (デーバナーガリー)、マンクス語、マオリ語、マラーティー語、モンゴル語 (キリル)、モンテネグロ語 (キリル)、モンテネグロ語 (ラテン)、ナポリタン語、ネパール語、ニウエ語、ノガイ語、北サーミ語 (ラテン)、ノルウェー語、オクシタン語、オセティック語、パシュトゥー語、ペルシャ語、ポーランド語、ポルトガル語、パンジャブ語 (アラビア)、リプアーリ語、ルーマニア語、ロマンシュ語、ロシア語、サドリ語 (デーバナーガリー)、サモア語 (ラテン)、サンスクリット語 (デーバナーガリー)、サンタル語 (デーバナーガリー)、スコットランド語、スコットランド ゲール語、セルビア語 (ラテン)、シェルパ語 (デーバナーガリー)、スルマウリ語 (デーバナーガリー)、スコルト サーミ語、スロバキア語、スロベニア語、ソマリ語 (アラビア)、南サーミ語、スペイン語、スワヒリ語 (ラテン)、スウェーデン語、タジク語 (キリル)、タタール語 (ラテン)、テトゥン語、タンミ語、トンガ語、トルコ語、トルクメン語 (ラテン)、トゥバ語、上ソルブ語、ウルドゥー語、ウイグル語 (アラビア)、ウズベク語 (アラビア)、ウズベク語 (キリル)、ウズベク語 (ラテン)、ヴォラピュク語、ウォルサー語、ウェールズ語、西フリジア語、ユカテコマヤ語、チワン語、ズールー語
  • 手書きテキストの言語: 英語、中国語 (簡体字)、フランス語、ドイツ語、イタリア語、日本語、韓国語、ポルトガル語、スペイン語
  • 形式:
    • JPG
    • PNG
    • BMP
    • PDF
  • サイズ: 最大 20 MB
  • PDF ドキュメントの場合、最初の 2,000 ページのみが処理されます。

モデルの出力

テキスト認識モデルがドキュメントを検出すると次の情報を出力します。

  • 結果: 入力テキストから抽出した行のリスト。
  • テキスト: 検出したテキストの行を含む文字列。
  • BoundingBox: 境界ボックスを表す 4 つの値で、幅と高さとともに上と左の位置を使用して記述します。

制限

Action 制限 更新期間
テキスト認識呼び出し (環境ごと) 480 60 秒

参照

トレーニング: AI Builder でテキストを認識する (モジュール)