OCR アクション
Power Automate を使用すると、ユーザーは光学式文字認識 (OCR) を通じてファイルの中からデータの読み込み、抽出、管理を行うことができます。
OCR エンジンを作成し、画像やドキュメントからテキストを抽出するには、OCRでテキストを抽出する アクションを使用します。 次の例では、指定した画像全体からテキストを抽出します。
すべての OCR アクションは、新しい OCR エンジン変数を作成するか、または既存のものを使用することができます。 OCR 機能を提供するあらゆるアクションで、既存の OCR エンジン変数を使用することができます。
Power Automate は、Windows OCR と Tesseract エンジンの両方をサポートします。 選択した OCR エンジンを設定するには、該当するアクションの OCR エンジン設定に移動します。 使用可能なオプションは、言語と画像の幅と高さの倍率です。
Note
- 利用可能な OCR エンジンはすべて Power Automate にプリインストールされており、クラウドに接続することなくローカルに動作します。 ただし、特定の言語のテキストを抽出するために、言語パックやデータファイルのダウンロードが必要な場合があります。
- 画像の乗数は画像サイズを大きくし、テキストの抽出や検索をより効果的に行えるようにします。 3 より大きい値を設定すると、誤った結果が生じる可能性があります。
Windows OCR エンジンの使用
Power Automate の規定の OCR エンジンは、Windows の OCR エンジンです。 Windows OCR エンジンを使用してテキストを抽出するには、抽出する言語に適した言語パックをインストールする必要があります。
適切な言語パックがインストールされていない場合、Power Automate はエラーを出し、インストールを促します。 言語パックのダウンロードとインストールに関する詳細については、Windows 用の言語パックを参照してください。
適切な言語パックをインストールした後、OCR アクションの OCR エンジン設定を選択し、希望の言語を選択します。 Windows OCR エンジンは、中国語 (簡体字および繁体字)、チェコ語、デンマーク語、オランダ語、英語、フィンランド語、フランス語、ドイツ語、ギリシャ語、ハンガリー語、イタリア語、日本語、韓国語、ノルウェー語、ポーランド語、ポルトガル語、ルーマニア語、ロシア語、セルビア語 (キリル文字とラテン語)、スロバキア語、スペイン語、スウェーデン語、トルコ語の 25 言語をサポートしています。
Tesseract OCR エンジンの使用
Note
Tesseract OCR エンジンを利用するには、コンピューターの CPU が AVX2 命令セットをサポートしていることを確認してください。
Windows OCRエンジンとは別に、Power Automate は Tesseract エンジンをサポートします。 このエンジンは、英語、ドイツ語、スペイン語、フランス語、イタリア語の 5 つの言語でテキストを抽出できます。
上記のリスト以外の言語でテキストを抽出するには、OCR アクションの OCR エンジン設定で他の言語を使用するオプションを有効にします。 このオプションを有効にすると、アクションに言語の省略形と言語データ パス の 2 つの追加パラメーターが表示されます。
言語の略語フィールドは、OCR 中に検索する言語をエンジンに示します。 言語データ パス フィールドには、OCR エンジンのトレーニングに使用される言語データ ファイル (.traineddata) が含まれます。 利用可能なすべての言語の言語データファイルは、この GitHub リポジトリにあります。
また、Tesseract エンジンを使って多言語ドキュメントからテキストを抽出することもできます。 多言語ドキュメントからのテキストの抽出に関する詳細については、多言語ドキュメントで OCR を実行するを参照してください。
テキストが画面に表示される場合 (OCR)
特定のテキストが画面に表示されるかどうかに応じて、OCR を使ってアクションの条件付きブロックの開始位置を示します
入力パラメーター
引数 | オプション | 受入 | Default Value | 説明設定 |
---|---|---|---|---|
If text | N/A | 存在する、存在しない | 存在する | 分析する特定のソースにテキストが存在するかどうかを確認するかどうかを指定します |
OCR engine type | 無効 | Windows OCR エンジン、Tesseract エンジン、OCR エンジン変数 | OCR engine variable | 使用する OCR エンジン タイプ。 事前構成済みの OCR エンジンまたは新しい OCR エンジンを選択します。 |
OCR engine variable | 無効 | OCREngineObject | OCR 操作に使うエンジン | |
Text to find | 無効 | テキスト値 | 指定されたソース内で検索するテキスト | |
Is regular expression | N/A | ブール値 | 無効 | 指定されたテキストを検索するために正規表現を使うかどうかを指定します |
Search for text on | N/A | スクリーン全体、前景ウィンドウ | 画面全体 | 指定されたテキストを表示された画面全体で検索するかフォアグラウンド ウィンドウだけで検索するかを指定します |
Search mode | N/A | 特定のソース全体、特定のサブ領域のみ、イメージを基準としたサブ領域 | 指定されたすべてのソース | 画面 (またはウィンドウ) 全体をスキャンするか、そのサブ領域に絞り込むかを指定します |
画像 | いいえ | 画像のリスト | 指定されたテキストをスキャンするサブ領域 (画像の左上隅に対する相対値) を指定する画像 | |
X1 | 有効 | 数値 | 指定されたテキストをスキャンするサブ領域の開始 X 座標 | |
Tolerance | 有効 | 数値 | 10 | 最初に選択した画像に一致するまで、何回検索を繰り返すかを指定します |
Y1 | 有効 | 数値 | 指定されたテキストをスキャンするサブ領域の開始 Y 座標 | |
X1 | 有効 | 数値 | 指定されたテキストをスキャンする指定された画像に対するサブ領域の開始相対 X 座標 | |
X2 | 有効 | 数値 | 指定されたテキストをスキャンするサブ領域の終了 X 座標 | |
Y1 | 有効 | 数値 | 指定されたテキストをスキャンする指定された画像に対するサブ領域の開始相対 Y 座標 | |
Y2 | 有効 | 数値 | 指定されたテキストをスキャンするサブ領域の終了 Y 座標 | |
X2 | 有効 | 数値 | 指定されたテキストをスキャンする指定された画像に対するサブ領域の終了相対 X 座標 | |
Y2 | 有効 | 数値 | 指定されたテキストをスキャンする指定された画像に対するサブ領域の終了相対 Y 座標 | |
Windows OCR の言語 | N/A | 中国語 (簡体字および繁体字)、チェコ語、デンマーク語、オランダ語、英語、フィンランド語、フランス語、ドイツ語、ギリシャ語、ハンガリー語、イタリア語、日本語、韓国語、ノルウェー語、ポーランド語、ポルトガル語、ルーマニア語、ロシア語、セルビア語 (ラテン語)、スロバキア語、スペイン語、スウェーデン語、トルコ語 | 英語 | Windows OCR エンジンが検出するテキストの言語 |
Use other language | N/A | ブール値 | 偽 | [Tesseract 言語] フィールドに指定されていない言語を使用するかどうかを指定します |
Tesseract language | N/A | 英語、ドイツ語、スペイン語、フランス語、イタリア語 | 英語 | Tesseract エンジンにより検出されるテキストの言語 |
Language abbreviation | 無効 | テキスト値 | 使用する言語の Tesseract 言語コードです。 たとえば、データが 'eng.traineddata' の場合、このパラメーターを 'eng' に設定します | |
言語データ パス | 番号 | Text 値 | 指定された言語の Tesseract データを含むフォルダーのパス | |
Image width multiplier | 無効 | 数値 | 1 | 画像の幅の乗数 |
画像の高さの乗数 | 番号 | 数値 | 1 | 画像の高さの乗数 |
画像照合アルゴリズム | N/A | 基本、上級 | 基本 | 画像を検索するときに使用する画像のアルゴリズムです |
Note
- Power Automate の正規表現エンジンは .NET です。 正規表現に関する詳細については、正規表現言語 - クイック リファレンス を参照してください。
- OCR エンジン変数 オプションは非推奨になる予定です。
生成された変数
引数 | タイプ | 説明設定 |
---|---|---|
LocationOfTextFoundX | 数値 | 画面上にテキストが表示されるポイントの X 座標。 検索が前景ウィンドウで行われた場合、返される座標はウィンドウの左上隅を基準とした相対座標となります |
LocationOfTextFoundY | 数値 | 画面上にテキストが表示されるポイントの X 座標。 検索が前景ウィンドウで行われた場合、返される座標はウィンドウの左上隅を基準とした相対座標となります |
例外
例外 | 説明設定 |
---|---|
非インタラクティブ モードではテキストが存在するかどうかをチェックできません | 非インタラクティブ モードの場合に、画面上のテキストをチェックできないことを示します |
無効なサブ領域座標 | 指定されたサブ領域の座標が無効であることを示します |
OCR を使ってテキストを分析できません | OCR を使用したテキストの分析中にエラーが発生したことを示します |
OCR エンジンを作成できません | OCR エンジンの作成中にエラーが発生したことを示します |
データ パス フォルダーが存在しません | 言語データの指定されたフォルダーが存在しないことを示します |
選択した Windows 言語パックがコンピューターにインストールされていません | 選択した Windows 言語パックがコンピューターにインストールされていないことを示します |
OCR エンジンが利用できません | OCR エンジンが利用できないことを示します |
テキストが画面に表示されるまで待機 (OCR)
画面、フォアグラウンド ウィンドウ、または OCR を使って画面またはフォアグラウンド ウィンドウの画像に対する相対位置に、特定のテキストが表示されるか消えるまで待機します。
入力パラメーター
引数 | オプション | 受入 | Default Value | 説明設定 |
---|---|---|---|---|
Wait for text to | N/A | 表示、非表示 | 表示される | テキストが表示されるか消えるまで待機するかどうかを指定します |
OCR engine type | 無効 | Windows OCR エンジン、Tesseract エンジン、OCR エンジン変数 | OCR engine variable | 使用する OCR エンジン タイプ。 事前構成済みの OCR エンジンまたは新しい OCR エンジンを選択します。 |
OCR engine variable | 無効 | OCREngineObject | OCR 操作に使うエンジン | |
Text to find | 無効 | テキスト値 | 指定されたソース内で検索するテキスト | |
Is regular expression | N/A | ブール値 | 無効 | 指定されたテキストを検索するために正規表現を使うかどうかを指定します |
Search for text on | N/A | スクリーン全体、前景ウィンドウ | 画面全体 | 指定されたテキストを表示された画面全体で検索するかフォアグラウンド ウィンドウだけで検索するかを指定します |
Search mode | N/A | 特定のソース全体、特定のサブ領域のみ、イメージを基準としたサブ領域 | 指定されたすべてのソース | 画面 (またはウィンドウ) 全体をスキャンするか、そのサブ領域に絞り込むかを指定します |
画像 | いいえ | 画像のリスト | 指定されたテキストをスキャンするサブ領域 (画像の左上隅に対する相対値) を指定する画像 | |
X1 | 有効 | 数値 | 指定されたテキストをスキャンするサブ領域の開始 X 座標 | |
Tolerance | 有効 | 数値 | 10 | 最初に選択した画像に一致するまで、何回検索を繰り返すかを指定します |
Y1 | 有効 | 数値 | 指定されたテキストをスキャンするサブ領域の開始 Y 座標 | |
X1 | 有効 | 数値 | 指定されたテキストをスキャンする指定された画像に対するサブ領域の開始相対 X 座標 | |
X2 | 有効 | 数値 | 指定されたテキストをスキャンするサブ領域の終了 X 座標 | |
Y1 | 有効 | 数値 | 指定されたテキストをスキャンする指定された画像に対するサブ領域の開始相対 Y 座標 | |
Y2 | 有効 | 数値 | 指定されたテキストをスキャンするサブ領域の終了 Y 座標 | |
X2 | 有効 | 数値 | 指定されたテキストをスキャンする指定された画像に対するサブ領域の終了相対 X 座標 | |
Y2 | 有効 | 数値 | 指定されたテキストをスキャンする指定された画像に対するサブ領域の終了相対 Y 座標 | |
Windows OCR の言語 | N/A | 中国語 (簡体字および繁体字)、チェコ語、デンマーク語、オランダ語、英語、フィンランド語、フランス語、ドイツ語、ギリシャ語、ハンガリー語、イタリア語、日本語、韓国語、ノルウェー語、ポーランド語、ポルトガル語、ルーマニア語、ロシア語、セルビア語 (ラテン語)、スロバキア語、スペイン語、スウェーデン語、トルコ語 | 英語 | Windows OCR エンジンが検出するテキストの言語 |
Use other language | N/A | ブール値 | 偽 | [Tesseract 言語] フィールドに指定されていない言語を使用するかどうかを指定します |
Tesseract language | N/A | 英語、ドイツ語、スペイン語、フランス語、イタリア語 | 英語 | Tesseract エンジンにより検出されるテキストの言語 |
Language abbreviation | 無効 | テキスト値 | 使用する言語の Tesseract 言語コードです。 たとえば、データが 'eng.traineddata' の場合、このパラメーターを 'eng' に設定します | |
言語データ パス | 番号 | Text 値 | 指定された言語の Tesseract データを含むフォルダーのパス | |
Image width multiplier | 無効 | 数値 | 1 | 画像の幅の乗数 |
画像の高さの乗数 | 番号 | 数値 | 1 | 画像の高さの乗数 |
画像照合アルゴリズム | N/A | 基本、上級 | 基本 | 画像を検索するときに使用する画像のアルゴリズムです |
タイムアウト エラーで失敗しました | N/A | ブール値 | False | アクションを無期限に待機するか、設定した期間後にエラーにするかを指定します |
Note
- Power Automate の正規表現エンジンは .NET です。 正規表現に関する詳細については、正規表現言語 - クイック リファレンス を参照してください。
- OCR エンジン変数 オプションは非推奨になる予定です。
生成された変数
引数 | タイプ | 説明設定 |
---|---|---|
LocationOfTextFoundX | 数値 | 画面上にテキストが表示されるポイントの X 座標。 検索が前景ウィンドウで行われた場合、返される座標はウィンドウの左上隅を基準とした相対座標となります |
LocationOfTextFoundY | 数値 | 画面上にテキストが表示されるポイントの X 座標。 検索が前景ウィンドウで行われた場合、返される座標はウィンドウの左上隅を基準とした相対座標となります |
例外
例外 | 説明設定 |
---|---|
非インタラクティブ モードではテキストが存在するかどうかをチェックできません | 非インタラクティブ モードの場合に、画面上のテキストをチェックできないことを示します |
無効なサブ領域座標 | 指定されたサブ領域の座標が無効であることを示します |
OCR を使ってテキストを分析できません | OCR を使用したテキストの分析中にエラーが発生したことを示します |
OCR エンジンを作成できません | OCR エンジンの作成中にエラーが発生したことを示します |
データ パス フォルダーが存在しません | 言語データの指定されたフォルダーが存在しないことを示します |
選択した Windows 言語パックがコンピューターにインストールされていません | 選択した Windows 言語パックがコンピューターにインストールされていないことを示します |
OCR エンジンが利用できません | OCR エンジンが利用できないことを示します |
タイムアウト エラー | 設定した時間が経過した後にアクションが失敗したことを示します |
OCR を使ってテキストを抽出
指定された OCR エンジンを使って指定されたソースからテキストを抽出します。
入力パラメーター
引数 | オプション | 受入 | Default Value | 説明設定 |
---|---|---|---|---|
OCR engine | 無効 | Windows OCR エンジン、Tesseract エンジン、OCR エンジン変数 | OCR engine variable | 使用する OCR エンジン タイプ。 事前構成済みの OCR エンジンまたは新しい OCR エンジンを選択します |
OCR エンジン変数 | 番号 | OCREngineObject | OCR 操作に使うエンジン | |
OCR source | N/A | スクリーン、前景ウィンドウ、ディスク上のイメージ | スクリーン | OCR 操作を実行する画像のソース |
Image file path | 無効 | ファイル | OCR 操作を実行する画像のパス | |
Search mode | N/A | 特定のソース全体、特定のサブ領域のみ、イメージを基準としたサブ領域 | 指定されたすべてのソース | OCR 操作に選択したモード |
画像 | いいえ | 画像のリスト | 指定した画像に対するサブ領域の相対位置にスキャンを絞り込むために使う画像 | |
Tolerance | 有効 | 数値 | 10 | 最初に選択した画像と比較して、画像がどれだけ異なるかを指定します |
X1 | 有効 | 数値 | スキャンを絞り込むサブ領域の開始 X 座標 | |
X2 | 有効 | 数値 | スキャンを絞り込むサブ領域の終了 X 座標 | |
Y1 | 有効 | 数値 | スキャンを絞り込むサブ領域の開始 Y 座標 | |
Y2 | 有効 | 数値 | スキャンを絞り込むサブ領域の終了 Y 座標 | |
Windows OCR の言語 | N/A | 中国語 (簡体字および繁体字)、チェコ語、デンマーク語、オランダ語、英語、フィンランド語、フランス語、ドイツ語、ギリシャ語、ハンガリー語、イタリア語、日本語、韓国語、ノルウェー語、ポーランド語、ポルトガル語、ルーマニア語、ロシア語、セルビア語 (ラテン語)、スロバキア語、スペイン語、スウェーデン語、トルコ語 | 英語 | Windows OCR エンジンが検出するテキストの言語 |
Use other language | N/A | ブール値 | 偽 | [Tesseract 言語] フィールドに指定されていない言語を使用するかどうかを指定します |
Tesseract language | N/A | 英語、ドイツ語、スペイン語、フランス語、イタリア語 | 英語 | Tesseract エンジンにより検出されるテキストの言語 |
Language abbreviation | 無効 | テキスト値 | 使用する言語の Tesseract 言語コードです。 たとえば、データが 'eng.traineddata' の場合、このパラメーターを 'eng' に設定します | |
言語データ パス | 番号 | Text 値 | 指定された言語の Tesseract データを含むフォルダーのパス | |
Image width multiplier | 無効 | 数値 | 1 | 画像の幅の乗数 |
Image height multiplier | 番号 | 数値 | 1 | 画像の高さの乗数 |
画像が表示されるまで待機 | N/A | ブール値 | True | 画面や前景ウィンドウに画像が表示されるのを待機するかどうかを指定します |
タイムアウト | 番号 | 数値 | 5 | アクションが失敗するまで操作の完了を待機する時間を指定します |
画像照合アルゴリズム | N/A | 基本、上級 | 基本 | 画像を検索するときに使用する画像のアルゴリズムです |
Note
OCR エンジン変数 オプションは非推奨になる予定です。
生成された変数
引数 | タイプ | 説明設定 |
---|---|---|
OcrText | Text 値 | テキスト抽出後の結果 |
例外
例外 | 内容 |
---|---|
OCR を使ってテキストを抽出できません | 指定されたソースから OCR を使ってテキストを抽出しているときにエラーが発生したことを示します |
画像ファイルが見つかりません | 指定されたパスにファイルが存在しないことを示します |
ランドマーク画像が見つかりません | ランドマーク画像が存在しないことを示します |
非インタラクティブ モードでは画面からテキストを取得できません | 非インタラクティブ モードの場合に、画面からテキストを取得できないことを示します |
OCR エンジンを作成できません | OCR エンジンの作成中にエラーが発生したことを示します |
データ パス フォルダーが存在しません | 言語データの指定されたフォルダーが存在しないことを示します |
選択した Windows 言語パックがコンピューターにインストールされていません | 選択した Windows 言語パックがコンピューターにインストールされていないことを示します |
OCR エンジンが利用できません | OCR エンジンが利用できないことを示します |