光学式文字認識 (OCR) を使用して Word 文書からテキストを抽出できますが、このアプローチは、スクロールが必要な複数ページの文書では複雑になる可能性があります。
Word 文書からテキストを抽出するためのより効率的な方法は、VBScript を使用することです。 Power Automate は、デスクトップでスクリプトを実行できるよう VBScript の実行アクションを提供します。
Word 文書からテキストを抽出するには、VBScript の実行 アクションを実行し、次のコードを実行する VBScript フィールドに貼り付けます。
Dim Word
Dim WordDoc
Dim var
Set Word = CreateObject("Word.Application")
'Open the document
Set WordDoc = Word.Documents.open("%FilePath%")
'Read the document
NumberOfWords = WordDoc.Sentences.count
For i = 1 to NumberOfWords
WScript.Echo WordDoc.Sentences(i)
Next
'Close the document
WordDoc.Save
Word.Quit
'Release the object variables
Set WordDoc = Nothing
Set Word = Nothing
スクリプトには、Word 文書のファイル パスを指定する FilePath という名前の変数が含まれています。 この変数は、VBScript の実行アクションを実行する前に、またはハードコードされた値に置き換える前に、変数の設定アクションを使用して初期化できます。
VBScript の実行アクションは、抽出されたテキストをデフォルトで VBScriptOutput という名前の変数に格納します。 この変数を使用可能なテキスト アクションの入力として使用して、取得したテキストを操作できます。