次の方法で共有


VBScript を使用して Word 文書からテキストを抽出する

光学式文字認識 (OCR) を使用して Word 文書からテキストを抽出できますが、このアプローチは、スクロールが必要な複数ページの文書では複雑になる可能性があります。

Word 文書からテキストを抽出するためのより効率的な方法は、VBScript を使用することです。 Power Automate は、デスクトップでスクリプトを実行できるよう VBScript の実行アクションを提供します。

Word 文書からテキストを抽出するには、VBScript の実行 アクションを実行し、次のコードを実行する VBScript フィールドに貼り付けます。

Dim Word
Dim WordDoc
Dim var
Set Word = CreateObject("Word.Application")

'Open the document
Set WordDoc = Word.Documents.open("%FilePath%")

'Read the document
NumberOfWords = WordDoc.Sentences.count
For i = 1 to NumberOfWords
WScript.Echo WordDoc.Sentences(i)
Next

'Close the document
WordDoc.Save
Word.Quit

'Release the object variables
Set WordDoc = Nothing
Set Word = Nothing

入力された [VBScript の実行] アクションのスクリーンショット。

スクリプトには、Word 文書のファイル パスを指定する FilePath という名前の変数が含まれています。 この変数は、VBScript の実行アクションを実行する前に、またはハードコードされた値に置き換える前に、変数の設定アクションを使用して初期化できます。

変数の設定アクションのスクリーンショット。

VBScript の実行アクションは、抽出されたテキストをデフォルトで VBScriptOutput という名前の変数に格納します。 この変数を使用可能なテキスト アクションの入力として使用して、取得したテキストを操作できます。

[テキストのトリミング] アクションのスクリーンショット。