Compartilhar via


Extrair texto de um documento do Word usando VBScript

Embora seja possível usar OCR (Reconhecimento óptico de caracteres) para extrair texto de documentos do Word, essa abordagem pode se tornar complicada para documentos de várias páginas que exijam rolagem.

Uma maneira mais eficiente de extrair texto de documentos do Word é pelo uso de VBScript. O Power Automate oferece a ação Executar VBScript que permite executar scripts na área de trabalho.

Para extrair texto de um documento do Word, implante a ação Executar VBScript e cole o código a seguir no campo VBScript a ser executado.

Dim Word
Dim WordDoc
Dim var
Set Word = CreateObject("Word.Application")

'Open the document
Set WordDoc = Word.Documents.open("%FilePath%")

'Read the document
NumberOfWords = WordDoc.Sentences.count
For i = 1 to NumberOfWords
WScript.Echo WordDoc.Sentences(i)
Next

'Close the document
WordDoc.Save
Word.Quit

'Release the object variables
Set WordDoc = Nothing
Set Word = Nothing

Captura de tela da ação Executar VBScript preenchida.

O script contém uma variável chamada FilePath que especifica o caminho do arquivo do documento do Word. Você pode inicializar essa variável usando uma ação Definir variável antes da ação Executar VBScript ou substitui-la por um valor embutido em código.

Captura de tela da ação Definir variável.

A ação Executar VBScript armazena o texto extraído por padrão em uma variável chamada VBScriptOutput. É possível usar essa variável como uma entrada nas ações de Texto disponível para manipular o texto recuperado.

Captura de tela da ação Aparar texto.