Extraer texto de un documento de Word mediante VBScript

Aunque puede utilizar el reconocimiento óptico de caracteres (OCR) para extraer texto de documentos de Word, este enfoque puede resultar complicado para documentos de varias páginas que requieren desplazamiento.

VBScript ofrece una forma más eficaz de extraer texto de documentos de Word. Power Automate proporciona la acción Ejecutar VBScript que le permite ejecutar scripts en su escritorio.

Para extraer texto de un documento de Word, implemente la acción Ejecutar VBScript y pegue el siguiente código en el campo VBScript que se ejecutará.

Dim Word
Dim WordDoc
Dim var
Set Word = CreateObject("Word.Application")

'Open the document
Set WordDoc = Word.Documents.open("%FilePath%")

'Read the document
NumberOfWords = WordDoc.Sentences.count
For i = 1 to NumberOfWords
WScript.Echo WordDoc.Sentences(i)
Next

'Close the document
WordDoc.Save
Word.Quit

'Release the object variables
Set WordDoc = Nothing
Set Word = Nothing

Captura de pantalla de la acción Ejecutar VBScript.

El script contiene una variable llamada FilePath que especifica la ruta del archivo del documento de Word. Puede inicializar esta variable mediante una Establecer variable antes de la acción Ejecutar VBScript o reemplazar su valor con un valor codificado.

Captura de pantalla de la acción Establecer variable.

La acción Ejecutar VBScript almacena el texto extraído por defecto en una variable llamada VBScriptOutput. Puede utilizar esta variable como entrada en las acciones de texto disponibles para manipular el texto recuperado.

Captura de pantalla de la ación Recortar texto.