Freigeben über


Text mit VBScript aus einem Word-Dokument extrahieren

Obwohl Sie die optische Zeichenerkennung (OCR) verwenden können, um Text aus Word-Dokumenten zu extrahieren, kann dieser Ansatz bei mehrseitigen Dokumenten, die einen Bildlauf erfordern, kompliziert werden.

Eine effizientere Möglichkeit, Text aus Word-Dokumenten zu extrahieren, ist die Verwendung von VBScript. Power Automate bietet die VBScript ausführen-Aktion, mit der Sie Skripts auf Ihrem Desktop ausführen können.

Um Text aus einem Word-Dokument zu extrahieren, stellen Sie die Aktion VBScript ausführen bereit und fügen Sie den folgenden Code in das Feld Auszuführendes VBScript ein.

Dim Word
Dim WordDoc
Dim var
Set Word = CreateObject("Word.Application")

'Open the document
Set WordDoc = Word.Documents.open("%FilePath%")

'Read the document
NumberOfWords = WordDoc.Sentences.count
For i = 1 to NumberOfWords
WScript.Echo WordDoc.Sentences(i)
Next

'Close the document
WordDoc.Save
Word.Quit

'Release the object variables
Set WordDoc = Nothing
Set Word = Nothing

Screenshot der ausgefüllten Aktion „VBScript ausführen“.

Das Skript enthält eine Variable namens FilePath, die den Dateipfad des Word-Dokuments angibt. Sie können diese Variable mit einer Aktion Variable setzen vor der Aktion VBScript ausführen initialisieren oder es durch einen hartcodierten Wert ersetzen.

Screenshot der Aktion „Variable festlegen“.

Die Aktion VBScript ausführen speichert den extrahierten Text standardmäßig in einer Variablen namens VBScriptOutput. Sie können diese Variable als Eingabe in die verfügbaren Textaktionen verwenden, um den abgerufenen Text zu bearbeiten.

Screenshot der Aktion „Text zuschneiden“.