Udostępnij za pośrednictwem


Wyodrębnianie tekstu z dokumentu programu Word przy użyciu języka VBScript

Chociaż do wyodrębniania tekstu z dokumentów programu Word można użyć optycznego rozpoznawania znaków (OCR), podejście to może stać się skomplikowane w przypadku dokumentów wielostronicowych, które wymagają przewijania.

Bardziej efektywnym sposobem ekstrakcji tekstu z dokumentów Word jest wykorzystanie języka VBScript. Power Automate udostępnia akcję Run VBScript, która umożliwia uruchamianie skryptów na komputerze.

Aby wyodrębnić tekst z dokumentu programu Word, należy wdrożyć akcję Uruchom VBScript i wkleić następujący kod w języku VBScript, aby uruchomić pole.

Dim Word
Dim WordDoc
Dim var
Set Word = CreateObject("Word.Application")

'Open the document
Set WordDoc = Word.Documents.open("%FilePath%")

'Read the document
NumberOfWords = WordDoc.Sentences.count
For i = 1 to NumberOfWords
WScript.Echo WordDoc.Sentences(i)
Next

'Close the document
WordDoc.Save
Word.Quit

'Release the object variables
Set WordDoc = Nothing
Set Word = Nothing

Zrzut ekranu wypełnionej akcji Uruchom VBScript.

Skrypt zawiera zmienną o nazwie FilePath, która określa ścieżkę pliku dokumentu programu Word. Zmienną można zainicjować, używając akcji Ustaw zmienną przed Uruchom VBScript lub zastąpieniem jej wartością podaną.

Zrzut ekranu z akcją Ustaw zmienną.

Akcja Uruchom VBScript przechowuje domyślnie wyodrębniony tekst w zmiennej o nazwie VBScriptOutput. Możesz użyć tej zmiennej jako wejścia w dostępnych akcjach Tekst, aby manipulować pobranym tekstem.

Zrzut ekranu akcji Przytnij tekst.