Power Automate umożliwia użytkownikom odczytywanie i wyodrębnianie danych z plików oraz zarządzanie nimi za pomocą rozpoznawania znaków (OCR).
Aby utworzyć aparat OCR i wyodrębnić tekst z obrazów i dokumentów za pomocą OCR, użyj akcji Wyodrębnij tekst za pomocą funkcji OCR. W poniższym przykładzie wyodrębniono tekst z całego wskazanego obrazu.
Wszystkie akcje OCR mogą tworzyć nowe zmienne silnika OCR lub używać istniejących. Możesz użyć istniejących zmiennych silnika OCR w każdej akcji, która oferuje możliwość OCR.
Power Automate obsługuje silnik OCR systemu Windows i Tesseract. Aby skonfigurować wybrany silnik OCR, przejdź do Ustawień silnika OCR odpowiedniej akcji. Dostępne opcje obejmują język oraz mnożniki szerokości i wysokości obrazu.
Uwaga
Wszystkie dostępne silniki OCR są preinstalowane w Power Automate i działają lokalnie bez konieczności łączenia się z chmurą. Jednak aby wyodrębnić teksty w określonych językach, możesz potrzebować pobrać pakiety językowe lub pliki danych.
Mnożniki obrazu zwiększają rozmiar obrazu, aby wyszukiwanie i wyodrębnianie tekstu było efektywniejsze. Ustawienie wartości większych niż trzy może powodować błędne wyniki.
Korzystanie z aparatu OCR systemu Windows
Domyślnym silnikiem OCR w Power Automate jest silnik OCR systemu Windows. Aby wyodrębnić dowolny tekst przy użyciu aparatu OCR systemu Windows, należy zainstalować odpowiedni pakiet językowy dla języka, który ma zostać wyodrębniony.
Jeśli odpowiedni pakiet językowy nie został zainstalowany, usługa Power Automate wyświetli błąd z monitem o zainstalowanie pakietu. Więcej informacji na temat pobierania i instalowania pakietów językowych można znaleźć w temacie Pakiety językowe dla systemu Windows.
Po zainstalowaniu odpowiedniego pakietu językowego należy rozszerzyć ustawienia aparatu OCR w akcji OCR i wybrać żądany język. Aparat Windows OCR obsługuje 25 języków, w tym: chiński (uproszczony i tradycyjny), czeski, duński, holenderski, angielski, fiński, francuski, niemiecki, grecki, węgierski, włoski, japoński, koreański, norweski, polski, portugalski, rumuński, rosyjski, serbski (cyrylica i łaciński), słowacki, hiszpański, szwedzki i turecki.
Korzystanie z aparatu OCR Tesseract
Uwaga
Aby korzystać z aparatu OCR Tesseract, upewnij się, że procesor komputera obsługuje zestaw instrukcji AVX2.
Oprócz aparatu OCR systemu Windows usługa Power Automate obsługuje również aparat Tesseract. Bez konieczności dalszego konfigurowania ten aparat może wyodrębnić tekst w pięciu językach: angielskim, niemieckim, hiszpańskim, francuskim i włoskim.
Aby wyodrębnić tekst w języku poza wymienioną listą, należy włączyć opcję Użyj innych języków w ustawieniach aparatu OCR akcji OCR. Po włączeniu tej opcji w akcji są wyświetlane dwa dodatkowe parametry: pola Skrót językowy i Ścieżka danych językowych.
Pole Skrót językowy wskazuje silnikowi, jakiego języka ma szukać podczas OCR. Pole Ścieżka danych językowych zawiera pliki danych językowych (.traineddata) używane do trenowania aparatu OCR. Pliki danych językowych można znaleźć dla wszystkich dostępnych języków można znaleźć w tym repozytorium GitHub.
Aparat Tesseract może być także używany do wyodrębniania tekstu z dokumentów wielojęzykowych. Aby uzyskać więcej informacji na temat wyodrębniania tekstów z dokumentów wielojęzykowych, zobacz temat Przeprowadzanie OCR w dokumentach wielojęzykowych.
Jeśli tekst znajduje się na ekranie (OCR)
Oznacza początek bloku warunkowego akcji w zależności od tego, czy dany tekst pojawia się na ekranie, czy nie, używając funkcji OCR.
Parametry wejściowe
Argument
Opcjonalnie
Akceptuje
Wartość domyślna
opis
If text
Nie dotyczy
Istnieje, Nie istnieje
Istnieje
Określa, czy ma być sprawdzane istnienie tekstu w danym źródle przeznaczonym do analizy
Typ aparatu OCR
Nie
Aparat OCR systemu Windows, aparat Tesseract, zmienna aparatu OCR
Zmienna aparatu OCR
Typ aparatu OCR do użycia. Wybierz wstępnie skonfigurowany aparat OCR lub skonfiguruj nowy.
Współrzędna X punktu, w którym tekst pojawia się na ekranie. Jeśli wyszukiwanie jest wykonywane w oknie pierwszego planu, zwrócona współrzędna jest względem lewego górnego rogu okna
Współrzędna X punktu, w którym tekst pojawia się na ekranie. Jeśli wyszukiwanie jest wykonywane w oknie pierwszego planu, zwrócona współrzędna jest względem lewego górnego rogu okna
Wyjątki
Wyjątek
opis
W trybie nieinterakcyjnym nie można sprawdzić, czy istnieje tekst
Wskazuje, że podczas działania w trybie nieinterakcyjnym nie można sprawdzić, czy na ekranie znajduje się tekst
Nieprawidłowe współrzędne podregionu
Wskazuje, że określone współrzędne podregionu są nieprawidłowe
Nie można przeanalizować tekstu za pomocą funkcji OCR
Wskazuje, że wystąpił błąd podczas próby przeanalizowania tekstu za pomocą funkcji OCR
Nie można utworzyć aparatu OCR
Wskazuje, że wystąpił błąd podczas próby utworzenia aparatu OCR
Folder ścieżki danych nie istnieje
Wskazuje, że określony na potrzeby przechowywania danych języka folder nie istnieje
Wybrany pakiet językowy systemu Windows nie jest zainstalowany na maszynie
Wskazuje, że wybrany pakiet językowy systemu Windows nie został zainstalowany na komputerze
Aparat OCR nie jest aktywny
Wskazuje, że aparat OCR nie jest aktywny
Zaczekaj na tekst na ekranie (OCR)
Zaczekaj, aż określony tekst zostanie wyświetlony na ekranie lub w oknie na pierwszym planie (bądź na pozycji względnej w stosunku do obrazu na ekranie lub w oknie na pierwszym planie) albo z niego zniknie, używając funkcji OCR.
Parametry wejściowe
Argument
Opcjonalnie
Akceptuje
Wartość domyślna
opis
Wait for text to
Nie dotyczy
Pojawi się, Zniknie
Pojawi się
Określa, czy należy czekać na wyświetlenie lub zniknięcie tekstu
Typ aparatu OCR
Nie
Aparat OCR systemu Windows, aparat Tesseract, zmienna aparatu OCR
Zmienna aparatu OCR
Typ aparatu OCR do użycia. Wybierz wstępnie skonfigurowany aparat OCR lub skonfiguruj nowy.
Współrzędna X punktu, w którym tekst pojawia się na ekranie. Jeśli wyszukiwanie jest wykonywane w oknie pierwszego planu, zwrócona współrzędna jest względem lewego górnego rogu okna
Współrzędna X punktu, w którym tekst pojawia się na ekranie. Jeśli wyszukiwanie jest wykonywane w oknie pierwszego planu, zwrócona współrzędna jest względem lewego górnego rogu okna
Wyjątki
Wyjątek
opis
W trybie nieinterakcyjnym nie można sprawdzić, czy istnieje tekst
Wskazuje, że podczas działania w trybie nieinterakcyjnym nie można sprawdzić, czy na ekranie znajduje się tekst
Nieprawidłowe współrzędne podregionu
Wskazuje, że określone współrzędne podregionu są nieprawidłowe
Nie można przeanalizować tekstu za pomocą funkcji OCR
Wskazuje, że wystąpił błąd podczas próby przeanalizowania tekstu za pomocą funkcji OCR
Nie można utworzyć aparatu OCR
Wskazuje, że wystąpił błąd podczas próby utworzenia aparatu OCR
Folder ścieżki danych nie istnieje
Wskazuje, że określony na potrzeby przechowywania danych języka folder nie istnieje
Wybrany pakiet językowy systemu Windows nie jest zainstalowany na maszynie
Wskazuje, że wybrany pakiet językowy systemu Windows nie został zainstalowany na komputerze
Aparat OCR nie jest aktywny
Wskazuje, że aparat OCR nie jest aktywny
Błąd limitu czasu
Wskazuje, że akcja zakończyła się niepowodzeniem po upływie ustawionego okresu
Wyodrębnij tekst za pomocą funkcji OCR
Wyodrębnij tekst z danego źródła za pomocą danego aparatu OCR.
Parametry wejściowe
Argument
Opcjonalnie
Akceptuje
Wartość domyślna
opis
Aparat OCR
Nie
Aparat OCR systemu Windows, aparat Tesseract, zmienna aparatu OCR
Zmienna aparatu OCR
Typ aparatu OCR do użycia. Wybierz wstępnie skonfigurowany aparat OCR lub skonfiguruj nowy
Ostateczne wydarzenie prowadzone przez społeczność w usłudze Power BI, sieci szkieletowej, SQL i sztucznej inteligencji. 31 marca - 2 kwietnia. Użyj kodu MSCUST dla rabatu w wysokości 150 USD. Ceny idą w górę 11 lutego.