OCR radnje
Power Automate omogućava korisnicima da čitaju, izdvajaju i upravljaju podacima unutar datoteka putem optičkog prepoznavanja znakova (OCR).
Da biste kreirali OCR mašinu i izdvojili tekst iz slika i dokumenata, koristite tekst "Izdvajanje" sa radnjom OCR - a. Sledeći primer izdvaja tekst iz cele navedene slike.
Sve OCR radnje mogu da kreiraju novu promenljivu OCR motora ili da koriste postojeću. Postojeće promenljive OCR motora možete da koristite u svakoj radnji koja nudi OCR mogućnosti.
Power Automate podržava Windows OCR i Tesseract mašine. Da biste konfigurisali izabranu OCR mašinu, dođite do postavki OCR mašine odgovarajuće radnje. Dostupne opcije uključuju jezik i množioce širine i visine slike.
Belešku
- Svi dostupni OCR motori su unapred instalirani i Power Automate rade lokalno bez povezivanja sa oblakom. Međutim, možda ćete morati da preuzmete jezičke pakete ili datoteke sa podacima da biste izdvojili tekstove na određenim jezicima.
- Množioci slika povećavaju veličinu slike da bi pretraživanje i vađenje teksta bili efikasniji. Postavljanje vrednosti većih od tri može dovesti do pogrešnih rezultata.
Korišćenje Windows OCR mašine
Podrazumevana OCR mašina u programu Power Automate je Windows OCR mašina. Da biste izdvojili tekstove pomoću Windows OCR mašine, morate da instalirate odgovarajući jezički paket za jezik koji želite da izdvojite.
Ako odgovarajući jezički paket nije instaliran, dobacuje se Power Automate greška, što vas je u kojem se od vas navodi da ga instalirate. Da biste pronašli više informacija o preuzimanju i instaliranju jezičkih paketa, idite na jezičke pakete za Windows.
Nakon instaliranja odgovarajućeg jezičkog paketa, proširite postavke OCR mašine OCR radnje i izaberite jezik koji želite. Windows OCR motor podržava 25 jezika, uključujući kineski (pojednostavljeni i tradicionalni), češki, danski, holandski, engleski, finski, francuski, nemački, grčki, mađarski, italijanski, japanski, korejski, norveški, poljski, portugalski, rumunski, ruski, srpski (ćirilica i latinica), slovački, španski, švedski i turski.
Koristi Tesseract OCR motor
Belešku
Da biste koristili Tesseract OCR motor, uverite se da CPU mašine podržava AVX2 skup instrukcija.
Osim Windows OCR mašine, podržava Power Automate i Tesseract mašinu. Ovaj motor može da izdvoji tekst na pet jezika bez dalje konfiguracije: engleski, nemački, španski, francuski i italijanski.
Da biste izdvojili tekst na jeziku izvan pomenute liste, omogućite opciju "Koristi druge jezike" u postavkama OCR mašine OCR radnje. Kada je ova opcija omogućena, radnja prikazuje još dva parametra: jezičku skraćenicu i putanju podatakajezika.
Polje sa skraćenicom jezika mašini označava jezik koji treba tražiti tokom OCR-a. Polje putanje podataka jezika sadrži jezičke datoteke sa podacima (.traineddata) koje se koriste za obuku OCR mašine. Jezičke datoteke sa podacima možete pronaći za sve dostupne jezike u ovom GitHub skladištu.
Mašinu za tesefakt možete koristiti i za izdvajanje teksta iz višejezičnih dokumenata. Da biste pronašli više informacija o izdvajanju teksta iz višejezičnih dokumenata, idite na dugme "Izvrši OCR" na višejezičnim dokumentima.
Ako je tekst na ekranu (OCR)
Označava početak uslovnog bloka radnji u zavisnosti od toga da li će se dati tekst pojaviti na ekranu ili ne, koristeći OCR.
Ulazni parametri
Argument | Opcionalno | Prihvata | Podrazumevana vrednost | Opis |
---|---|---|---|---|
Ako tekst | Nepoznato | Postoji, ne postoji | Postoji | Određuje da li treba proveriti da li tekst postoji u datom izvoru koji treba analizirati |
Tip OCR mehanizma | No | Windows OCR motor, Tesseract motor, promenljiva OCR motora | Promenljiva OCR mehanizma | Tip OCR mašine za korišćenje. Izaberite unapred konfigurisanu OCR mašinu ili podesite novu. |
Promenljiva OCR mehanizma | No | OCREngineObject | Mehanizam koji treba koristiti za OCR operaciju | |
Tekst koji treba pronaći | No | Tekstualna vrednost | Tekst koji treba potražiti u navedenom izvoru | |
Je regularni izraz | Nepoznato | Logička vrednost | Netačno | Određuje da li se koristi običan izraz za pronalaženje navedenog teksta |
Traži tekst na | Nepoznato | Ceo ekran, prozor u prednjem planu | Ceo ekran | Određuje da li treba tražiti navedeni tekst na celom vidljivom ekranu ili samo prozoru u prednjem planu |
Režim pretrage | Nepoznato | Ceo navedeni izvor, samo određena podregionacija, podregion u odnosu na sliku | Ceo navedeni izvor | Određuje da li treba skenirati ceo ekran (ili prozor) ili suženu podregiju njemu |
Slike | No | Listaslika | Slike koje određuju podregion (u odnosu na gornji levi ugao slike) za skeniranje u potrazi za navedenim tekstom | |
X1 | Da | Numerička vrednost | Početna X koordinata podregiona skeniranje u potrazi za navedenim tekstom | |
Tolerancija | Da | Numerička vrednost | 10 | Određuje u kojoj meri slike koje se traže mogu da se razlikuju od prvobitno izabrane slike |
Y1 | Da | Numerička vrednost | Početna Y koordinata podregiona skeniranje u potrazi za navedenim tekstom | |
X1 | Da | Numerička vrednost | Početna X koordinata podregiona u odnosu na navedenu sliku za skeniranje u potrazi za navedenim tekstom | |
X2 | Da | Numerička vrednost | Krajnja X koordinata podregiona skeniranje u potrazi za navedenim tekstom | |
Y1 | Da | Numerička vrednost | Početna Y koordinata podregiona u odnosu na navedenu sliku za skeniranje u potrazi za navedenim tekstom | |
Y2 | Da | Numerička vrednost | Krajnja Y koordinata podregiona skeniranje u potrazi za navedenim tekstom | |
X2 | Da | Numerička vrednost | Krajnja X koordinata podregiona u odnosu na navedenu sliku za skeniranje u potrazi za navedenim tekstom | |
Y2 | Da | Numerička vrednost | Krajnja Y koordinata podregiona u odnosu na navedenu sliku za skeniranje u potrazi za navedenim tekstom | |
Windows OCR jezik | Nepoznato | Kineski (pojednostavljeni), kineski (tradicionalni), češki, danski, holandski, engleski, finski, francuski, nemački, grčki, mađarski, italijanski, japanski, korejski, norveški, poljski, portugalski, rumunski, ruski, srpski (ćirilica), srpski (latinica), slovački, španski, švedski, turski | Engleski | Jezik teksta koji windows OCR mašina otkriva |
Koristi drugi jezik | Nepoznato | Logička vrednost | Netačno | Određuje da li treba koristiti jezik koji nije naveden u polju „Tesseract jezik“ |
Tesseract jezik | Nepoznato | Engleski, nemački, španski, francuski, italijanski | Engleski | Jezik teksta koji otkriva Tesseract mehanizam |
Skraćenica jezika | No | Tekstualna vrednost | Tesseract skraćenica jezika za upotrebu. Na primer, ako su podaci "eng.traineddata", postavite ovaj parametar na "eng" | |
Putanja do podataka o jeziku | No | Tekstualna vrednost | Putanja do fascikle koja sadrži Tesseract podatke navedenog jezika | |
Množilac širine slike | No | Numerička vrednost | 1 | Množilac širine slike |
Množilac visine slike | No | Numerička vrednost | 1 | Množilac visine slike |
Algoritam podudaranja slika | Nepoznato | Osnovno, napredno | Osnovno | Koji algoritam slike treba koristiti prilikom traženja slike |
Belešku
- Power Automateredovna mašina za izražavanje je .NET. Da biste pronašli više informacija o običnim izrazima, idite na "Redovan jezik izraza " - brza referenca " .
- Opcija promenljive OCR motora planirana je za amortizaciju.
Proizvedene promenljive
Argument | Tip | Opis |
---|---|---|
LocationOfTextFoundX | Numerička vrednost | Koordinata X tačke na kojoj se tekst pojavljuje na ekranu. Ako se pretraga izvrši u prozoru prednjeg plana, vraćena koordinata je u odnosu na gornji levi ugao prozora |
LocationOfTextFoundY | Numerička vrednost | Koordinata X tačke na kojoj se tekst pojavljuje na ekranu. Ako se pretraga izvrši u prozoru prednjeg plana, vraćena koordinata je u odnosu na gornji levi ugao prozora |
Izuzeci
Izuzetak | Opis |
---|---|
Nije moguće proveriti da li tekst postoji u neinteraktivnom režimu | Označava da u neinteraktivnom režimu nije moguće proveriti da li na ekranu ima teksta |
Nevažeće koordinate podregiona | Označava da su navedene koordinate podregiona nevažeće |
Nije uspela analiza teksta pomoću tehnologije OCR | Označava da je došlo do greške pri pokušaju analize teksta pomoću tehnologije OCR |
Nije uspelo kreiranje OCR mehanizma | Označava da je došlo do greške pri pokušaju kreiranja OCR mehanizma |
Fascikla putanje podataka ne postoji | Označava da fascikla navedena za podatke o jeziku ne postoji |
Izabrani Windows jezički paket nije instaliran na računaru | Označava da izabrani Windows jezički paket nije instaliran na računaru |
OCR mehanizam nije aktivan | Označava da OCR mehanizam nije aktivan |
Sačekaj tekst na ekranu (OCR)
Sačekajte da se određeni tekst pojavi/nestane na ekranu, prozoru u prednjem planu ili u odnosu na sliku na ekranu ili prozoru u prednjem planu pomoću OCR-a.
Ulazni parametri
Argument | Opcionalno | Prihvata | Podrazumevana vrednost | Opis |
---|---|---|---|---|
Sačekaj da se tekst | Nepoznato | Pojavi se, nestani | Pojavljivanje | Određuje da li treba sačekati da se tekst pojavi ili da nestane |
Tip OCR mehanizma | No | Windows OCR motor, Tesseract motor, promenljiva OCR motora | Promenljiva OCR mehanizma | Tip OCR mašine za korišćenje. Izaberite unapred konfigurisanu OCR mašinu ili podesite novu. |
Promenljiva OCR mehanizma | No | OCREngineObject | Mehanizam koji treba koristiti za OCR operaciju | |
Tekst koji treba pronaći | No | Tekstualna vrednost | Tekst koji treba potražiti u navedenom izvoru | |
Je regularni izraz | Nepoznato | Logička vrednost | Netačno | Određuje da li se koristi običan izraz za pronalaženje navedenog teksta |
Traži tekst na | Nepoznato | Ceo ekran, prozor u prednjem planu | Ceo ekran | Određuje da li treba tražiti navedeni tekst na celom vidljivom ekranu ili samo prozoru u prednjem planu |
Režim pretrage | Nepoznato | Ceo navedeni izvor, samo određena podregionacija, podregion u odnosu na sliku | Ceo navedeni izvor | Određuje da li treba skenirati ceo ekran (ili prozor) ili suženu podregiju njemu |
Slike | No | Listaslika | Slike koje određuju podregion (u odnosu na gornji levi ugao slike) za skeniranje u potrazi za navedenim tekstom | |
X1 | Da | Numerička vrednost | Početna X koordinata podregiona skeniranje u potrazi za navedenim tekstom | |
Tolerancija | Da | Numerička vrednost | 10 | Određuje u kojoj meri slike koje se traže mogu da se razlikuju od prvobitno izabrane slike |
Y1 | Da | Numerička vrednost | Početna Y koordinata podregiona skeniranje u potrazi za navedenim tekstom | |
X1 | Da | Numerička vrednost | Početna X koordinata podregiona u odnosu na navedenu sliku za skeniranje u potrazi za navedenim tekstom | |
X2 | Da | Numerička vrednost | Krajnja X koordinata podregiona skeniranje u potrazi za navedenim tekstom | |
Y1 | Da | Numerička vrednost | Početna Y koordinata podregiona u odnosu na navedenu sliku za skeniranje u potrazi za navedenim tekstom | |
Y2 | Da | Numerička vrednost | Krajnja Y koordinata podregiona skeniranje u potrazi za navedenim tekstom | |
X2 | Da | Numerička vrednost | Krajnja X koordinata podregiona u odnosu na navedenu sliku za skeniranje u potrazi za navedenim tekstom | |
Y2 | Da | Numerička vrednost | Krajnja Y koordinata podregiona u odnosu na navedenu sliku za skeniranje u potrazi za navedenim tekstom | |
Windows OCR jezik | Nepoznato | Kineski (pojednostavljeni), kineski (tradicionalni), češki, danski, holandski, engleski, finski, francuski, nemački, grčki, mađarski, italijanski, japanski, korejski, norveški, poljski, portugalski, rumunski, ruski, srpski (ćirilica), srpski (latinica), slovački, španski, švedski, turski | Engleski | Jezik teksta koji windows OCR mašina otkriva |
Koristi drugi jezik | Nepoznato | Logička vrednost | Netačno | Određuje da li treba koristiti jezik koji nije naveden u polju „Tesseract jezik“ |
Tesseract jezik | Nepoznato | Engleski, nemački, španski, francuski, italijanski | Engleski | Jezik teksta koji otkriva Tesseract mehanizam |
Skraćenica jezika | No | Tekstualna vrednost | Tesseract skraćenica jezika za upotrebu. Na primer, ako su podaci "eng.traineddata", postavite ovaj parametar na "eng" | |
Putanja do podataka o jeziku | No | Tekstualna vrednost | Putanja do fascikle koja sadrži Tesseract podatke navedenog jezika | |
Množilac širine slike | No | Numerička vrednost | 1 | Množilac širine slike |
Množilac visine slike | No | Numerička vrednost | 1 | Množilac visine slike |
Algoritam podudaranja slika | Nepoznato | Osnovno, napredno | Osnovno | Koji algoritam slike treba koristiti prilikom traženja slike |
Neuspeh uz grešku zbog isteka vremenskog ograničenja | Nepoznato | Logička vrednost | Netačno | Odredite da li želite da radnja čeka neograničeno ili da ne uspe nakon određenog vremenskog perioda |
Belešku
- Power Automateredovna mašina za izražavanje je .NET. Da biste pronašli više informacija o običnim izrazima, idite na "Redovan jezik izraza " - brza referenca " .
- Opcija promenljive OCR motora planirana je za amortizaciju.
Proizvedene promenljive
Argument | Tip | Opis |
---|---|---|
LocationOfTextFoundX | Numerička vrednost | Koordinata X tačke na kojoj se tekst pojavljuje na ekranu. Ako se pretraga izvrši u prozoru prednjeg plana, vraćena koordinata je u odnosu na gornji levi ugao prozora |
LocationOfTextFoundY | Numerička vrednost | Koordinata X tačke na kojoj se tekst pojavljuje na ekranu. Ako se pretraga izvrši u prozoru prednjeg plana, vraćena koordinata je u odnosu na gornji levi ugao prozora |
Izuzeci
Izuzetak | Opis |
---|---|
Nije moguće proveriti da li tekst postoji u neinteraktivnom režimu | Označava da u neinteraktivnom režimu nije moguće proveriti da li na ekranu ima teksta |
Nevažeće koordinate podregiona | Označava da su navedene koordinate podregiona nevažeće |
Nije uspela analiza teksta pomoću tehnologije OCR | Označava da je došlo do greške pri pokušaju analize teksta pomoću tehnologije OCR |
Nije uspelo kreiranje OCR mehanizma | Označava da je došlo do greške pri pokušaju kreiranja OCR mehanizma |
Fascikla putanje podataka ne postoji | Označava da fascikla navedena za podatke o jeziku ne postoji |
Izabrani Windows jezički paket nije instaliran na računaru | Označava da izabrani Windows jezički paket nije instaliran na računaru |
OCR mehanizam nije aktivan | Označava da OCR mehanizam nije aktivan |
Greška vremenskog ograničenja | Označava da radnja nije uspela nakon određenog vremenskog perioda |
Izdvoj tekst koristeći OCR
Izdvojite tekst iz datog izvora pomoću date OCR mašine.
Ulazni parametri
Argument | Opcionalno | Prihvata | Podrazumevana vrednost | Opis |
---|---|---|---|---|
OCR mehanizam | No | Windows OCR motor, Tesseract motor, promenljiva OCR motora | Promenljiva OCR mehanizma | Tip OCR mašine za korišćenje. Izaberite unapred konfigurisanu OCR mašinu ili podesite novu |
Promenljiva OCR mehanizma | No | OCREngineObject | Mehanizam koji treba koristiti za OCR operaciju | |
OCR izvor | Nepoznato | Ekran, prozor u prednjem planu, Slika na disku | Ekran | Izvor slike na kojoj treba obaviti OCR operaciju |
Putanja datoteke slike | No | Datoteke | Putanja slike na koju treba izvršiti OCR operaciju | |
Režim pretrage | Nepoznato | Ceo navedeni izvor, samo određena podregionacija, podregion u odnosu na sliku | Ceo navedeni izvor | Izabrani režim OCR operacije |
Image | No | Listaslika | Slika koju treba koristiti za sužavanje skeniranja na podregion koji je u odnosu na navedenu sliku | |
Tolerancija | Da | Numerička vrednost | 10 | Određuje u kojoj meri slika može da se razlikuje od prvobitno izabrane slike |
X1 | Da | Numerička vrednost | Početna X koordinata podregiona za sužavanje skeniranja | |
X2 | Da | Numerička vrednost | Krajnja X koordinata podregiona za sužavanje skeniranja | |
Y1 | Da | Numerička vrednost | Početna Y koordinata podregiona za sužavanje skeniranja | |
Y2 | Da | Numerička vrednost | Krajnja Y koordinata podregiona za sužavanje skeniranja | |
Windows OCR jezik | Nepoznato | Kineski (pojednostavljeni), kineski (tradicionalni), češki, danski, holandski, engleski, finski, francuski, nemački, grčki, mađarski, italijanski, japanski, korejski, norveški, poljski, portugalski, rumunski, ruski, srpski (ćirilica), srpski (latinica), slovački, španski, švedski, turski | Engleski | Jezik teksta koji windows OCR mašina otkriva |
Koristi drugi jezik | Nepoznato | Logička vrednost | Netačno | Određuje da li treba koristiti jezik koji nije naveden u polju „Tesseract jezik“ |
Tesseract jezik | Nepoznato | Engleski, nemački, španski, francuski, italijanski | Engleski | Jezik teksta koji otkriva Tesseract mehanizam |
Skraćenica jezika | No | Tekstualna vrednost | Tesseract skraćenica jezika za upotrebu. Na primer, ako su podaci "eng.traineddata", postavite ovaj parametar na "eng" | |
Putanja do podataka o jeziku | No | Tekstualna vrednost | Putanja do fascikle koja sadrži Tesseract podatke navedenog jezika | |
Množilac širine slike | No | Numerička vrednost | 1 | Množilac širine slike |
Množilac visine slike | No | Numerička vrednost | 1 | Množilac visine slike |
Sačekaj da se slika pojavi | Nepoznato | Logička vrednost | Tačno | Određuje da li treba sačekati da se slika pojavi na ekranu ili prozoru u prednjem planu |
Istek vremena | No | Numerička vrednost | 5 | Određuje vreme čekanja potrebno da se operacija završi pre nego što radnja ne uspe |
Algoritam podudaranja slika | Nepoznato | Osnovno, napredno | Osnovno | Koji algoritam slike treba koristiti prilikom traženja slike |
Belešku
Opcija promenljive OCR motora planirana je za amortizaciju.
Proizvedene promenljive
Argument | Tip | Opis |
---|---|---|
OcrText | Tekstualna vrednost | Rezultat nakon izdvajanja teksta |
Izuzeci
Izuzetak | Opis |
---|---|
Nije uspelo izdvajanje teksta pomoću tehnologije OCR | Označava da je došlo do greške pri pokušaju izdvajanja teksta pomoću tehnologije OCR iz datog izvora |
Datoteka slike nije pronađena | Označava da datoteka ne postoji na navedenoj putanji |
Slika orijentira nije pronađena | Označava da slika orijentira ne postoji |
Nije moguće preuzeti tekst sa ekrana u neinteraktivnom režimu | Označava da u neinteraktivnom režimu nije moguće preuzeti tekst sa ekrana |
Nije uspelo kreiranje OCR mehanizma | Označava da je došlo do greške pri pokušaju kreiranja OCR mehanizma |
Fascikla putanje podataka ne postoji | Označava da fascikla navedena za podatke o jeziku ne postoji |
Izabrani Windows jezički paket nije instaliran na računaru | Označava da izabrani Windows jezički paket nije instaliran na računaru |
OCR mehanizam nije aktivan | Označava da OCR mehanizam nije aktivan |