Deli putem


OCR radnje

Power Automate omogućava korisnicima da čitaju, izdvajaju i upravljaju podacima unutar datoteka putem optičkog prepoznavanja znakova (OCR).

Da biste kreirali OCR mašinu i izdvojili tekst iz slika i dokumenata, koristite tekst "Izdvajanje" sa radnjom OCR - a. Sledeći primer izdvaja tekst iz cele navedene slike.

Snimak ekrana teksta

Sve OCR radnje mogu da kreiraju novu promenljivu OCR motora ili da koriste postojeću. Postojeće promenljive OCR motora možete da koristite u svakoj radnji koja nudi OCR mogućnosti.

Power Automate podržava Windows OCR i Tesseract mašine. Da biste konfigurisali izabranu OCR mašinu, dođite do postavki OCR mašine odgovarajuće radnje. Dostupne opcije uključuju jezik i množioce širine i visine slike.

Belešku

  • Svi dostupni OCR motori su unapred instalirani i Power Automate rade lokalno bez povezivanja sa oblakom. Međutim, možda ćete morati da preuzmete jezičke pakete ili datoteke sa podacima da biste izdvojili tekstove na određenim jezicima.
  • Množioci slika povećavaju veličinu slike da bi pretraživanje i vađenje teksta bili efikasniji. Postavljanje vrednosti većih od tri može dovesti do pogrešnih rezultata.

Korišćenje Windows OCR mašine

Podrazumevana OCR mašina u programu Power Automate je Windows OCR mašina. Da biste izdvojili tekstove pomoću Windows OCR mašine, morate da instalirate odgovarajući jezički paket za jezik koji želite da izdvojite.

Ako odgovarajući jezički paket nije instaliran, dobacuje se Power Automate greška, što vas je u kojem se od vas navodi da ga instalirate. Da biste pronašli više informacija o preuzimanju i instaliranju jezičkih paketa, idite na jezičke pakete za Windows.

Nakon instaliranja odgovarajućeg jezičkog paketa, proširite postavke OCR mašine OCR radnje i izaberite jezik koji želite. Windows OCR motor podržava 25 jezika, uključujući kineski (pojednostavljeni i tradicionalni), češki, danski, holandski, engleski, finski, francuski, nemački, grčki, mađarski, italijanski, japanski, korejski, norveški, poljski, portugalski, rumunski, ruski, srpski (ćirilica i latinica), slovački, španski, švedski i turski.

Koristi Tesseract OCR motor

Belešku

Da biste koristili Tesseract OCR motor, uverite se da CPU mašine podržava AVX2 skup instrukcija.

Osim Windows OCR mašine, podržava Power Automate i Tesseract mašinu. Ovaj motor može da izdvoji tekst na pet jezika bez dalje konfiguracije: engleski, nemački, španski, francuski i italijanski.

Da biste izdvojili tekst na jeziku izvan pomenute liste, omogućite opciju "Koristi druge jezike" u postavkama OCR mašine OCR radnje. Kada je ova opcija omogućena, radnja prikazuje još dva parametra: jezičku skraćenicu i putanju podatakajezika.

Polje sa skraćenicom jezika mašini označava jezik koji treba tražiti tokom OCR-a. Polje putanje podataka jezika sadrži jezičke datoteke sa podacima (.traineddata) koje se koriste za obuku OCR mašine. Jezičke datoteke sa podacima možete pronaći za sve dostupne jezike u ovom GitHub skladištu.

Mašinu za tesefakt možete koristiti i za izdvajanje teksta iz višejezičnih dokumenata. Da biste pronašli više informacija o izdvajanju teksta iz višejezičnih dokumenata, idite na dugme "Izvrši OCR" na višejezičnim dokumentima.

Ako je tekst na ekranu (OCR)

Označava početak uslovnog bloka radnji u zavisnosti od toga da li će se dati tekst pojaviti na ekranu ili ne, koristeći OCR.

Ulazni parametri

Argument Opcionalno Prihvata Podrazumevana vrednost Opis
Ako tekst Nepoznato Postoji, ne postoji Postoji Određuje da li treba proveriti da li tekst postoji u datom izvoru koji treba analizirati
Tip OCR mehanizma No Windows OCR motor, Tesseract motor, promenljiva OCR motora Promenljiva OCR mehanizma Tip OCR mašine za korišćenje. Izaberite unapred konfigurisanu OCR mašinu ili podesite novu.
Promenljiva OCR mehanizma No OCREngineObject Mehanizam koji treba koristiti za OCR operaciju
Tekst koji treba pronaći No Tekstualna vrednost Tekst koji treba potražiti u navedenom izvoru
Je regularni izraz Nepoznato Logička vrednost Netačno Određuje da li se koristi običan izraz za pronalaženje navedenog teksta
Traži tekst na Nepoznato Ceo ekran, prozor u prednjem planu Ceo ekran Određuje da li treba tražiti navedeni tekst na celom vidljivom ekranu ili samo prozoru u prednjem planu
Režim pretrage Nepoznato Ceo navedeni izvor, samo određena podregionacija, podregion u odnosu na sliku Ceo navedeni izvor Određuje da li treba skenirati ceo ekran (ili prozor) ili suženu podregiju njemu
Slike No Listaslika Slike koje određuju podregion (u odnosu na gornji levi ugao slike) za skeniranje u potrazi za navedenim tekstom
X1 Da Numerička vrednost Početna X koordinata podregiona skeniranje u potrazi za navedenim tekstom
Tolerancija Da Numerička vrednost 10 Određuje u kojoj meri slike koje se traže mogu da se razlikuju od prvobitno izabrane slike
Y1 Da Numerička vrednost Početna Y koordinata podregiona skeniranje u potrazi za navedenim tekstom
X1 Da Numerička vrednost Početna X koordinata podregiona u odnosu na navedenu sliku za skeniranje u potrazi za navedenim tekstom
X2 Da Numerička vrednost Krajnja X koordinata podregiona skeniranje u potrazi za navedenim tekstom
Y1 Da Numerička vrednost Početna Y koordinata podregiona u odnosu na navedenu sliku za skeniranje u potrazi za navedenim tekstom
Y2 Da Numerička vrednost Krajnja Y koordinata podregiona skeniranje u potrazi za navedenim tekstom
X2 Da Numerička vrednost Krajnja X koordinata podregiona u odnosu na navedenu sliku za skeniranje u potrazi za navedenim tekstom
Y2 Da Numerička vrednost Krajnja Y koordinata podregiona u odnosu na navedenu sliku za skeniranje u potrazi za navedenim tekstom
Windows OCR jezik Nepoznato Kineski (pojednostavljeni), kineski (tradicionalni), češki, danski, holandski, engleski, finski, francuski, nemački, grčki, mađarski, italijanski, japanski, korejski, norveški, poljski, portugalski, rumunski, ruski, srpski (ćirilica), srpski (latinica), slovački, španski, švedski, turski Engleski Jezik teksta koji windows OCR mašina otkriva
Koristi drugi jezik Nepoznato Logička vrednost Netačno Određuje da li treba koristiti jezik koji nije naveden u polju „Tesseract jezik“
Tesseract jezik Nepoznato Engleski, nemački, španski, francuski, italijanski Engleski Jezik teksta koji otkriva Tesseract mehanizam
Skraćenica jezika No Tekstualna vrednost Tesseract skraćenica jezika za upotrebu. Na primer, ako su podaci "eng.traineddata", postavite ovaj parametar na "eng"
Putanja do podataka o jeziku No Tekstualna vrednost Putanja do fascikle koja sadrži Tesseract podatke navedenog jezika
Množilac širine slike No Numerička vrednost 1 Množilac širine slike
Množilac visine slike No Numerička vrednost 1 Množilac visine slike
Algoritam podudaranja slika Nepoznato Osnovno, napredno Osnovno Koji algoritam slike treba koristiti prilikom traženja slike

Belešku

  • Power Automateredovna mašina za izražavanje je .NET. Da biste pronašli više informacija o običnim izrazima, idite na "Redovan jezik izraza " - brza referenca " .
  • Opcija promenljive OCR motora planirana je za amortizaciju.

Proizvedene promenljive

Argument Tip Opis
LocationOfTextFoundX Numerička vrednost Koordinata X tačke na kojoj se tekst pojavljuje na ekranu. Ako se pretraga izvrši u prozoru prednjeg plana, vraćena koordinata je u odnosu na gornji levi ugao prozora
LocationOfTextFoundY Numerička vrednost Koordinata X tačke na kojoj se tekst pojavljuje na ekranu. Ako se pretraga izvrši u prozoru prednjeg plana, vraćena koordinata je u odnosu na gornji levi ugao prozora

Izuzeci

Izuzetak Opis
Nije moguće proveriti da li tekst postoji u neinteraktivnom režimu Označava da u neinteraktivnom režimu nije moguće proveriti da li na ekranu ima teksta
Nevažeće koordinate podregiona Označava da su navedene koordinate podregiona nevažeće
Nije uspela analiza teksta pomoću tehnologije OCR Označava da je došlo do greške pri pokušaju analize teksta pomoću tehnologije OCR
Nije uspelo kreiranje OCR mehanizma Označava da je došlo do greške pri pokušaju kreiranja OCR mehanizma
Fascikla putanje podataka ne postoji Označava da fascikla navedena za podatke o jeziku ne postoji
Izabrani Windows jezički paket nije instaliran na računaru Označava da izabrani Windows jezički paket nije instaliran na računaru
OCR mehanizam nije aktivan Označava da OCR mehanizam nije aktivan

Sačekaj tekst na ekranu (OCR)

Sačekajte da se određeni tekst pojavi/nestane na ekranu, prozoru u prednjem planu ili u odnosu na sliku na ekranu ili prozoru u prednjem planu pomoću OCR-a.

Ulazni parametri

Argument Opcionalno Prihvata Podrazumevana vrednost Opis
Sačekaj da se tekst Nepoznato Pojavi se, nestani Pojavljivanje Određuje da li treba sačekati da se tekst pojavi ili da nestane
Tip OCR mehanizma No Windows OCR motor, Tesseract motor, promenljiva OCR motora Promenljiva OCR mehanizma Tip OCR mašine za korišćenje. Izaberite unapred konfigurisanu OCR mašinu ili podesite novu.
Promenljiva OCR mehanizma No OCREngineObject Mehanizam koji treba koristiti za OCR operaciju
Tekst koji treba pronaći No Tekstualna vrednost Tekst koji treba potražiti u navedenom izvoru
Je regularni izraz Nepoznato Logička vrednost Netačno Određuje da li se koristi običan izraz za pronalaženje navedenog teksta
Traži tekst na Nepoznato Ceo ekran, prozor u prednjem planu Ceo ekran Određuje da li treba tražiti navedeni tekst na celom vidljivom ekranu ili samo prozoru u prednjem planu
Režim pretrage Nepoznato Ceo navedeni izvor, samo određena podregionacija, podregion u odnosu na sliku Ceo navedeni izvor Određuje da li treba skenirati ceo ekran (ili prozor) ili suženu podregiju njemu
Slike No Listaslika Slike koje određuju podregion (u odnosu na gornji levi ugao slike) za skeniranje u potrazi za navedenim tekstom
X1 Da Numerička vrednost Početna X koordinata podregiona skeniranje u potrazi za navedenim tekstom
Tolerancija Da Numerička vrednost 10 Određuje u kojoj meri slike koje se traže mogu da se razlikuju od prvobitno izabrane slike
Y1 Da Numerička vrednost Početna Y koordinata podregiona skeniranje u potrazi za navedenim tekstom
X1 Da Numerička vrednost Početna X koordinata podregiona u odnosu na navedenu sliku za skeniranje u potrazi za navedenim tekstom
X2 Da Numerička vrednost Krajnja X koordinata podregiona skeniranje u potrazi za navedenim tekstom
Y1 Da Numerička vrednost Početna Y koordinata podregiona u odnosu na navedenu sliku za skeniranje u potrazi za navedenim tekstom
Y2 Da Numerička vrednost Krajnja Y koordinata podregiona skeniranje u potrazi za navedenim tekstom
X2 Da Numerička vrednost Krajnja X koordinata podregiona u odnosu na navedenu sliku za skeniranje u potrazi za navedenim tekstom
Y2 Da Numerička vrednost Krajnja Y koordinata podregiona u odnosu na navedenu sliku za skeniranje u potrazi za navedenim tekstom
Windows OCR jezik Nepoznato Kineski (pojednostavljeni), kineski (tradicionalni), češki, danski, holandski, engleski, finski, francuski, nemački, grčki, mađarski, italijanski, japanski, korejski, norveški, poljski, portugalski, rumunski, ruski, srpski (ćirilica), srpski (latinica), slovački, španski, švedski, turski Engleski Jezik teksta koji windows OCR mašina otkriva
Koristi drugi jezik Nepoznato Logička vrednost Netačno Određuje da li treba koristiti jezik koji nije naveden u polju „Tesseract jezik“
Tesseract jezik Nepoznato Engleski, nemački, španski, francuski, italijanski Engleski Jezik teksta koji otkriva Tesseract mehanizam
Skraćenica jezika No Tekstualna vrednost Tesseract skraćenica jezika za upotrebu. Na primer, ako su podaci "eng.traineddata", postavite ovaj parametar na "eng"
Putanja do podataka o jeziku No Tekstualna vrednost Putanja do fascikle koja sadrži Tesseract podatke navedenog jezika
Množilac širine slike No Numerička vrednost 1 Množilac širine slike
Množilac visine slike No Numerička vrednost 1 Množilac visine slike
Algoritam podudaranja slika Nepoznato Osnovno, napredno Osnovno Koji algoritam slike treba koristiti prilikom traženja slike
Neuspeh uz grešku zbog isteka vremenskog ograničenja Nepoznato Logička vrednost Netačno Odredite da li želite da radnja čeka neograničeno ili da ne uspe nakon određenog vremenskog perioda

Belešku

  • Power Automateredovna mašina za izražavanje je .NET. Da biste pronašli više informacija o običnim izrazima, idite na "Redovan jezik izraza " - brza referenca " .
  • Opcija promenljive OCR motora planirana je za amortizaciju.

Proizvedene promenljive

Argument Tip Opis
LocationOfTextFoundX Numerička vrednost Koordinata X tačke na kojoj se tekst pojavljuje na ekranu. Ako se pretraga izvrši u prozoru prednjeg plana, vraćena koordinata je u odnosu na gornji levi ugao prozora
LocationOfTextFoundY Numerička vrednost Koordinata X tačke na kojoj se tekst pojavljuje na ekranu. Ako se pretraga izvrši u prozoru prednjeg plana, vraćena koordinata je u odnosu na gornji levi ugao prozora

Izuzeci

Izuzetak Opis
Nije moguće proveriti da li tekst postoji u neinteraktivnom režimu Označava da u neinteraktivnom režimu nije moguće proveriti da li na ekranu ima teksta
Nevažeće koordinate podregiona Označava da su navedene koordinate podregiona nevažeće
Nije uspela analiza teksta pomoću tehnologije OCR Označava da je došlo do greške pri pokušaju analize teksta pomoću tehnologije OCR
Nije uspelo kreiranje OCR mehanizma Označava da je došlo do greške pri pokušaju kreiranja OCR mehanizma
Fascikla putanje podataka ne postoji Označava da fascikla navedena za podatke o jeziku ne postoji
Izabrani Windows jezički paket nije instaliran na računaru Označava da izabrani Windows jezički paket nije instaliran na računaru
OCR mehanizam nije aktivan Označava da OCR mehanizam nije aktivan
Greška vremenskog ograničenja Označava da radnja nije uspela nakon određenog vremenskog perioda

Izdvoj tekst koristeći OCR

Izdvojite tekst iz datog izvora pomoću date OCR mašine.

Ulazni parametri

Argument Opcionalno Prihvata Podrazumevana vrednost Opis
OCR mehanizam No Windows OCR motor, Tesseract motor, promenljiva OCR motora Promenljiva OCR mehanizma Tip OCR mašine za korišćenje. Izaberite unapred konfigurisanu OCR mašinu ili podesite novu
Promenljiva OCR mehanizma No OCREngineObject Mehanizam koji treba koristiti za OCR operaciju
OCR izvor Nepoznato Ekran, prozor u prednjem planu, Slika na disku Ekran Izvor slike na kojoj treba obaviti OCR operaciju
Putanja datoteke slike No Datoteke Putanja slike na koju treba izvršiti OCR operaciju
Režim pretrage Nepoznato Ceo navedeni izvor, samo određena podregionacija, podregion u odnosu na sliku Ceo navedeni izvor Izabrani režim OCR operacije
Image No Listaslika Slika koju treba koristiti za sužavanje skeniranja na podregion koji je u odnosu na navedenu sliku
Tolerancija Da Numerička vrednost 10 Određuje u kojoj meri slika može da se razlikuje od prvobitno izabrane slike
X1 Da Numerička vrednost Početna X koordinata podregiona za sužavanje skeniranja
X2 Da Numerička vrednost Krajnja X koordinata podregiona za sužavanje skeniranja
Y1 Da Numerička vrednost Početna Y koordinata podregiona za sužavanje skeniranja
Y2 Da Numerička vrednost Krajnja Y koordinata podregiona za sužavanje skeniranja
Windows OCR jezik Nepoznato Kineski (pojednostavljeni), kineski (tradicionalni), češki, danski, holandski, engleski, finski, francuski, nemački, grčki, mađarski, italijanski, japanski, korejski, norveški, poljski, portugalski, rumunski, ruski, srpski (ćirilica), srpski (latinica), slovački, španski, švedski, turski Engleski Jezik teksta koji windows OCR mašina otkriva
Koristi drugi jezik Nepoznato Logička vrednost Netačno Određuje da li treba koristiti jezik koji nije naveden u polju „Tesseract jezik“
Tesseract jezik Nepoznato Engleski, nemački, španski, francuski, italijanski Engleski Jezik teksta koji otkriva Tesseract mehanizam
Skraćenica jezika No Tekstualna vrednost Tesseract skraćenica jezika za upotrebu. Na primer, ako su podaci "eng.traineddata", postavite ovaj parametar na "eng"
Putanja do podataka o jeziku No Tekstualna vrednost Putanja do fascikle koja sadrži Tesseract podatke navedenog jezika
Množilac širine slike No Numerička vrednost 1 Množilac širine slike
Množilac visine slike No Numerička vrednost 1 Množilac visine slike
Sačekaj da se slika pojavi Nepoznato Logička vrednost Tačno Određuje da li treba sačekati da se slika pojavi na ekranu ili prozoru u prednjem planu
Istek vremena No Numerička vrednost 5 Određuje vreme čekanja potrebno da se operacija završi pre nego što radnja ne uspe
Algoritam podudaranja slika Nepoznato Osnovno, napredno Osnovno Koji algoritam slike treba koristiti prilikom traženja slike

Belešku

Opcija promenljive OCR motora planirana je za amortizaciju.

Proizvedene promenljive

Argument Tip Opis
OcrText Tekstualna vrednost Rezultat nakon izdvajanja teksta

Izuzeci

Izuzetak Opis
Nije uspelo izdvajanje teksta pomoću tehnologije OCR Označava da je došlo do greške pri pokušaju izdvajanja teksta pomoću tehnologije OCR iz datog izvora
Datoteka slike nije pronađena Označava da datoteka ne postoji na navedenoj putanji
Slika orijentira nije pronađena Označava da slika orijentira ne postoji
Nije moguće preuzeti tekst sa ekrana u neinteraktivnom režimu Označava da u neinteraktivnom režimu nije moguće preuzeti tekst sa ekrana
Nije uspelo kreiranje OCR mehanizma Označava da je došlo do greške pri pokušaju kreiranja OCR mehanizma
Fascikla putanje podataka ne postoji Označava da fascikla navedena za podatke o jeziku ne postoji
Izabrani Windows jezički paket nije instaliran na računaru Označava da izabrani Windows jezički paket nije instaliran na računaru
OCR mehanizam nije aktivan Označava da OCR mehanizam nije aktivan