OCR ekintzak
Power Automate Erabiltzaileei fitxategietako datuak irakurtzeko, ateratzeko eta kudeatzeko aukera ematen die, karaktere optikoen ezagutzaren bidez (OCR).
OCR motor bat sortzeko eta irudietatik eta dokumentuetatik testua ateratzeko, erabili Atera testua OCR bidez ekintza. Hurrengo adibidean zehaztutako irudi osotik testua ateratzen da.
OCR ekintza guztiek OCR motorren aldagai berri bat sor dezakete edo lehendik dagoen bat erabil dezakete. Lehendik dauden OCR motorren aldagaiak erabil ditzakezu OCR gaitasunak eskaintzen dituen edozein ekintzatan.
Power Automate Windows OCR eta Tesseract motorrak onartzen ditu. Hautatutako OCR motorra konfiguratzeko, joan dagokion ekintzaren OCR motorren ezarpenetara . Eskuragarri dauden aukeren artean hizkuntza eta irudiaren zabalera eta altuera biderkatzaileak daude.
Oharra
- Eskuragarri dauden OCR motor guztiak aurrez instalatuta daude Power Automate n eta lokalean funtzionatzen dute hodeira konektatu gabe. Hala ere, baliteke hizkuntza paketeak edo datu-fitxategiak deskargatu behar izatea hizkuntza zehatzetako testuak ateratzeko.
- Irudien biderkatzaileek irudiaren tamaina handitzen dute bilaketak eta testuak erauztea eraginkorragoak izan daitezen. Hiru baino balio handiagoak ezartzeak emaitza okerrak ekar ditzake.
Erabili Windows OCR motorra
Power Automate n OCR motor lehenetsia Windows OCR motorra da. Windows OCR motorra erabiliz testuak ateratzeko, atera nahi duzun hizkuntzarako dagokion hizkuntza paketea instalatu behar duzu.
Hizkuntza pakete egokia instalatuta ez badago, Power Automate k errore bat botatzen du, instalatzeko eskatuz. Hizkuntza paketeak deskargatzeari eta instalatzeari buruzko informazio gehiago aurkitzeko, joan Windows-erako hizkuntza paketeakra.
Hizkuntza pakete egokia instalatu ondoren, zabaldu OCR ekintzaren OCR motorren ezarpenak eta hautatu nahi duzun hizkuntza. Windows OCR motorrak 25 hizkuntza onartzen ditu, besteak beste, txinera (sinplifikatua eta tradizionala), txekiera, daniera, nederlandera, ingelesa, finlandiera, frantsesa, alemana, grekoa, hungariera, italiera, japoniera, koreera, norvegiera, poloniera, portugesa, errumaniera, errusiera, serbiera (zirilikoa eta latina), eslovakiera, gaztelania, suediera eta turkiera.
Erabili Tesseract OCR motorra
Oharra
Tesseract OCR motorra erabiltzeko, ziurtatu makinaren CPUak AVX2 instrukzio multzoa onartzen duela.
Windows OCR motorraz gain, Power Automate Tesseract motorra onartzen du. Motor honek bost hizkuntzatako testua atera dezake konfigurazio gehiagorik gabe: ingelesa, alemana, gaztelania, frantsesa eta italiera.
Aipatutako zerrendatik kanpoko hizkuntza batean testua ateratzeko, gaitu Erabili beste hizkuntza batzuk aukera OCR motorren ezarpenetan OCR ekintzaren. Aukera hau gaituta dagoenean, ekintzak beste bi parametro bistaratzen ditu: Hizkuntzaren laburdura eta Hizkuntza-datuen bidea.
Hizkuntza laburdura eremuak OCR-an zein hizkuntza bilatu behar duen motorrari adierazten dio. Hizkuntza-datuen bidea eremuak OCR motorra entrenatzeko erabiltzen diren hizkuntza-datuen fitxategiak (.traineddata) ditu. Eskuragarri dauden hizkuntza guztien hizkuntza-datuen fitxategiak GitHub biltegi honetan aurki ditzakezu.
Tesseract motorra ere erabil dezakezu dokumentu eleanitzetatik testua ateratzeko. Dokumentu eleanitzetatik testua ateratzeari buruzko informazio gehiago aurkitzeko, joan Egin OCR dokumentu eleanitzetanra.
Testua pantailan badago (OCR)
Ekintzen baldintza-bloke baten hasiera markatzen du, testu jakin bat pantailan agertzen den ala ez, OCR erabiliz.
Sarrerako parametroak
Argumentua | Aukerakoa | Onartzen du | Balio lehenetsia | Deskribapenak |
---|---|---|---|---|
Testuren baldintza | E/E | Existitzen da, ez da existitzen | Badago | Aztertu beharreko iturburuan testua dagoen ala ez egiaztatu behar den zehazten du |
OCR motor mota | No | Windows OCR motorra, Tesseract motorra, OCR motorra aldagaia | OCR motorraren aldagaia | Erabili beharreko OCR motor mota. Hautatu aurrez konfiguratutako OCR motor bat edo konfiguratu berri bat. |
OCR motorraren aldagaia | No | OCRengineObject | OCR eragiketarako erabili beharreko motorra | |
Bilatu beharreko testua | No | Testuaren balioa | Zehaztutako iturburuan bilatu beharreko testua | |
Adierazpen erregularra da | E/E | Balio boolearra | Gezurrezkoa | Adierazpen erregular bat erabili behar den zehazten du zehaztutako testua aurkitzeko |
Bilatu testua hemen: | E/E | Pantaila osoa, Lehen planoko leihoa | Pantaila osoa | Zehazten du zehaztutako testua ikusgai dagoen pantaila osoan edo soilik lehen planoko leihoan bilatu behar den |
Bilaketa modua | E/E | Zehaztutako iturri osoa, Azpieskualde zehatza soilik, Azpieskualdea irudiarekiko | Zehaztutako iturburu osoa | Pantaila osoa (edo leihoa) edo haren azpieskualde murriztu bat eskaneatu behar den zehazten du |
Irudiak | No | Zerrenda de Irudiak | Emandako testua bilatu beharreko azpieremua zehazten duten irudiak Irudiak azpieskualdea (irudiaren goiko ezkerreko izkinarekiko) zehazten du | |
X1 | Yes | Zenbakizko balioa | Emandako testua bilatzeko erabili beharreko azpieremuaren hasierako X koordenatua | |
Tolerantzia | Yes | Zenbakizko balioa | 1,0 | Bilatutako irudiak jatorriz aukeratutakoarekiko izan dezaketen desberdintasuna zehazten du |
Y1 | Yes | Zenbakizko balioa | Emandako testua bilatzeko erabili beharreko azpieremuaren hasierako Y koordenatua | |
X1 | Yes | Zenbakizko balioa | Emandako testua bilatu beharreko azpieremuaren hasierako X koordenatua (zehaztutako irudiarekiko) | |
X2 | Yes | Zenbakizko balioa | Emandako testua bilatzeko erabili beharreko azpieremuaren amaierako X koordenatua | |
Y1 | Yes | Zenbakizko balioa | Emandako testua bilatu beharreko azpieremuaren hasierako Y koordenatua (zehaztutako irudiarekiko) | |
Y2 | Yes | Zenbakizko balioa | Emandako testua bilatzeko erabili beharreko azpieremuaren amaierako Y koordenatua | |
X2 | Yes | Zenbakizko balioa | Emandako testua bilatu beharreko azpieremuaren amaierako X koordenatua (zehaztutako irudiarekiko) | |
Y2 | Yes | Zenbakizko balioa | Emandako testua bilatu beharreko azpieremuaren amaierako Y koordenatua (zehaztutako irudiarekiko) | |
Windows OCR hizkuntza | E/E | Txinera (sinplifikatua), txinera (tradizionala), daniera, nederlandera, ingelesa, finlandiera, frantsesa, alemana, grekoa, hungariera, italiera, japoniera, koreera, norvegiera, poloniera, portugesa, errumaniera, errusiera, serbiera (zirilikoa), serbiera (latindarra), eslovakiera, gaztelania, suediera, turkiera | English | Windows OCR motorrak detektatzen duen testuaren hizkuntza |
Erabili beste hizkuntza bat | E/E | Balio boolearra | Gezurrezkoa | "Tesseract hizkuntza" eremuan adierazitako hizkuntza erabili behar den zehazten du |
Tesseract hizkuntza | E/E | Ingelesa, alemana, gaztelania, frantsesa, italiera | English | Tesseract motorrak hautematen duen testu-hizkuntza |
Hizkuntzaren laburdura | No | Testuaren balioa | Erabili beharreko hizkuntzaren Tesseract laburdura. Adibidez, datuak 'eng.traineddata' badira, ezarri parametro hau 'eng' gisa | |
Hizkuntzaren datuen bide-izena | No | Testuaren balioa | Zehaztutako hizkuntzaren Tesseract datuak dituen karpetaren bide-izena | |
Irudiaren zabalera-biderkatzailea | No | Zenbakizko balioa | 1 | Irudiaren zabalera-biderkatzailea |
Irudiaren altuera-biderkatzailea | No | Zenbakizko balioa | 1 | Irudiaren altuera-biderkatzailea |
Irudia bat etorrarazteko algoritmoa | E/E | Oinarrizkoa, Aurreratua | Oinarrizkoa | Zein irudi-algoritmo erabili irudia bilatzerakoan |
Oharra
- Power Automateren adierazpen erregularreko motorra .NET da. Adierazpen erregularrei buruzko informazio gehiago lortzeko, joan esamolde erregularren hizkuntzara : erreferentzia azkarra.
- OCR motorren aldagaia aukera zaharkituta dago.
Sortu dira aldagaiak
Argumentua | Idatzi | Deskribapenak |
---|---|---|
LocationOfTextFoundX | Zenbakizko balioa | Testua pantailan agertzen den puntuaren X koordenatua. Bilaketa lehen planoko leihoan egiten bada, itzulitako koordenatua leihoaren goiko ezkerreko ertzean dago. |
LocationOfTextFoundY | Zenbakizko balioa | Testua pantailan agertzen den puntuaren X koordenatua. Bilaketa lehen planoko leihoan egiten bada, itzulitako koordenatua leihoaren goiko ezkerreko ertzean dago. |
Salbuespenak
Salbuespena | Deskribapenak |
---|---|
Modu interaktiboa erabiltzen ez bada ezin da egiaztatu testurik dagoen | Modu interaktiboa erabiltzen ez bada pantailan testurik dagoen egiaztatu ezin dela adierazten du |
Azpieremuaren koordenatuek ez dute balio | Zehaztutako azpieremuaren koordenatuek balio ez dutela adierazten du |
Ezin izan da analizatu testua OCR erabilita | OCR erabilita testua analizatzen saiatzean errore bat gertatu dela adierazten du |
Ezin izan da sortu OCR motorra | OCR motorra sortzen saiatzean errore bat gertatu dela adierazten du |
Datuen bide-izeneko karpeta ez dago | Hizkuntza-datuetarako zehaztutako karpeta ez dagoela adierazten du |
Hautatutako Windows hizkuntza-paketea ez dago instalatuta makinan | Hautatutako Windows hizkuntza-paketea makinan instalatu ez dela adierazten du |
OCR motorra ez dago aktibo | OCR motorra aktibo ez dagoela adierazten du |
Itxaron testua pantailan agertu arte (OCR)
Itxaron testu zehatz bat pantailan, lehen planoko leihoan edo OCR erabiliz pantailako edo lehen planoko leihoko irudi bati dagokionean agertu/desagertzen den arte.
Sarrerako parametroak
Argumentua | Aukerakoa | Onartzen du | Balio lehenetsia | Deskribapenak |
---|---|---|---|---|
Itxaron testuak hau egin arte: | E/E | Agertu, Desagertu | Agertu | Testua agertu edo desagertu arte itxaron behar den zehazten du |
OCR motor mota | No | Windows OCR motorra, Tesseract motorra, OCR motorra aldagaia | OCR motorraren aldagaia | Erabili beharreko OCR motor mota. Hautatu aurrez konfiguratutako OCR motor bat edo konfiguratu berri bat. |
OCR motorraren aldagaia | No | OCRengineObject | OCR eragiketarako erabili beharreko motorra | |
Bilatu beharreko testua | No | Testuaren balioa | Zehaztutako iturburuan bilatu beharreko testua | |
Adierazpen erregularra da | E/E | Balio boolearra | Gezurrezkoa | Adierazpen erregular bat erabili behar den zehazten du zehaztutako testua aurkitzeko |
Bilatu testua hemen: | E/E | Pantaila osoa, Lehen planoko leihoa | Pantaila osoa | Zehazten du zehaztutako testua ikusgai dagoen pantaila osoan edo soilik lehen planoko leihoan bilatu behar den |
Bilaketa modua | E/E | Zehaztutako iturri osoa, Azpieskualde zehatza soilik, Azpieskualdea irudiarekiko | Zehaztutako iturburu osoa | Pantaila osoa (edo leihoa) edo haren azpieskualde murriztu bat eskaneatu behar den zehazten du |
Irudiak | No | Zerrenda de Irudiak | Emandako testua bilatu beharreko azpieremua zehazten duten irudiak Irudiak azpieskualdea (irudiaren goiko ezkerreko izkinarekiko) zehazten du | |
X1 | Yes | Zenbakizko balioa | Emandako testua bilatzeko erabili beharreko azpieremuaren hasierako X koordenatua | |
Tolerantzia | Yes | Zenbakizko balioa | 1,0 | Bilatutako irudiak jatorriz aukeratutakoarekiko izan dezaketen desberdintasuna zehazten du |
Y1 | Yes | Zenbakizko balioa | Emandako testua bilatzeko erabili beharreko azpieremuaren hasierako Y koordenatua | |
X1 | Yes | Zenbakizko balioa | Emandako testua bilatu beharreko azpieremuaren hasierako X koordenatua (zehaztutako irudiarekiko) | |
X2 | Yes | Zenbakizko balioa | Emandako testua bilatzeko erabili beharreko azpieremuaren amaierako X koordenatua | |
Y1 | Yes | Zenbakizko balioa | Emandako testua bilatu beharreko azpieremuaren hasierako Y koordenatua (zehaztutako irudiarekiko) | |
Y2 | Yes | Zenbakizko balioa | Emandako testua bilatzeko erabili beharreko azpieremuaren amaierako Y koordenatua | |
X2 | Yes | Zenbakizko balioa | Emandako testua bilatu beharreko azpieremuaren amaierako X koordenatua (zehaztutako irudiarekiko) | |
Y2 | Yes | Zenbakizko balioa | Emandako testua bilatu beharreko azpieremuaren amaierako Y koordenatua (zehaztutako irudiarekiko) | |
Windows OCR hizkuntza | E/E | Txinera (sinplifikatua), txinera (tradizionala), daniera, nederlandera, ingelesa, finlandiera, frantsesa, alemana, grekoa, hungariera, italiera, japoniera, koreera, norvegiera, poloniera, portugesa, errumaniera, errusiera, serbiera (zirilikoa), serbiera (latindarra), eslovakiera, gaztelania, suediera, turkiera | English | Windows OCR motorrak detektatzen duen testuaren hizkuntza |
Erabili beste hizkuntza bat | E/E | Balio boolearra | Gezurrezkoa | "Tesseract hizkuntza" eremuan adierazitako hizkuntza erabili behar den zehazten du |
Tesseract hizkuntza | E/E | Ingelesa, alemana, gaztelania, frantsesa, italiera | English | Tesseract motorrak hautematen duen testu-hizkuntza |
Hizkuntzaren laburdura | No | Testuaren balioa | Erabili beharreko hizkuntzaren Tesseract laburdura. Adibidez, datuak 'eng.traineddata' badira, ezarri parametro hau 'eng' gisa | |
Hizkuntzaren datuen bide-izena | No | Testuaren balioa | Zehaztutako hizkuntzaren Tesseract datuak dituen karpetaren bide-izena | |
Irudiaren zabalera-biderkatzailea | No | Zenbakizko balioa | 1 | Irudiaren zabalera-biderkatzailea |
Irudiaren altuera-biderkatzailea | No | Zenbakizko balioa | 1 | Irudiaren altuera-biderkatzailea |
Irudia bat etorrarazteko algoritmoa | E/E | Oinarrizkoa, Aurreratua | Oinarrizkoa | Zein irudi-algoritmo erabili irudia bilatzerakoan |
Huts egin du denbora-mugaren errorearekin | E/E | Balio boolearra | Gezurrezkoa | Zehaztu ekintzak behin betiko itxarotea edo denbora-tarte baten ondoren huts egitea nahi duzun |
Oharra
- Power Automateren adierazpen erregularreko motorra .NET da. Adierazpen erregularrei buruzko informazio gehiago lortzeko, joan esamolde erregularren hizkuntzara : erreferentzia azkarra.
- OCR motorren aldagaia aukera zaharkituta dago.
Sortu dira aldagaiak
Argumentua | Idatzi | Deskribapenak |
---|---|---|
LocationOfTextFoundX | Zenbakizko balioa | Testua pantailan agertzen den puntuaren X koordenatua. Bilaketa lehen planoko leihoan egiten bada, itzulitako koordenatua leihoaren goiko ezkerreko ertzean dago. |
LocationOfTextFoundY | Zenbakizko balioa | Testua pantailan agertzen den puntuaren X koordenatua. Bilaketa lehen planoko leihoan egiten bada, itzulitako koordenatua leihoaren goiko ezkerreko ertzean dago. |
Salbuespenak
Salbuespena | Deskribapenak |
---|---|
Modu interaktiboa erabiltzen ez bada ezin da egiaztatu testurik dagoen | Modu interaktiboa erabiltzen ez bada pantailan testurik dagoen egiaztatu ezin dela adierazten du |
Azpieremuaren koordenatuek ez dute balio | Zehaztutako azpieremuaren koordenatuek balio ez dutela adierazten du |
Ezin izan da analizatu testua OCR erabilita | OCR erabilita testua analizatzen saiatzean errore bat gertatu dela adierazten du |
Ezin izan da sortu OCR motorra | OCR motorra sortzen saiatzean errore bat gertatu dela adierazten du |
Datuen bide-izeneko karpeta ez dago | Hizkuntza-datuetarako zehaztutako karpeta ez dagoela adierazten du |
Hautatutako Windows hizkuntza-paketea ez dago instalatuta makinan | Hautatutako Windows hizkuntza-paketea makinan instalatu ez dela adierazten du |
OCR motorra ez dago aktibo | OCR motorra aktibo ez dagoela adierazten du |
Denbora-mugaren errorea | Ekintzak ezarritako denbora-tarte baten ondoren huts egin duela adierazten du |
Atera testua OCR erabilita
Atera testua iturri jakin batetik emandako OCR motorra erabiliz.
Sarrerako parametroak
Argumentua | Aukerakoa | Onartzen du | Balio lehenetsia | Deskribapenak |
---|---|---|---|---|
OCR motorra | No | Windows OCR motorra, Tesseract motorra, OCR motorra aldagaia | OCR motorraren aldagaia | Erabili beharreko OCR motor mota. Hautatu aurrez konfiguratutako OCR motor bat edo konfiguratu berri bat |
OCR motorraren aldagaia | No | OCRengineObject | OCR eragiketarako erabili beharreko motorra | |
OCR iturburua | E/E | Pantaila, Lehen planoko leihoa, Irudia diskoan | Pantaila | OCR eragiketa egin behar zaion irudiaren iturburua |
Irudi-fitxategiaren bide-izena | No | Fitxategia | OCR eragiketa egiteko irudiaren bidea | |
Bilaketa modua | E/E | Zehaztutako iturri osoa, Azpieskualde zehatza soilik, Azpieskualdea irudiarekiko | Zehaztutako iturburu osoa | OCR eragiketarako hautatutako modua |
Image | No | Zerrenda de Irudiak | Eskaneatzea zehaztutako irudiarekiko erlatiboa den azpieskualde batera murrizteko erabiliko den irudia | |
Tolerantzia | Yes | Zenbakizko balioa | 1,0 | Irudia jatorriz aukeratutakoarekiko izan dezakeen desberdintasuna zehazten du |
X1 | Yes | Zenbakizko balioa | Eskaneatutakoa mugatzeko erabili beharreko azpieremuaren X koordenatuaren hasiera | |
X2 | Yes | Zenbakizko balioa | Eskaneatutakoa mugatzeko erabili beharreko azpieremuaren X koordenatuaren amaiera | |
Y1 | Yes | Zenbakizko balioa | Eskaneatutakoa mugatzeko erabili beharreko azpieremuaren Y koordenatuaren hasiera | |
Y2 | Yes | Zenbakizko balioa | Eskaneatutakoa mugatzeko erabili beharreko azpieremuaren Y koordenatuaren amaiera | |
Windows OCR hizkuntza | E/E | Txinera (sinplifikatua), txinera (tradizionala), daniera, nederlandera, ingelesa, finlandiera, frantsesa, alemana, grekoa, hungariera, italiera, japoniera, koreera, norvegiera, poloniera, portugesa, errumaniera, errusiera, serbiera (zirilikoa), serbiera (latindarra), eslovakiera, gaztelania, suediera, turkiera | English | Windows OCR motorrak detektatzen duen testuaren hizkuntza |
Erabili beste hizkuntza bat | E/E | Balio boolearra | Gezurrezkoa | "Tesseract hizkuntza" eremuan adierazitako hizkuntza erabili behar den zehazten du |
Tesseract hizkuntza | E/E | Ingelesa, alemana, gaztelania, frantsesa, italiera | English | Tesseract motorrak hautematen duen testu-hizkuntza |
Hizkuntzaren laburdura | No | Testuaren balioa | Erabili beharreko hizkuntzaren Tesseract laburdura. Adibidez, datuak 'eng.traineddata' badira, ezarri parametro hau 'eng' gisa | |
Hizkuntzaren datuen bide-izena | No | Testuaren balioa | Zehaztutako hizkuntzaren Tesseract datuak dituen karpetaren bide-izena | |
Irudiaren zabalera-biderkatzailea | No | Zenbakizko balioa | 1 | Irudiaren zabalera-biderkatzailea |
Irudiaren altuera-biderkatzailea | No | Zenbakizko balioa | 1 | Irudiaren altuera-biderkatzailea |
Itxaron irudia agertu arte | E/E | Balio boolearra | Egiazkoa | Irudia pantailan edo lehen planoko leihoan agertzera itxaron behar den ala ez zehazten du |
Debora-muga | No | Zenbakizko balioa | 5 | Ekintzak huts egin aurretik eragiketak amaitu arte itxaron beharreko denbora zehazten du |
Irudia bat etorrarazteko algoritmoa | E/E | Oinarrizkoa, Aurreratua | Oinarrizkoa | Zein irudi-algoritmo erabili irudia bilatzerakoan |
Oharra
OCR motorren aldagaia aukera zaharkituta dago.
Sortu dira aldagaiak
Argumentua | Idatzi | Deskribapenak |
---|---|---|
OcrText | Testuaren balioa | Testua atera ondoren emaitza |
Salbuespenak
Salbuespena | Deskribapenak |
---|---|
Ezin izan da atera testua OCR erabilita | Emandako iturburutik OCR erabilita testua ateratzen saiatzean errore bat gertatu dela adierazten du |
Ez da aurkitu irudi-fitxategia | Emandako bide-izenean fitxategia ez dagoela adierazten du |
Ez da aurkitu mugarriaren irudia | Mugarriaren irudia ez dagoela adierazten du |
Modu interaktiboa erabiltzen ez bada ezin da eskuratu pantailako testua | Modu interaktiboa erabiltzen ez bada pantailako testua eskuratu ezin dela adierazten du |
Ezin izan da sortu OCR motorra | OCR motorra sortzen saiatzean errore bat gertatu dela adierazten du |
Datuen bide-izeneko karpeta ez dago | Hizkuntza-datuetarako zehaztutako karpeta ez dagoela adierazten du |
Hautatutako Windows hizkuntza-paketea ez dago instalatuta makinan | Hautatutako Windows hizkuntza-paketea makinan instalatu ez dela adierazten du |
OCR motorra ez dago aktibo | OCR motorra aktibo ez dagoela adierazten du |