Бөлісу құралы:


OCR әрекеттері

Power Automate пайдаланушыларға таңбаларды оптикалық тану (OCR) арқылы файлдардағы деректерді оқуға, шығаруға және басқаруға мүмкіндік береді.

OCR механизмін жасау және суреттер мен құжаттардан мәтінді шығару үшін OCR мәтінді шығару әрекетін пайдаланыңыз. Келесі мысал бүкіл көрсетілген кескіннен мәтінді шығарады.

OCR әрекетімен мәтінді шығару скриншоты.

Барлық OCR әрекеттері жаңа OCR қозғалтқышының айнымалысын жасай алады немесе барын пайдалана алады. Сіз OCR мүмкіндіктерін ұсынатын кез келген әрекетте бар OCR қозғалтқышының айнымалы мәндерін пайдалана аласыз.

Power Automate Windows OCR және Tesseract қозғалтқыштарын қолдайды. Таңдалған OCR механизмін конфигурациялау үшін тиісті әрекеттің OCR механизмінің параметрлеріне өтіңіз. Қол жетімді опциялар тіл мен кескіннің ені мен биіктігінің көбейткіштерін қамтиды.

Ескертпе

  • Барлық қолжетімді OCR қозғалтқыштары Power Automate де алдын ала орнатылған және бұлтқа қосылмай жергілікті түрде жұмыс істейді. Дегенмен, белгілі бір тілдердегі мәтіндерді шығару үшін тіл бумаларын немесе деректер файлдарын жүктеп алу қажет болуы мүмкін.
  • Сурет көбейткіштері іздеуді және мәтінді шығаруды тиімдірек ету үшін кескін өлшемін арттырады. Үштен жоғары мәндерді орнату қате нәтижелерге әкелуі мүмкін.

Windows OCR механизмін пайдаланыңыз

Power Automate ішіндегі әдепкі OCR механизмі Windows OCR механизмі болып табылады. Windows OCR механизмін пайдаланып мәтіндерді шығарып алу үшін шығарғыңыз келетін тілге сәйкес тіл бумасын орнатуыңыз керек.

Сәйкес тіл бумасы орнатылмаған болса, Power Automate оны орнатуды сұрайтын қате жібереді. Тіл бумаларын жүктеп алу және орнату туралы қосымша ақпаратты алу үшін Windows жүйесіне арналған тіл бумалары бөліміне өтіңіз.

Сәйкес тіл бумасын орнатқаннан кейін, OCR әрекетінің OCR механизмінің параметрлерін кеңейтіп, қалаған тілді таңдаңыз. Windows OCR механизмі 25 тілді қолдайды, соның ішінде қытай (жеңілдетілген және дәстүрлі), чех, дат, голланд, ағылшын, фин, француз, неміс, грек, венгр, итальян, жапон, корей, норвег, поляк, португал, румын, орыс, Серб (кириллица және латын), словак, испан, швед және түрік.

Tesseract OCR қозғалтқышын пайдаланыңыз

Ескертпе

Tesseract OCR қозғалтқышын пайдалану үшін құрылғының CPU AVX2 нұсқаулар жинағын қолдайтынына көз жеткізіңіз.

Windows OCR қозғалтқышынан басқа Power Automate Tesseract қозғалтқышын қолдайды. Бұл қозғалтқыш қосымша конфигурациясыз бес тілдегі мәтінді шығара алады: ағылшын, неміс, испан, француз және итальян.

Аталған тізімнен тыс тілдегі мәтінді шығарып алу үшін OCR механизмінің параметрлерінде Басқа тілдерді пайдалану опциясын қосыңыз OCR әрекеті. Бұл опция қосылғанда, әрекет тағы екі параметрді көрсетеді: Тіл аббревиатурасы және Тіл деректерінің жолы.

Тіл аббревиатурасы өрісі қозғалтқышқа OCR кезінде қай тілді іздеу керектігін көрсетеді. Тіл деректерінің жолы өрісі OCR механизмін үйрету үшін пайдаланылатын тіл деректерінің файлдарын (.traineddata) қамтиды. Барлық қолжетімді тілдер үшін тіл деректерінің файлдарын осы GitHub репозиторийінен таба аласыз.

Сондай-ақ, көптілді құжаттардан мәтінді шығару үшін Tesseract механизмін пайдалануға болады. Көптілді құжаттардан мәтінді шығаруға қатысты қосымша ақпаратты табу үшін Көп тілді құжаттарда OCR орындау бөліміне өтіңіз.

Егер экрандағы мәтін (OCR)

OCR көмегімен берілген мәтіннің экранда пайда болуына немесе пайда болуына байланысты әрекеттердің шартты блогының басын белгілейді.

Кіріс параметрлер

Аргумент Таңдаулы Қабылдайды Әдепкі мәні Сипаттама
Егер мәтін Қатысты емес Бар, жоқ Бар Талдау үшін мәтіннің берілген дереккөзде бар-жоғын тексеру
OCR механизмінің түрі No Windows OCR қозғалтқышы, Tesseract қозғалтқышы, OCR қозғалтқышының айнымалысы OCR механизмінің айнымалысы Қолданылатын OCR қозғалтқыш түрі. Алдын ала конфигурацияланған OCR қозғалтқышын таңдаңыз немесе жаңасын орнатыңыз.
OCR механизмінің айнымалысы No OCRengineObject OCR жұмысына арналған механизм
Табылатын мәтін No Мәтін мәні Көрсетілген дереккөзден іздеу керек мәтін
Тұрақты өрнек Қатысты емес Логикалық мән Жалған Көрсетілген мәтінді табу үшін тұрақты өрнекті пайдалану керектігін анықтайды
Мәтінді іздеу Қатысты емес Бүкіл экран, Алдыңғы терезе Бүкіл экран Көрсетілген мәтінді бүкіл көрінетін экранда немесе тек алдыңғы терезеде іздеу керектігін анықтайды
Іздеу режимі Қатысты емес Көрсетілген көздің толық, тек арнайы ішкі аймақ, кескінге қатысты қосалқы аймақ Толық көрсетілген дереккөзі Бүкіл экранды (немесе терезені) немесе оның тарылтылған ішкі аймағын сканерлеу керектігін анықтайды
Кескін(дер) No Тізім ның Суреттер Берілген мәтін үшін сканерлеу керек ішкі аймақты (кескіннің жоғарғы сол жақ бұрышына қатысты) көрсететін кескін(дер)
X1 Иә Сандық мән Берілген мәтін үшін сканерлеу керек ішкі аймақтың бастапқы X координатасы
Шек Иә Сандық мән 10 Ізделген кескін(дер)дің бастапқыда таңдалған кескіннен қаншалықты өзгеше болатындығын көрсетеді
Y1 Иә Сандық мән Берілген мәтін үшін сканерлеу керек ішкі аймақтың бастапқы Y координатасы
X1 Иә Сандық мән Берілген мәтін үшін сканерлеу керек көрсетілген кескінге қатысты ішкі аймақтың бастапқы X координатасы
X2 Иә Сандық мән Берілген мәтін үшін сканерлеу керек ішкі аймақтың соңғы X координатасы
Y1 Иә Сандық мән Берілген мәтін үшін сканерлеу керек көрсетілген кескінге қатысты ішкі аймақтың бастапқы Y координатасы
Y2 Иә Сандық мән Берілген мәтін үшін сканерлеу керек ішкі аймақтың соңғы Y координатасы
X2 Иә Сандық мән Берілген мәтін үшін сканерлеу керек көрсетілген кескінге қатысты ішкі аймақтың соңғы X координатасы
Y2 Иә Сандық мән Берілген мәтін үшін сканерлеу керек көрсетілген кескінге қатысты ішкі аймақтың соңғы Y координатасы
Windows OCR тілі Қатысты емес Қытай (жеңілдетілген), қытай (дәстүрлі), чех, дат, голланд, ағылшын, фин, француз, неміс, грек, венгр, итальян, жапон, корей, норвег, поляк, португал, румын, орыс, серб (кириллица), серб (латын), словак, испан, швед, түрік Ағылшын тілі Windows OCR механизмі анықтайтын мәтін тілі
Басқа тілді қолдану Қатысты емес Логикалық мән Жалған "Tesseract тілі" өрісінде берілмеген тілді қолдану-қолданбауды анықтайды
Tesseract тілі Қатысты емес Ағылшын, неміс, испан, француз, итальян Ағылшын тілі Tesseract механизмі анықтайтын мәтін тілі
Тіл аббревиатурасы No Мәтін мәні Қолданылатын тілдің Tesseract аббревиатурасы. Мысалы, егер деректер 'eng.traineddata' болса, бұл параметрді 'eng' етіп орнатыңыз
Тіл деректерінің жолы No Мәтін мәні Көрсетілген тілдің Tesseract деректерін сақтайтын қалта жолы
Кескін енін көбейткіш No Сандық мән 1-көше Кескіннің ен көбейткіші
Кескін биіктік көбейткіші No Сандық мән 1-көше Кескіннің биіктік көбейткіші
Кескінді сәйкестендіру алгоритмі Қатысты емес Негізгі, Жетілдірілген Негізгі Кескінді іздеу кезінде қандай кескін алгоритмін қолдану керек

Ескертпе

  • Power Automateның тұрақты өрнек механизмі .NET болып табылады. Тұрақты өрнектер туралы қосымша ақпаратты табу үшін өтіңіз Тұрақты өрнек тілі – жылдам анықтама.
  • OCR қозғалтқышының ауыспалы опциясы ескіруге жоспарланған.

Жасалған айнымалылар

Аргумент Түр Сипаттама
LocationOfTextFoundX Сандық мән Экранда мәтін пайда болатын нүктенің Х координатасы. Егер іздеу алдыңғы терезеде орындалса, қайтарылатын координат терезенің жоғарғы сол жақ бұрышына қатысты болады.
LocationOfTextFoundY Сандық мән Экранда мәтін пайда болатын нүктенің Х координатасы. Егер іздеу алдыңғы терезеде орындалса, қайтарылатын координат терезенің жоғарғы сол жақ бұрышына қатысты болады.

Ерекшеліктер

Ерекшелік Сипаттама
Интерактивті емес режимде мәтін бар-жоғын тексеру мүмкін емес Интерактивті емес режимде болған кезде экрандағы мәтінді тексеру мүмкін еместігін көрсетеді
Жарамсыз ішкі аймақ координаттары Көрсетілген ішкі аймақ координаттарының жарамсыз екенін көрсетеді
OCR көмегімен мәтінді талдау сәтсіз аяқталды Мәтінді OCR көмегімен талдау кезінде қате орын алғандығын көрсетеді
OCR механизмін жасау сәтсіз болды OCR механизмін жасау кезінде қате орын алғандығын көрсетеді
Деректер жолының қалтасы жоқ Тіл деректері үшін көрсетілетін қалтаның жоқ екенін көрсетеді
Таңдалған Windows тіл бумасы машинада орнатылмаған Таңдалған Windows тіл бумасының құрылғыда орнатылмағанын көрсетеді
OCR механизмі іске қосылмаған OCR механизмінің іске қосылмағандығын көрсетеді

Мәтіннің экранда пайда болуын күту (OCR)

Экранда, алдыңғы терезеде немесе OCR көмегімен экрандағы немесе алдыңғы терезедегі кескінге қатысты белгілі бір мәтін пайда болғанша/жоғалғанша күтіңіз.

Кіріс параметрлер

Аргумент Таңдаулы Қабылдайды Әдепкі мәні Сипаттама
Мәтінді күту Қатысты емес Көріну, жоғалу Пайда болу Мәтіннің пайда болуын немесе жоғалуын күту керектігін көрсетеді
OCR механизмінің түрі No Windows OCR қозғалтқышы, Tesseract қозғалтқышы, OCR қозғалтқышының айнымалысы OCR механизмінің айнымалысы Қолданылатын OCR қозғалтқыш түрі. Алдын ала конфигурацияланған OCR қозғалтқышын таңдаңыз немесе жаңасын орнатыңыз.
OCR механизмінің айнымалысы No OCRengineObject OCR жұмысына арналған механизм
Табылатын мәтін No Мәтін мәні Көрсетілген дереккөзден іздеу керек мәтін
Тұрақты өрнек Қатысты емес Логикалық мән Жалған Көрсетілген мәтінді табу үшін тұрақты өрнекті пайдалану керектігін анықтайды
Мәтінді іздеу Қатысты емес Бүкіл экран, Алдыңғы терезе Бүкіл экран Көрсетілген мәтінді бүкіл көрінетін экранда немесе тек алдыңғы терезеде іздеу керектігін анықтайды
Іздеу режимі Қатысты емес Көрсетілген көздің толық, тек арнайы ішкі аймақ, кескінге қатысты қосалқы аймақ Толық көрсетілген дереккөзі Бүкіл экранды (немесе терезені) немесе оның тарылтылған ішкі аймағын сканерлеу керектігін анықтайды
Кескін(дер) No Тізім ның Суреттер Берілген мәтін үшін сканерлеу керек ішкі аймақты (кескіннің жоғарғы сол жақ бұрышына қатысты) көрсететін кескін(дер)
X1 Иә Сандық мән Берілген мәтін үшін сканерлеу керек ішкі аймақтың бастапқы X координатасы
Шек Иә Сандық мән 10 Ізделген кескін(дер)дің бастапқыда таңдалған кескіннен қаншалықты өзгеше болатындығын көрсетеді
Y1 Иә Сандық мән Берілген мәтін үшін сканерлеу керек ішкі аймақтың бастапқы Y координатасы
X1 Иә Сандық мән Берілген мәтін үшін сканерлеу керек көрсетілген кескінге қатысты ішкі аймақтың бастапқы X координатасы
X2 Иә Сандық мән Берілген мәтін үшін сканерлеу керек ішкі аймақтың соңғы X координатасы
Y1 Иә Сандық мән Берілген мәтін үшін сканерлеу керек көрсетілген кескінге қатысты ішкі аймақтың бастапқы Y координатасы
Y2 Иә Сандық мән Берілген мәтін үшін сканерлеу керек ішкі аймақтың соңғы Y координатасы
X2 Иә Сандық мән Берілген мәтін үшін сканерлеу керек көрсетілген кескінге қатысты ішкі аймақтың соңғы X координатасы
Y2 Иә Сандық мән Берілген мәтін үшін сканерлеу керек көрсетілген кескінге қатысты ішкі аймақтың соңғы Y координатасы
Windows OCR тілі Қатысты емес Қытай (жеңілдетілген), қытай (дәстүрлі), чех, дат, голланд, ағылшын, фин, француз, неміс, грек, венгр, итальян, жапон, корей, норвег, поляк, португал, румын, орыс, серб (кириллица), серб (латын), словак, испан, швед, түрік Ағылшын тілі Windows OCR механизмі анықтайтын мәтін тілі
Басқа тілді қолдану Қатысты емес Логикалық мән Жалған "Tesseract тілі" өрісінде берілмеген тілді қолдану-қолданбауды анықтайды
Tesseract тілі Қатысты емес Ағылшын, неміс, испан, француз, итальян Ағылшын тілі Tesseract механизмі анықтайтын мәтін тілі
Тіл аббревиатурасы No Мәтін мәні Қолданылатын тілдің Tesseract аббревиатурасы. Мысалы, егер деректер 'eng.traineddata' болса, бұл параметрді 'eng' етіп орнатыңыз
Тіл деректерінің жолы No Мәтін мәні Көрсетілген тілдің Tesseract деректерін сақтайтын қалта жолы
Кескін енін көбейткіш No Сандық мән 1-көше Кескіннің ен көбейткіші
Кескін биіктік көбейткіші No Сандық мән 1-көше Кескіннің биіктік көбейткіші
Кескінді сәйкестендіру алгоритмі Қатысты емес Негізгі, Жетілдірілген Негізгі Кескінді іздеу кезінде қандай кескін алгоритмін қолдану керек
Күту уақыты қатесі орын алды Қатысты емес Логикалық мән Жалған Әрекеттің белгісіз уақыт күтуін немесе орнатылған уақыт аралығынан кейін сәтсіз болды деп есептеуді көрсету

Ескертпе

  • Power Automateның тұрақты өрнек механизмі .NET болып табылады. Тұрақты өрнектер туралы қосымша ақпаратты табу үшін өтіңіз Тұрақты өрнек тілі – жылдам анықтама.
  • OCR қозғалтқышының ауыспалы опциясы ескіруге жоспарланған.

Жасалған айнымалылар

Аргумент Түр Сипаттама
LocationOfTextFoundX Сандық мән Экранда мәтін пайда болатын нүктенің Х координатасы. Егер іздеу алдыңғы терезеде орындалса, қайтарылатын координат терезенің жоғарғы сол жақ бұрышына қатысты болады.
LocationOfTextFoundY Сандық мән Экранда мәтін пайда болатын нүктенің Х координатасы. Егер іздеу алдыңғы терезеде орындалса, қайтарылатын координат терезенің жоғарғы сол жақ бұрышына қатысты болады.

Ерекшеліктер

Ерекшелік Сипаттама
Интерактивті емес режимде мәтін бар-жоғын тексеру мүмкін емес Интерактивті емес режимде болған кезде экрандағы мәтінді тексеру мүмкін еместігін көрсетеді
Жарамсыз ішкі аймақ координаттары Көрсетілген ішкі аймақ координаттарының жарамсыз екенін көрсетеді
OCR көмегімен мәтінді талдау сәтсіз аяқталды Мәтінді OCR көмегімен талдау кезінде қате орын алғандығын көрсетеді
OCR механизмін жасау сәтсіз болды OCR механизмін жасау кезінде қате орын алғандығын көрсетеді
Деректер жолының қалтасы жоқ Тіл деректері үшін көрсетілетін қалтаның жоқ екенін көрсетеді
Таңдалған Windows тіл бумасы машинада орнатылмаған Таңдалған Windows тіл бумасының құрылғыда орнатылмағанын көрсетеді
OCR механизмі іске қосылмаған OCR механизмінің іске қосылмағандығын көрсетеді
Күту уақыты кезіндегі қате Белгіленген уақыт кезеңінен кейін әрекет орындалмағанын көрсетеді

Мәтінді оптикалық тану көмегімен мәтінді шығарып алу

Берілген OCR механизмін пайдаланып, берілген дереккөзден мәтінді шығарып алыңыз.

Кіріс параметрлер

Аргумент Таңдаулы Қабылдайды Әдепкі мәні Сипаттама
OCR механизмі No Windows OCR қозғалтқышы, Tesseract қозғалтқышы, OCR қозғалтқышының айнымалысы OCR механизмінің айнымалысы Қолданылатын OCR қозғалтқыш түрі. Алдын ала конфигурацияланған OCR қозғалтқышын таңдаңыз немесе жаңасын орнатыңыз
OCR механизмінің айнымалысы No OCRengineObject OCR жұмысына арналған механизм
OCR дереккөзі Қатысты емес Экран, Алдыңғы терезе, Дискідегі сурет Экран OCR әрекетін орындауға арналған кескін дереккөзі
Кескін файлының жолы No Файл OCR әрекетін орындау үшін кескіннің жолы
Іздеу режимі Қатысты емес Көрсетілген көздің толық, тек арнайы ішкі аймақ, кескінге қатысты қосалқы аймақ Толық көрсетілген дереккөзі OCR әрекеті үшін таңдалған режим
Image No Тізім ның Суреттер Көрсетілген кескінге қатысты ішкі аймаққа сканерлеуді тарылту үшін пайдаланылатын кескін
Шек Иә Сандық мән 10 Кескіннің бастапқыда таңдалған кескіннен қаншалықты өзгеше болатындығын анықтайды
X1 Иә Сандық мән Сканерлеуді тарылту үшін ішкі аймақтың бастапқы X координатасы
X2 Иә Сандық мән Сканерлеуді тарылту үшін ішкі аймақтың соңғы X координатасы
Y1 Иә Сандық мән Сканерлеуді тарылту үшін ішкі аймақтың бастапқы Y координатасы
Y2 Иә Сандық мән Сканерлеуді тарылту үшін ішкі аймақтың соңғы Y координатасы
Windows OCR тілі Қатысты емес Қытай (жеңілдетілген), қытай (дәстүрлі), чех, дат, голланд, ағылшын, фин, француз, неміс, грек, венгр, итальян, жапон, корей, норвег, поляк, португал, румын, орыс, серб (кириллица), серб (латын), словак, испан, швед, түрік Ағылшын тілі Windows OCR механизмі анықтайтын мәтін тілі
Басқа тілді қолдану Қатысты емес Логикалық мән Жалған "Tesseract тілі" өрісінде берілмеген тілді қолдану-қолданбауды анықтайды
Tesseract тілі Қатысты емес Ағылшын, неміс, испан, француз, итальян Ағылшын тілі Tesseract механизмі анықтайтын мәтін тілі
Тіл аббревиатурасы No Мәтін мәні Қолданылатын тілдің Tesseract аббревиатурасы. Мысалы, егер деректер 'eng.traineddata' болса, бұл параметрді 'eng' етіп орнатыңыз
Тіл деректерінің жолы No Мәтін мәні Көрсетілген тілдің Tesseract деректерін сақтайтын қалта жолы
Кескін енін көбейткіш No Сандық мән 1-көше Кескіннің ен көбейткіші
Кескін биіктік көбейткіші No Сандық мән 1-көше Кескіннің биіктік көбейткіші
Кескіннің пайда болуын күту Қатысты емес Логикалық мән Шынайы Кескіннің экранда немесе алдыңғы терезеде пайда болуын күту керек не керек еместігін көрсетеді
Күту уақыты No Сандық мән 5 Әрекет сәтсіз аяқталғанға дейін әрекеттің аяқталуын күту уақытын белгілейді
Кескінді сәйкестендіру алгоритмі Қатысты емес Негізгі, Жетілдірілген Негізгі Кескінді іздеу кезінде қандай кескін алгоритмін қолдану керек

Ескертпе

OCR қозғалтқышының ауыспалы опциясы ескіруге жоспарланған.

Жасалған айнымалылар

Аргумент Түр Сипаттама
OcrText Мәтін мәні Мәтінді шығарудан кейінгі нәтиже

Ерекшеліктер

Ерекшелік Сипаттама
OCR көмегімен мәтінді шығару сәтсіз аяқталды Берілген көзден OCR көмегімен мәтін шығарып алу кезінде қате орын алғандығын көрсетеді
Кескін файлы табылмады Берілген жолда файл жоқ екенін көрсетеді
Бағдар кескіні табылмады Бағдар кескінінің жоқ екенін көрсетеді
Интерактивті емес режимде экрандағы мәтінді алу мүмкін емес Интерактивті емес режимде болған кезде экрандағы мәтінді алу мүмкін еместігін көрсетеді
OCR механизмін жасау сәтсіз болды OCR механизмін жасау кезінде қате орын алғандығын көрсетеді
Деректер жолының қалтасы жоқ Тіл деректері үшін көрсетілетін қалтаның жоқ екенін көрсетеді
Таңдалған Windows тіл бумасы машинада орнатылмаған Таңдалған Windows тіл бумасының құрылғыда орнатылмағанын көрсетеді
OCR механизмі іске қосылмаған OCR механизмінің іске қосылмағандығын көрсетеді