Бөлісу құралы:


Мәтін тану алдын ала құрастырылған үлгі

Мәтін тану алдын ала құрастырылған үлгісі құжаттар мен кескіндерден сөздерді машина оқылатын таңбалар ағындарына шығарады. Ол кескіндердегі басып шығарылған және қолмен жазылған мәтінді анықтау үшін заманауи оптикалық таңбаларды тануды (OCR) пайдаланады.

Бұл модель басып шығарылған немесе қолмен жазылған мәтін жолдарын шығару үшін кескіндер мен құжат файлдарын өңдейді.

Power Apps пайдалану

Мәтін тану алдын ала құрастырылған үлгісі мәтін тану компонентін пайдалану арқылы Power Apps қол жетімді. Қосымша ақпарат: Мәтінді тану компонентін пайдаланыңыз Power Apps

Power Automate жүйесінде пайдалану

Бұл үлгіні Power Automate ішінде пайдалану жолы туралы ақпаратты Ішінде алдын ала құрастырылған Мәтін тану үлгісін пайдалану бөлімінен қараңыз Power Automate.

Қолдау көрсетілетін тіл, пішім және өлшем

Мәтін тану үлгісімен сканерлеуге болатын файлдар келесі сипаттамаларға ие болуы керек:

  • Басып шығару мәтінінің тілі: Африкаанс, албан, ангика (деванагири), араб, астуриялық, авади-хинди (деванагири), әзірбайжан (латын), багели, баск, белорус (кириллица), беларусь (латын), Бходжпури-Хинди (Деванагири), Бислама, Бодо (Деванагири), Босния (Латын), Бражбха, Бретон, Болгар, Бундели, Бурят (кириллица), Каталан, Себуано, Чамлинг, Чаморро, Чхаттисгархи (Деванагири), Қытай (Симплификацияланған), қытай (дәстүрлі), корниш, корсик, қырым татары (латын), хорват, чех, дат, дари, димал (деванагири), догри (деванагири), голланд, ағылшын, эрзя (кириллица), эстон, фарер, фиджи, филиппин, фин, француз, фриул, гагауз (латын), галисия, неміс, гилберт, гонди (деванагири), гренландия, гурунг (деванагири), гаити креолы, халби (деванагири), хани, харьянви, гавай, хинди, хмонг-дов (латын) ), хо(Деванагири), венгр, исланд, инари сами, индонезия, интерлингва, инуктитут (латын), ирланд, итальян, жапон, яунсари (деванагири), яван, кабувердиану, качин (латын), кангри (деванагири), карачай- Балқар, қарақалпақ (кириллица), қарақалпақ (латын), кашуби, қазақ (кириллица), қазақ (латын), халинг, хаси, киче, корей, корку, коряк, косрей, құмық (кириллица), Күрд (араб), күрд (латын), курух (деванагири), қырғыз (кириллица), лакота, латын, литва, төменгі сорб, луле сами, люксембург, махасу пахари (деванагири), малай (латын), мальталық, мальталық (деванагири) ), манкс, маори, маратхи, моңғол (кириллица), черногория (кириллица), черногория (латын), неаполитан, непал, ниуэн, ногай, солтүстік сами (латын), норвег, окситан, осетикалық, пушту, парсы, поляк, португал, Пенджаби (араб), рипуар, румын, романш, орыс, садри (деванагири), самоа (латын), санскрит (деванагири), сантали (деванагири), шотланд, шотланд гали, серб (латын), шерпа (деванагири), сирмаури (Деванагири), скольт сами, словак, словен, сомали (араб), оңтүстік сами, испан, суахили (латын), швед, тәжік (кириллица), татар (латын), тетум, тангми, тонган, түрік, түрікмен (латын), тува, жоғарғы сорб, урду, ұйғыр (араб), өзбек (араб), өзбек (кириллица), өзбек (латын), волапук, вальсер, вальс, батыс фриз, юкатек майя, жуан, зулу
  • Қолжазба мәтінінің тілі: ағылшын, қытай (жеңілдетілген), француз, неміс, итальян, жапон, корей, португал, испан
  • Формат:
    • JPG
    • PNG
    • BMP
    • PDF
  • Өлшем: максимум 20 МБ
  • PDF құжаттары үшін тек алғашқы 2000 бет өңделеді.

Үлгі шығару

Құжат анықталса, Мәтін тану үлгісі келесі ақпаратты шығарады:

  • Нәтижелер: Енгізілген мәтіннен алынған жолдар тізімі.
  • Мәтін: Анықталған мәтін жолын қамтитын жолдар.
  • BoundingBox: ені мен биіктігімен бірге жоғарғы және сол жақ позицияларды пайдалану арқылы сипатталған шектеу жолағын көрсететін төрт мән.

Шектеулер

Әрекет Шектеу Жаңарту кезеңі
Мәтін тану қоңыраулары (әр орта үшін) 480-көше 60 секунд сайын

Тренинг: AI Builder (модуль) арқылы мәтінді тану