Предварительно созданная модель для распознавания текста

Предварительно созданная модель распознавания текста извлекает распознаваемые слова из документов и изображений в потоки машиночитаемых символов. Для обнаружения печатных и рукописных текстов на изображениях используется современный механизм оптического распознавания символов (OCR).

Эта модель обрабатывает изображения и файлы документов для извлечения строк печатного или рукописного текста.

Использование в Power Apps

Предварительно созданную модель распознавания текста можно использовать в Power Apps с помощью компонента "Распознаватель текста". Дополнительные сведения: Использование компонента распознавания текста в Power Apps

Использование в Power Automate

О том, как использовать эту модель в Power Automate см. в статье Использование предварительно созданной модели распознавания текстов в Power Automate.

Поддерживаемый язык, формат и размер

Файлы, которые можно проверить с помощью модели распознавания текста, должны обладать следующими характеристиками:

  • Язык печатного текста: африкаанс, албанский, ангика (деванагири), арабский, астурийский, авадхи-хинди (деванагири), азербайджанский (латиница), багхели, баскский, белорусский (кириллица), белорусский (латиница), бходжпури-хинди (деванагири), бислама, бодо (деванагири), боснийский (латиница), браджбха, бретонский, болгарский, бундели, бурятский (кириллица), каталанский, себуано, чамлинг, чаморро, чхаттисгархи (деванагири), китайский (упрощенный), китайский (традиционный), корнский, корсиканский, крымскотатарский (латиница), хорватский, чешский, датский, дари, дхималь (деванагири), догри (деванагири), нидерландский, английский, эрзянский (кириллица), эстонский, фарерский, фиджи, филиппинский, финский, французский, фриуланский, гагаузский (латиница), галисийский, немецкий, гильбертский, гонди (деванагири), гренландский, гурунг (деванагири), гаитянский, халби (деванагири), хани, харьянви, гавайский, хинди, хмонг дау (латиница), хо (деванагири), венгерский, исландский, инари-саамский, индонезийский, интерлингва, инуктитут (латиница), ирландский, итальянский, японский, яунсари (деванагири), яванский, кабувердиану, качин (латиница), кангри (деванагири), карачаево-балкарский, каракалпакский (кириллица), каракалпакский (латиница), кашубский, казахский (кириллица), казахский (латиница), халинг, хаси, киче, корейский, корку, корякский, косяэ, кумыкский (кириллица), курдский (арабский), курдский (латиница), курухский (деванагири), киргизский (кириллица), лакота, латынь, литовский, нижнелужицкий, луле-саамский, люксембургский, махасу-пахари (деванагири), малайский (латиница), мальтийский, мальто (деванагири), мэнский, маори, маратхи, монгольский (кириллица), черногорский (кириллица), черногорский (латиница), неаполитанский, непальский, ниуэанский, ногайский, северносаамский (латиница), норвежский, окситанский, осетинский, пушту, персидский, польский, португальский, панджаби (арабский), рипуарский, румынский, романшский, русский, садри (деванагири), самоанский (латиница), санскрит (деванагари), сантали (деванагири), шотландский, гэльский, сербский (латиница), шерпа (деванагири), сирмаури (деванагири), скольт-саамский, словацкий, словенский, сомалийский (арабский), южносаамский, испанский, суахили (латиница), шведский, таджикский (кириллица), татарский (латиница), тетум, тхангми, тонганский, турецкий, туркменский (латиница), тувинский, верхнелужицкий, урду, уйгурский (арабский), узбекский (арабский), узбекский (кириллица), узбекский (латиница), волапюк, валисский, валлийский, западно-фризский, юкатекский майя, чжуанский, зулусский
  • Язык рукописного текста: английский, китайский (упрощенный), французский, немецкий, итальянский, японский, корейский, португальский, испанский
  • Формат:
    • JPG
    • PNG
    • BMP
    • PDF
  • Размер: не более 20 МБ
  • Для документов PDF обрабатываются только первые 2000 страниц.

Выходные данные модели

При обнаружении документа модель распознавания текста выводит следующую информацию:

  • Результаты: список строк, извлеченных из входного текста.
  • Текст: строки, содержащие обнаруженные строки текста.
  • BoundingBox: четыре значения, представляющие ограничивающий прямоугольник, описываемый шириной и высотой, которые отсчитываются от верхнего левого угла.

Ограничения

Действие Ограничение Период возобновления действия
Вызовы распознавания текста (на среду) 480 60 секунд

См. также

Обучение. Распознавание текста с помощью AI Builder (модуль)