Поделиться через


Требования и ограничения для модели обработки документов

Поддерживаемые языки

Модель для документов с фиксированным шаблоном

Следующие языки поддерживается при обучении модели обработки документов при выборе типа Документы с фиксированным шаблоном:

Абазинский, абхазский, китайский, аколи, адангме, адыгейский, афарский, африкаанс, акан, албанский, алгонкинский, ангика (деванагари), арабский, астурийский, асу (Танзания), аварский, авадхи-хинди (деванагари), аймара, азербайджанский (латиница), Бафия, Багели, Бамбара, Башкирский, Баскский, Белорусский (кириллица), Белорусский (латиница), Бемба (Замбия), Бемба (Замбия), Бходжпури-хинди (Деванагари), Бикол, Бини, Бислама, Бодо (Деванагари), Боснийский (латиница), браджбха, бретонский, болгарский, бундели, бурятский (кириллица), каталанский, кебуанский, чамлинг, чаморро, чеченский, чхаттисгархи (деванагари), чига, китайский упрощенный, китайский традиционный, чокто, чукотский, чувашский, корнуэльский, корсиканский, кри, крик, крымскотатарский (латиница), хорватский, вороний, чешский, датский, даргва, дари, дхимал (деванагари), догри (деванагари), дуала, дунганский, голландский, эфик, английский, эрзя (кириллица), эстонский, Фарерский, фиджийский, филиппинский, финский, фон, французский, фриульский, га, гагаузский (латиница), галисийский, ганда, гайо, немецкий, гилбертский, гонди (деванагари), греческий, гренландский, гуарани, гурунг (деванагари), гусии, гаитянский Креольский, халби (деванагари), хани, харианви, гавайский, иврит, гереро, хилигайнон, хинди, хмонг до (латиница), хо (деванагири), венгерский, ибан, исландский, игбо, илоко, инари саамский, индонезийский, ингушский, интерлингва, инуктитут (латиница), ирландский, итальянский, японский, яунсари (деванагари), яванский, джола-фонийи, кабардинский, кабувердиану, качин (латиница), календжин, калмыцкий, кангри (деванагари), канури, карачаево-балкарский, каракалпакский (кириллица), каракалпакский (латиница), кашубский, казахский (кириллица), казахский (латиница), хакас, халинг, хаси, киче, кикую, кильдин саами, киньяруанда, коми, конго, корейский, корку, коряк, косраский, кпелле, куаньяма, кумык (кириллица), курдский (арабский), курдский (латиница), курух (деванагари), кыргызский (кириллица), лакский, лакота, латынь, латышский, лезгинский, лингала, литовский, нижнесербский, лози, Луле Сами, Луо (Кения и Танзания), Люксембургский, Луйя Луй, Македонский, Мачаме, Мадурский, Махасу Пахари (Деванагари), Махува-Митто, Маконде, Малагасийский, Малайский (латинский), Мальтийский, Мальтийский (Деванагари), Мандинка, Мэнский язык, маори, мапудунгун, маратхи, мари (Россия), масаи, менде (Сьерра-Леоне), меру, мета', минангкабау, ирокез, монгольский (кириллица), монгондоу, черногорский (кириллица), черногорский (латиница), морисен, мунданг, Науатль, Навахо, Ндонга, Неаполитанский, Непальский, Нгомба, Ниуэ, Ногайский, Северный Ндебеле, Северные Саамы (латиница), Норвежский, Ньянджа, Ньянколе, Нзима, Окситанский, Оджибва, Оромо, Осетинский, Пампанга, Пангасинан, Папиаменто, Пушту, Педи, персидский, польский, португальский, пенджабский (арабский), кечуа, прибрежный, румынский, ретороманский, рунди, русский, руа, садри (деванагари), сакха, самбуру, самоанский (латиница), санго, сангу (Габон), санскрит ( деванагари), сантали (деванагири), шотландцы, шотландский гэльский, сена, сербский (кириллица), сербский (латиница), шамбала, шерпа (деванагари), шона, сиксика, сирмаури (деванагари), сколт-саамы, словацкий, словенский, сога, Сомали (арабский), сомалийский (латиница), сонгай, южный ндебеле, южный Алтай, южные саамы, южный сото, испанский, сунданский, суахили (латиница), свати, шведский, табасаран, тачелхит, таитянский, таита, таджикский (кириллица), Тамильский, татарский (кириллица), татарский (латиница), тесо, тетум, тайский, тханми, ток-писин, тонганский, цонга, тсвана, турецкий, туркменский (латиница), тувинский, удмуртский, уйгурский (кириллица), украинский, верхнесербский, Урду, уйгурский (арабский), узбекский (арабский), узбекский (кириллица), узбекский (латиница), вьетнамский, волапюк, вунджо, вальсер, валлийский, западно-фризский, волоф, коса, юкатек-майя, сапотек, зарма, чжуан, зулу

Модель общих документов

Следующие языки поддерживается при обучении модели обработки документов при выборе типа Общие документы:

Африкаанс, албанский, арабский, китайский (хан (упрощенный вариант), китайский (хан (традиционный вариант)), хорватский, чешский, датский, нидерландский, эстонский, финский, французский, немецкий, иврит, хинди, венгерский, индонезийский, итальянский, японский, корейский, латышский, литовский, македонский, маратхи, современный греческий (1453-), непальский (макроязык), норвежский, панджаби, персидский, польский, португальский, румынский, русский, словацкий, словенский, сомали (арабский), сомали (латиница), испанский, суахили (макроязык), шведский, тамильский, тайский, турецкий, украинский, урду, вьетнамский

Требования

Обработчик документов работает со входными документами, которые соответствуют следующим требованиям:

  • Формат JPG, PNG или PDF (текстовые или отсканированные документы). PDF-файлы с внедренным текстом предпочтительнее, так как при извлечении символа и расположения не будет ошибок.
  • Файлы TIFF нельзя использовать для обучения. Для обучения модели вам понадобятся документы в формате PDF, JPG или PNG. После обучения модели она может извлекать данные из файлов TIFF, когда модель используется в облачном потоке Power Automate.
  • Если ваши PDF-файлы защищены паролем, вы должны снять блокировку перед отправкой.
  • Максимальный размер обрабатываемого документа не должен превышать 20 МБ.
  • Изображения должны иметь размеры в пределах от 50 ×50 до 10 000 × 10 000 пикселей.
  • При сканировании бумажных документов полученные изображения должны быть высококачественными.
  • Вы можете создать до 200 коллекций на одну модель.
  • В облачном потоке ограничение полей, которые можно пометить для обработки документов, равно 300.

Заметка

  • Извлечение подписей из документов в настоящее время не поддерживается.
  • Поля, которые выходят за границы страницы, в настоящее время не поддерживаются.
  • Строки, которые переходят с одной страницы на другую, в настоящее время не поддерживаются.

Совет по оптимизации

Узнайте, как можно повысить производительность моделей обработки документов.

Следующий шаг

Создание модели для обработки форм