Нотатка
Доступ до цієї сторінки потребує авторизації. Можна спробувати ввійти або змінити каталоги.
Доступ до цієї сторінки потребує авторизації. Можна спробувати змінити каталоги.
У цій статті зібрані найчастіші запитання про модель обробки документів у AI Builder. Якщо ви не знайшли своє запитання тут, перегляньте Огляд моделі штучного інтелекту обробки документів або надішліть своє запитання до спільноти Power Automate для AI Builder.
Функціональність
Що я можу робити з обробкою документів?
За допомогою обробки документів ви можете побудувати власну модель штучного інтелекту для вилучення інформації з різних видів документів.
- Опція «Документи з фіксованим шаблоном» ідеально підходить, якщо елементи ваших документів можна знайти в аналогічних місцях. Зазвичай це стосується рахунків-фактур, замовлень на покупку, замовлень на доставку та податкових форм.
- Варіант загальних документів ідеально підходить для будь-якого виду документів, включаючи ті, що підтримуються першим варіантом, а також договори, технічне завдання, листи та інші. Цей параметр може бути більш потужним для вилучення даних, але вимагає більш тривалого часу навчання.
Дізнайтеся більше в Огляді моделі обробки документів.
З якими видами документів може працювати документообіг?
Підтримувані типи файлів: PDF, JPG і PNG.
Які дані можна витягнути з документів за допомогою обробки документів?
Обробка документів може витягувати з документів поля, таблиці та прапорці.
Дізнайтеся більше в статті Визначення інформації для вилучення.
Чи можна витягти рукописний текст із документів?
Так. Обробка документів дає змогу витягувати друкований і рукописний текст із ваших документів.
Скільки зразків потрібно для навчання моделі обробки документів?
Для якісних документів, які використовують однаковий макет, має бути достатньо п’яти зразків документів. Для документів низької якості (наприклад, сканів поганої якості) може знадобитися більше зразків документів. Для поліпшення результатів використовуйте від 15 до 20 зразків документів.
Рекомендації
Для шаблонних документів
- Один (1) макет на колекцію.
- Макет повинен бути ідентичним в межах однієї колекції.
- Мінімум п’ять (5) і максимум 20 документів на колекцію (не перевищуйте цей ліміт).
Для загальних документів
Створюйте єдину модель для всіх варіантів типу документа, включаючи як структуровані, так і неструктуровані документи.
Позначте поля, що відповідають їхнім значенням, для кращої точності витягування.
Наприклад, використовуйте "supplier_id" для ідентифікатора постачальника. Назви полів мають відповідати мові документа.
Мінімум п’ять (5) і максимум 20 документів на колекцію (не перевищуйте цей ліміт).
Моя модель на даний момент опублікована в v3.1 (GA), і я планую перевчити її на v4.0 (GA). Чи потрібно переставляти теги на всі мої документи?
Якщо ви не додаєте до колекції нові поля, прапорці, таблиці, підписи для вилучення даних або нові документи, вам не потрібно повторно додавати теги до всіх документів.
Перш ніж публікувати модель, рекомендується швидко протестувати її , використовуючи один або кілька зразків, щоб перевірити та переконатися, що всі потрібні поля правильно виділені.
Чи можна переходити з одного типу документа на інший?
Так, під час редагування моделі ви можете перемикатися між фіксованим типом документа шаблону та загальним типом документа. Однак цей перемикач не підтримується для рахунків-фактур.
Чи може одна модель обробки форм отримувати інформацію з документів, які мають різні макети або шаблони?
Так. Використовуючи функцію колекцій, ви навчаєте єдину модель обробки форм працювати з документами з різним макетом.
Дізнайтеся більше в статті Групування документів за колекціями.
Чи може обробка документів обробляти кілька форм в одному документі?
Кожна форма має бути в окремому файлі. Наприклад, якщо у вас є PDF-документ із кількома рахунками-фактурами, створіть окремий файл для кожного рахунка-фактури, перш ніж надсилати його за моделлю обробки документів.
Ви також можете вказати сторінки, які має обробляти модель обробки документів. Таким чином, ви можете скористатися функціональністю моделі, щоб циклічно виконувати посторінкову роботу та обробляти одну форму за раз.
Дізнайтеся більше в розділі Діапазон сторінок.
Я навчив модель обробки документів, але я не отримую хороших результатів, коли справа доходить до вилучених даних. Як я можу вдосконалити модель?
Якщо ваша модель показує погані результати після того, як ви її навчили, відредагуйте модель і надайте більше зразків для навчання. Чим більше зразків ви надасте, тим більше модель штучного інтелекту навчиться витягувати дані з ваших документів.
Дізнайтеся більше в статті Підвищення продуктивності моделі обробки документів.
Обмеження
Яку максимальну кількість документів я можу опрацювати?
Ви можете обробляти до 360 документів у кожному середовищі кожні 60 секунд.
Чому деякі символи розпізнаються неправильно?
- Може статися так, що деякі символи плутаються: 0 (цифра) і О (буква), 1 (цифра) і л (буква), 4 (цифра) і А (буква) та інше.
- Може статися так, що деякі символи над іншими або близькими до них розпізнаються неправильно: O (буква) над вертикальною лінією стає 0 (цифра), 5 (цифра) над рядком стає $ (знак американського долара), l_ (маленька літера, підкреслення) стає L (велика літера) тощо.
- Може статися так, що деякі символи на документах поганої якості розпізнаються неправильно, або не впізнаються зовсім.
У попередніх випадках нічого не можна зробити для AI Builder поліпшення впізнаваності. Ми рекомендуємо покращити якість та макет вихідного документа для вирішення аналогічних проблем.
Нотатка
Корпорація Майкрософт постійно вдосконалює технологію оптичного розпізнавання символів (OCR) для виявлення символів, тому такі проблеми виникають рідше.
Чи можу я створити модель з безліччю колекцій?
Ви можете створити до 200 колекцій на одну модель. Однак навчання моделей загальних документів з десятками колекцій може зайняти кілька годин і, в рідкісних випадках, тайм-аут. Якщо ваша модель має велику кількість колекцій, розраховуйте чекати до 24 годин на завершення навчання моделі.
Чи можу я створити модель у розчині?
В даний час неможливо створити модель в розв’язанні.
Чи можу я використовувати договори та листи у своїй моделі обробки документів?
Так, неструктуровані документи, такі як договори та листи, підтримуються обробкою документів за допомогою опції Загальні документи .
Порівняння
Які відмінності між обробкою документів, обробкою рахунків-фактур, обробкою чеків, зчитувачем документів, що посвідчують особу, читачем візиток і розпізнаванням тексту?
Залежно від вашої ситуації, вам може знадобитися використовувати певну модель або їх комбінацію.
Використовуйте розпізнавання тексту, якщо потрібно витягнути весь текст, присутній на зображенні або PDF-файлі. Потім ви можете, наприклад, шукати ключове слово у витягнутому тексті або створити певні фіксовані правила для вилучення певних елементів.
Якщо ви хочете отримати інформацію з рахунків-фактур, квитанцій, паспортів, водійських прав або візитних карток, почніть з відповідної готової моделі:
- Обробка інвойсів
- Обробка чеків
- Зчитувач документів, що посвідчують особу (паспорти та водійські права)
- Зчитувач візиток
Ви можете використовувати ці готові моделі відразу, без необхідності створювати нову модель. Ці моделі можуть витягувати загальну інформацію, що міститься у відповідному типі документів.
Для будь-якого іншого типу документа можна створити спеціальну модель обробки документів, щоб витягти потрібні поля та таблиці. Це також стосується, якщо вам потрібна додаткова інформація, яка не надана готовою моделлю.
Дізнайтеся більше в статті Користувацька модель обробки документів.
У чому різниця між AI Builder обробкою документів і Azure Form Recognizer?
AI Builder Обробка документів побудована на основі Azure Form Recognizer. Це забезпечує обидва продукти останніми досягненнями в галузі штучного інтелекту Microsoft.
AI Builder входить до складу Microsoft Power Platform. Це дозволяє будь-кому додавати штучний інтелект у програми та автоматизацію за допомогою простого у використанні інтерфейсу. Вам не потрібно бути розробником або фахівцем з обробки даних.
Azure Form Recognizer орієнтований на професійних розробників. Вони можуть використовувати прості REST API, щоб додати можливості штучного інтелекту до своїх рішень з користувацьким кодом.
Варіанти витрат
Скільки коштує AI Builder оформлення документів?
Ви можете почати пробувати обробку документів безкоштовно, запустивши пробну версію. Після того, як ви його оціните, вам потрібно придбати AI Builder кредити, щоб скористатися обробкою документів. На кожну сторінку, яку ви обробляєте під час обробки AI Builder документів, витрачаються кредити, навіть якщо сторінка не містить даних для вилучення. AI Builder Кредити можна придбати через AI Builder додаткові компоненти.
Докладніше про AI Builder ліцензування.