Поширені запитання про обробку документів
Ця стаття містить поширені запитання про модель обробки документів у AI Builder. Якщо ви не знайшли своє запитання тут, перегляньте огляд моделі штучного інтелекту для обробки документів або надішліть своє запитання спільноті Power Automate для AI Builder.
За допомогою обробки документів ви можете побудувати власну модель штучного інтелекту для вилучення інформації з різних видів документів.
- Опція Документи з фіксованим шаблоном ідеально підходить, якщо елементи ваших документів знаходяться в схожих місцях. Зазвичай це стосується рахунків-фактур, замовлень на купівлю, замовлень на доставку та податкових форм.
- Варіант «Загальні документи » ідеально підходить для будь-якого виду документів, включаючи ті, що підтримуються першим варіантом, а також контракти, технічне завдання, листи та інші. Цей параметр може бути більш потужним для вилучення даних, але вимагає більш тривалого часу на навчання.
Детальніше: Огляд моделі обробки документів
Підтримувані типи файлів: PDF, JPG і PNG.
Обробка документів може витягувати з документів поля, таблиці та прапорці.
Докладніше: Визначення інформації для вилучення
Так. Обробка документів дає змогу витягувати друкований і рукописний текст із ваших документів.
Для високоякісних документів, які використовують однаковий макет, має бути достатньо п’яти зразків документів. Для документів низької якості (наприклад, сканів низької якості) можуть знадобитися документи більшого зразка. Щоб покращити результати, використовуйте від 15 до 20 зразків документів.
Чи може одна модель обробки форм витягти інформацію з документів, які мають різні макети або шаблони?
Так. За допомогою функції «Колекції» можна навчити єдину модель обробки форм працювати з документами з різними макетами.
Докладніше: Групування документів за колекціями
Кожна форма має бути в окремому файлі. Наприклад, якщо у вас є PDF-документ із кількома рахунками-фактурами, створіть окремий файл для кожного рахунка-фактури, перш ніж надсилати його за моделлю обробки документів.
Також можна вказати сторінки, які потрібно обробляти моделі обробки документів. Таким чином, ви можете скористатися функціональністю моделі, щоб зациклювати сторінку за сторінкою та обробляти одну форму за раз.
Докладніше: Діапазон сторінок
Я тренував модель обробки документів, але я не отримую хороших результатів, коли справа доходить до вилучених даних. Як я можу покращити модель?
Якщо ваша модель дає погані результати після того, як ви її навчили, відредагуйте її та надайте більше зразків для навчання. Чим більше зразків ви надасте, тим більше модель штучного інтелекту навчиться витягувати дані з ваших документів.
Докладніше: Підвищення продуктивності моделі обробки документів
Ви можете обробляти до 360 документів у кожному середовищі кожні 60 секунд.
- Може статися так, що деякі символи плутаються: 0 (цифра) і О (буква), 1 (цифра) і l (буква), 4 (цифра) і A (буква) і інше.
- Може статися так, що деякі символи над іншими або близькими до них розпізнаються неправильно: O (літера) над вертикальною лінією стає 0 (цифра), 5 (цифра) над рядком стає $ (знак американського долара), l_ (маленька літера, підкреслення) стає L (велика літера) тощо.
- Може статися так, що деякі символи на документах поганої якості розпізнаються некоректно, або не впізнаються зовсім.
У вищевказаних випадках нічого не можна зробити для AI Builder поліпшення впізнаваності. Ми докладаємо всіх зусиль для покращення якості та оформлення вихідного документа для вирішення аналогічних проблем.
Примітка
Технологія OCR для виявлення символів постійно вдосконалюється Microsoft, тому такі проблеми трапляються рідше.
На одну модель можна створити до 200 колекцій. Однак навчання моделей загальних документів з десятками колекцій може зайняти кілька годин і, в рідкісних випадках, тайм-аут. Якщо ваша модель має велику кількість колекцій, очікуйте, що ви зачекаєте до 24 годин до завершення навчання моделі.
Наразі неможливо створити модель у рішенні.
Так, неструктуровані документи, такі як контракти та листи, підтримуються обробкою документів за допомогою опції «Загальні документи ».
Які відмінності між обробкою документів, обробкою рахунків-фактур, обробкою квитанцій, зчитувачем документів, що посвідчують особу, зчитувачем візитних карток і розпізнаванням тексту?
Залежно від вашої ситуації, вам може знадобитися використовувати певну модель або їх комбінацію.
Використовуйте розпізнавання тексту, якщо потрібно витягти весь текст із зображення або PDF-файлу. Потім ви можете, наприклад, шукати ключове слово у витягнутому тексті або створювати певні фіксовані правила для вилучення певних елементів.
Якщо ви хочете отримати інформацію з рахунків-фактур, квитанцій, паспортів, водійських прав або візитних карток, почніть з відповідної готової моделі:
- Обробка рахунків-фактур
- Обробка квитанцій
- Зчитувач документів, що посвідчують особу (паспорти та водійські права)
- Зчитувач візиток
Ви можете використовувати ці готові моделі відразу, без необхідності створювати нову модель. Ці моделі можуть витягувати загальну інформацію, що міститься у відповідному типі документа.
Для будь-якого іншого типу документа можна створити власну модель обробки документів, щоб витягти потрібні поля та таблиці. Це також застосовується, якщо вам потрібна додаткова інформація, яка не надається готовою моделлю.
Детальніше: Кастомна модель обробки документів
AI Builder Обробка документів побудована на основі Azure Form Recognizer. Це забезпечує обидва продукти останніми досягненнями в галузі штучного інтелекту Microsoft.
AI Builder входить до складу Microsoft Power Platform. Це дозволяє будь-кому додавати штучний інтелект у програми та автоматизацію за допомогою простого у використанні інтерфейсу. Вам не потрібно бути розробником або фахівцем з обробки даних.
Azure Form Recognizer призначено для професійних розробників. Вони можуть використовувати прості REST API, щоб додати можливості штучного інтелекту до своїх рішень для користувацького коду.
Ви можете почати пробувати обробку документів безкоштовно, запустивши пробну версію. Після того, як ви його оціните, вам потрібно придбати AI Builder кредити, щоб скористатися обробкою документів. Кожна сторінка, яку ви обробляєте за допомогою обробки документів, споживає AI Builder кредити, навіть якщо сторінка не містить даних для вилучення. AI Builder Кредити можна придбати за допомогою AI Builder доповнень.
Детальніше: AI Builder ліцензування