Поділитися через


Створення користувальницької моделі обробки документів

Ознайомившись із вимогами, ви можете приступити до створення моделі обробки документів.

Створіть свою модель за допомогою майстра

Створити модель обробки документів можна за допомогою майстра Створення користувацької моделі . Майстер проведе вас через процес створення моделі для вилучення інформації з документів.

  1. Увійдіть в АБО Power AppsPower Automate.

  2. На лівій панелі виберіть ... Більше>AI hub.

    (Необов’язково) Щоб моделі штучного інтелекту постійно залишалися в меню для легкого доступу, виберіть значок шпильки поруч із концентратором AI.

  3. У розділі Знайомство з можливостями штучного інтелекту виберіть моделі штучного інтелекту.

  4. Виберіть Витягти настроювану інформацію з документів.

  5. Виберіть Створити власну модель.

  6. Покроковий майстер проведе вас через весь процес, попросивши вас перерахувати всі дані, які ви хочете витягнути з документа.

    Дізнайтеся більше в розділі Вибір типу документа в цій статті.

    Якщо ви хочете створити свою модель за допомогою власних документів, переконайтеся, що у вас є принаймні п’ять прикладів, які використовують однаковий макет. В іншому випадку для створення моделі можна використовувати зразки даних .

  7. Виберіть Поїзд.

  8. Протестуйте модель, вибравши Швидкий тест.

Виберіть тип документа

На кроці Вибрати тип документа виберіть тип документа, який потрібно побудувати модель штучного інтелекту для автоматизації вилучення даних. Є три варіанти: фіксовані шаблонні документи, загальні документи та рахунки-фактури.

Скріншот різних типів документів.

  • Фіксовані шаблонні документи: раніше відомий як структурований, цей варіант ідеальний, коли для даного макета поля, таблиці, прапорці, підписи та інші елементи можна знайти в подібних місцях. Ви можете навчити цю модель витягувати дані зі структурованих документів із різним макетом. Дана модель відрізняється швидким часом навчання.
  • Загальні документи: раніше відомий як неструктурований, цей параметр ідеально підходить для будь-якого типу документів, особливо коли немає встановленої структури або коли формат складний. Ви можете навчити цю модель витягувати дані зі структурованих або неструктурованих документів, які мають різний макет. Ця модель потужна, але має тривалий час навчання.
  • Рахунки-фактури: доповніть поведінку попередньо створеної моделі обробки рахунків-фактур, додавши нові поля, які потрібно витягнути, на додаток до тих, що вказані за замовчуванням, або зразків документів, які не витягнуті належним чином.

Про версії аналітики документів

Модель document intelligence доступна у двох версіях: v4.0 та v3.1. Версія моделі залежить від того, коли ви востаннє редагували модель.

Document Intelligence v4.0 – загальна доступність (GA)

На додаток до функцій, перерахованих у цій статті, v4.0 зберігає всі можливості v3.1.

  • Перекриття полів: версія 4.0 підтримує перекриття полів у користувацьких моделях, що дозволяє ефективніше витягувати інформацію з документів зі складним макетом.
  • Виявлення підписів: версія 4.0 виявляє підписи в документах, що особливо корисно для договорів, угод та інших підписаних форм.
  • Оцінки впевненості для таблиць: версія 4.0 надає оцінки впевненості для столу та його клітинок.
  • Удосконалення механізму оптичного розпізнавання символів: версія 4.0 покращує механізм оптичного розпізнавання символів (OCR), підвищуючи точність розпізнавання тексту та підтримуючи більше типів і форматів документів.

Загальна доступність Document Intelligence v3.1 (GA)

  • Версія 3.1 підтримує користувацькі моделі, навчені розпізнавати конкретні шаблони даних, такі як унікальні текстові поля або структури.
  • Версія 3.1 включає користувацькі моделі шаблонів, які дозволяють користувачам створювати шаблони на основі макета та структури документа.

Перевірте версію моделі

Ви можете перевірити версію, використану для навчання, і опублікувати свою модель. Для цього виберіть Налаштування>Опублікована версія>моделі Остання навчена версія моделі.

Знімок екрана панелі

Ви можете перенести модель з версії 3.1 на версію 4.0, відредагувавши, перенавчавши та опублікувавши її. Повторне додавання тегів та інші конкретні зміни не потрібні. Дізнайтеся більше в розділі ЧАП щодо обробки документів.

Визначте інформацію для вилучення

На екрані Вибрати інформацію для вилучення визначте поля, таблиці та прапорці, які ви хочете навчити свою модель видобувати. Щоб почати їх визначення, виберіть + Додати.

Знімок екрана кроку в майстрі обробки документів, де ви визначаєте поля, таблиці та прапорці, які ви хочете отримати модель штучного інтелекту.

  1. Для кожного текстового поля вкажіть ім’я поля, яке буде використовуватися в моделі.

  2. Для кожного числового поля вкажіть ім’я поля, яке буде використовуватися в моделі.

    Визначте формат крапки (.) або коми (,) як десяткового роздільника.

  3. Для кожного поля «Дата» вкажіть ім’я поля, яке використовуватиметься в моделі.

    Також визначте формат (Рік, Місяць, День), або (Місяць, День, Рік), або (День, Місяць, Рік).

  4. Для кожного пункту вкажіть ім’я прапорця, яке буде використовуватися в моделі.

    Визначте окремі прапорці для кожного елемента, які можна відмітити в документі.

  5. Для кожної таблиці вкажіть ім’я таблиці.

    Визначте різні стовпці, які модель повинна витягти.

Нотатка

Модель користувацьких рахунків-фактур містить поля за замовчуванням, які не можна редагувати.

Групування документів за колекціями

Колекція – це група документів з однаковим макетом. Створюйте стільки колекцій, скільки макетів документів, які має обробляти ваша модель. Наприклад, якщо ви створюєте модель штучного інтелекту для обробки рахунків-фактур від двох різних постачальників, кожен з яких має власний шаблон рахунків-фактур, створіть дві колекції.

Анімація створення колекцій.

Для кожної створеної колекції потрібно завантажити принаймні п’ять зразків документів на кожну колекцію. Приймаються файли з форматами JPG, PNG і PDF.

Анімація завантаження документів.

Нотатка

Ви можете створити до 200 колекцій на одну модель.

Наступний крок

Додавання тегів до документів у моделі обробки документів