Поделиться через


Документы по тегу

Помечая отправленные вами документы, вы обучаете свою модель AI Builder извлекать указанные вами поля и таблицы.

Чтобы начать разметку, выберите одну из коллекций на правой панели.

Поля тегов

Чтобы добавить тег для поля, просто нарисуйте прямоугольник вокруг поля, которое нужно извлечь, и выберите для поля соответствующее имя.

Анимация расстановки тегов полей в документе.

В любое время вы можете изменить размеры, чтобы скорректировать выбор.

Если поле заканчивается в одной строке и начинается в другой, вы можете пометить его с помощью пункта Продолжить расстановку тегов.

Анимация расстановки тегов нескольких слов и разрывов строк.

Вы также можете использовать кнопку Control в Windows или Command ⌘ в macOS, чтобы одновременно отметить несколько слов. Вы можете использовать кнопку Shift, чтобы выбрать первое и последнее слова и пометить все слова между ними.

При наведении курсора на слова в документах могут появиться голубые поля. Это означает, что вы можете нарисовать прямоугольник вокруг этих слов, чтобы выбрать поле.

Снимок экрана выбора полей крупным планом.

Только для пользовательской модели счетов

Вы можете переопределить поведение поля по умолчанию, перерисовав существующую ограничивающую рамку.

Снимок экрана переопределяющего поведения поля по умолчанию.

Поля счета-фактуры по умолчанию, которые не были автоматически обнаружены в вашем документе, отмечены как «Нет в документе». Вы можете изменить это на Доступно в документе и вручную пометить его, если оно присутствует.

Снимок экрана поля, доступного в документе.

При расстановке тегов выберите Пользовательский, чтобы отобразить список добавленных полей без тегов, и выберите По умолчанию, чтобы отобразить поля по умолчанию без тегов, помеченные как «Доступно в документе».

Снимок экрана представления по умолчанию.

Таблицы тегов

  1. Нарисуйте прямоугольник вокруг таблицы в интересующем вас документе, а затем выберите имя таблицы, которому она соответствует. Содержимое панели справа изменяется.

  2. Нарисуйте строки щелчком левой кнопки мыши между разделителями строк.

  3. Нарисуйте столбцы, нажав Ctrl + щелчок левой кнопкой мыши.

  4. После установки строк и столбцов назначьте заголовки для извлечения, выбрав столбец заголовка и сопоставив его с нужным.

    Предварительный просмотр того, как будет извлечена таблица, появится на панели справа.

  5. Если заголовок таблицы помечен тегами, выберите Игнорировать первую строку, тогда заголовок таблицы не извлекается как содержимое таблицы.

    Следующая анимация иллюстрирует этот процесс:

    Анимация расстановки тегов таблицы в документе.

В качестве альтернативы, определите строки и столбцы для таблицы, выбрав Разделение строк и столбцов вверху экрана.

Снимок экрана с разделением строк и столбцов.

Использование расширенного режима расстановки тегов

Расширенный режим расстановки тегов позволяет присваивать теги таблицам на уровне ячеек. Используйте этот режим для сложных таблиц, например:

  • Перекошенные таблицы, в которых теги с сеткой невозможны.
  • Когда вам нужно извлечь вложенные элементы, например элемент в ячейке.

Учитывая таблицу из следующего примера, чтобы извлечь цену за единицу, вы определяете ее как отдельный столбец на шаге Выберите информацию для извлечения. Вы определяете Описание, Цена за единицу, Количество и Сумма, каждый как столбец таблицы, и помечаете их тегами соответствующим образом, используя расширенный режим тегов.

Анимация разделения строк и столбцов.

Вы можете начать расстановку тегов в режиме по умолчанию, чтобы быстро получить все строки и столбцы. Затем переключитесь в расширенный режим, чтобы настроить каждую ячейку и пометить тегами вложенные элементы.

Вложенные элементы в таблицах

Вы можете пометить элементы, вложенные в строку, определив их как столбцы. Учитывая таблицу из следующего примера, чтобы извлечь цену за единицу, мы определяем ее как отдельный столбец в Выберите информацию для извлечения ранее в этой статье. Определите Описание, Цена за единицу, Количество и Сумма, каждый как столбец таблицы и затем пометьте их тегами соответствующим образом.

Снимок экрана с расстановкой тегов вложенных элементов в таблицах.

Многостраничные таблицы

Если таблица занимает более одной страницы, убедитесь, что вы пометили ее на всех страницах. Завершив добавление тегов к таблице на одной странице, выберите Эта таблица продолжается на следующей странице и продолжите добавление тегов к таблице на следующей странице. Таким образом, вы научите модель, что таблица может занимать несколько страниц.

Снимок экрана, на котором показано, как выбрать параметр «Эта таблица продолжается на следующей странице», чтобы продолжить пометку таблицы, которая охватывает несколько страниц.

После добавления тегов ко всем страницам, на которых присутствует таблица, выберите Готово, чтобы пометить таблицу как полностью помеченную.

Можно помечать сложные таблицы, содержащие объединенные ячейки, вложенные элементы, границы или без границ, а также неожиданные элементы, такие как пятно от кофе, как показано в следующем примере.

Снимок экрана, показывающий выбор параметра «Готово» после того, как таблица была помечена на всех страницах.

Совет

Рекомендуется отправлять документы для обучения с ожидаемыми вариациями. Например, включите образцы, в которых вся таблица находится на одной странице, и в которых таблицы занимают две или более страниц.

Добавление тегов для флажков

Чтобы добавить тег для флажка, просто нарисуйте прямоугольник вокруг флажка, который нужно извлечь, и выберите для него соответствующее имя.

Анимация расстановки тегов флажка.

Если качество документа низкое, AI Builder может не обнаружить флажок. Если вы не можете пометить флажок, сделайте следующее:

  1. На панели справа выберите три точки рядом с флажком, который вы хотите извлечь.
  2. Выберите Отсутствует в документе.

AI Builder поддерживает обнаружение и извлечение меток выбора, таких как флажки и переключатели, с разными маркерами, чтобы указать, отмечен ли выбор или нет.

Поля, флажка или таблицы нет в документе или нет в коллекции

Если поле, флажок или таблица отсутствуют в одном из документов или в коллекции, которые вы отправили для обучения, выберите Отсутствует в документе или Отсутствует в коллекции на панели справа, рядом с полем, флажком или таблицей.

Анимация поля или таблицы, которых нет в документе или нет в коллекции.

Разметка всех документов во всех коллекциях

Все загруженные вами документы представлены для пометки. Если вы создали несколько коллекций, отметьте все документы во всех коллекциях.

Если невозможно расставить теги полей в документе, перейдите к шагу Не удается загрузить поля для этого документа для поиска возможных решений.

Следующий шаг

Извлечение дат и чисел

Обучение. Обработка произвольных документов с помощью AI Builder (модуль)