Поделиться через


Использование модели обработки документов в Power Automate

  1. Выполните вход в Power Automate.

  2. Выберите Мои потоки>Создать поток>Мгновенный облачный поток.

  3. Введите имя потока.

  4. В разделе Выбор способа запуска для этого потока выберите Активировать поток вручную и затем выберите Создать.

  5. Разверните Активация потока вручную и выберите +Добавить входные данные>Файл в качестве типа входных данных.

  6. Выберите +Создать шаг>AI Builder, затем выберите Извлечение информации из документов в списке действий.

  7. Выберите модель обработки документов, которую необходимо использовать, а затем выберите тип документа.

  8. В поле Форма добавьте Содержимое файла из триггера.

    Снимок экрана содержимого файла.

  9. В дальнейших действиях можно использовать любые поля и таблицы, извлеченные моделью AI Builder. Например, предположим, что наша модель обучена извлекать значения Номер партии, Вес нетто и Вес брутто. Мы также хотим опубликовать их в канале Microsoft Teams после того, как AI Builder извлек их из документа. Просто добавьте действие Опубликовать сообщение из соединителя Microsoft Teams, а затем выберите поля в списке токенов.

    Заметка

    • Чтобы извлечь значение для поля, выберите значение <имя_поля> . Например, для поля Номер партии выберите Значение номера партии.
    • Чтобы получить значение для флажка, выберите значение <имя_флажка>. Например, для флажка с именем Приоритетная доставка выберите Значение приоритетной доставки. Возвращаемое значение имеет тип "логический": true — если флажок отмечен как выбранный в документе, false — если нет.
    • Чтобы получить степень достоверности для извлеченного элемента, выберите степень достоверности <имя_поля>. Например, для поля Номер партии выберите Степень достоверности номера партии.

    Снимок экрана обзора потока обработки документов.

Поздравляем! Вы создали поток, использующий модель обработки документов AI Builder. Щелкните Сохранить в правом верхнем углу, а затем выберите Тест, чтобы проверить поток.

Диапазон страниц

Для документов с несколькими страницами можно указать диапазон страниц для обработки.

  1. На карточке Извлечь информацию из документов выберите Показать дополнительные параметры. Этот параметр изменится на Скрыть дополнительные параметры.

  2. В параметре Страницы введите значение страницы или диапазон страниц. Пример: 1 или 3–5.

    Снимок экрана поля «Страницы», где вы вводите диапазон страниц.

Заметка

Если у вас есть большой документ только с одной формой, мы настоятельно рекомендуем вам использовать параметр Страницы. Это может снизить стоимость прогноза модели, что может повысить производительность. Однако диапазон страниц должен содержать уникальную форму для действия, чтобы вернуть правильные данные.

Пример: документ содержит первую форму на странице 2 и вторую форму, который занимает страницы 3 и 4:

  • Если вы введете диапазон страниц 2, он вернет данные первой формы.
  • Если вы введете диапазон страниц 3–4, он вернет только данные второй формы.
  • Если вы введете диапазон страниц 2–4, он вернет частичные данные первой и второй формы (следует избегать).

Параметры

Входные данные

Имя Обязательно Тип Описание Значения
Модель ИИ Да модель Модель обработки документов для анализа Обученные и опубликованные модели обработки документов
Тип документа Да список Тип файла формы для анализа PDF-документ (.pdf), Изображение JPEG (.jpeg), Изображение PNG (.png)
Форма Да файл Форма для обработки
Страницы Нет строка Диапазон страниц для обработки

Выходные данные

Имя. Тип Описание Values
Значение {field} строка Значение, извлеченное моделью ИИ
Степень достоверности {field} с плавающей запятой Степень уверенности модели в своем прогнозе Значение в диапазоне от 0 до 1. Значения, близкие к 1, свидетельствуют о большей уверенности в том, что извлеченное значение точно
Значение {table}{column} string Значение, извлеченное моделью ИИ для ячейки в таблице
Степень достоверности {table}{column} с плавающей запятой Степень уверенности модели в своем прогнозе Значение в диапазоне от 0 до 1. Значения, близкие к 1, свидетельствуют о большей уверенности в том, что извлеченное значение ячейки точно

Заметка

  • Могут быть предложены дополнительные параметры вывода, такие как координаты поля, многоугольники, ограничивающие прямоугольники и номера страниц. Они не указаны специально, поскольку предназначены в основном для расширенного использования.

  • Координаты представлены в процентах от высоты и ширины документа, начиная с верхнего левого угла. Например, если заданы координаты X = 0,10 и Y = 0,20, это означает местоположение на расстоянии 10 % ширины документа по оси X и 20 % его высоты по оси Y, оба измерения от верхнего левого угла.

Распространенные варианты использования

Пошаговый вывод таблицы обработки документов в Power Automate

Чтобы проиллюстрировать эту процедуру, мы используем следующий пример, в котором мы обучили модель обработки документа для извлечения таблицы, которую мы назвали Товары с тремя столбцами: Количество, Описание и Всего. Мы хотим сохранить каждую позицию из таблицы в файл Excel.

Таблица, извлеченная при обработке документа.

  1. Выберите поле, в которое хотите записать ячейку таблицы. Откроется панель динамического содержимого, показывающая все, что умеет извлекать модель обработки документов. Найдите значение {имя вашей таблицы} {имя вашего столбца}. В нашем примере используется Значение количества элементов.

    Экран

  2. После добавления этого значения действие, в которое вы его добавили, автоматически вставляется в элемент управления Apply to each. Таким образом, каждая строка в таблице будет обработана при запуске потока.

  3. Продолжайте добавлять столбцы, которые хотите итерировать.

Карточка «Добавление строки в таблицу».

Заметка

Таблицы, извлеченные при обработке документов, в настоящее время не возвращают оценку достоверности.

Обработка выходных данных флажков в Power Automate

Значения флажков имеют тип "логический": true — флажок отмечен как выбранный в документе, false — нет.

Один из способов проверить его значение — использовать действие Состояние. Если значение флажка равно true, затем выполните одно действие. Если значение равно false, выполните другое действие. Следующая иллюстрация показывает пример.

Получите значение флажка в условии

Другой вариант — сопоставить выходные данные флажка true/false с другими значениями по вашему выбору с помощью выражения если. Например, у вас может быть столбец в файле Excel, где вы хотите написать «Приоритет», если установлен один из флажков в документе, или «Не приоритетный», если не выбран. Для этого можно воспользоваться указанным ниже выражением: if(<document processing output>, 'Priority', 'Non-priority'). Следующая анимация показывает пример.

Сопоставление значения флажка с выражением

Удаление символов валют (€, $,…) из вывода обработки документа в Power Automate

Для примера, значение Всего, извлеченное моделью обработки таблицы, может содержать символ валюты, например $54. Чтобы удалить знак $ или любые другие символы, которые вы хотите опустить, используйте выражение replace, чтобы удалить его. Это делается следующим образом:

replace(<document processing output>, '$', '')

Анимация выражения Заменить валюту.

Преобразование выходной строки обработки документа в число в Power Automate

Обработка документов AI Builder возвращает все извлеченные значения в виде строк. Если назначение, в котором нужно сохранить значение, извлеченное обработкой документов AI Builder, подразумевает сохранение числа, вы можете преобразовать значение в число, используя выражение int или float. Используйте int, если число не имеет десятичных знаков. Используйте float, если у числа есть десятичные знаки. Вот как это сделать:

float('<document processing output>')

Анимация преобразования в число.

Удаление пробелов из вывода обработки документа в Power Automate

Чтобы удалить пробелы из выходных значений, используйте функцию replace:

replace(<document processing output>, ' ', '')

Анимация выражения Заменить пробелы.

Преобразование выходной строки обработки документа в дату в Power Automate

Обработка документов AI Builder возвращает все выходные данные в виде строк. Если назначение, в котором нужно сохранить значение, извлеченное при обработке документа, подразумевает сохранение даты, вы можете преобразовать значение, содержащее дату, в формат даты. Сделайте это с помощью выражения formatDateTime. Вот как это сделать:

formatDateTime(<document processing output>)

Анимация выражения formatDateTime.

Фильтрация подписи электронной почты из потока, чтобы она не обрабатывалась моделью обработки документов (Microsoft 365 Outlook)

Для входящих писем от соединителя Microsoft 365 Outlook подписи электронной почты собираются в Power Automate как вложения. Чтобы они не обрабатывались моделью обработки документов, добавьте в поток условие, которое проверяет, имеют ли выходные данные от соединителя Microsoft 365 Outlook с именем Вложения встроены значение false. В условии в ветви Если да добавьте действие обработки документов. При этом будут обрабатываться только вложения электронной почты, которые не являются встроенными подписями.

Условие фильтрации вложений.