Поделиться через


Использование модели обработки документов в Power Automate

Заметка

С мая 2025 г. имя действия Извлечение информации из документов изменено на Обработать документы.

Чтобы использовать модель обработки документов в Power Automate, выполните следующие действия

  1. Выполните вход в Power Automate.

  2. Выберите +Создать>Мгновенный облачный поток.

  3. Выберите Активировать поток вручную>Создать.

  4. Выберите Активация потока вручную и выберите +Добавить входные данные>Файл на левой панели.

  5. В конструкторе выберите + после Запустить поток вручную, затем выберите Обработать документы в списке действий.

  6. Выберите модель обработки документов, которую необходимо использовать, а затем выберите тип документа.

  7. В поле Форма добавьте File Content из триггера.

    Снимок экрана «Содержание файла» в поле «Форма».

  8. В дальнейших действиях можно использовать любые поля и таблицы, извлеченные моделью AI Builder. Например, предположим, что ваша модель обучена извлекать значения InvoiceID и Total. Вы также хотите опубликовать их в канале Microsoft Teams после того, как AI Builder извлечет их из документа. Необходимо добавить действие Опубликовать сообщение в чате или канале, а затем выходные поля из модели AI Builder.

    Заметка

    • Чтобы извлечь значение для поля, выберите значение <имя_поля>.
    • Чтобы получить степень достоверности для извлеченного элемента, выберите степень достоверности <имя_поля>.

    Снимок экрана действия «Опубликовать сообщение в чате или в канале».

Поздравляем! Вы создали поток, использующий модель обработки документов AI Builder. Щелкните Сохранить в правом верхнем углу, а затем выберите Тест, чтобы проверить поток.

Диапазон страниц

Для документов с несколькими страницами можно указать диапазон страниц для обработки.

  1. На карточке Обработать документы выберите Дополнительные параметры, затем выберите Страницы.

  2. В параметре Страницы введите значение страницы или диапазон страниц. Пример: 1 или 3–5.

    Снимок экрана поля «Страницы», где вы вводите диапазон страниц.

Заметка

Если у вас есть большой документ только с одной формой, мы настоятельно рекомендуем вам использовать параметр Страницы. Это может снизить стоимость прогноза модели, что может повысить производительность. Однако диапазон страниц должен содержать уникальную форму для действия, чтобы вернуть правильные данные.

Пример: документ содержит первую форму на странице 2 и вторую форму, который занимает страницы 3 и 4:

  • Если вы введете диапазон страниц 2, он вернет данные первой формы.
  • Если вы введете диапазон страниц 3–4, он вернет только данные второй формы.
  • Если вы введете диапазон страниц 2–4, он вернет только частичные данные первой и второй форм (следует избегать).

Входные параметры

Полное имя Обязательно Type Описаниен Values
Модель ИИ Да модель Модель обработки документов для анализа Обученные и опубликованные модели обработки документов
Тип документа Да список Тип файла формы для анализа PDF-документ (.pdf), Изображение JPEG (.jpeg), Изображение PNG (.png)
Форма Да файл Форма для обработки
Страницы нет string Диапазон страниц для обработки

Выходные параметры

Полное имя Type Описаниен Values
Значение {field} string Значение, извлеченное моделью ИИ
Степень достоверности {field} с плавающей запятой Степень уверенности модели в своем прогнозе Значение в диапазоне от 0 до 1. Значения, близкие к 1, свидетельствуют о большей уверенности в том, что извлеченное значение точно
Значение {table}{column} string Значение, извлеченное моделью ИИ для ячейки в таблице
Степень достоверности {table}{column} с плавающей запятой Степень уверенности модели в своем прогнозе Значение в диапазоне от 0 до 1. Значения, близкие к 1, свидетельствуют о большей уверенности в том, что извлеченное значение ячейки точно

Заметка

  • Могут быть предложены дополнительные параметры вывода, такие как координаты поля, многоугольники, ограничивающие прямоугольники и номера страниц. Они не указаны специально, поскольку они предназначены для расширенного использования.

  • Координаты представлены в процентах от высоты и ширины документа, начиная с верхнего левого угла. Например, если заданы координаты X = 0,10 и Y = 0,20, это означает местоположение на расстоянии 10 % ширины документа по оси X и 20 % его высоты по оси Y, оба измерения от верхнего левого угла.

Распространенные варианты использования

Пошаговый вывод таблицы обработки документов в Power Automate

Чтобы проиллюстрировать эту процедуру, мы используем следующий пример, в котором мы обучили модель обработки документов для извлечения таблицы, которую мы назвали Товары с тремя столбцами: Количество, Описание и Всего. Мы хотим сохранить каждую позицию из таблицы в файл Excel.

Снимок экрана таблицы, извлеченной при обработке документа.

  1. Выберите поле, в которое хотите записать ячейку таблицы. Открывается панель динамического содержимого, показывающая все, что умеет извлекать модель обработки документов. Найдите значение {имя вашей таблицы} {имя вашего столбца}. В наших примерах используется Items Quantity value.

    Снимок экрана

  2. После добавления этого значения действие, в которое вы его добавили, автоматически вставляется в элемент управления Apply to each. Таким образом, каждая строка в таблице обрабатывается при выполнении потока.

  3. Продолжайте добавлять столбцы, которые хотите итерировать.

    Снимок экрана карточки

Обработка выходных данных флажков в Power Automate

Значения флажков имеют тип "логический": true — флажок отмечен как выбранный в документе, false — нет.

Один из способов проверить его значение — использовать действие Состояние. Если значение флажка равно true, затем выполните одно действие. Если значение равно false, выполните другое действие. Следующая иллюстрация показывает пример.

Снимок экрана получения значения флажка в условии.

Другой вариант — сопоставить выходные данные флажка true/false с другими значениями по вашему выбору с помощью выражения если. Например, у вас может быть столбец в файле Excel, где вы хотите написать «Приоритет», если установлен один из флажков в документе, или «Не приоритетный», если не выбран. Для этого можно воспользоваться указанным ниже выражением: if(<document processing output>, 'Priority', 'Non-priority'). Следующая анимация показывает пример.

Анимация, показывающая, как использовать выражение для сопоставления логического значения, возвращаемого флажком.

Удаление символов валют (€, $,…) из вывода обработки документа в Power Automate

Для примера, значение Всего, извлеченное моделью обработки таблицы, может содержать символ валюты, например $54. Чтобы удалить знак $ или любые другие символы, которые вы хотите опустить, используйте выражение replace, чтобы удалить его. Это делается следующим образом:

replace(<document processing output>, '$', '')

Анимация выражения Заменить валюту.

Преобразование выходной строки обработки документа в число в Power Automate

Обработка документов AI Builder возвращает все извлеченные значения в виде строк. Если назначение, в котором нужно сохранить значение, извлеченное обработкой документов AI Builder, подразумевает сохранение числа, вы можете преобразовать значение в число, используя выражение int или float. Используйте int, если число не имеет десятичных знаков. Используйте float, если у числа есть десятичные знаки. Вот как это сделать:

float('<document processing output>')

Анимация, показывающая, как добавить выражение

Удаление пробелов из вывода обработки документа в Power Automate

Чтобы удалить пробелы из выходных значений, используйте функцию replace:

replace(<document processing output>, ' ', '')

Анимация выражения Заменить пробелы.

Преобразование выходной строки обработки документа в дату в Power Automate

Обработка документов AI Builder возвращает все выходные данные в виде строк. Если назначение, в котором нужно сохранить значение, извлеченное при обработке документа, подразумевает сохранение даты, вы можете преобразовать значение, содержащее дату, в формат даты. Сделайте это с помощью выражения formatDateTime. Вот как это сделать:

formatDateTime(<document processing output>)

Анимация выражения formatDateTime.

Фильтрация подписи электронной почты из потока, чтобы она не обрабатывалась моделью обработки документов (Microsoft 365 Outlook)

Для входящих писем от соединителя Microsoft 365 Outlook подписи электронной почты собираются в Power Automate как вложения. Чтобы они не обрабатывались моделью обработки документов, добавьте в поток условие, которое проверяет, имеют ли выходные данные от соединителя Microsoft 365 Outlook с именем Вложения встроены значение false. В условии в ветви Если да добавьте действие обработки документов. При этом обрабатываются только вложения электронной почты, которые не являются встроенными подписями.

Снимок экрана условия фильтрации вложений.