Примечание
Для доступа к этой странице требуется авторизация. Вы можете попробовать войти или изменить каталоги.
Для доступа к этой странице требуется авторизация. Вы можете попробовать изменить каталоги.
Заметка
С мая 2025 г. имя действия Извлечение информации из документов изменено на Обработать документы.
Чтобы использовать модель обработки документов в Power Automate, выполните следующие действия
Выполните вход в Power Automate.
Выберите +Создать>Мгновенный облачный поток.
Выберите Активировать поток вручную>Создать.
Выберите Активация потока вручную и выберите +Добавить входные данные>Файл на левой панели.
В конструкторе выберите + после Запустить поток вручную, затем выберите Обработать документы в списке действий.
Выберите модель обработки документов, которую необходимо использовать, а затем выберите тип документа.
В поле Форма добавьте
File Content
из триггера.В дальнейших действиях можно использовать любые поля и таблицы, извлеченные моделью AI Builder. Например, предположим, что ваша модель обучена извлекать значения
InvoiceID
иTotal
. Вы также хотите опубликовать их в канале Microsoft Teams после того, как AI Builder извлечет их из документа. Необходимо добавить действие Опубликовать сообщение в чате или канале, а затем выходные поля из модели AI Builder.Заметка
- Чтобы извлечь значение для поля, выберите значение <имя_поля>.
- Чтобы получить степень достоверности для извлеченного элемента, выберите степень достоверности <имя_поля>.
Поздравляем! Вы создали поток, использующий модель обработки документов AI Builder. Щелкните Сохранить в правом верхнем углу, а затем выберите Тест, чтобы проверить поток.
Диапазон страниц
Для документов с несколькими страницами можно указать диапазон страниц для обработки.
На карточке Обработать документы выберите Дополнительные параметры, затем выберите Страницы.
В параметре Страницы введите значение страницы или диапазон страниц. Пример: 1 или 3–5.
Заметка
Если у вас есть большой документ только с одной формой, мы настоятельно рекомендуем вам использовать параметр Страницы. Это может снизить стоимость прогноза модели, что может повысить производительность. Однако диапазон страниц должен содержать уникальную форму для действия, чтобы вернуть правильные данные.
Пример: документ содержит первую форму на странице 2 и вторую форму, который занимает страницы 3 и 4:
- Если вы введете диапазон страниц 2, он вернет данные первой формы.
- Если вы введете диапазон страниц 3–4, он вернет только данные второй формы.
- Если вы введете диапазон страниц 2–4, он вернет только частичные данные первой и второй форм (следует избегать).
Входные параметры
Полное имя | Обязательно | Type | Описаниен | Values |
---|---|---|---|---|
Модель ИИ | Да | модель | Модель обработки документов для анализа | Обученные и опубликованные модели обработки документов |
Тип документа | Да | список | Тип файла формы для анализа | PDF-документ (.pdf), Изображение JPEG (.jpeg), Изображение PNG (.png) |
Форма | Да | файл | Форма для обработки | |
Страницы | нет | string | Диапазон страниц для обработки |
Выходные параметры
Полное имя | Type | Описаниен | Values |
---|---|---|---|
Значение {field} | string | Значение, извлеченное моделью ИИ | |
Степень достоверности {field} | с плавающей запятой | Степень уверенности модели в своем прогнозе | Значение в диапазоне от 0 до 1. Значения, близкие к 1, свидетельствуют о большей уверенности в том, что извлеченное значение точно |
Значение {table}{column} | string | Значение, извлеченное моделью ИИ для ячейки в таблице | |
Степень достоверности {table}{column} | с плавающей запятой | Степень уверенности модели в своем прогнозе | Значение в диапазоне от 0 до 1. Значения, близкие к 1, свидетельствуют о большей уверенности в том, что извлеченное значение ячейки точно |
Заметка
Могут быть предложены дополнительные параметры вывода, такие как координаты поля, многоугольники, ограничивающие прямоугольники и номера страниц. Они не указаны специально, поскольку они предназначены для расширенного использования.
Координаты представлены в процентах от высоты и ширины документа, начиная с верхнего левого угла. Например, если заданы координаты X = 0,10 и Y = 0,20, это означает местоположение на расстоянии 10 % ширины документа по оси X и 20 % его высоты по оси Y, оба измерения от верхнего левого угла.
Распространенные варианты использования
Пошаговый вывод таблицы обработки документов в Power Automate
Чтобы проиллюстрировать эту процедуру, мы используем следующий пример, в котором мы обучили модель обработки документов для извлечения таблицы, которую мы назвали Товары с тремя столбцами: Количество, Описание и Всего. Мы хотим сохранить каждую позицию из таблицы в файл Excel.
Выберите поле, в которое хотите записать ячейку таблицы. Открывается панель динамического содержимого, показывающая все, что умеет извлекать модель обработки документов. Найдите значение {имя вашей таблицы} {имя вашего столбца}. В наших примерах используется
Items Quantity value
.После добавления этого значения действие, в которое вы его добавили, автоматически вставляется в элемент управления Apply to each. Таким образом, каждая строка в таблице обрабатывается при выполнении потока.
Продолжайте добавлять столбцы, которые хотите итерировать.
Обработка выходных данных флажков в Power Automate
Значения флажков имеют тип "логический": true
— флажок отмечен как выбранный в документе, false
— нет.
Один из способов проверить его значение — использовать действие Состояние. Если значение флажка равно true
, затем выполните одно действие. Если значение равно false
, выполните другое действие. Следующая иллюстрация показывает пример.
Другой вариант — сопоставить выходные данные флажка true
/false
с другими значениями по вашему выбору с помощью выражения если. Например, у вас может быть столбец в файле Excel, где вы хотите написать «Приоритет», если установлен один из флажков в документе, или «Не приоритетный», если не выбран. Для этого можно воспользоваться указанным ниже выражением: if(<document processing output>, 'Priority', 'Non-priority')
. Следующая анимация показывает пример.
Удаление символов валют (€, $,…) из вывода обработки документа в Power Automate
Для примера, значение Всего, извлеченное моделью обработки таблицы, может содержать символ валюты, например $54. Чтобы удалить знак $ или любые другие символы, которые вы хотите опустить, используйте выражение replace, чтобы удалить его. Это делается следующим образом:
replace(<document processing output>, '$', '')
Преобразование выходной строки обработки документа в число в Power Automate
Обработка документов AI Builder возвращает все извлеченные значения в виде строк. Если назначение, в котором нужно сохранить значение, извлеченное обработкой документов AI Builder, подразумевает сохранение числа, вы можете преобразовать значение в число, используя выражение int или float. Используйте int, если число не имеет десятичных знаков. Используйте float, если у числа есть десятичные знаки. Вот как это сделать:
float('<document processing output>')
Удаление пробелов из вывода обработки документа в Power Automate
Чтобы удалить пробелы из выходных значений, используйте функцию replace:
replace(<document processing output>, ' ', '')
Преобразование выходной строки обработки документа в дату в Power Automate
Обработка документов AI Builder возвращает все выходные данные в виде строк. Если назначение, в котором нужно сохранить значение, извлеченное при обработке документа, подразумевает сохранение даты, вы можете преобразовать значение, содержащее дату, в формат даты. Сделайте это с помощью выражения formatDateTime. Вот как это сделать:
formatDateTime(<document processing output>)
Фильтрация подписи электронной почты из потока, чтобы она не обрабатывалась моделью обработки документов (Microsoft 365 Outlook)
Для входящих писем от соединителя Microsoft 365 Outlook подписи электронной почты собираются в Power Automate как вложения. Чтобы они не обрабатывались моделью обработки документов, добавьте в поток условие, которое проверяет, имеют ли выходные данные от соединителя Microsoft 365 Outlook с именем Вложения встроены значение false. В условии в ветви Если да добавьте действие обработки документов. При этом обрабатываются только вложения электронной почты, которые не являются встроенными подписями.