Използване на модел за обработка на документи в Power Automate

Бележка

От май 2025 г . името на действието Извличане на информация от документи е Обработване на документи.

За да използвате модел Power Automate за обработка на документи, изпълнете следните стъпки.

  1. влезте в Power Automate.

  2. Изберете +Създаване>на незабавен облачен поток.

  3. Изберете Ръчно задействане на поток>Създаване.

  4. Изберете Ръчно задействане на поток и след това изберете +Добавяне на входен>файл в левия панел.

  5. В дизайнера изберете + след Ръчно задействане на поток и след това изберете Обработка на документи в списъка с действия.

  6. Изберете модела за обработка на документа, който искате да използвате, след което изберете типа на документа.

  7. В полето Формуляр добавете File Content от задействането.

    Екранна снимка на

  8. В последователните действия можете да използвате някое от полетата и таблиците, извлечени от модела AI Builder . Например, да кажем, че вашият модел е обучен да извлича InvoiceID стойностите и Total стойностите. Също така искате да ги публикувате в канал, Microsoft Teams след като AI Builder ги извлечете от документа. Трябва да добавите съобщението за публикуване в действие за чат или канал и след това изходните полета от модела AI Builder .

    Бележка

    • За да извлечете стойността за поле, изберете <field_name> стойност.
    • За да извлечете оценката за доверие за извлечен елемент, изберете <field_name> оценка на доверие.

    Екранна снимка на

Поздравления! Създали сте облачен поток, който използва модел за обработка на AI Builder документи. Изберете Запиши горе вдясно и след това изберете Тестване , за да изпробвате потока в облака.

Диапазон от страници

За документи, които имат няколко страници, е възможно да се посочи диапазонът от страници за обработка.

  1. В картата Обработка на документи изберете Разширени параметри и след това изберете Страници.

  2. В параметъра Страници въведете стойност на страница или диапазон от страници. Пример: 1 или 3-5.

    Екранна снимка на полето Страници, където въвеждате диапазона от страници.

Бележка

Ако имате голям документ само с един формуляр, силно препоръчваме да използвате параметъра Страници . Това може да намали разходите за прогнозиране на модела, което може да увеличи производителността. Диапазонът от страници обаче трябва да съдържа уникален формуляр, за да може действието да върне правилни данни.

Пример: Документ съдържа първи формуляр на страница 2 и втори формуляр, който обхваща страници 3 и 4:

  • Ако въведете диапазон от страници 2, той връща данните от първия формуляр.
  • Ако въведете диапазон от страници 3-4, той връща само данните от втория формуляр.
  • Ако въведете диапазон от страници 2-4, той връща само частични данни от първа и втора форма (трябва да се избягва).

Входни параметри

Име Необходимо Тип Описание Стойности
AI модел Да модел Модел за обработка на документи, който да се използва за анализ Обучени и публикувани модели за обработка на документи
Тип документ Да списък Типът на файла на формуляра за анализ PDF документ (.pdf), JPEG изображение (.jpeg), PNG изображение (.png)
Формуляр Да файлове Формуляр за обработка
Страници No string Диапазон от страници за обработка

Изходни параметри

Име Тип Описание Стойности
{field} стойност string Стойността, извлечена от модела на ИИ
{field} Оценка на доверието плавам Колко достоверна е прогнозата на модела Стойност в диапазона от 0 до 1. Стойности, близки до 1, показват по-голяма увереност, че извлечената стойност е точна
{table}{column} стойност string Стойността, извлечена от AI модела за клетка в таблица
{table}{column} Оценка на доверието плавам Колко достоверна е прогнозата на модела Стойност в диапазона от 0 до 1. Стойности, близки до 1, показват по-голяма увереност, че стойността на извлечената клетка е точна

Бележка

  • Могат да бъдат предложени повече изходни параметри като координати на полета, многоъгълници, ограничителни полета и номера на страници. Те не са изброени нарочно, тъй като са предназначени за разширена употреба.

  • Координатите се представят като проценти от височината и ширината на документа, произхождащи от горния ляв ъгъл. Например, ако са дадени координати X = 0.10 и Y = 0.20, това означава местоположение на 10% от ширината на документа по оста X и 20% от височината му по оста Y, и двете измерени от горния ляв ъгъл.

Обичайни случаи на употреба

Итерация на изхода на таблица за обработка на документи в Power Automate

За да илюстрираме тази процедура, използваме следния пример, в който обучихме модел за обработка на документи да извлече таблица, която нарекохме Елементи с три колони: Количество, Описание и Общо. Искаме да съхраним всеки ред от таблицата във файл на Excel.

Екранна снимка на таблица, извлечена чрез обработка на документи.

  1. Изберете полето, което искате да напишете в клетката за таблица. Отваря се панелът с динамично съдържание, показващ всичко, което моделът за обработка на документи знае как да извлече. Потърсете {името} {на таблицата, стойността} на иметона колоната. Нашият пример използва Items Quantity value.

    Екранна снимка на екрана

  2. След като добавите тази стойност, действието, в което сте я добавили, автоматично се вмъква в Приложи към всяка контрола. По този начин всеки ред в таблицата се обработва, когато се изпълнява облачният поток.

  3. Продължавайте да добавяте колони, които искате да повторите.

    Екранна снимка на картата

Обработка на изходите на квадратчетата за отметка в Power Automate

Стойностите на квадратчетата за отметка са от тип Boolean: true означава, че квадратчето за отметка е маркирано като избрано в документа и false означава, че не е.

Един от начините да проверите стойността му е с действие Условие . Ако стойността на квадратчето за отметка е равна на true, тогава изпълнете едно действие. Ако стойността е false, изпълнете друго действие. Следващата илюстрация показва пример.

Екранна снимка на извличане на стойност на квадратче за отметка в условие.

Друга опция е да съпоставите изхода true/false на квадратчето за отметка с други стойности по ваш избор, като използвате израза if . Например може да имате колона във файл на Excel, където искате да напишете "Приоритет", ако е избрано едно от квадратчетата за отметка в документа, или "Без приоритет", ако не е избрано. За да направите това, можете да използвате следния израз: if(<document processing output>, 'Priority', 'Non-priority'). Следващата анимация показва пример.

Анимация, показваща как да използвате израз за картографиране на булевата стойност, върната от квадратче за отметка.

Премахване на валутни символи (€, $,...) в изхода за обработка на документи в Power Automate

За да илюстрираме, общата стойност, извлечена от модела за обработка на документи, може да има символ за валута, например $54. За да премахнете знака $ или други символи, които искате да пропуснете, използвайте израза за замяна , за да го премахнете. Ето как:

replace(<document processing output>, '$', '')

Анимация на израза Заместване на валутата.

Преобразуване на изходен низ за обработка на документи в число в Power Automate

AI Builder Обработката на документи връща всички извлечени стойности като низове. Ако местоназначението, където искате да запишете стойност, извлечена чрез AI Builder обработка на документ, изисква число, можете да преобразувате стойност в число с помощта на израза int или float . Използвайте int, ако числото няма десетични знаци. Използвайте float, ако числото има десетични знаци. Ето как да го направите:

float('<document processing output>')

Анимация, показваща как да добавите израза

Премахване на празни пространства в изхода за обработка на документи в Power Automate

За да премахнете празните интервали от изходните стойности, използвайте функцията за замяна :

replace(<document processing output>, ' ', '')

Анимация на израза Заместване на интервали.

Преобразуване на изходен низ за обработка на документи в дата в Power Automate

AI Builder Обработката на документи връща всички изходи като низове. Ако местоназначението, където искате да запишете стойност, извлечена чрез обработка на документ, трябва да е във формат на дата, можете да конвертирате стойност, която съдържа дата, във формат на дата. Направете това, като използвате израза formatDateTime . Ето как да го направите:

formatDateTime(<document processing output>)

Анимация на израза formatDateTime.

Филтриране на имейл подписа от поток, така че да не се обработва от модела за обработка на документи (Microsoft 365 Outlook)

За входящи имейли от конектора Microsoft 365 на Outlook имейл подписите се приемат като Power Automate прикачени файлове. За да предотвратите обработката им от модела за обработка на документи, добавете условие към вашия облачен поток, което проверява дали изходът от конектора Microsoft 365 на Outlook с име Прикачени файлове е Вграден е равен на false. В клона Ако да на условието добавете действието за обработка на документа. С това се обработват само прикачени файлове към имейли, които не са вградени подписи.

Екранна снимка на условието за прикачен файл Филтър.