Бележка
Достъпът до тази страница изисква удостоверяване. Можете да опитате да влезете или да промените директориите.
Достъпът до тази страница изисква удостоверяване. Можете да опитате да промените директориите.
Тази статия се състои от често задавани въпроси относно модела за обработка на документи в AI Builder. Ако не намерите въпроса си тук, прегледайте Общ преглед на модела на изкуствен интелект за обработка на документи или изпратете въпроса си до Power Automate Общността AI Builder.
Функционалност
Какво мога да направя с обработката на документи?
С обработката на документи можете да изградите персонализиран AI модел за извличане на информация от различни видове документи.
- Опцията Документи с фиксиран шаблон е идеална, ако елементите на вашите документи могат да бъдат намерени на подобни места. Обикновено това важи за фактури, поръчки за покупка, поръчки за доставка и данъчни формуляри.
- Опцията за общи документи е идеална за всякакъв вид документи, включително тези, поддържани от първата опция, но също така и договори, работно задание, писма и други. Тази опция може да бъде по-мощна за извличане на данни, но изисква по-дълго време за обучение.
Научете повече в Общ преглед на модела за обработка на документи.
Какви видове документи може да обработва обработката на документи?
Поддържаните типове файлове са PDF, JPG и PNG.
Какви данни мога да извлека от документи чрез обработка на документи?
Обработката на документи може да извлича полета, таблици и квадратчета за отметка от документи.
Научете повече в Дефиниране на информация за извличане.
Мога ли да извлека ръкописен текст от документи?
Да. Обработката на документи може да извлече отпечатан и ръкописен текст от вашите документи.
Колко проби са ми необходими, за да обуча модел за обработка на документи?
За висококачествени документи, които използват едно и също оформление, трябва да са достатъчни пет примерни документа. За документи с ниско качество (например сканирания с лошо качество) може да са необходими повече примерни документи. За да подобрите резултатите, използвайте 15 до 20 примерни документа.
Най-добри практики
За образци на документи
- Едно (1) оформление на колекция.
- Оформлението трябва да е идентично в рамките на една и съща колекция.
- Минимум пет (5) и максимум 20 документа на колекция (не превишавайте това ограничение).
За общи документи
Създайте единен модел за всички варианти на даден тип документ, включително структурирани и неструктурирани документи.
Етикетирайте полетата, съответстващи на техните стойности, за по-добра точност на извличане.
Например използвайте "supplier_id" за идентификационен номер на доставчика. Имената на полетата трябва да съвпадат с езика на документа.
Минимум пет (5) и максимум 20 документа на колекция (не превишавайте това ограничение).
Моят модел в момента е публикуван във v3.1 (GA) и планирам да го преобуча с помощта на v4.0 (GA). Необходимо ли е да маркирам отново всичките си документи?
Освен ако не добавяте нови полета, квадратчета за отметка, таблици, подписи за извличане на данни или нови документи към колекцията, не е необходимо да маркирате отново всички документи.
Мога ли да превключвам от един тип документ към друг?
Да, когато редактирате модела, можете да превключвате между фиксиран тип документ с шаблон и общ тип документ. Това превключване обаче не се поддържа за фактури.
Може ли един модел за обработка на формуляри да извлича информация от документи, които имат различни оформления или шаблони?
Да. С помощта на функцията за колекции вие обучавате един модел за обработка на формуляри да обработва документи, които имат различни оформления.
Научете повече в Групиране на документи по колекции.
Може ли обработката на документи да обработва множество формуляри в един документ?
Всеки формуляр трябва да бъде в отделен файл. Например, ако имате PDF документ с множество фактури в него, създайте отделен файл за всяка фактура, преди да я изпратите към модела за обработка на документи.
Можете също така да зададете страници, които моделът за обработка на документи да обработва. По този начин можете да се възползвате от функционалността на модела, за да повтаряте страница по страница и да обработвате формуляр по формуляр.
Научете повече в Диапазон от страници.
Обучих модел за обработка на документи, но не получавам добри резултати, когато става въпрос за извлечени данни. Как мога да подобря модела?
Ако вашият модел дава лоши резултати, след като сте го обучили, редактирайте модела и предоставете още примери за обучение. Колкото повече проби предоставите, толкова повече AI моделът се научава как да извлича данни от вашите документи.
Научете повече в Подобряване на производителността на вашия модел за обработка на документи.
Ограничения
Какъв е максималният брой документи, които мога да обработвам?
Можете да обработвате до 360 документа на среда на всеки 60 секунди.
Защо някои знаци се разпознават неправилно?
- Може да се случи някои знаци да се объркат: 0 (число) и O (буква), 1 (число) и l (буква), 4 (число) и A (буква) и др.
- Може да се случи някои знаци над или близо до други да бъдат разпознати неправилно: O (буква) над вертикална линия става 0 (число), 5 (число) над ред става $ (знак за американски долар), l_ (малка буква, долна черта) става L (главна буква) и др.
- Може да се случи някои знаци в документи с лошо качество да бъдат разпознати неправилно или изобщо да не бъдат разпознати.
В предишните случаи нищо не може да се направи AI Builder , за да се подобри разпознаването. Препоръчваме да подобрим качеството и оформлението на изходния документ, за да разрешим подобни проблеми.
Бележка
Microsoft непрекъснато подобрява технологията за оптично разпознаване на символи (OCR) за откриване на знаци, така че подобни проблеми се случват по-рядко.
Мога ли да създам модел с много колекции?
Можете да създадете до 200 колекции на модел. Въпреки това, обучението на модели на общи документи с десетки колекции може да отнеме няколко часа и – в редки случаи – време за изчакване. Ако вашият модел има голям брой колекции, очаквайте да изчакате до 24 часа за завършване на обучението на модела.
Мога ли да създам модел в решение?
В момента не е възможно да се създаде модел в решение.
Мога ли да използвам договори и писма в модела си за обработка на документи?
Да, неструктурираните документи като договори и писма се поддържат от обработката на документи, като се използва опцията Общи документи .
Сравнения
Какви са разликите между обработка на документи, обработка на фактури, обработка на разписки, четец на документи за самоличност, четец на визитни картички и разпознаване на текст?
В зависимост от вашата ситуация може да се наложи да използвате конкретен модел или комбинация от тях.
Използвайте разпознаване на текст, когато искате да извлечете целия текст, присъстващ в изображение или PDF. След това можете например да търсите ключова дума в текста, който се извлича, или да създадете някои фиксирани правила за извличане на определени елементи.
Ако искате да извлечете информация от фактури, разписки, паспорти, шофьорски книжки или визитни картички, започнете със съответния предварително изграден модел:
- Обработка на фактури
- Обработка на касови бележки
- Четец на документи за самоличност (паспорти и шофьорски книжки)
- Четец на визитки
Можете да използвате тези предварително изградени модели веднага, без да се налага да създавате нов модел. Тези модели могат да извличат обща информация, намираща се в съответния им тип документ.
За всеки друг тип документ можете да създадете персонализиран модел за обработка на документи, за да извлечете полетата и таблиците, от които се нуждаете. Това важи и ако имате нужда от допълнителна информация, която не е предоставена от предварително изградения модел.
Научете повече в Персонализиран модел за обработка на документи.
Каква е разликата между AI Builder обработката на документи и Azure Form Recognizer?
AI Builder обработката на документи е изградена върху Azure Form Recognizer. Това осигурява и на двата продукта най-новите постижения в изкуствения интелект на Microsoft.
AI Builder е част от Microsoft Power Platform. Това позволява на всеки да добави AI в приложения и автоматизация с лесен за използване интерфейс. Не е нужно да сте разработчик или специалист по данни.
Azure Form Recognizer е насочен към професионални разработчици. Те могат да използват прости REST API, за да добавят AI възможности към своите персонализирани кодови решения.
Опции за цена
Колко струва обработката AI Builder на документи?
Можете да започнете да изпробвате обработката на документи безплатно, като започнете пробен период. След като го оцените, трябва да закупите AI Builder кредити, за да използвате обработката на документи. Всяка страница, която обработвате с обработка на документи, AI Builder изразходва кредити, дори ако страницата не съдържа данни за извличане. AI Builder Кредитите могат да бъдат закупени чрез AI Builder добавки.
Научете повече в AI Builder лицензирането.