ЧЗВ за обработката на документи
Тази статия се състои от често задавани въпроси за модела за обработка на документи в AI Builder. Ако не намерите въпроса си тук, прегледайте прегледа на AI модела за обработка на документи или изпратете въпроса си до Power Automate Общността за AI Builder.
С обработката на документи можете да създадете персонализиран AI модел, за да извлечете информация от различни видове документи.
- Опцията за документи с фиксиран шаблон е идеална, ако елементите на вашите документи могат да бъдат намерени на подобни места. Обикновено това се отнася за фактури, поръчки за покупка, поръчки за доставка и данъчни формуляри.
- Опцията за общи документи е идеална за всякакъв вид документи, включително тези, поддържани от първата опция, но също така и договори, декларация за работа, писма и други. Тази опция може да бъде по-мощна за извличане на данни, но изисква по-дълго време за обучение.
Научете повече: Общ преглед на модела за обработка на документи
Поддържаните типове файлове са PDF, JPG и PNG.
Обработката на документи може да извлича полета, таблици и квадратчета за отметка от документи.
Научете повече: Дефиниране на информация за извличане
Да. Обработката на документи може да извлече отпечатан и ръкописен текст от вашите документи.
За висококачествени документи, които използват едно и също оформление, трябва да са достатъчни пет примерни документа. За документи с ниско качество (например сканиране с лошо качество, може да са необходими повече примерни документи. За да подобрите резултатите, използвайте 15 до 20 примерни документа.
Може ли един модел за обработка на формуляри да извлече информация от документи, които имат различни оформления или шаблони?
Да. С помощта на функцията за колекции можете да обучите един модел за обработка на формуляри да обработва документи, които имат различни оформления.
Научете повече: Групиране на документи по колекции
Всеки формуляр трябва да бъде в отделен файл. Например, ако имате PDF документ с множество фактури в него, създайте отделен файл за всяка фактура, преди да го изпратите до модела за обработка на документи.
Можете също да зададете страници, които моделът за обработка на документи да обработва. По този начин можете да се възползвате от функционалността на модела, за да обхождате страница по страница и да обработвате формуляр по формуляр.
Научете повече: Диапазон от страници
Обучих модел за обработка на документи, но не получавам добри резултати, когато става въпрос за извлечени данни. Как мога да подобря модела?
Ако вашият модел връща лоши резултати, след като сте го обучили, редактирайте модела и предоставете повече проби за обучение. Колкото повече образци предоставяте, толкова повече AI моделът научава как да извлича данни от вашите документи.
Научете повече: Подобрете ефективността на вашия модел за обработка на документи
Можете да обработвате до 360 документа на среда, на всеки 60 секунди.
- Може да се случи така, че някои знаци да се объркат: 0 (число) и O (буква), 1 (цифра) и l (буква), 4 (цифра) и A (буква) и др.
- Може да се случи, че някои знаци над или близо до други се разпознават неправилно: O (буква) над вертикална линия става 0 (число), 5 (число) над ред става $ (знак за американски долар), l_ (малка буква, долна черта) става L (главна буква) и др.
- Може да се случи, че някои знаци на документи с лошо качество се разпознават неправилно или изобщо не се разпознават.
В горните случаи не може да се направи AI Builder нищо, за да се подобри разпознаването. Препоръчваме да се подобри качеството и оформлението на изходния документ за решаване на подобни проблеми.
Бележка
OCR технологията за откриване на знаци непрекъснато се подобрява от Microsoft, така че такива проблеми се случват по-рядко.
Можете да създадете до 200 колекции на модел. Въпреки това, обучението Моделите на общи документи с десетки колекции могат да отнемат няколко часа и – в редки случаи – изчакване. Ако вашият модел има голям брой колекции, очаквайте да изчакате до 24 часа за завършване на моделното обучение.
В момента не е възможно да се създаде модел в решение.
Да, неструктурирани документи като договори и писма се поддържат от обработка на документи, като се използва опцията Общи документи .
Какви са разликите между обработката на документи, обработката на фактури, обработката на разписки, четеца на документи за самоличност, четеца на визитни картички и разпознаването на текст?
В зависимост от ситуацията, може да се наложи да използвате конкретен модел или комбинация от тях.
Използвайте разпознаване на текст, когато искате да извлечете целия текст, присъстващ в изображение или PDF файл. След това можете например да търсите ключова дума в текста, който се извлича, или да създадете някои фиксирани правила, за да извлечете определени елементи.
Ако искате да извлечете информация от фактури, разписки, паспорти, шофьорски книжки или визитки, започнете със съответния предварително изграден модел:
- Обработка на фактури
- Обработка на разписки
- Четец на документи за самоличност (паспорти и шофьорски книжки)
- Четец на визитни картички
Можете да използвате тези предварително изградени модели веднага, без да се налага да създавате нов модел. Тези модели могат да извличат обща информация, намираща се в съответния им тип документ.
За всеки друг тип документ можете да създадете персонализиран модел за обработка на документи, за да извлечете полетата и таблиците, от които се нуждаете. Това важи и ако имате нужда от допълнителна информация, която не е предоставена от предварително изградения модел.
Научете повече: Персонализиран модел за обработка на документи
Каква е разликата между AI Builder обработката на документи и програмата за разпознаване на формуляри на Azure?
AI Builder обработката на документи е изградена върху модула за разпознаване на формуляри на Azure. Това предоставя и на двата продукта най-новите постижения в Microsoft AI.
AI Builder е част от Microsoft Power Platform. Това дава възможност на всеки да добави AI в приложения и автоматизация с лесен за използване интерфейс. Не е нужно да сте разработчик или учен по данни.
Azure Form Recognizer е насочен към професионални разработчици. Те могат да използват прости REST API, за да добавят AI възможности към своите персонализирани кодови решения.
Можете да започнете да изпробвате обработката на документи безплатно, като започнете пробна версия. След като го оцените, трябва да закупите AI Builder кредити, за да използвате обработка на документи. Всяка страница, която обработвате с обработка на документи, консумира AI Builder кредити, дори ако страницата не съдържа данни за извличане. AI Builder Кредитите могат да бъдат закупени чрез AI Builder добавки.
Научете повече: AI Builder лицензиране