Примечание
Для доступа к этой странице требуется авторизация. Вы можете попробовать войти или изменить каталоги.
Для доступа к этой странице требуется авторизация. Вы можете попробовать изменить каталоги.
Эта статья состоит из часто задаваемых вопросов о модели обработки документов в AI Builder. Если вы не нашли здесь свой вопрос, просмотрите Обзор модели ИИ для обработки документов или задайте свой вопрос в Сообществе Power Automate для AI Builder.
Функциональность
Что можно сделать с помощью обработки документов?
С помощью обработки документов вы можете создать собственную модель ИИ для извлечения информации из различных документов.
- Вариант Документы с фиксированным шаблоном идеален, если элементы ваших документов можно найти в одинаковых местах. Обычно это относится к счетам-фактурам, заказам на покупку, заказам на поставку и налоговым формам.
- Вариант Общие документы идеально подходит для документов любого типа, включая те, которые поддерживаются первым вариантом, а также контракты, технические задания, письма и другие. Этот вариант может быть более эффективным для извлечения данных, но требует больше времени на обучение.
Дополнительные сведения см. в разделе Общие сведения о модели обработки документов.
С какими типами документов может работать обработка документов?
Поддерживаемые типы файлов: PDF, JPG и PNG.
Какие данные я могу извлечь из документов с помощью обработки документов?
Обработка документов может извлекать из документов поля, таблицы и флажки.
Подробнее см. в разделе Определение информации для извлечения.
Можно ли извлекать рукописный текст из документов?
Да. Обработка документов способна извлекать печатный и рукописный текст из ваших документов.
Сколько образцов понадобится для обучения модели обработки документов?
Для документов высокого качества одинаковым макетом должно быть достаточно пяти образцов документов. Для документов низкого качества (например, плохо отсканированных) может потребоваться больше образцов документов. Чтобы улучшить результаты, используйте от 15 до 20 образцов документов.
Рекомендации
Для документов с шаблоном
- Один (1) макет на коллекцию.
- Макет должен быть идентичен в пределах одной коллекции.
- Минимум пять (5) и максимум 20 документов на коллекцию (не превышайте это ограничение).
Для общих документов
Создайте единую модель для всех вариантов типа документа, включая как структурированные, так и неструктурированные документы.
Пометьте поля, соответствующие их значениям, для повышения точности извлечения.
Например, используйте "supplier_id" в качестве идентификатора поставщика. Имена полей должны соответствовать языку документа.
Минимум пять (5) и максимум 20 документов на коллекцию (не превышайте это ограничение).
Моя модель в настоящее время опубликована в v3.1 (GA), и я планирую переобучить ее с помощью v4.0 (GA). Нужно ли перепрославливать все документы?
Если вы не добавляете в коллекцию новые поля, флажки, таблицы, подписи для извлечения данных или новые документы, вам не нужно повторно помечать все документы.
Можно ли переключиться с одного типа документа на другой?
Да, при редактировании модели можно переключаться между типом документа с фиксированным шаблоном и общим типом документа. Однако это переключение не поддерживается для счетов.
Может ли единая модель обработки формы извлекать информацию из документов с разными макетами или шаблонами?
Да. Используя функцию коллекций, вы обучаете единую модель обработки форм для работы с документами с разным макетом.
Подробнее см. в разделе Группировка документов по коллекциям.
Может ли обработка документов обработать несколько форм в одном документе?
Каждая форма должна быть в отдельном файле. Например, если у вас есть документ PDF с несколькими счетами, создайте отдельный файл для каждого счета перед передачей модели обработки документов.
Вы также можете указать страницы, которые должны быть обработаны моделью обработки документов. Таким образом, вы можете использовать функциональные возможности модели, переходя циклически от одной страницы к другой и обрабатывая одну форму за раз.
Подробнее см. в разделе Диапазон страниц.
Я обучил модель обработки документов, но результаты после извлечения данных неудовлетворительны. Как улучшить модель?
Если после обучения ваша модель дает плохие результаты, отредактируйте модель и предоставьте больше образцов для обучения. Чем больше образцов вы предоставите, тем лучше модель ИИ научится извлекать данные из ваших документов.
Дополнительные сведения см. в разделе Повышение производительности вашей модели обработки документов.
Ограничения
Каковы ограничения на максимальное количество документов, которые можно обработать?
Вы можете обрабатывать до 360 документов в каждой среде каждые 60 секунд.
Почему некоторые символы распознаются неправильно?
- Бывает, что некоторые символы путаются: 0 (цифра) и О (буква), 1 (цифра) и l (английская буква), 4 (цифра) и А (буква) и другие.
- Может случиться так, что некоторые символы, находящиеся над другими или рядом с ними, распознаются неправильно: O (буква) над вертикальной линией становится 0 (цифрой), 5 (цифра) над строкой становится $ (знак американского доллара), l_ (строчная буква, подчеркивание) превращается в букву L (прописную букву) и т. д.
- Может случиться так, что некоторые символы в документах низкого качества распознаются неправильно или не распознаются вообще.
В предыдущих случаях ничего нельзя сделать в AI Builder для улучшения распознавания. Рекомендуем улучшить качество и оформление исходного документа для решения подобных проблем.
Заметка
Microsoft постоянно совершенствует технологию оптического распознавания символов (OCR) для детектирования символов, поэтому такие проблемы случаются реже.
Могу ли я создать модель с множеством коллекций?
Вы можете создать до 200 коллекций на одну модель. Однако обучение моделей Общих документов с десятками коллекций может занять несколько часов и — в редких случаях — привести к истечению времени ожидания. Если ваша модель имеет большое количество коллекций, подождите до 24 часов для завершения обучения модели.
Можно ли создать модель в решении?
В настоящее время невозможно создать модель в решении.
Могу ли я использовать контракты и письма в своей модели обработки документов?
Да, неструктурированные документы, такие как контракты и письма, поддерживаются обработкой документов с использованием параметра Общие документы.
Сравнения
В чем разница между обработкой документов, обработкой счетов, обработкой квитанций, считывателем удостоверений личности, считывателем визитных карточек и распознаванием текста?
В зависимости от вашей ситуации вам может потребоваться использовать определенную модель или их комбинацию.
Используйте распознавание текста, когда вы хотите извлечь весь текст, присутствующий в изображении или PDF-файле. Затем вы можете, например, искать ключевое слово в извлеченном тексте или создать некоторые фиксированные правила для извлечения определенных элементов.
Если вы хотите извлечь информацию из счетов-фактур, квитанций, удостоверений личности, водительских удостоверений или визитных карточек, начните с соответствующей готовой модели:
- Обработка счетов
- Обработка чеков
- Средство чтения документов, удостоверяющих личность (паспорта и водительские удостоверения)
- Считыватель визитных карточек
Вы можете сразу же использовать эти готовые модели, не создавая новую модель. Эти модели могут извлекать общую информацию, содержащуюся в соответствующем им типе документа.
Для любого другого типа документа вы можете создать пользовательскую модель обработки документов для извлечения нужных вам полей и таблиц. То же относится и к ситуации, когда вам нужна дополнительная информация, не предоставляемая предварительно созданной моделью.
Подробнее см. в разделе Настраиваемая модель обработки документов.
В чем разница между обработкой документов AI Builder и Распознавателем документов Azure?
Обработка документов AI Builder построена на основе Распознавателя документов Azure. Это обеспечивает использование новейших разработок Майкрософт в сфере ИИ в обоих продуктах.
AI Builder является частью Microsoft Power Platform. Это позволяет любому добавлять ИИ в приложения и автоматизацию с помощью простого в использовании интерфейса. Вам не нужно быть разработчиком или специалистом по обработке и анализу данных.
Распознаватель форм Azureпредназначен для профессиональных разработчиков. Они могут использовать простые API-интерфейсы REST для добавления возможностей ИИ в свои решения с пользовательским кодом.
Варианты стоимости
Сколько стоит обработка документов AI Builder?
Вы можете бесплатно попробовать обработку документов в пробной версии. После того, как вы оцените ее, вам нужно будет купить кредиты AI Builder для использования обработки документов. Каждая страница, которую вы обрабатываете с помощью обработки документов, потребляет кредиты AI Builder, даже если страница не содержит данных для извлечения. Кредиты AI Builder можно приобрести через дополнения AI Builder.
Подробнее см. в разделе Лицензирование AI Builder.