FAQ sobre o processamento de documentos
Este artigo consiste em perguntas frequentes sobre o modelo de processamento de documentos no AI Builder. Se não encontrar a sua pergunta aqui, reveja a visão geral do modelo de IA de processamento de documentos ou submeta a sua pergunta à Comunidade Power Automate para AI Builder.
Com o processamento de documentos, pode construir um modelo de IA personalizado para extrair informações de vários tipos de documentos.
- A opção Documentos de modelo fixo é ideal se os elementos dos seus documentos puderem ser encontrados em locais semelhantes. Geralmente é o caso de faturas, notas de encomenda, ordens de entrega e formulários de impostos.
- A opção Documentos gerais é ideal para qualquer tipo de documento, incluindo os suportados pela primeira opção, mas também contratos, declaração de trabalho, cartas e outros. Esta opção pode ser mais poderosa para extrair dados, mas requer um tempo de preparação mais longo.
Saber mais: Descrição geral do modelo de processamento de documentos
Os tipos de ficheiro suportados são PDF, JPG e PNG.
O processamento de documentos pode extrair campos, tabelas e caixas de verificação de documentos.
Saber mais: Definir informações a extrair
Sim. O processamento de documentos pode extrair dos seus documentos texto impresso e escrito à mão.
Para documentos de alta qualidade que utilizam o mesmo esquema, cinco documentos de exemplo devem ser suficientes. Para os documentos de baixa qualidade (por exemplo, documentos mal digitalizados), poderão ser necessários mais documentos de exemplo. Para melhorar os resultados, utilize 15 a 20 documentos de amostra.
Um modelo de processamento de formulário único pode extrair informações de documentos que têm esquemas ou modelos diferentes?
Sim. Ao utilizar a caraterística de coleções, treina um modelo de processamento de formulário único para lidar com documentos que têm esquemas diferentes.
Saber mais: Agrupar documentos por coleções
Cada formulário tem de estar num ficheiro separado. Por exemplo, se tiver um documento PDF com várias faturas nele, crie um ficheiro separado para cada fatura antes de o enviar para o modelo de processamento de documentos.
Também pode especificar páginas para o modelo de processamento de documentos processar. Desta forma, pode tirar partido da caraterística do modelo para dar a volta página a página e processar um formulário de cada vez.
Saber mais: Intervalo de página
Já preparei um modelo de processamento de documentos, mas não estou a obter resultados positivos quando se trata de dados extraídos. Como posso melhorar o modelo?
Se o seu modelo estiver a devolver maus resultados depois de o treinar, edite o modelo e forneça mais amostras para o treino. Quantas mais amostras fornecer, mais o modelo de IA aprende a extrair dados dos seus documentos.
Saber mais: Melhorar o desempenho do seu modelo de processamento de documentos
Pode processar até 360 documentos por ambiente, a cada 60 segundos.
- Pode acontecer que alguns carateres se confundam: 0 (número) e O (letra), 1 (número) e l (letra), 4 (número) e A (letra) e muito mais.
- Pode acontecer que alguns carateres acima ou próximos de outros sejam reconhecidos incorretamente: O (letra) sobre uma linha vertical torna-se num 0 (número), 5 (número) sobre uma linha torna-se num $ (cifrão americano), l_ (letra minúscula, sublinhada) torna-se num L (letra maiúscula) e muito mais.
- Pode acontecer que alguns carateres em documentos de baixa qualidade sejam reconhecidos incorretamente ou nem sejam reconhecidos.
Nos casos acima, nada pode ser feito no AI Builder para melhorar o reconhecimento. Recomendamos que melhore a qualidade e o esquema do documento de origem para resolver problemas semelhantes.
Nota
A tecnologia de OCR para detetar carateres é constantemente melhorada pela Microsoft, portanto, este tipo de problemas acontecem com menos frequência.
Pode criar até 200 coleções por modelo. No entanto, a preparação de modelos de Documentos gerais com dezenas de coleções pode levar várias horas e, em raras ocasiões, atingir o tempo limite. Se o seu modelo tiver um elevado número de coleções, espere até 24 horas para concluir a preparação do modelo.
Atualmente, não é possível criar um modelo numa solução.
Sim, documentos não estruturados, como contratos e cartas, são suportados pelo processamento de documentos através da opção Documentos gerais.
Quais são as diferenças entre o processamento de documentos, o processamento de faturas, o processamento de recibos, o leitor de documentos de identidade, o leitor de cartões de visita e o reconhecimento de texto?
Dependendo da sua situação, poderá ter de usar um modelo específico ou uma combinação deles.
Utilize o reconhecimento de texto quando pretender extrair todo o texto presente numa imagem ou num PDF. Pode então, por exemplo, procurar uma palavra-chave no texto extraído ou construir algumas regras fixas para extrair determinados itens.
Se pretender extrair informações de faturas, recibos, passaportes, cartas de condução ou cartões de visita, comece pelo modelo pré-criado correspondente:
- Processamento de faturas
- Processamento de recibos
- Leitor de documento de identidade (passaportes e cartas de condução)
- Leitor de cartões de visita
Pode utilizar estes modelos pré-criados imediatamente, sem ter de criar um novo modelo. Estes modelos podem extrair informações comuns encontradas no seu tipo de documento correspondente.
Para qualquer outro tipo de documento, pode criar um modelo de processamento de documentos personalizado para extrair os campos e tabelas de que necessita. Isto também se aplica se precisar de informações adicionais não fornecidas pelo modelo pré-construído.
Saber mais: Modelo personalizado de processamento de documentos
O processamento de documentos do AI Builder é construído em cima do Azure Form Recogniser. Isto fornece a ambos os produtos os mais recentes avanços na Microsoft AI.
AI Builder faz parte de Microsoft Power Platform. Isto permite a qualquer pessoa adicionar IA em apps e automação com uma interface fácil de usar. Não precisa de ser um programador ou cientista de dados.
O Azure Form Recogniser é direcionado para programadores profissionais. Podem utilizar API REST simples para adicionar capacidades de IA às suas soluções de código personalizadas.
Pode começar a experimentar o processamento de documentos gratuitamente iniciando uma avaliação. Depois de o avaliar, terá de comprar créditos do AI Builder para utilizar o processamento de documentos. Cada página que processa com o processamento de documentos consome créditos do AI Builder, mesmo que a página não contenha dados para extrair. Os créditos AI Builder podem ser adquiridos através de suplementos do AI Builder.
Saiba mais: licenciamento AI Builder