Partilhar via


FAQ sobre o processamento de documentos

Este artigo consiste em perguntas frequentes sobre o modelo de processamento de documentos no AI Builder. Se não encontrar a sua pergunta aqui, reveja Descrição geral do modelo de IA de processamento de documentos ou submeta a sua pergunta à Comunidade Power Automate para AI Builder.

Caraterística

O que posso fazer com o processamento de documentos?

Com o processamento de documentos, pode construir um modelo de IA personalizado para extrair informações de vários tipos de documentos.

  • A opção Documentos de modelo fixo é ideal se os elementos dos seus documentos puderem ser encontrados em locais semelhantes. Geralmente é o caso de faturas, notas de encomenda, ordens de entrega e formulários de impostos.
  • A opção Documentos gerais é ideal para qualquer tipo de documento, incluindo os suportados pela primeira opção, mas também contratos, declaração de trabalho, cartas e outros. Esta opção pode ser mais poderosa para extrair dados, mas requer um tempo de preparação mais longo.

Mais informações em Descrição geral do modelo de processamento de documentos.

Que tipos de documentos é que o processamento de documentos pode processar?

Os tipos de ficheiro suportados são PDF, JPG e PNG.

Que dados posso extrair de documentos utilizando o processamento de documentos?

O processamento de documentos pode extrair campos, tabelas e caixas de verificação de documentos.

Mais informações em Definir informações a extrair.

Posso extrair texto manuscrito de documentos?

Sim. O processamento de documentos pode extrair dos seus documentos texto impresso e escrito à mão.

De quantas amostras preciso para prepara um modelo de processamento de documentos?

Para documentos de alta qualidade que utilizam o mesmo esquema, cinco documentos de exemplo devem ser suficientes. Para os documentos de baixa qualidade (por exemplo, documentos mal digitalizados), poderão ser necessários mais documentos de amostra. Para melhorar os resultados, utilize 15 a 20 documentos de amostra.

Melhores práticas

  • Para documentos de modelo

    • Um (1) esquema por coleção.
    • O esquema tem de ser idêntico dentro da mesma coleção.
    • Um mínimo de cinco (5) e um máximo de 20 documentos por coleção (não exceda este limite).
  • Para documentos gerais

    • Crie um único modelo para todas as variações de um tipo de documento, incluindo documentos estruturados e não estruturados.

    • Etiquete campos relevantes para os seus valores para melhor precisão da extração.

      Por exemplo, use "supplier_id" para um ID de fornecedor. Os nomes dos campos devem corresponder ao idioma do documento.

    • Um mínimo de cinco (5) e um máximo de 20 documentos por coleção (não exceda este limite).

O meu modelo está atualmente publicado na v3.1 (Disponibilidade Geral) e estou a planear prepará-lo novamente usando a v4.0 (Disponibilidade Geral). É necessário voltar a etiquetar todos os meus documentos?

A menos que esteja a adicionar novos campos, caixas de seleção, tabelas, assinaturas para extração de dados ou novos documentos à coleção, não precisa de etiquetar novamente todos os documentos.

Posso mudar de um tipo de documento para outro?

Sim, quando editar o seu modelo, pode alternar entre um tipo de documento de modelo fixo e um tipo de documento geral. No entanto, esta mudança não é suportada para faturas.

Um modelo de processamento de formulário único pode extrair informações de documentos que têm esquemas ou modelos diferentes?

Sim. Ao utilizar a caraterística de coleções, treina um modelo de processamento de formulário único para lidar com documentos que têm esquemas diferentes.

Mais informações em Agrupar documentos por coleções.

O processamento de documentos pode processar múltiplos formulários num único documento?

Cada formulário tem de estar num ficheiro separado. Por exemplo, se tiver um documento PDF com várias faturas nele, crie um ficheiro separado para cada fatura antes de o enviar para o modelo de processamento de documentos.

Também pode especificar páginas para o modelo de processamento de documentos processar. Desta forma, pode tirar partido da caraterística do modelo para dar a volta página a página e processar um formulário de cada vez.

Mais informações em Intervalo de páginas.

Já preparei um modelo de processamento de documentos, mas não estou a obter resultados positivos quando se trata de dados extraídos. Como posso melhorar o modelo?

Se o seu modelo estiver a devolver maus resultados depois de o treinar, edite o modelo e forneça mais amostras para o treino. Quantas mais amostras fornecer, mais o modelo de IA aprende a extrair dados dos seus documentos.

Mais informações em Melhorar o desempenho do seu modelo de processamento de documentos.

Limitações

Qual é o número máximo de documentos que posso processar?

Pode processar até 360 documentos por ambiente, a cada 60 segundos.

Porque é que alguns carateres são reconhecidos incorretamente?

  • Pode acontecer que alguns carateres se confundam: 0 (número) e O (letra), 1 (número) e l (letra), 4 (número) e A (letra) e muito mais.
  • Pode acontecer que alguns carateres acima ou próximos de outros sejam reconhecidos incorretamente: O (letra) sobre uma linha vertical torna-se num 0 (número), 5 (número) sobre uma linha torna-se num $ (cifrão americano), l_ (letra minúscula, sublinhada) torna-se num L (letra maiúscula) e muito mais.
  • Pode acontecer que alguns carateres em documentos de baixa qualidade sejam reconhecidos incorretamente ou nem sejam reconhecidos.

Nos casos anteriores, nada podia ser feito no AI Builder para melhorar o reconhecimento. Recomendamos que melhore a qualidade e o esquema do documento de origem para resolver problemas semelhantes.

Nota

A Microsoft melhora constantemente a tecnologia de reconhecimento ótico de carateres (OCR) para detetar carateres, para que este tipo de problemas aconteçam com menos frequência.

Posso criar um modelo com muitas coleções?

Pode criar até 200 coleções por modelo. No entanto, a preparação de modelos de Documentos gerais com dezenas de coleções pode levar várias horas e, em raras ocasiões, atingir o tempo limite. Se o seu modelo tiver um elevado número de coleções, espere até 24 horas para concluir a preparação do modelo.

Posso criar um modelo numa solução?

Atualmente, não é possível criar um modelo numa solução.

Posso utilizar contratos e cartas no modelo de processamento de documentos?

Sim, documentos não estruturados, como contratos e cartas, são suportados pelo processamento de documentos através da opção Documentos gerais.

Comparações

Quais são as diferenças entre o processamento de documentos, o processamento de faturas, o processamento de recibos, o leitor de documentos de identidade, o leitor de cartões de visita e o reconhecimento de texto?

Dependendo da sua situação, poderá ter de usar um modelo específico ou uma combinação deles.

Utilize o reconhecimento de texto quando pretender extrair todo o texto presente numa imagem ou num PDF. Pode então, por exemplo, procurar uma palavra-chave no texto extraído ou construir algumas regras fixas para extrair determinados itens.

Se pretender extrair informações de faturas, recibos, passaportes, cartas de condução ou cartões de visita, comece pelo modelo pré-criado correspondente:

Pode utilizar estes modelos pré-criados imediatamente, sem ter de criar um novo modelo. Estes modelos podem extrair informações comuns encontradas no seu tipo de documento correspondente.

Para qualquer outro tipo de documento, pode criar um modelo de processamento de documentos personalizado para extrair os campos e tabelas de que necessita. Isto também se aplica se precisar de informações adicionais não fornecidas pelo modelo pré-construído.

Mais informações em Modelo personalizado de processamento de documentos.

Qual é a diferença entre o processamento de documentos do AI Builder e o Azure Form Recogniser?

O processamento de documentos do AI Builder é construído em cima do Azure Form Recogniser. Isto fornece a ambos os produtos os mais recentes avanços na Microsoft AI.

  • AI Builder faz parte de Microsoft Power Platform. Isto permite a qualquer pessoa adicionar IA em apps e automação com uma interface fácil de usar. Não precisas de ser um programador ou cientista de dados.

  • O Azure Form Recogniser é direcionado para programadores profissionais. Podem utilizar API REST simples para adicionar capacidades de IA às suas soluções de código personalizadas.

Opções de custo

Quanto custa o processamento de documentos do AI Builder?

Pode começar a experimentar o processamento de documentos gratuitamente iniciando uma avaliação. Depois de o avaliar, terá de comprar créditos do AI Builder para utilizar o processamento de documentos. Cada página que processa com o processamento de documentos consome créditos do AI Builder, mesmo que a página não contenha dados para extrair. Os créditos AI Builder podem ser adquiridos através de suplementos do AI Builder.

Mais informações em Licenciamento do AI Builder.