Introdução à Informação de Documentos do Azure

Concluído

Para iniciar um projeto com os serviços do Azure Document Intelligence, você precisa de um recurso do Azure e seleção de arquivos de formulário para extração de dados.

Assinar um recurso

Você pode acessar os serviços do Azure Document Intelligence por meio de:

  • Um recurso do Foundry Tools: uma chave de assinatura usada em várias Foundry Tools

OR

  • Um recurso do Azure Document Intelligence: uma chave de assinatura de serviço único (usada apenas com um serviço de IA do Azure específico)

Observação

Crie um recurso de Ferramentas Foundry se você planeja acessar várias Ferramentas Foundry em um único endpoint/chave de acesso. Somente para acesso ao Azure Document Intelligence, crie um recurso do Azure Document Intelligence. Observe que você precisa de um recurso de serviço único se pretende usar a autenticação do Microsoft Entra.

Você pode assinar um serviço no portal do Azure ou com a CLI (Interface de Linha de Comando) do Azure. Você pode saber mais sobre os comandos da CLI aqui.

Entender os requisitos de entrada do arquivo do Azure Document Intelligence

O Azure Document Intelligence funciona em documentos de entrada que atendem a esses requisitos:

  • O formato deve ser JPG, PNG, BMP, PDF (texto ou digitalizado) ou TIFF.
  • O tamanho do arquivo deve ser inferior a 500 MB para o nível pago (S0) e 4 MB para o nível gratuito (F0).
  • As dimensões da imagem devem estar entre 50 x 50 pixels e 10.000 x 10.000 pixels.
  • O tamanho total do conjunto de dados de treinamento deve ser de 500 páginas ou menos.

Mais requisitos de entrada podem ser encontrados na documentação de modelos específicos.

Decidir qual componente do Azure Document Intelligence usar

Depois de coletar seus arquivos, decida o que você precisa realizar.

Caso de uso Recursos recomendados para usar
Usar recursos do OCR para capturar a análise de documentos Use o modelo de layout, modelo de leitura ou o modelo de documento geral.
Criar um aplicativo que extraia dados de W-2s, Faturas, Recibos, Documentos de ID, Seguro de saúde, vacinação e cartões de visita Use um modelo predefinido. Esses modelos não precisam ser treinados. Os serviços do Azure Document Intelligence analisam os documentos e retornam uma saída JSON.
Criar um aplicativo para extrair dados de seus formulários específicos do setor Crie um modelo personalizado. O modelo precisa ser treinado com documentos de exemplo. Depois de treinar o modelo personalizado, ele pode analisar novos documentos e retornar uma saída JSON.