Introdução à Informação de Documentos do Azure
Para iniciar um projeto com os serviços do Azure Document Intelligence, você precisa de um recurso do Azure e seleção de arquivos de formulário para extração de dados.
Assinar um recurso
Você pode acessar os serviços do Azure Document Intelligence por meio de:
- Um recurso do Foundry Tools: uma chave de assinatura usada em várias Foundry Tools
OR
- Um recurso do Azure Document Intelligence: uma chave de assinatura de serviço único (usada apenas com um serviço de IA do Azure específico)
Observação
Crie um recurso de Ferramentas Foundry se você planeja acessar várias Ferramentas Foundry em um único endpoint/chave de acesso. Somente para acesso ao Azure Document Intelligence, crie um recurso do Azure Document Intelligence. Observe que você precisa de um recurso de serviço único se pretende usar a autenticação do Microsoft Entra.
Você pode assinar um serviço no portal do Azure ou com a CLI (Interface de Linha de Comando) do Azure. Você pode saber mais sobre os comandos da CLI aqui.
Entender os requisitos de entrada do arquivo do Azure Document Intelligence
O Azure Document Intelligence funciona em documentos de entrada que atendem a esses requisitos:
- O formato deve ser JPG, PNG, BMP, PDF (texto ou digitalizado) ou TIFF.
- O tamanho do arquivo deve ser inferior a 500 MB para o nível pago (S0) e 4 MB para o nível gratuito (F0).
- As dimensões da imagem devem estar entre 50 x 50 pixels e 10.000 x 10.000 pixels.
- O tamanho total do conjunto de dados de treinamento deve ser de 500 páginas ou menos.
Mais requisitos de entrada podem ser encontrados na documentação de modelos específicos.
Decidir qual componente do Azure Document Intelligence usar
Depois de coletar seus arquivos, decida o que você precisa realizar.
| Caso de uso | Recursos recomendados para usar |
|---|---|
| Usar recursos do OCR para capturar a análise de documentos | Use o modelo de layout, modelo de leitura ou o modelo de documento geral. |
| Criar um aplicativo que extraia dados de W-2s, Faturas, Recibos, Documentos de ID, Seguro de saúde, vacinação e cartões de visita | Use um modelo predefinido. Esses modelos não precisam ser treinados. Os serviços do Azure Document Intelligence analisam os documentos e retornam uma saída JSON. |
| Criar um aplicativo para extrair dados de seus formulários específicos do setor | Crie um modelo personalizado. O modelo precisa ser treinado com documentos de exemplo. Depois de treinar o modelo personalizado, ele pode analisar novos documentos e retornar uma saída JSON. |