O que é o Azure Document Intelligence?

8 minutos

Sugestão

Consulte a guia Texto e imagens para obter mais detalhes!

O Azure Document Intelligence é um serviço de IA baseado na cloud na Microsoft Foundry que utiliza OCR e modelos de aprendizagem profunda para extrair texto, pares-chave-valor, marcas de seleção e tabelas de documentos.

O OCR captura a estrutura do documento criando caixas delimitadoras em torno de objetos detetados em uma imagem. Os locais das caixas delimitadoras são registrados como coordenadas em relação ao resto da página. O Azure Document Intelligence devolve dados de caixa delimitadora e outras informações num formato JSON estruturado que preserva as relações do documento original.

Captura de ecrã mostrando a Inteligência do Documento a analisar um documento de exemplo com campos extraídos e caixas delimitadoras.

Para construir um modelo de extração de documentos de alta precisão do zero, é necessário conhecimento em aprendizagem profunda, grandes quantidades de cálculo e longos tempos de treino. O Azure Document Intelligence fornece modelos subjacentes já treinados em milhares de exemplos de formulários, para que possa obter extração de dados de alta precisão com esforço mínimo.

Componentes do serviço de Inteligência Documental

O Azure Document Intelligence é composto por três categorias de modelos:

Modelos de análise de documentos: extrair texto, estrutura, tabelas e marcas de seleção dos documentos. O modelo de leitura extrai texto e deteta línguas, enquanto o modelo de layout adiciona extração de tabelas e estruturas. Vais explorar estes modelos em detalhe na unidade Usar modelos pré-construídos .
Modelos pré-construídos: Extrair informação de tipos comuns de documentos — como faturas, recibos, formulários fiscais, documentos de identificação e mais — sem necessidade de qualquer formação. Verá a lista completa de modelos pré-construídos disponíveis na unidade Utilizar modelos pré-construídos.
Modelos personalizados: Extraia dados de formulários específicos para o seu negócio usando os seus próprios conjuntos de dados rotulados. As opções incluem modelos de modelos personalizados (rápidos e económicos para layouts fixos), modelos neurais personalizados (maior precisão para layouts variados), modelos compostos e classificadores personalizados. Vais aprender sobre treino e uso de modelos personalizados na unidade Treinar e usar modelos personalizados.

Acesso aos Serviços de Inteligência Documental

Pode aceder ao Azure Document Intelligence de várias formas:

API REST: Chamar o serviço diretamente usando pedidos HTTP.
Bibliotecas de cliente SDKs: Use SDKs para Python, C#, Java e JavaScript.
Document Intelligence Studio: Uma ferramenta online para explorar visualmente, testar e construir soluções de Inteligência Documental.
Portal Microsoft Foundry: Integrar a Inteligência de Documentos com outras ferramentas da Foundry.

Sugestão

O exercício deste módulo foca-se no SDK em Python. Os serviços REST subjacentes podem ser usados por qualquer idioma.

Criar um recurso de Inteligência Documental

Para usar o Azure Document Intelligence, precisa de um recurso Azure. Pode utilizar qualquer uma das duas opções:

Um recurso Foundry: Uma subscrição multi-serviço que fornece acesso a múltiplos serviços de IA sob um único endpoint e chave.
Um recurso Azure Document Intelligence: Um recurso de serviço único usado apenas com Document Intelligence.

Observação

Crie um recurso Foundry se planeia aceder a múltiplas ferramentas Foundry num único endpoint e chave. Para acesso apenas à Inteligência Documental, crie um recurso dedicado à Inteligência Documental.

Requisitos de entrada

O Azure Document Intelligence funciona em documentos de entrada que atendem a estes requisitos:

O formato deve ser JPEG, PNG, BMP, PDF (texto ou digitalizado) ou TIFF. O modelo de leitura também aceita formatos de ficheiros do Microsoft Office.
O tamanho do ficheiro deve ser inferior a 500 MB para o nível padrão e 4 MB para o nível gratuito.
As dimensões da imagem têm de ser entre 50 x 50 e 10 000 x 10 000 píxeis.
Os documentos PDF devem ter dimensões inferiores a 17 x 17 polegadas (tamanho de papel A3).
Os documentos PDF não devem estar protegidos por palavra-passe.

Mais informações

Comentários

Esta página foi útil?