O que é a IA do Azure para Informação de Documentos?

Concluído

O Azure Document Intelligence é uma das muitas Ferramentas de Foundry, serviços de inteligência artificial (IA) baseados em nuvem com APIs REST e SDKs de bibliotecas de cliente que podem ser usados para adicionar inteligência aos seus aplicativos.

A Informação de Documentos do Azure usa funcionalidades de OCR (reconhecimento óptico de caracteres) e modelos de aprendizado profundo para extrair texto, pares chave-valor, marcas de seleção e tabelas de documentos.

Captura de tela de como o OCR funciona.

O OCR captura a estrutura do documento criando caixas delimitadoras em torno dos objetos detectados em uma imagem. As localizações das caixas delimitadores são registradas como coordenadas em relação ao restante da página. Os serviços da Informação de Documentos do Azure retornam dados da caixa delimitadora e outras informações em um formulário estruturado com as relações do arquivo original.

Captura de tela de um exemplo de saída JSON.

Para criar um modelo de alta precisão do zero, as pessoas precisam criar modelos de aprendizado profundo, usar uma grande quantidade de recursos de computação e enfrentar longos tempos de treinamento de modelo. Esses fatores podem inviabilizar um projeto. A Informação de Documentos do Azure fornece modelos subjacentes que foram treinados com milhares de exemplos de formulário. Os modelos subjacentes permitem que você faça a extração de dados de alta precisão dos seus formulários com pouco ou nenhum treinamento de modelo.

Componentes da Informação de Documentos do Azure

A Informação de Documentos do Azure é composta pelos seguintes serviços:

  • Modelos de análise de documentos: recebem uma entrada de arquivos JPEG, PNG, PDF e TIFF e retornam um arquivo JSON com a localização do texto em caixas delimitadoras, conteúdo de texto, tabelas, marcas de seleção (também conhecidas como caixas de seleção ou botões de opção) e estrutura do documento.

  • Modelos predefinidos: detectam e extraem informações de imagens de documentos e retornam os dados extraídos em uma saída JSON estruturada. Atualmente, a Informação de Documentos do Azure oferece suporte a modelos predefinidos para vários formulários, incluindo:

    • Formulários W-2
    • Faturas
    • Recibos
    • Documentos de ID
    • Cartões de visita
  • Modelos personalizados: extraem dados de formulários específicos para seus negócios. Modelos personalizados podem ser treinados por meio do Estúdio da Informação de Documentos do Azure.

Observação

Alguns recursos da Informação de Documentos do Azure estão em versão prévia no momento da criação deste conteúdo e, como resultado, os recursos e os detalhes de uso podem ter alterações. Veja a página oficial para obter informações atualizadas.

Acessar serviços

Você pode acessar os serviços de Informação de Documentos do Azure de várias maneiras. Essas opções incluem o uso de:

  • Uma API REST
  • SDKs da biblioteca de clientes
  • Estúdio de Informação de Documentos do Azure
  • Microsoft Foundry

Dica

O exercício deste módulo tem como foco os SDKs do Python e do .NET. Os serviços REST subjacentes podem ser usados por qualquer linguagem.

Confira a documentação para obter guias de início rápido da API REST e de todos os SDKs disponíveis.