Treinar modelos personalizados

Concluído

O serviço de Informação de Documentos do Azure é compatível com o aprendizado de máquina supervisionado. Você pode treinar modelos personalizados e criar modelos compostos com documentos de formulário e documentos JSON que contêm campos rotulados.

Captura de tela de um documento de formulário de exemplo necessário para treinamento de modelo personalizado.

Para treinar um modelo personalizado:

  1. Armazene formulários de exemplo em um contêiner de blob do Azure, juntamente com arquivos JSON contendo informações de layout e campo de rótulo.
    • Você pode gerar um arquivo ocr.json para cada formulário de exemplo usando a função de documento Analisar do Azure Document Intelligence. Além disso, você precisa de um único arquivo fields.json que descreva os campos que deseja extrair e um arquivo labels.json para cada formulário de exemplo mapeando os campos para a localização deles nesse formulário.
  2. Gere uma URL SAS (Segurança de Acesso Compartilhado) para o contêiner.
  3. Use a função de API REST Criar modelo (ou método SDK equivalente).
  4. Use a função de API REST Get model (ou método SDK equivalente) para obter o ID do modelo treinado.

OR

  1. Use o Estúdio da Informação de Documentos do Azure para rotular e treinar. Há dois tipos de modelos subjacentes para modelos personalizados de formulários personalizados ou modelos neurais personalizados.
    • Modelos personalizados extraem com precisão pares chave-valor rotulados, marcas de seleção, tabelas, regiões e assinaturas de documentos. O treinamento leva apenas alguns minutos e há suporte para mais de 100 idiomas.
    • Modelos neurais personalizados são modelos de aprendizado profundo que combinam recursos de layout e linguagem para extrair com precisão campos rotulados de documentos. Esse modelo é melhor para documentos semiestruturados ou não estruturados.