Partilhar via


Modelos personalizados compostos por Document Intelligence

Importante

  • As versões de visualização pública do Document Intelligence fornecem acesso antecipado a recursos que estão em desenvolvimento ativo. Recursos, abordagens e processos podem mudar, antes da Disponibilidade Geral (GA), com base nos comentários dos usuários.
  • A versão de visualização pública das bibliotecas de cliente do Document Intelligence usa como padrão a API REST versão 2024-07-31-preview.
  • A versão de pré-visualização pública 2024-07-31-preview está atualmente disponível apenas nas seguintes regiões do Azure. Observe que o modelo generativo personalizado (extração de campo de documento) no AI Studio só está disponível na região Centro-Norte dos EUA:
    • E.U.A. Leste
    • Oeste dos EUA2
    • Europa Ocidental
    • Centro-Norte dos EUA

Este conteúdo aplica-se a: marca de verificação v4.0 (pré-visualização) | Versões anteriores: Marca de verificação azul v3.1 (GA) Marca de verificação azul v3.0 (GA) Marca de verificação azul v2.1 (GA)

Este conteúdo aplica-se a: marca de verificação v3.1 (GA) | Última versão:marca de verificação roxa v4.0 (pré-visualização) | Versões anteriores: Marca de verificação azul v3.0Marca de verificação azul v2.1

Este conteúdo aplica-se a: marca de verificação v3.0 (GA) | Últimas versões: marca de verificação roxa v4.0 (preview) marca de verificação roxav3.1 | Versão anterior: Marca de verificação azul v2.1

Este conteúdo aplica-se a: marca de verificação v2.1 | Última versão: Marca de verificação azul v4.0 (pré-visualização)

Importante

O model compose comportamento da operação está mudando de api-version=2024-07-31-preview. A model compose operação v4.0 e posterior adiciona um classificador explicitamente treinado em vez de um classificador implícito para análise. Para a versão anterior do modelo composto, consulte Modelos personalizados compostos v3.1. Se você estiver usando modelos compostos no momento, considere atualizar para a implementação mais recente.

O que é um modelo composto?

Com modelos compostos, você pode agrupar vários modelos personalizados em um modelo composto chamado com um único ID de modelo. Por exemplo, seu modelo composto pode incluir modelos personalizados treinados para analisar seus pedidos de compra de suprimentos, equipamentos e móveis. Em vez de tentar selecionar manualmente o modelo apropriado, você pode usar um modelo composto para determinar o modelo personalizado apropriado para cada análise e extração.

Alguns cenários exigem classificar o documento primeiro e, em seguida, analisar o documento com o modelo mais adequado para extrair os campos do modelo. Esses cenários podem incluir aqueles em que um usuário carrega um documento, mas o tipo de documento não é explicitamente conhecido. Outro cenário pode ser quando vários documentos são digitalizados juntos em um único arquivo e o arquivo é enviado para processamento. Seu aplicativo precisa identificar os documentos componentes e selecionar o melhor modelo para cada documento.

Em versões anteriores, a model compose operação executava uma classificação implícita para decidir qual modelo personalizado melhor representa o documento enviado. A 2024-07-31-preview implementação da operação substitui a classificação implícita das versões anteriores por uma etapa de model compose classificação explícita e adiciona roteamento condicional.

Benefícios do novo modelo de operação de composição

A nova model compose operação exige que você treine um classificador explícito e oferece vários benefícios.

  • Melhoria incremental contínua. Você pode melhorar consistentemente a qualidade do classificador adicionando mais amostras e melhorando incrementalmente a classificação. Esse ajuste fino garante que seus documentos sejam sempre encaminhados para o modelo certo para extração.

  • Controle total sobre o roteamento. Ao adicionar roteamento baseado em confiança, você fornece um limite de confiança para o tipo de documento e a resposta de classificação.

  • Ignore os tipos de documentos específicos do documento durante a operação. Implementações anteriores da operação selecionaram o model compose melhor modelo de análise para extração com base no escore de confiança, mesmo que os escores de confiança mais altos fossem relativamente baixos. Ao fornecer um limite de confiança ou não mapear explicitamente um tipo de documento conhecido da classificação para um modelo de extração, você pode ignorar tipos de documento específicos.

  • Analise várias instâncias do mesmo tipo de documento. Quando emparelhada com a splitMode opção do classificador, a model compose operação pode detetar várias instâncias do mesmo documento em um arquivo e dividir o arquivo para processar cada documento independentemente. O uso splitMode permite o processamento de várias instâncias de um documento em uma única solicitação.

  • Suporte para recursos adicionais. Recursos adicionais como campos de consulta ou códigos de barras também podem ser especificados como parte dos parâmetros do modelo de análise.

  • Modelo personalizado atribuído máximo expandido para 500. A nova implementação da model compose operação permite atribuir até 500 modelos personalizados treinados a um único modelo composto.

Como usar a composição do modelo

  • Comece coletando amostras de todos os seus documentos necessários, incluindo amostras com informações que devem ser extraídas ou ignoradas.

  • Treine um classificador organizando os documentos em pastas onde os nomes das pastas são o tipo de documento que você pretende usar na definição do modelo composto.

  • Por fim, treine um modelo de extração para cada um dos tipos de documentos que você pretende usar.

  • Depois que seus modelos de classificação e extração forem treinados, use o Document Intelligence Studio, bibliotecas de clientes ou a API REST para compor os modelos de classificação e extração em um modelo composto.

Use o splitMode parâmetro para controlar o comportamento de divisão de arquivos:

  • Nenhum. Todo o ficheiro é tratado como um único documento.
  • perPage. Cada página do ficheiro é tratada como um documento separado.
  • automático. O ficheiro é automaticamente dividido em documentos.

Faturação e preços

Os modelos compostos são cobrados da mesma forma que os modelos personalizados individuais. O preço é baseado no número de páginas analisadas pelo modelo de análise a jusante. O faturamento é baseado no preço de extração das páginas roteadas para um modelo de extração. Com a adição da classificação explícita, são incorridos encargos para a classificação de todas as páginas no ficheiro de entrada. Para obter mais informações, consulte a página de preços do Document Intelligence.

Usar composição de modelo

  • Comece criando uma lista de todos os IDs de modelo que você deseja compor em um único modelo.

  • Componha os modelos em um único ID de modelo usando o Studio, a API REST ou as bibliotecas de cliente.

  • Use o ID do modelo composto para analisar documentos.

Faturação

Os modelos compostos são cobrados da mesma forma que os modelos personalizados individuais. O preço é baseado no número de páginas analisadas. O faturamento é baseado no preço de extração das páginas roteadas para um modelo de extração. Para obter mais informações, consulte a página de preços do Document Intelligence.

  • Não há alteração no preço para analisar um documento usando um modelo personalizado individual ou um modelo personalizado composto.

Características dos modelos compostos

  • Custom template e custom neural os modelos podem ser compostos juntos em um único modelo composto em várias versões de API.

  • A resposta inclui uma docType propriedade para indicar qual dos modelos compostos foi usado para analisar o documento.

  • Para custom template modelos, o modelo composto pode ser criado usando variações de um modelo personalizado ou diferentes tipos de formulário. Esta operação é útil quando os formulários de entrada pertencem a um dos vários modelos.

  • Para custom neural modelos, a prática recomendada é adicionar todas as diferentes variações de um único tipo de documento em um único conjunto de dados de treinamento e treinar em modelo neural personalizado. A model compose operação é mais adequada para cenários em que você tem documentos de diferentes tipos sendo enviados para análise.

Limites do modelo de composição

  • Com a model compose operação, você pode atribuir até 500 modelos a um único ID de modelo. Se o número de modelos que quero compor exceder o limite superior de um modelo composto, você pode usar uma destas alternativas:

    • Classifique os documentos antes de chamar o modelo personalizado. Você pode usar o modelo Read e criar uma classificação com base no texto extraído dos documentos e determinadas frases usando fontes como código, expressões regulares ou pesquisa.

    • Se você quiser extrair os mesmos campos de vários documentos estruturados, semiestruturados e não estruturados, considere usar o modelo neural personalizado de aprendizado profundo. Saiba mais sobre as diferenças entre o modelo de modelo personalizado e o modelo neural personalizado.

  • Analisar um documento usando modelos compostos é idêntico a analisar um documento usando um único modelo. O Analyze Document resultado retorna uma docType propriedade que indica qual dos modelos de componente você selecionou para analisar o documento.

  • Atualmente, a model compose operação está disponível apenas para modelos personalizados treinados com etiquetas.

Compatibilidade de modelos compostos

Tipo de modelo personalizado Modelos treinados com v2.1 e v2.0 Modelo personalizado e modelos neurais v3.1 e v3.0 Modelo personalizado e visualização de modelos neurais v4.0 Modelos generativos personalizados v4.0 preview
Modelos treinados com versões 2.1 e v2.0 Não suportado Não suportado Não suportado Não suportado
Modelo personalizado e modelos neurais v3.0 e v3.1 Não suportado Suportado Suportado Não suportado
Modelo personalizado e visualização de modelos neurais v4.0 Não suportado Suportado Suportado Não suportado
Modelos generativos personalizados v4.0 preview Não suportado Não suportado Não suportado Não suportado
  • Para compor um modelo treinado com uma versão anterior da API (v2.1 ou anterior), treine um modelo com a API v3.0 usando o mesmo conjunto de dados rotulado. Essa adição garante que o modelo v2.1 possa ser composto com outros modelos.

  • Com modelos compostos usando v2.1 da API continua a ser suportado, não exigindo atualizações.

Opções de desenvolvimento

O Document Intelligence v4.0:2024-07-31-preview suporta as seguintes ferramentas, aplicações e bibliotecas:

Caraterística Recursos
Modelo personalizado • Document Intelligence Studio
API REST
C# SDK
Java SDK
JavaScript SDK
Python SDK
Modelo composto • Document Intelligence Studio
API REST
C# SDK
Java SDK
JavaScript SDK
Python SDK

O Document Intelligence v3.1:2023-07-31 (GA) suporta as seguintes ferramentas, aplicações e bibliotecas:

Caraterística Recursos
Modelo personalizado • Document Intelligence Studio
API REST
C# SDK
Java SDK
JavaScript SDK
Python SDK
Modelo composto • Document Intelligence Studio
API REST
C# SDK
Java SDK
JavaScript SDK
Python SDK

O Document Intelligence v3.0:2022-08-31 (GA) suporta as seguintes ferramentas, aplicações e bibliotecas:

Caraterística Recursos
Modelo personalizado • Document Intelligence Studio
API REST
C# SDK
Java SDK
JavaScript SDK
Python SDK
Modelo composto • Document Intelligence Studio
API REST
C# SDK
Java SDK
JavaScript SDK
Python SDK

O Document Intelligence v2.1 suporta os seguintes recursos:

Caraterística Recursos
Modelo personalizado • Ferramenta
de etiquetagem de Inteligência Documental• API REST
SDK
da biblioteca do cliente• Contêiner Docker de Inteligência Documental
Modelo composto • Ferramenta
de etiquetagem de inteligência documental• API REST
C# SDK
Java SDK
• JavaScript SDK
Python SDK

Próximos passos

Aprenda a criar e compor modelos personalizados: