Modelos personalizados compostos por Document Intelligence

Artigo
10/16/2024

Importante

As versões de visualização pública do Document Intelligence fornecem acesso antecipado a recursos que estão em desenvolvimento ativo. Recursos, abordagens e processos podem mudar, antes da Disponibilidade Geral (GA), com base nos comentários dos usuários.
A versão de visualização pública das bibliotecas de cliente do Document Intelligence usa como padrão a API REST versão 2024-07-31-preview.
A versão de pré-visualização pública 2024-07-31-preview está atualmente disponível apenas nas seguintes regiões do Azure. Observe que o modelo generativo personalizado (extração de campo de documento) no AI Studio só está disponível na região Centro-Norte dos EUA:
- E.U.A. Leste
- Oeste dos EUA2
- Europa Ocidental
- Centro-Norte dos EUA

Este conteúdo aplica-se a: v4.0 (pré-visualização) | Versões anteriores: v3.1 (GA) v3.0 (GA) v2.1 (GA)

Este conteúdo aplica-se a: v3.1 (GA) | Última versão: v4.0 (pré-visualização) | Versões anteriores: v3.0 v2.1

Este conteúdo aplica-se a: v3.0 (GA) | Últimas versões: v4.0 (preview) v3.1 | Versão anterior: v2.1

Este conteúdo aplica-se a: v2.1 | Última versão: v4.0 (pré-visualização)

Importante

O model compose comportamento da operação está mudando de api-version=2024-07-31-preview. A model compose operação v4.0 e posterior adiciona um classificador explicitamente treinado em vez de um classificador implícito para análise. Para a versão anterior do modelo composto, consulte Modelos personalizados compostos v3.1. Se você estiver usando modelos compostos no momento, considere atualizar para a implementação mais recente.

O que é um modelo composto?

Com modelos compostos, você pode agrupar vários modelos personalizados em um modelo composto chamado com um único ID de modelo. Por exemplo, seu modelo composto pode incluir modelos personalizados treinados para analisar seus pedidos de compra de suprimentos, equipamentos e móveis. Em vez de tentar selecionar manualmente o modelo apropriado, você pode usar um modelo composto para determinar o modelo personalizado apropriado para cada análise e extração.

Alguns cenários exigem classificar o documento primeiro e, em seguida, analisar o documento com o modelo mais adequado para extrair os campos do modelo. Esses cenários podem incluir aqueles em que um usuário carrega um documento, mas o tipo de documento não é explicitamente conhecido. Outro cenário pode ser quando vários documentos são digitalizados juntos em um único arquivo e o arquivo é enviado para processamento. Seu aplicativo precisa identificar os documentos componentes e selecionar o melhor modelo para cada documento.

Em versões anteriores, a model compose operação executava uma classificação implícita para decidir qual modelo personalizado melhor representa o documento enviado. A 2024-07-31-preview implementação da operação substitui a classificação implícita das versões anteriores por uma etapa de model compose classificação explícita e adiciona roteamento condicional.

Benefícios do novo modelo de operação de composição

A nova model compose operação exige que você treine um classificador explícito e oferece vários benefícios.

Melhoria incremental contínua. Você pode melhorar consistentemente a qualidade do classificador adicionando mais amostras e melhorando incrementalmente a classificação. Esse ajuste fino garante que seus documentos sejam sempre encaminhados para o modelo certo para extração.
Controle total sobre o roteamento. Ao adicionar roteamento baseado em confiança, você fornece um limite de confiança para o tipo de documento e a resposta de classificação.
Ignore os tipos de documentos específicos do documento durante a operação. Implementações anteriores da operação selecionaram o model compose melhor modelo de análise para extração com base no escore de confiança, mesmo que os escores de confiança mais altos fossem relativamente baixos. Ao fornecer um limite de confiança ou não mapear explicitamente um tipo de documento conhecido da classificação para um modelo de extração, você pode ignorar tipos de documento específicos.
Analise várias instâncias do mesmo tipo de documento. Quando emparelhada com a splitMode opção do classificador, a model compose operação pode detetar várias instâncias do mesmo documento em um arquivo e dividir o arquivo para processar cada documento independentemente. O uso splitMode permite o processamento de várias instâncias de um documento em uma única solicitação.
Suporte para recursos adicionais. Recursos adicionais como campos de consulta ou códigos de barras também podem ser especificados como parte dos parâmetros do modelo de análise.
Modelo personalizado atribuído máximo expandido para 500. A nova implementação da model compose operação permite atribuir até 500 modelos personalizados treinados a um único modelo composto.

Como usar a composição do modelo

Comece coletando amostras de todos os seus documentos necessários, incluindo amostras com informações que devem ser extraídas ou ignoradas.
Treine um classificador organizando os documentos em pastas onde os nomes das pastas são o tipo de documento que você pretende usar na definição do modelo composto.
Por fim, treine um modelo de extração para cada um dos tipos de documentos que você pretende usar.
Depois que seus modelos de classificação e extração forem treinados, use o Document Intelligence Studio, bibliotecas de clientes ou a API REST para compor os modelos de classificação e extração em um modelo composto.

Use o splitMode parâmetro para controlar o comportamento de divisão de arquivos:

Nenhum. Todo o ficheiro é tratado como um único documento.
perPage. Cada página do ficheiro é tratada como um documento separado.
automático. O ficheiro é automaticamente dividido em documentos.

Faturação e preços

Os modelos compostos são cobrados da mesma forma que os modelos personalizados individuais. O preço é baseado no número de páginas analisadas pelo modelo de análise a jusante. O faturamento é baseado no preço de extração das páginas roteadas para um modelo de extração. Com a adição da classificação explícita, são incorridos encargos para a classificação de todas as páginas no ficheiro de entrada. Para obter mais informações, consulte a página de preços do Document Intelligence.

Usar a operação de composição do modelo

Comece criando uma lista de todos os IDs de modelo que você deseja compor em um único modelo.
Componha os modelos em um único ID de modelo usando o Studio, a API REST ou as bibliotecas de cliente.
Use o ID do modelo composto para analisar documentos.

Faturação

Os modelos compostos são cobrados da mesma forma que os modelos personalizados individuais. O preço é baseado no número de páginas analisadas. O faturamento é baseado no preço de extração das páginas roteadas para um modelo de extração. Para obter mais informações, consulte a página de preços do Document Intelligence.

Não há alteração no preço para analisar um documento usando um modelo personalizado individual ou um modelo personalizado composto.

Características dos modelos compostos

Custom template e custom neural os modelos podem ser compostos juntos em um único modelo composto em várias versões de API.
A resposta inclui uma docType propriedade para indicar qual dos modelos compostos foi usado para analisar o documento.
Para custom template modelos, o modelo composto pode ser criado usando variações de um modelo personalizado ou diferentes tipos de formulário. Esta operação é útil quando os formulários de entrada pertencem a um dos vários modelos.
Para custom neural modelos, a prática recomendada é adicionar todas as diferentes variações de um único tipo de documento em um único conjunto de dados de treinamento e treinar em modelo neural personalizado. A model compose operação é mais adequada para cenários em que você tem documentos de diferentes tipos sendo enviados para análise.

Limites do modelo de composição

Com a model compose operação, você pode atribuir até 500 modelos a um único ID de modelo. Se o número de modelos que quero compor exceder o limite superior de um modelo composto, você pode usar uma destas alternativas:
- Classifique os documentos antes de chamar o modelo personalizado. Você pode usar o modelo Read e criar uma classificação com base no texto extraído dos documentos e determinadas frases usando fontes como código, expressões regulares ou pesquisa.
- Se você quiser extrair os mesmos campos de vários documentos estruturados, semiestruturados e não estruturados, considere usar o modelo neural personalizado de aprendizado profundo. Saiba mais sobre as diferenças entre o modelo de modelo personalizado e o modelo neural personalizado.
Analisar um documento usando modelos compostos é idêntico a analisar um documento usando um único modelo. O Analyze Document resultado retorna uma docType propriedade que indica qual dos modelos de componente você selecionou para analisar o documento.
Atualmente, a model compose operação está disponível apenas para modelos personalizados treinados com etiquetas.

Compatibilidade de modelos compostos

Tipo de modelo personalizado	Modelos treinados com v2.1 e v2.0	Modelo personalizado e modelos neurais v3.1 e v3.0	Modelo personalizado e visualização de modelos neurais v4.0	Modelos generativos personalizados v4.0 preview
Modelos treinados com versões 2.1 e v2.0	Não suportado	Não suportado	Não suportado	Não suportado
Modelo personalizado e modelos neurais v3.0 e v3.1	Não suportado	Suportado	Suportado	Não suportado
Modelo personalizado e visualização de modelos neurais v4.0	Não suportado	Suportado	Suportado	Não suportado
Modelos generativos personalizados v4.0 preview	Não suportado	Não suportado	Não suportado	Não suportado

Para compor um modelo treinado com uma versão anterior da API (v2.1 ou anterior), treine um modelo com a API v3.0 usando o mesmo conjunto de dados rotulado. Essa adição garante que o modelo v2.1 possa ser composto com outros modelos.
Com modelos compostos usando v2.1 da API continua a ser suportado, não exigindo atualizações.

Opções de desenvolvimento

O Document Intelligence v4.0:2024-07-31-preview suporta as seguintes ferramentas, aplicações e bibliotecas:

Caraterística	Recursos
Modelo personalizado	• Document Intelligence Studio • API REST • C# SDK • Java SDK • JavaScript SDK • Python SDK
Modelo composto	• Document Intelligence Studio • API REST • C# SDK • Java SDK • JavaScript SDK • Python SDK

O Document Intelligence v3.1:2023-07-31 (GA) suporta as seguintes ferramentas, aplicações e bibliotecas:

Caraterística	Recursos
Modelo personalizado	• Document Intelligence Studio • API REST • C# SDK • Java SDK • JavaScript SDK • Python SDK
Modelo composto	• Document Intelligence Studio • API REST • C# SDK • Java SDK • JavaScript SDK • Python SDK

O Document Intelligence v3.0:2022-08-31 (GA) suporta as seguintes ferramentas, aplicações e bibliotecas:

Caraterística	Recursos
Modelo personalizado	• Document Intelligence Studio • API REST • C# SDK • Java SDK • JavaScript SDK • Python SDK
Modelo composto	• Document Intelligence Studio • API REST • C# SDK • Java SDK • JavaScript SDK • Python SDK

O Document Intelligence v2.1 suporta os seguintes recursos:

Caraterística	Recursos
Modelo personalizado	• Ferramenta de etiquetagem de Inteligência Documental• API REST • SDK da biblioteca do cliente• Contêiner Docker de Inteligência Documental
Modelo composto	• Ferramenta de etiquetagem de inteligência documental• API REST • C# SDK • Java SDK • JavaScript SDK • Python SDK

Próximos passos

Aprenda a criar e compor modelos personalizados:

Criar um modelopersonalizado Compor modelos personalizados

Partilhar via