Modelos personalizados compostos por Document Intelligence
Importante
- As versões de visualização pública do Document Intelligence fornecem acesso antecipado a recursos que estão em desenvolvimento ativo. Recursos, abordagens e processos podem mudar, antes da Disponibilidade Geral (GA), com base nos comentários dos usuários.
- A versão de visualização pública das bibliotecas de cliente do Document Intelligence usa como padrão a API REST versão 2024-07-31-preview.
- A versão de pré-visualização pública 2024-07-31-preview está atualmente disponível apenas nas seguintes regiões do Azure. Observe que o modelo generativo personalizado (extração de campo de documento) no AI Studio só está disponível na região Centro-Norte dos EUA:
- E.U.A. Leste
- Oeste dos EUA2
- Europa Ocidental
- Centro-Norte dos EUA
Este conteúdo aplica-se a: v4.0 (pré-visualização) | Versões anteriores: v3.1 (GA) v3.0 (GA) v2.1 (GA)
Este conteúdo aplica-se a: v3.1 (GA) | Última versão: v4.0 (pré-visualização) | Versões anteriores: v3.0 v2.1
Este conteúdo aplica-se a: v3.0 (GA) | Últimas versões: v4.0 (preview) v3.1 | Versão anterior: v2.1
Este conteúdo aplica-se a: v2.1 | Última versão: v4.0 (pré-visualização)
Importante
O model compose
comportamento da operação está mudando de api-version=2024-07-31-preview. A model compose
operação v4.0 e posterior adiciona um classificador explicitamente treinado em vez de um classificador implícito para análise. Para a versão anterior do modelo composto, consulte Modelos personalizados compostos v3.1. Se você estiver usando modelos compostos no momento, considere atualizar para a implementação mais recente.
O que é um modelo composto?
Com modelos compostos, você pode agrupar vários modelos personalizados em um modelo composto chamado com um único ID de modelo. Por exemplo, seu modelo composto pode incluir modelos personalizados treinados para analisar seus pedidos de compra de suprimentos, equipamentos e móveis. Em vez de tentar selecionar manualmente o modelo apropriado, você pode usar um modelo composto para determinar o modelo personalizado apropriado para cada análise e extração.
Alguns cenários exigem classificar o documento primeiro e, em seguida, analisar o documento com o modelo mais adequado para extrair os campos do modelo. Esses cenários podem incluir aqueles em que um usuário carrega um documento, mas o tipo de documento não é explicitamente conhecido. Outro cenário pode ser quando vários documentos são digitalizados juntos em um único arquivo e o arquivo é enviado para processamento. Seu aplicativo precisa identificar os documentos componentes e selecionar o melhor modelo para cada documento.
Em versões anteriores, a model compose
operação executava uma classificação implícita para decidir qual modelo personalizado melhor representa o documento enviado. A 2024-07-31-preview
implementação da operação substitui a classificação implícita das versões anteriores por uma etapa de model compose
classificação explícita e adiciona roteamento condicional.
Benefícios do novo modelo de operação de composição
A nova model compose
operação exige que você treine um classificador explícito e oferece vários benefícios.
Melhoria incremental contínua. Você pode melhorar consistentemente a qualidade do classificador adicionando mais amostras e melhorando incrementalmente a classificação. Esse ajuste fino garante que seus documentos sejam sempre encaminhados para o modelo certo para extração.
Controle total sobre o roteamento. Ao adicionar roteamento baseado em confiança, você fornece um limite de confiança para o tipo de documento e a resposta de classificação.
Ignore os tipos de documentos específicos do documento durante a operação. Implementações anteriores da operação selecionaram o
model compose
melhor modelo de análise para extração com base no escore de confiança, mesmo que os escores de confiança mais altos fossem relativamente baixos. Ao fornecer um limite de confiança ou não mapear explicitamente um tipo de documento conhecido da classificação para um modelo de extração, você pode ignorar tipos de documento específicos.Analise várias instâncias do mesmo tipo de documento. Quando emparelhada com a
splitMode
opção do classificador, amodel compose
operação pode detetar várias instâncias do mesmo documento em um arquivo e dividir o arquivo para processar cada documento independentemente. O usosplitMode
permite o processamento de várias instâncias de um documento em uma única solicitação.Suporte para recursos adicionais. Recursos adicionais como campos de consulta ou códigos de barras também podem ser especificados como parte dos parâmetros do modelo de análise.
Modelo personalizado atribuído máximo expandido para 500. A nova implementação da
model compose
operação permite atribuir até 500 modelos personalizados treinados a um único modelo composto.
Como usar a composição do modelo
Comece coletando amostras de todos os seus documentos necessários, incluindo amostras com informações que devem ser extraídas ou ignoradas.
Treine um classificador organizando os documentos em pastas onde os nomes das pastas são o tipo de documento que você pretende usar na definição do modelo composto.
Por fim, treine um modelo de extração para cada um dos tipos de documentos que você pretende usar.
Depois que seus modelos de classificação e extração forem treinados, use o Document Intelligence Studio, bibliotecas de clientes ou a API REST para compor os modelos de classificação e extração em um modelo composto.
Use o splitMode
parâmetro para controlar o comportamento de divisão de arquivos:
- Nenhum. Todo o ficheiro é tratado como um único documento.
- perPage. Cada página do ficheiro é tratada como um documento separado.
- automático. O ficheiro é automaticamente dividido em documentos.
Faturação e preços
Os modelos compostos são cobrados da mesma forma que os modelos personalizados individuais. O preço é baseado no número de páginas analisadas pelo modelo de análise a jusante. O faturamento é baseado no preço de extração das páginas roteadas para um modelo de extração. Com a adição da classificação explícita, são incorridos encargos para a classificação de todas as páginas no ficheiro de entrada. Para obter mais informações, consulte a página de preços do Document Intelligence.
Usar a operação de composição do modelo
Comece criando uma lista de todos os IDs de modelo que você deseja compor em um único modelo.
Componha os modelos em um único ID de modelo usando o Studio, a API REST ou as bibliotecas de cliente.
Use o ID do modelo composto para analisar documentos.
Faturação
Os modelos compostos são cobrados da mesma forma que os modelos personalizados individuais. O preço é baseado no número de páginas analisadas. O faturamento é baseado no preço de extração das páginas roteadas para um modelo de extração. Para obter mais informações, consulte a página de preços do Document Intelligence.
- Não há alteração no preço para analisar um documento usando um modelo personalizado individual ou um modelo personalizado composto.
Características dos modelos compostos
Custom template
ecustom neural
os modelos podem ser compostos juntos em um único modelo composto em várias versões de API.A resposta inclui uma
docType
propriedade para indicar qual dos modelos compostos foi usado para analisar o documento.Para
custom template
modelos, o modelo composto pode ser criado usando variações de um modelo personalizado ou diferentes tipos de formulário. Esta operação é útil quando os formulários de entrada pertencem a um dos vários modelos.Para
custom neural
modelos, a prática recomendada é adicionar todas as diferentes variações de um único tipo de documento em um único conjunto de dados de treinamento e treinar em modelo neural personalizado. Amodel compose
operação é mais adequada para cenários em que você tem documentos de diferentes tipos sendo enviados para análise.
Limites do modelo de composição
Com a
model compose
operação, você pode atribuir até 500 modelos a um único ID de modelo. Se o número de modelos que quero compor exceder o limite superior de um modelo composto, você pode usar uma destas alternativas:Classifique os documentos antes de chamar o modelo personalizado. Você pode usar o modelo Read e criar uma classificação com base no texto extraído dos documentos e determinadas frases usando fontes como código, expressões regulares ou pesquisa.
Se você quiser extrair os mesmos campos de vários documentos estruturados, semiestruturados e não estruturados, considere usar o modelo neural personalizado de aprendizado profundo. Saiba mais sobre as diferenças entre o modelo de modelo personalizado e o modelo neural personalizado.
Analisar um documento usando modelos compostos é idêntico a analisar um documento usando um único modelo. O
Analyze Document
resultado retorna umadocType
propriedade que indica qual dos modelos de componente você selecionou para analisar o documento.Atualmente, a
model compose
operação está disponível apenas para modelos personalizados treinados com etiquetas.
Compatibilidade de modelos compostos
Tipo de modelo personalizado | Modelos treinados com v2.1 e v2.0 | Modelo personalizado e modelos neurais v3.1 e v3.0 | Modelo personalizado e visualização de modelos neurais v4.0 | Modelos generativos personalizados v4.0 preview |
---|---|---|---|---|
Modelos treinados com versões 2.1 e v2.0 | Não suportado | Não suportado | Não suportado | Não suportado |
Modelo personalizado e modelos neurais v3.0 e v3.1 | Não suportado | Suportado | Suportado | Não suportado |
Modelo personalizado e visualização de modelos neurais v4.0 | Não suportado | Suportado | Suportado | Não suportado |
Modelos generativos personalizados v4.0 preview | Não suportado | Não suportado | Não suportado | Não suportado |
Para compor um modelo treinado com uma versão anterior da API (v2.1 ou anterior), treine um modelo com a API v3.0 usando o mesmo conjunto de dados rotulado. Essa adição garante que o modelo v2.1 possa ser composto com outros modelos.
Com modelos compostos usando v2.1 da API continua a ser suportado, não exigindo atualizações.
Opções de desenvolvimento
O Document Intelligence v4.0:2024-07-31-preview suporta as seguintes ferramentas, aplicações e bibliotecas:
Caraterística | Recursos |
---|---|
Modelo personalizado | • Document Intelligence Studio • API REST • C# SDK • Java SDK • JavaScript SDK • Python SDK |
Modelo composto | • Document Intelligence Studio • API REST • C# SDK • Java SDK • JavaScript SDK • Python SDK |
O Document Intelligence v3.1:2023-07-31 (GA) suporta as seguintes ferramentas, aplicações e bibliotecas:
Caraterística | Recursos |
---|---|
Modelo personalizado | • Document Intelligence Studio • API REST • C# SDK • Java SDK • JavaScript SDK • Python SDK |
Modelo composto | • Document Intelligence Studio • API REST • C# SDK • Java SDK • JavaScript SDK • Python SDK |
O Document Intelligence v3.0:2022-08-31 (GA) suporta as seguintes ferramentas, aplicações e bibliotecas:
Caraterística | Recursos |
---|---|
Modelo personalizado | • Document Intelligence Studio • API REST • C# SDK • Java SDK • JavaScript SDK • Python SDK |
Modelo composto | • Document Intelligence Studio • API REST • C# SDK • Java SDK • JavaScript SDK • Python SDK |
O Document Intelligence v2.1 suporta os seguintes recursos:
Caraterística | Recursos |
---|---|
Modelo personalizado | • Ferramenta de etiquetagem de Inteligência Documental• API REST • SDK da biblioteca do cliente• Contêiner Docker de Inteligência Documental |
Modelo composto | • Ferramenta de etiquetagem de inteligência documental• API REST • C# SDK • Java SDK • JavaScript SDK • Python SDK |
Próximos passos
Aprenda a criar e compor modelos personalizados: