Modelos personalizados compostos pelo Document Intelligence

Artigo
07/17/2024

Importante

As versões preliminares públicas da Informação de Documentos oferecem acesso antecipado a recursos que estão em desenvolvimento ativo.
Recursos, abordagens e processos podem ser alterados, antes da Disponibilidade Geral (GA), com base nos comentários do usuário.
A versão prévia pública das bibliotecas de clientes da Informação de Documentos usa como padrão a versão da API REST 2024-02-29-preview.
Atualmente, a versão prévia pública 2024-02-29-preview só está disponível nas seguintes regiões do Azure:
Leste dos EUA
Oeste dos EUA 2
Oeste da Europa

Esse conteúdo se aplica a: v4.0 (versão prévia) | Versões prévias: v3.1 (GA) v3.0 (GA) v2.1 (GA)

Esse conteúdo se aplica a: v3.1 (GA) | Ultima versão: v4.0 (versão prévia) | Versões prévia: v3.0 v2.1

Esse conteúdo se aplica a: v3.0 (GA) | Ultimas versões: v4.0 (versão prévia) v3.1 | Versões prévia: v2.1

Esse conteúdo se aplica a: v2.1 | ais recente: v4.0 (versão prévia)

Modelos compostos. Um modelo composto é criado com uma coleção de modelos personalizados e atribuindo-os a um único modelo criado a partir de tipos de formulário. Quando um documento é enviado para análise com o uso de um modelo composto, o serviço executa uma classificação para decidir qual modelo personalizado representa melhor o documento enviado.

Com modelos compostos, você pode atribuir vários modelos personalizados a um modelo composto chamado com uma única ID de modelo. É útil quando você treina vários modelos e deseja agrupá-los para analisar tipos de formulários semelhantes. Por exemplo, seu modelo composto pode incluir modelos personalizados treinados para analisar suas ordens de compra de suprimentos, equipamentos e móveis. Em vez de tentar selecionar manualmente o modelo apropriado, você pode usar um modelo composto para determinar o modelo personalizado apropriado para cada análise e extração.

Os modelos Custom form e Custom template podem ser compostos juntos em um único modelo composto.
Com a operação de composição de modelo, você pode atribuir até 200 modelos personalizados treinados para um único modelo composto. Para analisar um documento com um modelo composto, o Document Intelligence classifica primeiro o formulário enviado, escolhe o modelo atribuído de melhor correspondência e retorna os resultados.
Para modelos de template personalizados, o modelo composto pode ser criado usando variações de um modelo personalizado ou tipos de formulário diferentes. Essa operação é útil quando formulários de entrada pertencem a um de vários modelos.
A resposta inclui uma propriedade docType para indicar quais dos modelos compostos foram usados para analisar o documento.
Para modelos Custom neural, a melhor prática é adicionar todas as diferentes variações de um único tipo de documento em um único conjunto de dados de treinamento e treinar no modelo neural personalizado. A composição de modelo é mais adequada para cenários quando você tem documentos de diferentes tipos sendo enviados para análise.

Com a introdução dos modelos de classificação personalizados, você pode optar por usar um modelo composto ou um modelo de classificação como uma etapa explícita antes da análise. Para uma compreensão mais aprofundada sobre quando usar uma classificação ou um modelo composto, confira Modelos de classificação personalizados.

Limites do modelo de composição

Observação

Com a adição do modelo neural personalizado, há alguns limites para a compatibilidade de modelos que podem ser compostos juntos.

Com a operação de composição de modelo, você pode atribuir até 200 modelos a uma única ID de modelo. Se o número de modelos que quero redigir exceder o limite superior de um modelo composto, você poderá usar uma destas alternativas:
- Classifique os documentos antes de chamar o modelo personalizado. Você pode usar o Modelo de leitura e compilar uma classificação com base no texto extraído dos documentos e em certas frases usando fontes como código, expressões regulares ou pesquisa.
- Se você quiser extrair os mesmos campos de vários documentos estruturados, semiestruturados e não estruturados, considere usar o modelo neural personalizado de aprendizado profundo. Saiba mais sobre as diferenças entre o modelo padrão personalizado e o modelo neural personalizado.
Analisar um documento usando modelos compostos é idêntico a analisar um documento usando um modelo único. O resultado Analyze Document retorna uma propriedade docType que indica os modelos de componentes que você selecionou para analisar o documento. Não há alteração no preço da análise de um documento usando um modelo personalizado individual ou um modelo personalizado composto.
O Model Compose está disponível atualmente apenas para modelos personalizados treinados com rótulos.

Compatibilidade de modelo composto

Tipo de modelo personalizado	Modelos treinados com v2.1 e v2.0	Modelos de template personalizados v3.0	Modelos neurais personalizados 3.0	Modelos neurais personalizados v3.1
Modelos treinados com as versões 2.1 e v2.0	Com suporte	Compatível	Sem suporte	Sem suporte
Modelos de template personalizados v3.0	Com suporte	Compatível	Sem suporte	Sem suporte
Modelos de template personalizados v3.0	Sem suporte	Sem suporte	Sem suporte	Sem suporte
Modelos de modelos personalizados v3.1	Sem suporte	Sem suporte	Sem suporte	Sem suporte
Modelos neurais personalizados v3.0	Sem suporte	Sem suporte	Com suporte	Com suporte
Modelos neurais personalizados v3.1	Sem suporte	Sem suporte	Com suporte	Com suporte

Para compor um modelo treinado com uma versão anterior da API (v2.1 ou anterior), treine um modelo com a API v3.0 usando o mesmo conjunto de dados rotulado. Essa adição garante que o modelo v2.1 possa ser composto por outros modelos.
Com modelos compostos usando a v2.1 da API continua a ter suporte, não exigindo atualizações.
Para modelos personalizados, o número máximo que poderá ser composto é 200.

Opções de desenvolvimento

O Document Intelligence v4.0:2023-02-29-preview dá suporte às seguintes ferramentas, aplicativos e bibliotecas:

Recurso	Recursos
Modelo personalizado	• Estúdio da Informação de Documentos • API REST • SDK do C# • SDK do Java • SDK do JavaScript • SDK do Python
Modelo composto	• Estúdio da Informação de Documentos • API REST • SDK do C# • SDK do Java • SDK do JavaScript • SDK do Python

A Informação de Documentos v3.1:2023-07-31 (GA) dá suporte às seguintes ferramentas, aplicativos e bibliotecas:

Recurso	Recursos
Modelo personalizado	• Estúdio da Informação de Documentos • API REST • SDK do C# • SDK do Java • SDK do JavaScript • SDK do Python
Modelo composto	• Estúdio da Informação de Documentos • API REST • SDK do C# • SDK do Java • SDK do JavaScript • SDK do Python

A Informação de Documentos v3.0:2022-08-31 (GA) dá suporte às seguintes ferramentas, aplicativos e bibliotecas:

Recurso	Recursos
Modelo personalizado	• Estúdio da Informação de Documentos • API REST • SDK do C# • SDK do Java • SDK do JavaScript • SDK do Python
Modelo composto	• Estúdio da Informação de Documentos • API REST • SDK do C# • SDK do Java • SDK do JavaScript • SDK do Python

O Document Intelligence v2.1 dá suporte aos seguintes recursos:

Recurso	Recursos
Modelo personalizado	● Ferramenta de rotulagem do recurso Informação de Documentos • REST API • SDK da biblioteca de clientes • Contêiner do Docker da Informação de Documentos
Modelo composto	• Ferramenta de rotulagem do recurso Informação de Documentos • API REST • SDK do C# • SDK do Java • SDK do JavaScript • SDK do Python

Próximas etapas

Saiba como criar e compor modelos personalizados:

Criar um modelo personalizadoCompor modelos personalizados

Compartilhar via