Modelos personalizados compostos pelo Document Intelligence
Importante
- As versões preliminares públicas da Informação de Documentos oferecem acesso antecipado a recursos que estão em desenvolvimento ativo.
- Recursos, abordagens e processos podem ser alterados, antes da Disponibilidade Geral (GA), com base nos comentários do usuário.
- A versão prévia pública das bibliotecas de clientes da Informação de Documentos usa como padrão a versão da API REST 2024-02-29-preview.
- Atualmente, a versão prévia pública 2024-02-29-preview só está disponível nas seguintes regiões do Azure:
- Leste dos EUA
- Oeste dos EUA 2
- Oeste da Europa
Este conteúdo se aplica a:v4.0 (versão prévia) | Versões anteriores:v3.1 (GA)v3.0 (GA)v2.1 (GA)
Este conteúdo se aplica a:v3.1 (GA) | Versão mais recente:v4.0 (versão prévia) | Versões anteriores:v3.0v2.1
Este conteúdo aplica-se a:v3.0 (GA) | Últimas versões:v4.0 (versão prévia)v3.1 | Versão anterior:v2.1
Este conteúdo se aplica a:v2.1 | Versão mais recente:v4.0 (versão prévia)
Modelos compostos. Um modelo composto é criado com uma coleção de modelos personalizados e atribuindo-os a um único modelo criado a partir de tipos de formulário. Quando um documento é enviado para análise com o uso de um modelo composto, o serviço executa uma classificação para decidir qual modelo personalizado representa melhor o documento enviado.
Com modelos compostos, você pode atribuir vários modelos personalizados a um modelo composto chamado com uma única ID de modelo. É útil quando você treina vários modelos e deseja agrupá-los para analisar tipos de formulários semelhantes. Por exemplo, seu modelo composto pode incluir modelos personalizados treinados para analisar suas ordens de compra de suprimentos, equipamentos e móveis. Em vez de tentar selecionar manualmente o modelo apropriado, você pode usar um modelo composto para determinar o modelo personalizado apropriado para cada análise e extração.
Os modelos
Custom form
eCustom template
podem ser compostos juntos em um único modelo composto.Com a operação de composição de modelo, você pode atribuir até 200 modelos personalizados treinados para um único modelo composto. Para analisar um documento com um modelo composto, o Document Intelligence classifica primeiro o formulário enviado, escolhe o modelo atribuído de melhor correspondência e retorna os resultados.
Para modelos de template personalizados, o modelo composto pode ser criado usando variações de um modelo personalizado ou tipos de formulário diferentes. Essa operação é útil quando formulários de entrada pertencem a um de vários modelos.
A resposta inclui uma propriedade
docType
para indicar quais dos modelos compostos foram usados para analisar o documento.Para modelos
Custom neural
, a melhor prática é adicionar todas as diferentes variações de um único tipo de documento em um único conjunto de dados de treinamento e treinar no modelo neural personalizado. A composição de modelo é mais adequada para cenários quando você tem documentos de diferentes tipos sendo enviados para análise.
Com a introdução dos modelos de classificação personalizados, você pode optar por usar um modelo composto ou um modelo de classificação como uma etapa explícita antes da análise. Para uma compreensão mais aprofundada sobre quando usar uma classificação ou um modelo composto, confiraModelos de classificação personalizados.
Limites do modelo de composição
Observação
Com a adição do modelo neural personalizado, há alguns limites para a compatibilidade de modelos que podem ser compostos juntos.
Compatibilidade de modelo composto
Tipo de modelo personalizado | Modelos treinados com v2.1 e v2.0 | Modelos de template personalizados v3.0 | Modelos neurais personalizados 3.0 | Modelos neurais personalizados v3.1 |
---|---|---|---|---|
Modelos treinados com as versões 2.1 e v2.0 | Com suporte | Compatível | Sem suporte | Sem suporte |
Modelos de template personalizados v3.0 | Com suporte | Compatível | Sem suporte | Sem suporte |
Modelos de template personalizados v3.0 | Sem suporte | Sem suporte | Sem suporte | Sem suporte |
Modelos de modelos personalizados v3.1 | Sem suporte | Sem suporte | Sem suporte | Sem suporte |
Modelos neurais personalizados v3.0 | Sem suporte | Sem suporte | Com suporte | Com suporte |
Modelos neurais personalizados v3.1 | Sem suporte | Sem suporte | Com suporte | Com suporte |
Para compor um modelo treinado com uma versão anterior da API (v2.1 ou anterior), treine um modelo com a API v3.0 usando o mesmo conjunto de dados rotulado. Essa adição garante que o modelo v2.1 possa ser composto por outros modelos.
Com modelos compostos usando a v2.1 da API continua a ter suporte, não exigindo atualizações.
Para modelos personalizados, o número máximo que poderá ser composto é 200.
Opções de desenvolvimento
O Document Intelligence v4.0:2023-02-29-preview dá suporte às seguintes ferramentas, aplicativos e bibliotecas:
Recurso | Recursos |
---|---|
Modelo personalizado | • Estúdio da Informação de Documentos • API REST • SDK do C# • SDK do Java • SDK do JavaScript • SDK do Python |
Modelo composto | • Estúdio da Informação de Documentos • API REST • SDK do C# • SDK do Java • SDK do JavaScript • SDK do Python |
A Informação de Documentos v3.1:2023-07-31 (GA) dá suporte às seguintes ferramentas, aplicativos e bibliotecas:
Recurso | Recursos |
---|---|
Modelo personalizado | • Estúdio da Informação de Documentos • API REST • SDK do C# • SDK do Java • SDK do JavaScript • SDK do Python |
Modelo composto | • Estúdio da Informação de Documentos • API REST • SDK do C# • SDK do Java • SDK do JavaScript • SDK do Python |
A Informação de Documentos v3.0:2022-08-31 (GA) dá suporte às seguintes ferramentas, aplicativos e bibliotecas:
Recurso | Recursos |
---|---|
Modelo personalizado | • Estúdio da Informação de Documentos • API REST • SDK do C# • SDK do Java • SDK do JavaScript • SDK do Python |
Modelo composto | • Estúdio da Informação de Documentos • API REST • SDK do C# • SDK do Java • SDK do JavaScript • SDK do Python |
O Document Intelligence v2.1 dá suporte aos seguintes recursos:
Recurso | Recursos |
---|---|
Modelo personalizado | ● Ferramenta de rotulagem do recurso Informação de Documentos • REST API • SDK da biblioteca de clientes • Contêiner do Docker da Informação de Documentos |
Modelo composto | • Ferramenta de rotulagem do recurso Informação de Documentos • API REST • SDK do C# • SDK do Java • SDK do JavaScript • SDK do Python |
Próximas etapas
Saiba como criar e compor modelos personalizados: