Observação
O acesso a essa página exige autorização. Você pode tentar entrar ou alterar diretórios.
O acesso a essa página exige autorização. Você pode tentar alterar os diretórios.
Importante
- A API do classificador só está disponível para documentos com a
2025-05-01-preview
versão. - O classificador de Compreensão de Conteúdo de IA do Azure está disponível na
2025-05-01-preview
versão. As versões preliminares públicas fornecem acesso antecipado a recursos que estão em desenvolvimento ativo. - Os recursos, abordagens e processos podem mudar ou ter seus recursos limitados antes da disponibilidade geral (GA).
- Para obter mais informações, confiraTermos Complementares de Uso para Versões Prévias do Microsoft Azure.
O classificador de Compreensão de Conteúdo de IA do Azure permite detectar e identificar documentos que você processa em seu aplicativo. O classificador de Compreensão de Conteúdo pode executar a classificação de um arquivo de entrada como um todo ou identificar vários documentos ou várias instâncias de um único documento em um arquivo de entrada.
Casos de uso de negócios
O classificador pode processar documentos complexos em vários formatos e modelos:
- Faturas: categorize faturas de vários fornecedores para processar cada categoria com um analisador de Compreensão de Conteúdo diferente, se necessário.
- Documentos fiscais: Categorize vários documentos fiscais em diferentes tipos de formulários fiscais, como 1040, 1099 etc.
- Contratos: contratos longos e não estruturados agora podem ser categorizados para simplificar as operações para entender diferentes tipos de contratos e suas implicações legais específicas.
Funcionalidades do classificador da Compreensão de Conteúdo
O classificador de Compreensão de Conteúdo pode analisar documentos de um ou vários arquivos para identificar se um arquivo de entrada pode ser classificado em uma categoria conforme definido. Aqui temos os cenários com suporte no momento:
- Um único arquivo que contém um tipo de documento, como um formulário de solicitação de empréstimo.
- Um único arquivo que contém vários tipos de documentos. Por exemplo, um pacote de solicitação de empréstimo contendo um formulário de solicitação de empréstimo, um contracheque e extrato bancário.
- Um único arquivo que contém várias instâncias do mesmo documento. Por exemplo, uma coleção de faturas digitalizadas.
- Por padrão, existe uma classe
$OTHER
que também utilizamos para categorizar as páginas quando nenhuma das categorias definidas parece adequada.
Como usar o classificador de Compreensão de Conteúdo
O classificador de Reconhecimento de Conteúdo não requer nenhum conjunto de dados de treinamento. Defina até 50 nomes de categoria e descrição e crie um classificador. Por padrão, todo o arquivo é tratado como um único objeto de conteúdo, o que significa que o arquivo/objeto está associado a uma única categoria.
No entanto, quando você tem mais de um documento em um arquivo, o classificador pode identificar os diferentes tipos de documento contidos no arquivo de entrada com a capacidade de divisão. A resposta do classificador contém os intervalos de páginas para cada um dos tipos de documentos identificados contidos em um arquivo. Essa resposta pode incluir várias instâncias do mesmo tipo de documento.
Quando você chama o classificador, a analyze
operação inclui uma splitMode
propriedade que fornece controle granular sobre o comportamento de divisão. Você também pode especificar os números de página para analisar apenas determinadas páginas do documento de entrada.
- Para tratar todo o arquivo de entrada como um único documento para classificação, defina como
splitMode
none
. Quando você faz isso, o serviço retorna apenas uma categoria para todo o arquivo de entrada. - Para classificar cada página do arquivo de entrada, configure
splitMode
paraperPage
. O serviço tenta classificar cada página como um documento individual. - Defina o
splitMode
paraauto
e o serviço identificará os documentos e os intervalos de páginas associados.
Análise opcional
Para um fluxo completo de ponta a ponta, você pode vincular categorias de classificador com analisadores existentes. Para cada objeto de conteúdo classificado para categorias com analisadores vinculados, o serviço invoca automaticamente a análise no objeto de conteúdo usando o analisador correspondente. Por exemplo, essa vinculação pode ser usada para criar classificadores que identificam e analisam apenas faturas de um PDF que podem conter vários tipos de formulários em um documento.
- Defina a
analyzerId
como um analisador existente para rotear e executar a extração de campo das páginas ou dos documentos classificados.
Limites do classificador
Para obter informações sobre formatos de documento de entrada com suporte e limites de classificador, consulte nossa página de cotas e limites de serviço .
Práticas recomendadas
Para melhorar a qualidade de classificação e divisão, é importante dar um bom nome e descrição de categoria para que o modelo possa entender as categorias com algum contexto. Para obter mais informações sobre nomes de categoria e descrições, consulteAs práticas recomendadas.
Principais benefícios
- Precisão e confiabilidade: Verifique a classificação precisa de documentos, reduzindo erros e aumentando a eficiência.
- Escalabilidade: dimensionar perfeitamente o processamento de documentos para atender às demandas comerciais.
- Personalizável: Adapte o classificador de documentos para ajustar fluxos de trabalho específicos.
Idiomas e regiões compatíveis
Para uma lista detalhada de idiomas e regiões com suporte, visite nossa página de Suporte a idiomas e regiões.
Segurança e privacidade de dados
Os desenvolvedores que usam a compreensão de conteúdo devem examinar as políticas da Microsoft sobre os dados do cliente. Para obter mais informações, visite a página Dados, proteção e privacidade.
Próxima etapa
- Tente processar o conteúdo do documento usando a compreensão de conteúdo no Azure AI Foundry.
- Saiba como analisar o conteúdo do documento modelos de analisador.