O que é a classificação de textos personalizada?

2025-06-24

A classificação de textos personalizada é um dos recursos personalizados oferecidos pela Linguagem de IA do Azure. Ela consiste em um serviço de API baseado em nuvem que aplica a inteligência do aprendizado de máquina para permitir que você crie modelos personalizados para tarefas de classificação de texto.

A classificação de textos personalizada permite que os usuários criem modelos personalizados de IA para classificar textos em classes personalizadas e previamente definidas por eles. Ao criar um projeto de classificação de textos personalizada, os desenvolvedores podem rotular dados iterativamente, além de treinar, avaliar e melhorar o desempenho do modelo antes de disponibilizá-lo para consumo. A qualidade dos dados rotulados afeta profundamente o desempenho do modelo. Para simplificar a criação e a personalização do modelo, o serviço oferece um portal da Web personalizado que pode ser acessado por meio do Language Studio. Para começar a usar o serviço com facilidade, siga as etapas neste guia de início rápido.

A classificação de textos personalizada dá suporte a dois tipos de projetos:

Classificação de rótulo único: é possível atribuir uma classe a cada documento no conjunto de dados. Por exemplo, um roteiro de filme só pode ser classificado como "Romance" ou "Comedy".
Classificação de diversos rótulos: é possível atribuir diversas classes a cada documento no conjunto de dados. Por exemplo, um roteiro de filme pode ser classificado como "Comédia" ou "Romance" e "Comédia".

Esta documentação contém os seguintes tipos de artigos:

Os guias de início rápido são instruções de introdução que orientam sobre como fazer solicitações ao serviço.
Os conceitos fornecem explicações sobre a funcionalidade e os recursos do serviço.
Os guias de instruções contêm instruções de uso do serviço de maneiras mais específicas ou personalizadas.

Cenários de uso de exemplo

A classificação de textos personalizada pode ser usada em cenários de vários setores:

Emails automáticos ou triagem de tíquetes

Os centros de suporte de todos os tipos recebem um grande volume de emails ou tíquetes que contêm textos e anexos não estruturados e de forma livre. É essencial atender aos prazos de revisão, confirmação e encaminhamento para especialistas no assunto das equipes internas. A triagem de emails nessa escala exige que as pessoas revisem e encaminhem para os departamentos adequados, o que toma tempo e recursos. A classificação de textos personalizada pode ser usada para analisar textos de entrada, triar e categorizar o conteúdo para ser encaminhado automaticamente aos departamentos relevantes para ações adicionais.

Mineração de conhecimento para aprimorar/enriquecer a pesquisa semântica

A pesquisa é fundamental para qualquer aplicativo que mostra conteúdo de texto para os usuários. Cenários comuns incluem pesquisas de catálogos ou documentos, pesquisas de produtos de varejo ou mineração de conhecimento para ciência de dados. Muitas empresas em vários setores desejam criar uma experiência de pesquisa avançada em conteúdos privados e diversificados, que incluem documentos estruturados e não estruturados. Como parte do pipeline, os desenvolvedores podem usar a classificação de textos personalizada para categorizar textos em classes relevantes para o setor. As classes previstas podem ser usadas para enriquecer a indexação do arquivo para uma experiência de pesquisa mais personalizada.

Ciclo de vida de desenvolvimento do projeto

A criação de um projeto de classificação de textos personalizada normalmente envolve várias etapas diferentes.

Siga estas etapas para aproveitar seu modelo ao máximo:

Defina o seu esquema: conheça seus dados e identifique as classes dentre as quais você deseja diferenciar para evitar ambiguidade.
Rotular os seus dados: a qualidade da rotulagem de dados é fundamental para determinar o desempenho do modelo. Os documentos que pertencem à mesma classe devem ter sempre a mesma classe. Se você tiver um documento que pode se enquadrar em duas classes diferentes, use projetos de classificação de diversos rótulos. Evite a ambiguidade de classes verificando se elas são claramente distintas entre si, especialmente em projetos de classificação de rótulo único.
Treinar o modelo: o modelo começa a aprender com os dados rotulados.
Exibir detalhes de desempenho do modelo: veja os detalhes de avaliação do modelo para determinar o desempenho dele diante de novos dados.
Implantar o modelo: a implantação de um modelo o disponibiliza para uso por meio da API de análise.
Classificar textos: use o modelo personalizado para tarefas de classificação de textos personalizada.

Documentação de referência e exemplos de código

Ao usar a classificação de textos personalizada, confira a seguinte documentação de referência e os exemplos de Linguagem de IA do Azure:

Opção/idioma de desenvolvimento	Documentação de referência	Exemplos
APIs REST (Criação)	Documentação da API REST
APIs REST (Tempo de Execução)	Documentação da API REST
C# (Tempo de Execução)	Documentação do C#	Exemplos de C# – Classificação de rótulo único Exemplos de C# – Classificação de vários rótulos
Java (Tempo de Execução)	Documentação do Java	Exemplos de Java – Classificação de rótulo único Exemplos de Java – Classificação de vários rótulos
JavaScript (Tempo de Execução)	Documentação do JavaScript	Exemplos de JavaScript – Classificação de rótulo único Exemplos de JavaScript – Classificação de vários rótulos
Python (Ambiente de Execução)	Documentação do Python	Exemplos de Python – Classificação de rótulo único Exemplos de Python – Classificação de vários rótulos

IA responsável

Um sistema de IA inclui não apenas a tecnologia, mas também as pessoas que a usarão, que serão afetadas por ele e o ambiente em que ele é implantado. Leia a nota de transparência sobre a classificação de textos personalizada para saber mais sobre o uso responsável de IA e a implantação nos seus sistemas. Você também pode conferir os artigos a seguir para saber mais:

Próximas etapas

Use o artigo de início rápido para começar a usar a classificação personalizada de textos.
Ao percorrer o ciclo de vida de desenvolvimento do projeto, examine o glossário para saber mais sobre os termos usados em toda a documentação do recurso.
Lembre-se de ver os limites de serviço para obter informações como a disponibilidade regional.