O que é a classificação de textos personalizada?

A classificação de textos personalizada é um dos recursos personalizados oferecidos pela Linguagem de IA do Azure. Ela consiste em um serviço de API baseado em nuvem que aplica a inteligência do aprendizado de máquina para permitir que você crie modelos personalizados para tarefas de classificação de texto.

A classificação de textos personalizada permite que os usuários criem modelos personalizados de IA para classificar textos em classes personalizadas e previamente definidas por eles. Ao criar um projeto de classificação de textos personalizada, os desenvolvedores podem rotular dados iterativamente, além de treinar, avaliar e melhorar o desempenho do modelo antes de disponibilizá-lo para consumo. A qualidade dos dados rotulados afeta profundamente o desempenho do modelo. Para simplificar a criação e a personalização do modelo, o serviço oferece um portal da Web personalizado que pode ser acessado por meio do Language Studio. Para começar a usar o serviço com facilidade, siga as etapas neste guia de início rápido.

A classificação de textos personalizada dá suporte a dois tipos de projetos:

  • Classificação de rótulo único: é possível atribuir uma classe a cada documento no conjunto de dados. Por exemplo, um roteiro de filme só pode ser classificado como "Romance" ou "Comedy".
  • Classificação de diversos rótulos: é possível atribuir diversas classes a cada documento no conjunto de dados. Por exemplo, um roteiro de filme pode ser classificado como "Comédia" ou "Romance" e "Comédia".

Esta documentação contém os seguintes tipos de artigos:

  • Os guias de início rápido são instruções de introdução que orientam sobre como fazer solicitações ao serviço.
  • Os conceitos fornecem explicações sobre a funcionalidade e os recursos do serviço.
  • Os guias de instruções contêm instruções de uso do serviço de maneiras mais específicas ou personalizadas.

Cenários de uso de exemplo

A classificação de textos personalizada pode ser usada em cenários de vários setores:

Emails automáticos ou triagem de tíquetes

Os centros de suporte de todos os tipos recebem um grande volume de emails ou tíquetes que contêm textos e anexos não estruturados e de forma livre. É essencial atender aos prazos de revisão, confirmação e encaminhamento para especialistas no assunto das equipes internas. A triagem de emails nessa escala exige que as pessoas que examinem e encaminhem as solicitações para os departamentos adequados, o que gasta tempo e recursos. A classificação de textos personalizada pode ser usada para analisar a triagem e os textos de entrada e categorizar o conteúdo a ser encaminhado automaticamente aos departamento relevantes para a ação adicional.

A pesquisa é fundamental para qualquer aplicativo que mostra conteúdo de texto para os usuários. Cenários comuns incluem pesquisas de catálogos ou documentos, pesquisas de produtos de varejo ou mineração de conhecimento para ciência de dados. Muitas empresas em vários setores desejam criar uma experiência de pesquisa avançada em conteúdos privados e diversificados, que incluem documentos estruturados e não estruturados. Como parte do pipeline, os desenvolvedores podem usar a classificação de textos personalizada para categorizar textos em classes relevantes para o setor. As classes previstas podem ser usadas para enriquecer a indexação do arquivo para uma experiência de pesquisa mais personalizada.

Ciclo de vida de desenvolvimento do projeto

A criação de um projeto de classificação de textos personalizada normalmente envolve várias etapas diferentes.

O ciclo de vida de desenvolvimento

Siga estas etapas para aproveitar seu modelo ao máximo:

  1. Defina o seu esquema: conheça seus dados e identifique as classes dentre as quais você deseja diferenciar para evitar ambiguidade.

  2. Rotular os seus dados: a qualidade da rotulagem de dados é fundamental para determinar o desempenho do modelo. Os documentos que pertencem à mesma classe devem ter sempre a mesma classe. Se você tiver um documento que pode se enquadrar em duas classes diferentes, use projetos de classificação de diversos rótulos. Evite a ambiguidade de classes verificando se elas são claramente distintas entre si, especialmente em projetos de classificação de rótulo único.

  3. Treinar o modelo: o modelo começa a aprender com os dados rotulados.

  4. Exibir detalhes de desempenho do modelo: veja os detalhes de avaliação do modelo para determinar o desempenho dele diante de novos dados.

  5. Implantar o modelo: a implantação de um modelo o disponibiliza para uso por meio da API de análise.

  6. Classificar textos: use o modelo personalizado para tarefas de classificação de textos personalizada.

Documentação de referência e exemplos de código

Ao usar a classificação de textos personalizada, confira a seguinte documentação de referência e os exemplos de Linguagem de IA do Azure:

Opção/idioma de desenvolvimento Documentação de referência Exemplos
APIs REST (Criação) Documentação da API REST
APIs REST (Runtime) Documentação da API REST
C# (Runtime) Documentação do C# Exemplos de C# – Classificação de rótulo únicoExemplos de C# – Classificação de vários rótulos
Java (Runtime) Documentação do Java Exemplos de Java – Classificação de rótulo únicoExemplos de Java – Classificação de vários rótulos
JavaScript (Runtime) Documentação do JavaScript Exemplos de JavaScript – Classificação de rótulo únicoExemplos de JavaScript – Classificação de vários rótulos
Python (Runtime) Documentação do Python Exemplos de Python – Classificação de rótulo únicoExemplos de Python – Classificação de vários rótulos

IA responsável

Um sistema de IA inclui não apenas a tecnologia, mas também as pessoas que a usarão, que serão afetadas por ele e o ambiente em que ele é implantado. Leia a nota de transparência sobre a classificação de textos personalizada para saber mais sobre o uso responsável de IA e a implantação nos seus sistemas. Você também pode conferir os artigos a seguir para saber mais:

Próximas etapas

  • Use o artigo do guia de início rápido para começar a usar a classificação de textos personalizada.

  • Ao percorrer o ciclo de vida de desenvolvimento do projeto, examine o glossário para saber mais sobre os termos usados em toda a documentação do recurso.

  • Lembre-se de ver os limites de serviço para obter informações como a disponibilidade regional.