Partilhar via


O que é classificação de texto personalizada?

A classificação de texto personalizada é um dos recursos personalizados oferecidos pelo Azure AI Language. É um serviço de API baseado em nuvem que aplica inteligência de aprendizado de máquina para permitir que você crie modelos personalizados para tarefas de classificação de texto.

A classificação de texto personalizada permite que os usuários criem modelos de IA personalizados para classificar o texto em classes personalizadas pré-definidas pelo usuário. Ao criar um projeto de classificação de texto personalizado, os desenvolvedores podem rotular dados iterativamente, treinar, avaliar e melhorar o desempenho do modelo antes de disponibilizá-lo para consumo. A qualidade dos dados rotulados afeta muito o desempenho do modelo. Para simplificar a construção e personalização do seu modelo, o serviço oferece um portal web personalizado que pode ser acessado através do estúdio de idiomas. Você pode facilmente começar com o serviço seguindo as etapas neste início rápido.

A classificação de texto personalizada suporta dois tipos de projetos:

  • Classificação de rótulo único - você pode atribuir uma única classe para cada documento em seu conjunto de dados. Por exemplo, um roteiro de filme só pode ser classificado como "Romance" ou "Comédia".
  • Classificação de vários rótulos - você pode atribuir várias classes para cada documento em seu conjunto de dados. Por exemplo, um roteiro de filme pode ser classificado como "Comédia" ou "Romance" e "Comédia".

Esta documentação contém os seguintes tipos de artigo:

  • Os guias de início rápido são instruções de introdução para guiá-lo ao fazer solicitações ao serviço.
  • Os conceitos fornecem explicações sobre a funcionalidade e os recursos do serviço.
  • Os guias de instruções contêm instruções para usar o serviço de maneiras mais específicas ou personalizadas.

Exemplos de cenários de utilização

A classificação de texto personalizada pode ser usada em vários cenários em vários setores:

E-mails automáticos ou triagem de bilhetes

Centros de suporte de todos os tipos recebem um grande volume de e-mails ou tíquetes contendo texto e anexos não estruturados e de forma livre. A revisão, o reconhecimento e o encaminhamento oportunos para especialistas no assunto dentro das equipes internas são fundamentais. A triagem de e-mails nessa escala exige que as pessoas analisem e encaminhem para os departamentos certos, o que leva tempo e recursos. A classificação de texto personalizada pode ser usada para analisar o texto recebido e triar e categorizar o conteúdo a ser encaminhado automaticamente para os departamentos relevantes para ações adicionais.

A pesquisa é fundamental para qualquer aplicativo que exponha conteúdo de texto para os usuários. Os cenários comuns incluem pesquisas de catálogos ou documentos, pesquisas de produtos de varejo ou mineração de conhecimento para ciência de dados. Muitas empresas em vários setores estão procurando construir uma experiência de pesquisa rica em conteúdo privado e heterogêneo, que inclui documentos estruturados e não estruturados. Como parte de seu pipeline, os desenvolvedores podem usar a classificação de texto personalizada para categorizar seu texto em classes que são relevantes para seu setor. As classes previstas podem ser usadas para enriquecer a indexação do arquivo para uma experiência de pesquisa mais personalizada.

Ciclo de vida de desenvolvimento do projeto

A criação de um projeto de classificação de texto personalizado normalmente envolve várias etapas diferentes.

O ciclo de vida do desenvolvimento

Siga estes passos para tirar o máximo partido do seu modelo:

  1. Defina seu esquema: conheça seus dados e identifique as classes entre as quais deseja diferenciar, para evitar ambiguidades.

  2. Rotule seus dados: a qualidade da rotulagem de dados é um fator-chave para determinar o desempenho do modelo. Os documentos que pertencem à mesma classe devem ter sempre a mesma classe, se você tiver um documento que pode se enquadrar em duas classes, use projetos de classificação de rótulo múltiplo. Evite a ambiguidade da classe, certifique-se de que suas classes sejam claramente separáveis umas das outras, especialmente com projetos de classificação de rótulo único.

  3. Treinar o modelo: seu modelo começa a aprender com seus dados rotulados.

  4. Visualize o desempenho do modelo: visualize os detalhes da avaliação do seu modelo para determinar o seu desempenho quando introduzido a novos dados.

  5. Implantar o modelo: a implantação de um modelo o torna disponível para uso por meio da API de análise.

  6. Classificar texto: use seu modelo personalizado para tarefas de classificação de texto personalizadas.

Documentação de referência e exemplos de código

À medida que você usa a classificação de texto personalizada, consulte a seguinte documentação de referência e exemplos para o Azure AI Language:

Opção de desenvolvimento / linguagem Documentação de referência Exemplos
APIs REST (criação) Documentação da API REST
APIs REST (tempo de execução) Documentação da API REST
C# (Tempo de execução) Documentação em C# Amostras de C# - Classificação de rótulo único Amostras de C# - Classificação de rótulo múltiplo
Java (Tempo de execução) Documentação Java Amostras Java - Classificação de rótulo único Amostras Java - Classificação de rótulo múltiplo
JavaScript (Tempo de execução) Documentação do JavaScript Exemplos de JavaScript - Classificação de rótulo único Exemplos de JavaScript - Classificação de rótulo múltiplo
Python (Tempo de execução) Documentação Python Exemplos de Python - Classificação de rótulo único Amostras de Python - Classificação de rótulo múltiplo

IA responsável

Um sistema de IA inclui não apenas a tecnologia, mas também as pessoas que a usarão, as pessoas que serão afetadas por ela e o ambiente em que ela é implantada. Leia a nota de transparência para classificação de texto personalizada para saber mais sobre o uso e a implantação responsáveis da IA em seus sistemas. Você também pode ver os seguintes artigos para obter mais informações:

Próximos passos

  • Use o artigo de início rápido para começar a usar a classificação de texto personalizada.

  • Ao percorrer o ciclo de vida de desenvolvimento do projeto, revise o glossário para saber mais sobre os termos usados em toda a documentação para esse recurso.

  • Lembre-se de visualizar os limites de serviço para informações como disponibilidade regional.