O que é a classificação de texto personalizado?

A classificação de textos personalizados é uma das funcionalidades personalizadas oferecidas pela Linguagem de IA do Azure. É um serviço de API baseado na cloud que aplica machine learning intelligence para lhe permitir criar modelos personalizados para tarefas de classificação de textos.

A classificação de textos personalizados permite que os utilizadores criem modelos de IA personalizados para classificar texto em classes personalizadas predefinidas pelo utilizador. Ao criar um projeto de classificação de textos personalizado, os programadores podem etiquetar iterativamente dados, preparar, avaliar e melhorar o desempenho do modelo antes de os disponibilizarem para consumo. A qualidade dos dados etiquetados afeta significativamente o desempenho do modelo. Para simplificar a criação e personalização do modelo, o serviço oferece um portal Web personalizado que pode ser acedido através do Language Studio. Pode facilmente começar a utilizar o serviço ao seguir os passos neste início rápido.

A classificação de textos personalizados suporta dois tipos de projetos:

  • Classificação de etiqueta única – pode atribuir uma única classe para cada documento no seu conjunto de dados. Por exemplo, um script de filme só podia ser classificado como "Romance" ou "Comédia".
  • Classificação de várias etiquetas – pode atribuir várias classes para cada documento no seu conjunto de dados. Por exemplo, um script de filme pode ser classificado como "Comédia" ou "Romance" e "Comédia".

Esta documentação contém os seguintes tipos de artigo:

  • Os inícios rápidos são instruções de introdução para orientá-lo através da realização de pedidos para o serviço.
  • Os conceitos fornecem explicações sobre as funcionalidades e funcionalidades do serviço.
  • Os manuais de instruções contêm instruções para utilizar o serviço de formas mais específicas ou personalizadas.

Cenários de utilização de exemplo

A classificação de textos personalizados pode ser utilizada em vários cenários em vários setores:

Triagem automática de e-mails ou pedidos de suporte

Os centros de suporte de todos os tipos recebem um elevado volume de e-mails ou pedidos de suporte que contêm texto e anexos não estruturados e de forma livre. A revisão, confirmação e encaminhamento oportunos para especialistas em assuntos dentro das equipas internas é fundamental. Email triagem a esta escala requer que as pessoas revejam e encaminhem para os departamentos certos, o que leva tempo e recursos. A classificação de textos personalizados pode ser utilizada para analisar texto recebido e fazer a triagem e categorizar os conteúdos a serem automaticamente encaminhados para os departamentos relevantes para mais ações.

A pesquisa é fundamental para qualquer aplicação que apresenta conteúdo de texto aos utilizadores. Os cenários comuns incluem pesquisas de catálogos ou documentos, pesquisas de produtos de retalho ou extração de conhecimentos para ciência de dados. Muitas empresas de várias indústrias procuram criar uma experiência de pesquisa avançada em conteúdos privados e heterogéneos, que incluem documentos estruturados e não estruturados. Como parte do pipeline, os programadores podem utilizar a classificação de textos personalizados para categorizar o texto em classes relevantes para a respetiva indústria. As classes previstas podem ser utilizadas para enriquecer a indexação do ficheiro para uma experiência de pesquisa mais personalizada.

Ciclo de vida de desenvolvimento de projetos

Normalmente, a criação de um projeto de classificação de textos personalizado envolve vários passos diferentes.

O ciclo de vida de desenvolvimento

Siga estes passos para tirar o máximo partido do seu modelo:

  1. Defina o seu esquema: conheça os seus dados e identifique as classes entre as quais pretende diferenciar, para evitar ambiguidade.

  2. Etiquetar os seus dados: a qualidade da etiquetagem de dados é um fator chave para determinar o desempenho do modelo. Os documentos que pertencem à mesma classe devem ter sempre a mesma classe, se tiver um documento que possa enquadrar-se em duas classes, utilize projetos de classificação de várias etiquetas . Evite a ambiguidade da classe, certifique-se de que as classes estão claramente separadas umas das outras, especialmente com projetos de classificação de etiqueta única.

  3. Preparar o modelo: o modelo começa a aprender com os seus dados etiquetados.

  4. Ver o desempenho do modelo: veja os detalhes de avaliação do modelo para determinar o desempenho do mesmo quando introduzido em novos dados.

  5. Implementar o modelo: implementar um modelo disponibiliza-o para utilização através da API de Análise.

  6. Classificar texto: utilize o seu modelo personalizado para tarefas de classificação de textos personalizadas.

Documentação de referência e exemplos de código

À medida que utiliza a classificação de textos personalizada, veja a seguinte documentação de referência e exemplos para a Linguagem de IA do Azure:

Opção de desenvolvimento/idioma Documentação de referência Amostras
APIs REST (Criação) Documentação da API REST
APIs REST (Runtime) Documentação da API REST
C# (Runtime) Documentação do C# Exemplos de C# – Exemplos C# de classificação de etiqueta única – Classificação de várias etiquetas
Java (Runtime) Documentação do Java Exemplos de Java – Exemplos Java de classificaçãode etiqueta única – Classificação de várias etiquetas
JavaScript (Runtime) Documentação do JavaScript Exemplos de JavaScript – Exemplos javaScript de classificação de etiqueta única – Classificação de várias etiquetas
Python (Runtime) Documentação do Python Exemplos de Python – Exemplos python de classificaçãode etiqueta única – Classificação de várias etiquetas

IA Responsável

Um sistema de IA inclui não só a tecnologia, mas também as pessoas que a utilizarão, as pessoas que serão afetadas pela mesma e o ambiente em que é implementada. Leia a nota de transparência da classificação de textos personalizados para saber mais sobre a utilização e implementação responsáveis de IA nos seus sistemas. Também pode ver os seguintes artigos para obter mais informações:

Passos seguintes

  • Utilize o artigo de início rápido para começar a utilizar a classificação de textos personalizada.

  • À medida que percorre o ciclo de vida de desenvolvimento do projeto, reveja o glossário para saber mais sobre os termos utilizados em toda a documentação para esta funcionalidade.

  • Lembre-se de ver os limites de serviço para obter informações como a disponibilidade regional.