evento
Crie aplicativos e agentes de IA
17/03, 21 - 21/03, 10
Junte-se à série meetup para criar soluções de IA escaláveis com base em casos de uso do mundo real com outros desenvolvedores e especialistas.
Registe-se agoraEste browser já não é suportado.
Atualize para o Microsoft Edge para tirar partido das mais recentes funcionalidades, atualizações de segurança e de suporte técnico.
Uma tarefa de de aprendizagem automática é um tipo de previsão ou inferência baseada em ambos os fatores.
Por exemplo, a tarefa de classificação atribui dados a categorias e a tarefa de agrupamento agrupa dados de acordo com a semelhança.
As tarefas de aprendizado de máquina dependem de padrões nos dados em vez de serem explicitamente programadas.
Este artigo descreve as diferentes tarefas de aprendizado de máquina disponíveis no ML.NET e alguns casos de uso comuns.
Depois de decidir qual tarefa funciona para o seu cenário, você precisa escolher o melhor algoritmo para treinar seu modelo. Os algoritmos disponíveis estão listados na seção para cada tarefa.
A classificação binária é uma tarefa de de aprendizado de máquina supervisionada por
Para mais informações, consulte o artigo Classificação binária na Wikipédia.
Você pode treinar um modelo de classificação binária usando os seguintes algoritmos:
Para melhores resultados com classificação binária, os dados de treinamento devem ser balanceados (ou seja, números iguais de dados de treinamento positivos e negativos). Os valores em falta devem ser tratados antes da formação.
Os dados da coluna do rótulo de entrada devem ser Boolean. Os dados da coluna de características de entrada devem ser um vetor de tamanho fixo de Single.
Esses instrutores produzem as seguintes colunas:
Nome da coluna de saída | Tipo de coluna | Descrição |
---|---|---|
Score |
Single | A pontuação bruta que o modelo calculou. |
PredictedLabel |
Boolean | O rótulo previsto, com base no sinal da pontuação. Uma pontuação negativa é mapeada para false e uma pontuação positiva é mapeada para true . |
A classificação multiclasse é uma tarefa de de aprendizado de máquina supervisionada
Para mais informações, consulte o artigo Classificação multiclasse na Wikipédia.
Nota
One-vs.-rest atualiza qualquer classificação binária que o aluno para atuar em conjuntos de dados multiclasse.
Você pode treinar um modelo de classificação multiclasse usando os seguintes algoritmos de treinamento:
Os dados da coluna de rótulo de entrada devem ser do tipo chave. A coluna de características deve ser um vetor de tamanho fixo de Single.
Este formador produz o seguinte:
Nome da saída | Tipo | Descrição |
---|---|---|
Score |
Vetor de Single | As pontuações de todas as classes. Valor mais alto significa maior probabilidade de cair na classe associada. Se o i -ésimo elemento tiver o maior valor, o índice de rótulo previsto será i . Observe que i é índice baseado em zero. |
PredictedLabel |
chave | O índice do rótulo previsto. Se o seu valor for i , o rótulo real será a categoria i -ésima no tipo de rótulo de entrada com valor chave. |
A classificação de texto é uma subcategoria de classificação multiclasse que lida especificamente com texto bruto. O texto coloca desafios interessantes porque você tem que levar em conta o contexto e a semântica em que o texto ocorre. Como tal, pode ser difícil codificar o significado e o contexto.
Deep learning modelos surgiram como uma técnica promissora para resolver problemas de linguagem natural. Mais especificamente, um tipo de rede neural conhecido como transformador de tornou-se a maneira predominante de resolver problemas de linguagem natural, como classificação de texto, tradução, sumarização e resposta a perguntas. Algumas arquiteturas de transformadores populares para tarefas de linguagem natural incluem:
A API de classificação de texto ML.NET é alimentada pelo TorchSharp. TorchSharp é uma biblioteca .NET que fornece acesso à biblioteca que alimenta o PyTorch. TorchSharp contém os blocos de construção para treinar redes neurais do zero no .NET. ML.NET abstrai um pouco da complexidade do TorchSharp para o nível do cenário. Ele usa uma versão pré-treinada do modelo de NAS-BERT
Para obter um exemplo de classificação de texto, consulte Introdução à API de classificação de texto.
A classificação de imagem é uma tarefa de aprendizado de máquina supervisionada usada para prever a classe (categoria) de uma imagem. A entrada é um conjunto de exemplos rotulados. Cada rótulo normalmente começa como texto. Em seguida, ele é executado através do TermTransform, que o converte para o tipo Key (numérico). A saída do algoritmo de classificação de imagem é um classificador, que você pode usar para prever a classe de novas imagens. A tarefa de classificação de imagem é um tipo de classificação multiclasse. Exemplos de cenários de classificação de imagem incluem:
Você pode treinar um modelo de classificação de imagem usando os seguintes algoritmos de treinamento:
Os dados da coluna de rótulo de entrada devem ser do tipo chave. A coluna de características deve ser um vetor de tamanho variável de Byte.
Este formador produz as seguintes colunas:
Nome da saída | Tipo | Descrição |
---|---|---|
Score |
Single | As pontuações de todas as classes. Valor mais alto significa maior probabilidade de cair na classe associada. Se o i -ésimo elemento tiver o maior valor, o índice de rótulo previsto será i . (i é um índice baseado em zero.) |
PredictedLabel |
tipo de chave | O índice do rótulo previsto. Se o seu valor for i , o rótulo real será a categoria i -ésima no tipo de rótulo de entrada com valor chave. |
A regressão é uma tarefa de aprendizado de máquina supervisionada ,, que é utilizada para prever o valor da etiqueta a partir de um conjunto de funcionalidades relacionadas. O rótulo pode ter qualquer valor real e não é de um conjunto finito de valores como em tarefas de classificação. Os algoritmos de regressão modelam a dependência do rótulo em seus recursos relacionados para determinar como o rótulo mudará à medida que os valores dos recursos forem variados. A entrada de um algoritmo de regressão é um conjunto de exemplos com rótulos de valores conhecidos. A saída de um algoritmo de regressão é uma função, que você pode usar para prever o valor do rótulo para qualquer novo conjunto de recursos de entrada. Exemplos de cenários de regressão incluem:
Você pode treinar um modelo de regressão usando os seguintes algoritmos:
Os dados da coluna do rótulo de entrada devem ser Single.
Os formadores para esta tarefa produzem o seguinte:
Nome da saída | Tipo | Descrição |
---|---|---|
Score |
Single | A pontuação bruta que foi prevista pelo modelo |
O clustering é uma tarefa de aprendizado de máquina não supervisionada usada para agrupar instâncias de dados em clusters que contêm características semelhantes. O clustering também pode ser usado para identificar relações em um conjunto de dados que você pode não derivar logicamente navegando ou observando simplesmente. As entradas e saídas de um algoritmo de agrupamento dependem da metodologia escolhida. Você pode adotar uma abordagem baseada em distribuição, centróide, conectividade ou densidade. ML.NET atualmente suporta uma abordagem baseada em centróides usando agrupamento K-Means. Exemplos de cenários de clustering incluem:
Você pode treinar um modelo de clustering usando o seguinte algoritmo:
Os dados das características de entrada devem ser Single. Não são necessários rótulos.
Este formador produz o seguinte:
Nome da saída | Tipo | Descrição |
---|---|---|
Score |
Vetor de Single | As distâncias do ponto de dados fornecido até os centróides de todos os clusters. |
PredictedLabel |
chave tipo | O índice do cluster mais próximo previsto pelo modelo. |
A tarefa de deteção de anomalias cria um modelo de deteção de anomalias usando a análise de componentes principais (PCA). A deteção de anomalias baseada em PCA ajuda a criar um modelo em cenários em que é fácil obter dados de treinamento de uma classe, como transações válidas, mas é difícil obter amostras suficientes das anomalias direcionadas.
Uma técnica estabelecida em aprendizado de máquina, a PCA é frequentemente usada na análise exploratória de dados porque revela a estrutura interna dos dados e explica a variância nos dados. A PCA funciona analisando dados que contêm múltiplas variáveis. Procura correlações entre as variáveis e determina a combinação de valores que melhor capta as diferenças nos resultados. Esses valores de recurso combinados são usados para criar um espaço de recurso mais compacto chamado componentes principais.
A deteção de anomalias engloba muitas tarefas importantes no aprendizado de máquina:
Como as anomalias são eventos raros por definição, pode ser difícil coletar uma amostra representativa de dados para usar na modelagem. Os algoritmos incluídos nesta categoria foram especialmente concebidos para abordar os principais desafios da construção e formação de modelos utilizando conjuntos de dados desequilibrados.
Você pode treinar um modelo de deteção de anomalias usando o seguinte algoritmo:
As características de entrada devem ser um vetor de tamanho fixo de Single.
Este formador produz o seguinte:
Nome da saída | Tipo | Descrição |
---|---|---|
Score |
Single | O escore não negativo e ilimitado que foi calculado pelo modelo de deteção de anomalias. |
PredictedLabel |
Boolean |
true se a entrada é uma anomalia ou false se não é. |
Uma tarefa de classificação constrói um classificador a partir de um conjunto de exemplos rotulados. Este conjunto de exemplos consiste em grupos de instâncias que podem ser pontuados com um determinado critério. Os rótulos de classificação são { 0, 1, 2, 3, 4 } para cada instância. O classificador é treinado para ordenar novos grupos de instâncias com pontuações desconhecidas para cada instância. Os algoritmos de classificação do ML.NET são baseados em de aprendizagem automática.
Você pode treinar um modelo de classificação com os seguintes algoritmos:
O tipo de dados do rótulo de entrada deve ser chave tipo ou Single. O valor do rótulo determina a relevância, onde valores mais altos indicam maior relevância. Se o rótulo for um tipo de chave , então o índice da chave é o valor de relevância, onde o menor índice é o menos relevante. Se o rótulo for um Single, valores maiores indicam maior relevância.
Os dados da característica devem ser um vetor de dimensão fixa de
Este formador produz o seguinte:
Nome da saída | Tipo | Descrição |
---|---|---|
Score |
Single | A pontuação ilimitada que foi calculada pelo modelo para determinar a previsão. |
Uma tarefa de recomendação permite produzir uma lista de produtos ou serviços recomendados. ML.NET usa
Você pode treinar um modelo de recomendação com o seguinte algoritmo:
A tarefa de previsão usa dados de séries temporais passadas para fazer previsões sobre o comportamento futuro. Os cenários aplicáveis à previsão incluem previsão do tempo, previsões de vendas sazonais e manutenção preditiva.
Você pode treinar um modelo de previsão com o seguinte algoritmo:
A deteção de objetos é uma tarefa supervisionada de aprendizagem de máquina que é usada para prever a classe (categoria) de uma imagem, mas também fornece uma caixa delimitadora indicando onde essa categoria está dentro da imagem. Em vez de classificar um único objeto em uma imagem, a deteção de objetos pode detetar vários objetos dentro de uma imagem. Exemplos de deteção de objetos incluem:
Atualmente, o treinamento de modelo de deteção de objeto só está disponível no do Construtor de Modelos usando o Aprendizado de Máquina do Azure.
Comentários do .NET
O .NET é um projeto código aberto. Selecione um link para fornecer comentários:
evento
Crie aplicativos e agentes de IA
17/03, 21 - 21/03, 10
Junte-se à série meetup para criar soluções de IA escaláveis com base em casos de uso do mundo real com outros desenvolvedores e especialistas.
Registe-se agoraFormação
Certificação
Certificado pela Microsoft: Azure Data Scientist Associate - Certifications
Gerencie a ingestão e a preparação de dados, o treinamento e a implantação de modelos e o monitoramento de soluções de aprendizado de máquina com Python, Azure Machine Learning e MLflow.