Referência do componente Algorithm & para o designer do Azure Machine Learning

APLICA-SE A: Python SDK azure-ai-ml v2 (atual)

Nota

O Designer suporta dois tipos de componentes, componentes pré-construídos clássicos e componentes personalizados. Estes dois tipos de componentes não são compatíveis.

Os componentes pré-construídos clássicos fornecem componentes pré-construídos principalmente para processamento de dados e tarefas tradicionais de aprendizado de máquina, como regressão e classificação. Este tipo de componente continua a ser suportado, mas não terá novos componentes adicionados.

Os componentes personalizados permitem que você forneça seu próprio código como um componente. Suportam a partilha entre áreas de trabalho e a criação totalmente fácil transversalmente nas interfaces do Studio, da CLI e do SDK.

Este artigo aplica-se a componentes pré-construídos clássicos.

Este conteúdo de referência fornece a base técnica sobre cada um dos componentes pré-criados clássicos disponíveis no designer do Azure Machine Learning.

Cada componente representa um conjunto de código que pode ser executado de forma independente e executar uma tarefa de aprendizado de máquina, dadas as entradas necessárias. Um componente pode conter um algoritmo específico ou executar uma tarefa que é importante no aprendizado de máquina, como substituição de valor ausente ou análise estatística.

Para obter ajuda com a escolha de algoritmos, consulte

Gorjeta

Em qualquer pipeline no designer, você pode obter informações sobre um componente específico. Selecione o link Saiba mais na placa de componente ao passar o mouse sobre o componente na lista de componentes ou no painel direito do componente.

Componentes de preparação de dados

Funcionalidade Description componente
Data Input and Output Mova dados de fontes de nuvem para seu pipeline. Escreva seus resultados ou dados intermediários no Armazenamento do Azure ou no Banco de Dados SQL enquanto executa um pipeline ou use o armazenamento em nuvem para trocar dados entre pipelines. Inserir dados manualmente
Exportar dados
Importar dados
Transformação de Dados Operações em dados que são exclusivos do aprendizado de máquina, como normalização ou vinculação de dados, redução de dimensionalidade e conversão de dados entre vários formatos de arquivo. Adicionar colunas
Adicionar linhas
Aplicar operação matemática
Aplicar transformação SQL
Limpar dados ausentes
Valores do clipe
Converter em CSV
Converter em conjunto de dados
Converter em valores indicadores
Editar metadados
Agrupar dados em compartimentos
Juntar dados
Normalizar dados
Partição e amostra
Remover linhas duplicadas
SMOTE
Selecionar Transformação de Colunas
Selecionar colunas no conjunto de dados
Dividir dados
Feature Selection Selecione um subconjunto de recursos relevantes e úteis para usar para criar um modelo analítico. Seleção de recursos baseada em filtro
Importância da característica de permutação
Funções Estatísticas Fornecer uma ampla variedade de métodos estatísticos relacionados à ciência de dados. Resumir dados

Algoritmos de aprendizagem automática

Funcionalidade Description componente
Regressão Preveja um valor. Regressão da árvore de decisão impulsionada
Regressão Florestal de Decisão
Regressão Quantílica Rápida da Floresta
Regressão Linear
Regressão de Rede Neural
Regressão de Poisson
Clustering Agrupe os dados. Agrupamento K-Means
Classificação Preveja uma classe. Escolha entre algoritmos binários (de duas classes) ou multiclasse. Árvore de decisão impulsionada por várias classes
Floresta de Decisão Multiclasse
Regressão Logística Multiclasse
Rede Neural Multiclasse
Um contra Todos Multiclasse
Um contra um multiclasse
Perceptron médio de duas classes
Árvore de decisão impulsionada de duas classes
Floresta de decisão de duas classes
Regressão Logística de Duas Classes
Rede Neural de Duas Classes
Máquina vetorial de suporte de duas classes

Componentes para construção e avaliação de modelos

Funcionalidade Description componente
Preparação de Modelos Execute dados através do algoritmo. Modelo de agrupamento de comboios
Modelo de comboio
Trem Pytorch Modelo
Ajustar hiperparâmetros do modelo
Pontuação e Avaliação do Modelo Meça a precisão do modelo treinado. Aplicar transformação
Atribuir dados a clusters
Modelo de validação cruzada
Avaliar modelo
Modelo de imagem de pontuação
Modelo de pontuação
Linguagem Python Escreva código e incorpore-o em um componente para integrar Python ao seu pipeline. Criar modelo Python
Executar script Python
Linguagem R Escreva código e incorpore-o em um componente para integrar o R ao seu pipeline. Executar script R
Análise de Texto Fornecer ferramentas computacionais especializadas para trabalhar com texto estruturado e não estruturado. Converter Word em Vetor
Extrair recursos de N Gram do texto
Hashing de recursos
Pré-processar texto
Alocação de Dirichlet latente
Pontuação Vowpal Wabbit Model
Trem Vowpal Wabbit Modelo
Imagem Digitalizada Pré-processamento de dados de imagem e componentes relacionados ao reconhecimento de imagem. Aplicar transformação de imagem
Converter em Diretório de Imagens
Transformação de imagem inicial
Diretório de imagens divididas
DenseNet
ResNet
Recomendação Crie modelos de recomendação. Avaliar Recomendação
Pontuação SVD Recommender
Recomendação ampla e profunda de pontuação
Trem SVD Recommender
Recomendação Treine Ampla e Profunda
Deteção de Anomalias Crie modelos de deteção de anomalias. Deteção de anomalias baseada em PCA
Modelo de deteção de anomalias do trem

Serviço Web

Saiba mais sobre os componentes de serviço Web, que são necessários para inferência em tempo real no designer do Azure Machine Learning.

Mensagens de erro

Saiba mais sobre as mensagens de erro e códigos de exceção que você pode encontrar usando componentes no designer do Azure Machine Learning.

Ambiente de componentes

Todos os componentes incorporados no estruturador serão executados num ambiente estabelecido fornecido pela Microsoft.

Anteriormente, este ambiente tinha por base o Python 3.6, tendo agora sido atualizado para o Python 3.8. Esta atualização é transparente, ou seja, os componentes serão executados automaticamente no ambiente Python 3.8 e não é necessária qualquer ação por parte do utilizador. A atualização do ambiente pode afetar as saídas de componentes e a implantação de pontos de extremidade em tempo real a partir de uma inferência em tempo real, consulte as seções a seguir para saber mais.

As saídas dos componentes são diferentes dos resultados anteriores

Depois que a versão do Python é atualizada de 3.6 para 3.8, as dependências dos componentes internos também podem ser atualizadas de acordo. Assim, você pode achar que algumas saídas de componentes são diferentes dos resultados anteriores.

Se você estiver usando o componente Execute Python Script e tiver instalado anteriormente pacotes vinculados ao Python 3.6, poderá encontrar erros como:

  • "Não foi possível encontrar uma versão que satisfaça o requisito."
  • "Nenhuma distribuição correspondente encontrada." Em seguida, você precisará especificar a versão do pacote adaptada para Python 3.8 e executar seu pipeline novamente.

Implante o ponto de extremidade em tempo real a partir do problema do pipeline de inferência em tempo real

Se você implantar diretamente o ponto de extremidade em tempo real de um pipeline de inferência em tempo real concluído anteriormente, ele poderá encontrar erros.

Recomendação: clone o pipeline de inferência e envie-o novamente e, em seguida, implante no endpoint em tempo real.

Próximos passos