Referência do componente Algorithm & para o designer do Azure Machine Learning

Artigo
01/10/2024

APLICA-SE A: Python SDK azure-ai-ml v2 (atual)

Nota

O Designer suporta dois tipos de componentes, componentes pré-construídos clássicos e componentes personalizados. Estes dois tipos de componentes não são compatíveis.

Os componentes pré-construídos clássicos fornecem componentes pré-construídos principalmente para processamento de dados e tarefas tradicionais de aprendizado de máquina, como regressão e classificação. Este tipo de componente continua a ser suportado, mas não terá novos componentes adicionados.

Os componentes personalizados permitem que você forneça seu próprio código como um componente. Suportam a partilha entre áreas de trabalho e a criação totalmente fácil transversalmente nas interfaces do Studio, da CLI e do SDK.

Este artigo aplica-se a componentes pré-construídos clássicos.

Este conteúdo de referência fornece a base técnica sobre cada um dos componentes pré-criados clássicos disponíveis no designer do Azure Machine Learning.

Cada componente representa um conjunto de código que pode ser executado de forma independente e executar uma tarefa de aprendizado de máquina, dadas as entradas necessárias. Um componente pode conter um algoritmo específico ou executar uma tarefa que é importante no aprendizado de máquina, como substituição de valor ausente ou análise estatística.

Para obter ajuda com a escolha de algoritmos, consulte

Gorjeta

Em qualquer pipeline no designer, você pode obter informações sobre um componente específico. Selecione o link Saiba mais na placa de componente ao passar o mouse sobre o componente na lista de componentes ou no painel direito do componente.

Componentes de preparação de dados

Funcionalidade	Description	componente
Data Input and Output	Mova dados de fontes de nuvem para seu pipeline. Escreva seus resultados ou dados intermediários no Armazenamento do Azure ou no Banco de Dados SQL enquanto executa um pipeline ou use o armazenamento em nuvem para trocar dados entre pipelines.	Inserir dados manualmente Exportar dados Importar dados
Transformação de Dados	Operações em dados que são exclusivos do aprendizado de máquina, como normalização ou vinculação de dados, redução de dimensionalidade e conversão de dados entre vários formatos de arquivo.	Adicionar colunas Adicionar linhas Aplicar operação matemática Aplicar transformação SQL Limpar dados ausentes Valores do clipe Converter em CSV Converter em conjunto de dados Converter em valores indicadores Editar metadados Agrupar dados em compartimentos Juntar dados Normalizar dados Partição e amostra Remover linhas duplicadas SMOTE Selecionar Transformação de Colunas Selecionar colunas no conjunto de dados Dividir dados
Feature Selection	Selecione um subconjunto de recursos relevantes e úteis para usar para criar um modelo analítico.	Seleção de recursos baseada em filtro Importância da característica de permutação
Funções Estatísticas	Fornecer uma ampla variedade de métodos estatísticos relacionados à ciência de dados.	Resumir dados

Algoritmos de aprendizagem automática

Funcionalidade	Description	componente
Regressão	Preveja um valor.	Regressão da árvore de decisão impulsionada Regressão Florestal de Decisão Regressão Quantílica Rápida da Floresta Regressão Linear Regressão de Rede Neural Regressão de Poisson
Clustering	Agrupe os dados.	Agrupamento K-Means
Classificação	Preveja uma classe. Escolha entre algoritmos binários (de duas classes) ou multiclasse.	Árvore de decisão impulsionada por várias classes Floresta de Decisão Multiclasse Regressão Logística Multiclasse Rede Neural Multiclasse Um contra Todos Multiclasse Um contra um multiclasse Perceptron médio de duas classes Árvore de decisão impulsionada de duas classes Floresta de decisão de duas classes Regressão Logística de Duas Classes Rede Neural de Duas Classes Máquina vetorial de suporte de duas classes

Componentes para construção e avaliação de modelos

Funcionalidade	Description	componente
Preparação de Modelos	Execute dados através do algoritmo.	Modelo de agrupamento de comboios Modelo de comboio Trem Pytorch Modelo Ajustar hiperparâmetros do modelo
Pontuação e Avaliação do Modelo	Meça a precisão do modelo treinado.	Aplicar transformação Atribuir dados a clusters Modelo de validação cruzada Avaliar modelo Modelo de imagem de pontuação Modelo de pontuação
Linguagem Python	Escreva código e incorpore-o em um componente para integrar Python ao seu pipeline.	Criar modelo Python Executar script Python
Linguagem R	Escreva código e incorpore-o em um componente para integrar o R ao seu pipeline.	Executar script R
Análise de Texto	Fornecer ferramentas computacionais especializadas para trabalhar com texto estruturado e não estruturado.	Converter Word em Vetor Extrair recursos de N Gram do texto Hashing de recursos Pré-processar texto Alocação de Dirichlet latente Pontuação Vowpal Wabbit Model Trem Vowpal Wabbit Modelo
Imagem Digitalizada	Pré-processamento de dados de imagem e componentes relacionados ao reconhecimento de imagem.	Aplicar transformação de imagem Converter em Diretório de Imagens Transformação de imagem inicial Diretório de imagens divididas DenseNet ResNet
Recomendação	Crie modelos de recomendação.	Avaliar Recomendação Pontuação SVD Recommender Recomendação ampla e profunda de pontuação Trem SVD Recommender Recomendação Treine Ampla e Profunda
Deteção de Anomalias	Crie modelos de deteção de anomalias.	Deteção de anomalias baseada em PCA Modelo de deteção de anomalias do trem

Serviço Web

Saiba mais sobre os componentes de serviço Web, que são necessários para inferência em tempo real no designer do Azure Machine Learning.

Mensagens de erro

Saiba mais sobre as mensagens de erro e códigos de exceção que você pode encontrar usando componentes no designer do Azure Machine Learning.

Ambiente de componentes

Todos os componentes incorporados no estruturador serão executados num ambiente estabelecido fornecido pela Microsoft.

Anteriormente, este ambiente tinha por base o Python 3.6, tendo agora sido atualizado para o Python 3.8. Esta atualização é transparente, ou seja, os componentes serão executados automaticamente no ambiente Python 3.8 e não é necessária qualquer ação por parte do utilizador. A atualização do ambiente pode afetar as saídas de componentes e a implantação de pontos de extremidade em tempo real a partir de uma inferência em tempo real, consulte as seções a seguir para saber mais.

As saídas dos componentes são diferentes dos resultados anteriores

Depois que a versão do Python é atualizada de 3.6 para 3.8, as dependências dos componentes internos também podem ser atualizadas de acordo. Assim, você pode achar que algumas saídas de componentes são diferentes dos resultados anteriores.

Se você estiver usando o componente Execute Python Script e tiver instalado anteriormente pacotes vinculados ao Python 3.6, poderá encontrar erros como:

"Não foi possível encontrar uma versão que satisfaça o requisito."
"Nenhuma distribuição correspondente encontrada." Em seguida, você precisará especificar a versão do pacote adaptada para Python 3.8 e executar seu pipeline novamente.

Implante o ponto de extremidade em tempo real a partir do problema do pipeline de inferência em tempo real

Se você implantar diretamente o ponto de extremidade em tempo real de um pipeline de inferência em tempo real concluído anteriormente, ele poderá encontrar erros.

Recomendação: clone o pipeline de inferência e envie-o novamente e, em seguida, implante no endpoint em tempo real.

Próximos passos

Tutorial: Construir um modelo no designer para prever os preços dos automóveis