Partilhar via


Executar código Python no designer do Azure Machine Learning

Importante

Este artigo fornece informações sobre como usar o SDK do Azure Machine Learning v1. O SDK v1 foi preterido a partir de 31 de março de 2025. O apoio terminará em 30 de junho de 2026. Você pode instalar e usar o SDK v1 até essa data.

Recomendamos a transição para o SDK v2 antes de 30 de junho de 2026. Para obter mais informações sobre o SDK v2, consulte O que é a CLI do Azure Machine Learning e o SDK do Python v2? e a referência do SDK v2.

Este artigo explica como usar o componente Executar Script Python para adicionar lógica personalizada ao designer do Azure Machine Learning. Neste guia, você usa a biblioteca Pandas para fazer engenharia de recursos simples.

Você pode usar o editor de código embutido para adicionar rapidamente uma lógica Python simples. Você deve usar o método de arquivo zip para adicionar código mais complexo ou para carregar mais bibliotecas Python.

O ambiente de execução padrão usa a distribuição Anacondas do Python. Consulte a referência do componente Executar Python Script para obter uma lista completa de pacotes pré-instalados.

Diagrama que mostra o mapa de entrada para Execute Python Script.

Importante

Se você não vir os elementos gráficos mencionados neste documento, como botões no estúdio ou no designer, talvez não tenha o nível certo de permissões para o espaço de trabalho. Contacte o administrador da subscrição do Azure para verificar se lhe foi concedido o nível de acesso correto. Para obter mais informações, veja Gerir utilizadores e funções.

Executar código Python no designer

Adicionar o componente Executar Python Script

  1. Entre no estúdio do Azure Machine Learning e selecione o espaço de trabalho que deseja usar.

  2. Selecione Designer no menu da barra lateral. Em Pré-construído clássico, escolha Criar um novo pipeline usando componentes pré-construídos clássicos.

  3. À esquerda do painel do pipeline, selecione Componente.

  4. Na seção Linguagem Python , localize o componente Executar Script Python . Arraste e solte o componente na tela do pipeline.

Conectar conjuntos de dados de entrada

  1. Encontre o conjunto de dados de preço de automóvel (bruto) na secção dados de exemplo. Arraste e solte o conjunto de dados na tela do pipeline.

  2. Conecte a porta de saída do conjunto de dados à porta de entrada superior esquerda do componente Execute Python Script . O designer expõe a entrada como um parâmetro para o script de ponto de entrada.

    A porta de entrada direita é reservada para bibliotecas Python compactadas.

    Captura de tela que mostra como conectar os nós do conjunto de dados.

  3. Observe cuidadosamente a porta de entrada específica que você usa. O designer atribui a porta de entrada esquerda à variável e a porta de entrada intermediária à dataset1.dataset2

Os componentes de entrada são opcionais, uma vez que você pode gerar ou importar dados diretamente no componente Execute Python Script .

Escreva seu código Python

O designer fornece um script de ponto de entrada inicial para você editar e inserir seu próprio código Python.

Neste exemplo, você usa o Pandas para combinar duas das colunas do conjunto de dados do automóvel, Preço e Potência, para criar uma nova coluna chamada Dólares por cavalo de potência. Esta coluna representa quanto você paga por cada unidade de potência, o que pode se tornar um ponto de informação útil para decidir se um carro específico é um bom negócio para o seu preço.

  1. Clique duas vezes no componente Executar script Python .

  2. No painel que aparece à direita da tela, selecione a caixa de texto do script Python.

  3. Copie e cole o seguinte código na caixa de texto:

    import pandas as pd
    
    def azureml_main(dataframe1 = None, dataframe2 = None):
        dataframe1['Dollar/HP'] = dataframe1.price / dataframe1.horsepower
        return dataframe1
    

    Seu pipeline deve se parecer com esta imagem:

    Captura de tela que mostra o pipeline Execute Python.

    O script de ponto de entrada deve conter a função azureml_main. A função tem dois parâmetros de função que mapeiam para as duas portas de entrada para o componente Execute Python Script .

    O valor de retorno deve ser um dataframe do Pandas. Você pode retornar no máximo dois dataframes como saídas de componentes.

  4. Envie o pipeline.

Agora você tem um conjunto de dados, que tem um novo recurso Dollars/HP . Este novo recurso pode ajudar a treinar um recomendado de carro. Este exemplo mostra a extração de recursos e a redução da dimensionalidade.

Próximo passo