Compartilhar via


core Pacote

Contém a funcionalidade básica para pipelines do Azure Machine Learning, que são fluxos de trabalho configuráveis do machine learning.

Os pipelines do Azure Machine Learning permitem criar fluxos de trabalho reutilizáveis do machine learning, que podem ser usados como modelo para os cenários do machine learning. Este pacote contém a funcionalidade básica para o trabalho com pipelines do Azure ML e, normalmente, é usado junto com as classes existentes no pacote steps.

Um pipeline do machine learning é representado por uma coleção de objetos PipelineStep que podem ser sequenciados e paralelizados ou criados com dependências explícitas entre as etapas. As etapas de pipeline são usadas para definir um objeto Pipeline que representa o fluxo de trabalho a ser executado. Você pode criar e trabalhar com pipelines em um Jupyter Notebook ou em qualquer outro IDE com o SDK do Azure ML instalado.

Com os pipelines do Azure ML, você se concentra no machine learning, e não na infraestrutura. Para começar a compilar um pipeline, consulte https://aka.ms/pl-first-pipeline.

Para saber mais sobre os benefícios do pipeline do Machine Learning e como ele está relacionado a outros pipelines oferecidos pelo Azure, confira O que são pipelines de ML no serviço do Azure Machine Learning?

Módulos

builder

Define classes para criar um pipeline do Azure Machine Learning.

Um grafo de pipeline é composto por etapas de pipeline (PipelineStep), dados de pipeline opcionais (PipelineData) produzidos ou consumidos em cada etapa e uma sequência de execução de etapa opcional (StepSequence).

graph

Define classes para a criação de grafos de pipeline do Azure Machine Learning.

Grafos de pipeline do Azure ML são criados para objetos Pipeline quando você usa objetos PipelineStep (e classes derivadas), PipelineData e PipelineData. Em casos de uso típicos, você não precisará usar diretamente as classes neste módulo.

Um grafo de execução de pipeline é composto por nós de módulo que representam unidades básicas, como uma fonte de dados ou uma etapa. Os nós podem ter portas de entrada e portas de saída, bem como parâmetros associados. Bordas definem relações entre duas portas de nó em um gráfico.

module

Contém classes para criar e gerenciar unidades computacionais reutilizáveis de um pipeline do Azure Machine Learning.

Os módulos permitem que você crie unidades computacionais em um Pipeline, que pode ter entradas, saídas e contar com parâmetros e uma configuração de ambiente para operar. Um módulo pode ter controle de versão e ser usado em diferentes pipelines do Azure Machine Learning, ao contrário dos PipelineStep (e classes derivadas) que são usados em um pipeline.

Os módulos foram desenvolvidos para serem reutilizados em vários pipelines e podem evoluir para adaptar uma lógica de computação específica para diferentes casos de uso. Uma etapa em um pipeline pode ser usada em iterações rápidas para melhorar um algoritmo e, depois que a meta é atingida, o algoritmo geralmente é publicado como um módulo para habilitar a reutilização.

module_step_base

Contém a funcionalidade para adicionar uma etapa a um pipeline usando uma versão de um Module.

pipeline

Define a classe para criar fluxos de trabalho reutilizáveis do Azure Machine Learning.

pipeline_draft

Define classes para gerenciamento de pipelines mutáveis.

pipeline_endpoint

Define classes para gerenciamento de pipelines, incluindo controle de versão e pontos de extremidade.

pipeline_output_dataset

Contém a funcionalidade para promover uma saída intermediária para um Conjunto de Dados do Azure Machine Learning.

Os dados intermediários (saída) em um pipeline por padrão não se tornarão um Conjunto de Dados do Azure Machine Learning. Para promover dados intermediários para um Conjunto de Dados do Azure Machine Learning, chame o método as_dataset na classe PipelineData para retornar um objeto PipelineOutputFileDataset. Em um objeto PipelineOutputFileDataset, você pode criar um objeto PipelineOutputTabularDataset.

run

Define classes para pipelines enviados, incluindo classes para verificar o status e recuperar os detalhes de execução.

schedule

Define classes para agendar envios de pipelines do Azure Machine Learning.

Classes

InputPortBinding

Define uma associação de uma origem e de uma entrada de uma etapa de pipeline.

Uma InputPortBinding pode ser usada como uma entrada para uma etapa. A origem pode ser PipelineData, PortDataReference, DataReference, PipelineDataset ou OutputPortBinding.

InputPortBinding é útil para especificar o nome da entrada da etapa, se ela deve ser diferente do nome do objeto de associação (ou seja, para evitar nomes de entrada/saída duplicados ou porque o script de etapa precisa de uma entrada para ter um determinado nome). Também pode ser usado para especificar o bind_mode de entradas PythonScriptStep.

Inicializar InputPortBinding.

Module

Representa uma unidade de computação usada em um pipeline do Azure Machine Learning.

Módulo é uma coleção de arquivos que serão executados em um destino de computação e uma descrição de uma interface. A coleção de arquivos pode incluir script, binários ou quaisquer outros arquivos necessários para execução no destino de computação. A interface do módulo descreve as entradas, saídas e definições de parâmetro. Ela não os associa a valores ou dados específicos. Um módulo tem um instantâneo associado, que captura a coleção de arquivos definidos para o módulo.

Inicializar Módulo.

ModuleVersion

Representa a unidade de computação real dentro de um Module.

Você não deve usar essa classe diretamente. Em vez disso, use um dos métodos de publicação da classe Module.

Inicializar ModuleVersion.

ModuleVersionDescriptor

Define a versão e a ID de um ModuleVersion.

Inicializar ModuleVersionDescriptor.

OutputPortBinding

Define uma saída nomeada de uma etapa de pipeline.

OutputPortBinding pode ser usado para especificar o tipo de dados que serão produzidos por uma etapa e como os dados serão produzidos. Ele pode ser usado com InputPortBinding para especificar que a saída da etapa é uma entrada necessária de outra etapa.

Inicializar OutputPortBinding.

Pipeline

Representa uma coleção de etapas que podem ser executadas como fluxo de trabalho reutilizável do Azure Machine Learning.

Use um pipeline para criar e gerenciar fluxos de trabalho que unem várias fases de machine learning. Cada fase de machine learning, como preparação de dados e treinamento de modelo, pode consistir em uma ou mais etapas em um pipeline.

Para ter uma visão geral de por que e quando usar pipelines, confira https://aka.ms/pl-concept.

Para ter uma visão geral sobre como construir um pipeline, confira https://aka.ms/pl-first-pipeline.

Inicializar Pipeline.

PipelineData

Representa os dados intermediários em um pipeline do Azure Machine Learning.

Os dados usados no pipeline podem ser produzidos em uma etapa e consumidos em outra etapa, fornecendo um objeto PipelineData como saída de uma etapa e entrada de uma ou mais etapas subsequentes.

Observação: se você estiver usando os dados do pipeline, verifique se o diretório usado existe.

Um exemplo do Python para garantir que o diretório existe é supor que há uma porta de saída nomeada output_folder em uma etapa do pipeline, e você quer gravar alguns dados no caminho relativo nessa pasta.


   import os
   os.makedirs(args.output_folder, exist_ok=True)
   f = open(args.output_folder + '/relative_path/file_name', 'w+')

O PipelineData usa o DataReference subjacente que não é mais a abordagem recomendada para acesso e entrega de dados, em vez disso, use o OutputFileDatasetConfig, um exemplo pode ser encontrado aqui: Pipeline usando OutputFileDatasetConfig.

Inicializar PipelineData.

PipelineDataset

Atua como um adaptador para o Conjunto de dados e o Pipeline.

Observação

Essa classe foi preterida. Saiba como usar o conjunto de dados com o pipeline, confira https://aka.ms/pipeline-with-dataset.

Essa é uma classe interna. Você não deve criar essa classe diretamente, mas chamar os métodos de instância as_* no conjunto de dados ou nas classes OutputDatasetConfig.

Atuar como um adaptador para Conjunto de Dados e Pipeline.

Essa é uma classe interna. Você não deve criar essa classe diretamente, mas chamar os métodos de instância as_* no conjunto de dados ou nas classes OutputDatasetConfig.

PipelineDraft

Representa um pipeline mutável que pode ser usado para enviar execuções e criar Pipelines Publicados.

Use PipelineDrafts para iterar em Pipelines. PipelineDrafts podem ser criados do zero, de outro PipelineDraft ou de pipelines existentes: Pipeline, PublishedPipeline ou PipelineRun.

Inicializar PipelineDraft.

PipelineEndpoint

Representa um fluxo de trabalho Pipeline que pode ser disparado de uma URL de ponto de extremidade exclusiva.

PipelineEndpoints pode ser usado para criar novas versões de um PublishedPipeline enquanto mantém o mesmo ponto de extremidade. PipelineEndpoints são nomeados exclusivamente em um workspace.

Usando o atributo de ponto de extremidade de um objeto PipelineEndpoint, você pode disparar novas execuções de pipeline de aplicativos externos com chamadas REST. Para obter informações sobre como autenticar ao chamar pontos de extremidade REST, consulte https://aka.ms/pl-restep-auth.

Para obter mais informações sobre como criar e executar pipelines de aprendizado de máquina, consulte https://aka.ms/pl-first-pipeline.

Inicializar PipelineEndpoint.

PipelineParameter

Define um parâmetro em uma execução de pipeline.

Use PipelineParameters para criar pipelines versáteis que podem ser reenviados mais tarde com valores de parâmetro variados.

Inicializar parâmetros de pipeline.

PipelineRun

Representa uma execução de um Pipeline.

Essa classe pode ser usada para gerenciar, verificar o status e recuperar detalhes da execução após uma execução de pipeline ser enviada. Use get_steps para recuperar os objetos StepRun criados pela execução de pipeline. Outros usos incluem recuperar o objeto Graph associado à execução do pipeline, buscar o status da execução do pipeline e aguardar a conclusão da execução.

Inicializar uma execução de Pipeline.

PipelineStep

Representa uma etapa de execução em um pipeline do Azure Machine Learning.

Os pipelines são construídos a partir de várias etapas de pipeline, que são unidades computacionais distintas no pipeline. Cada etapa pode ser executada de forma independente e usar recursos de computação isolados. Normalmente, cada etapa tem as próprias entradas, saídas e parâmetros nomeados.

A classe PipelineStep é a classe base da qual herdam outras classes de etapas internas projetadas para cenários comuns, como PythonScriptStep, DataTransferStep e HyperDriveStep.

Para obter uma visão geral de como Pipelines e PipelineSteps se relacionam, confira O que são pipelines de ML.

Inicializar PipelineStep.

PortDataReference

Modela dados associados a uma saída de um StepRun concluído.

Um objeto PortDataReference pode ser usado para baixar os dados de saída que foram produzidos por um StepRun. Ele também pode ser usado como uma entrada de etapa em um pipeline futuro.

Inicializar PortDataReference.

PublishedPipeline

Representa um pipeline a ser enviado sem o código Python que o constrói.

Além disso, um PublishedPipeline pode ser usado para reabrir um Pipeline com diferentes valores e entradas PipelineParameter.

Inicializar PublishedPipeline.

:p ponto de extremidade rest A URL do ponto de extremidade REST para enviar execuções de pipeline para esse pipeline. :type endpoint: str :p aram total_run_steps: o número de etapas neste pipeline :type total_run_steps: int :p aram workspace: o workspace do pipeline publicado. :type workspace: azureml.core.Workspace :p aram continue_on_step_failure: se deseja continuar a execução de outras etapas no PipelineRun

se uma etapa falhar, o padrão será false.

Schedule

Define um agendamento para enviar um pipeline.

Depois que um pipeline é publicado, um agendamento pode ser usado para enviá-lo em um intervalo especificado ou quando alterações são detectadas em um local de armazenamento de blobs.

Inicializar Agendamento.

ScheduleRecurrence

Define a frequência, o intervalo e a hora de início de um Schedule de pipeline.

ScheduleRecurrence também permite que você especifique o fuso horário e as horas, os minutos ou os dias da semana para a recorrência.

Inicializar uma recorrência de agendamento.

Ele também permite especificar o fuso horário e as horas ou minutos ou dias da semana para a recorrência.

StepRun

Uma execução de uma etapa em um Pipeline.

Essa classe pode ser usada para gerenciar, verificar o status e recuperar detalhes da execução depois que a execução do pipeline pai for enviada e o pipeline tiver enviado a execução da etapa.

Inicializar um StepRun.

StepRunOutput

Representa uma saída criada por um StepRun em um pipeline.

StepRunOutput pode ser usado para acessar o PortDataReference criado pela etapa.

Inicializar StepRunOutput.

StepSequence

Representa uma lista de etapas em uma Pipeline e a ordem de execução.

Use um StepSequence ao inicializar um pipeline para criar um fluxo de trabalho que contenha etapas para executar em uma ordem específica.

Inicializar StepSequence.

TrainingOutput

Define uma saída especializada de determinados PipelineSteps para uso em um pipeline.

O TrainingOutput permite que uma métrica ou um modelo de machine learning automatizado seja disponibilizado como uma saída de etapa para ser consumido por outra etapa em um pipeline do Azure Machine Learning. Não pode ser usado com AutoMLStep ou HyperDriveStep.

Inicializar TrainingOutput.

param model_file: o arquivo de modelo específico a ser incluído na saída. Somente para HyperDriveStep.

Enumerações

TimeZone

Enumera os fusos horários válidos para uma Schedule de recorrência.