Glossário do Azure Machine Learning

O glossário do Azure Machine Learning é um pequeno dicionário de terminologia para a plataforma de Machine Learning. Para obter a terminologia geral do Azure, consulte também:

Componente

Um componente de Aprendizado de Máquina é uma parte de código independente que executa uma etapa em um pipeline de aprendizado de máquina. Os componentes são os blocos de construção de pipelines avançados de aprendizado de máquina. Os componentes podem executar tarefas como processamento de dados, treinamento de modelos e pontuação de modelos. Um componente é análogo a uma função. Ele tem um nome e parâmetros, espera entrada e retorna saída.

Computação

Uma computação é um recurso de computação designado onde você executa seu trabalho ou hospeda seu ponto de extremidade. O Machine Learning suporta os seguintes tipos de computação:

  • Cluster de computação: uma infraestrutura de computação gerenciada que você pode usar para criar facilmente um cluster de nós de computação de CPU ou GPU na nuvem.

    Nota

    Em vez de criar um cluster de computação, use a computação sem servidor para descarregar o gerenciamento do ciclo de vida da computação para o Azure Machine Learning.

  • Instância de computação: um ambiente de desenvolvimento totalmente configurado e gerenciado na nuvem. Você pode usar a instância como um treinamento ou computação de inferência para desenvolvimento e teste. É semelhante a uma máquina virtual na nuvem.

  • Cluster Kubernetes: usado para implantar modelos treinados de aprendizado de máquina no Serviço Kubernetes do Azure (AKS). Você pode criar um cluster AKS a partir do seu espaço de trabalho de Aprendizado de Máquina ou anexar um cluster AKS existente.

  • Computação anexada: você pode anexar seus próprios recursos de computação ao seu espaço de trabalho e usá-los para treinamento e inferência.

Dados

O Machine Learning permite-lhe trabalhar com diferentes tipos de dados:

  • URIs (um local no armazenamento local ou em nuvem):
    • uri_folder
    • uri_file
  • Tabelas (uma abstração de dados tabulares):
    • mltable
  • Primitivos:
    • string
    • boolean
    • number

Para a maioria dos cenários, você usa URIs (uri_folder e uri_file) para identificar um local no armazenamento que pode ser facilmente mapeado para o sistema de arquivos de um nó de computação em um trabalho montando ou baixando o armazenamento para o nó.

O mltable parâmetro é uma abstração para dados tabulares que é usada para trabalhos de aprendizado de máquina automatizado (AutoML), trabalhos paralelos e alguns cenários avançados. Se você está começando a usar o Machine Learning e não está usando o AutoML, recomendamos que comece com URIs.

Arquivo de dados

Os armazenamentos de dados do Aprendizado de Máquina mantêm com segurança as informações de conexão com seu armazenamento de dados no Azure para que você não precise codificá-las em seus scripts. Você pode registrar e criar um armazenamento de dados para se conectar facilmente à sua conta de armazenamento e acessar os dados em seu serviço de armazenamento subjacente. A CLI do Azure Machine Learning v2 e o SDK v2 suportam os seguintes tipos de serviços de armazenamento baseados na nuvem:

  • Contêiner de Armazenamento de Blob do Azure
  • Compartilhamento de arquivos do Azure
  • Azure Data Lake Storage
  • Azure Data Lake Storage Gen2

Environment

Os ambientes de Machine Learning são um encapsulamento do ambiente onde sua tarefa de aprendizado de máquina acontece. Eles especificam os pacotes de software, as variáveis de ambiente e as configurações de software em torno de seus scripts de treinamento e pontuação. Os ambientes são entidades gerenciadas e versionadas em seu espaço de trabalho do Machine Learning. Os ambientes permitem fluxos de trabalho de aprendizado de máquina reproduzíveis, auditáveis e portáteis em vários computadores.

Tipos de ambiente

O Machine Learning suporta dois tipos de ambientes: com curadoria e personalizado.

Os ambientes com curadoria são fornecidos pelo Machine Learning e estão disponíveis em seu espaço de trabalho por padrão. Destinam-se a ser usados tal como estão. Eles contêm coleções de pacotes Python e configurações para ajudá-lo a começar com várias estruturas de aprendizado de máquina. Esses ambientes pré-criados também permitem um tempo de implantação mais rápido. Para recuperar uma lista completa de ambientes disponíveis, consulte Ambientes do Azure Machine Learning com a CLI & SDK (v2).

Em ambientes personalizados, você é responsável por configurar seu ambiente. Certifique-se de instalar os pacotes e quaisquer outras dependências que seu script de treinamento ou pontuação precisa na computação. O Machine Learning permite que você crie seu próprio ambiente usando:

  • Uma imagem do Docker.
  • Uma imagem base do Docker com um conda YAML para personalizar ainda mais.
  • Um contexto de construção do Docker.

Modelo

Os modelos de Machine Learning consistem nos arquivos binários que representam um modelo de aprendizado de máquina e quaisquer metadados correspondentes. Você pode criar modelos a partir de um arquivo ou diretório local ou remoto. Para locais remotos, https, wasbse azureml locais são suportados. O modelo criado é rastreado no espaço de trabalho sob o nome e a versão especificados. O Machine Learning suporta três tipos de formatos de armazenamento para modelos:

  • custom_model
  • mlflow_model
  • triton_model

Área de trabalho

O espaço de trabalho é o recurso de nível superior para Machine Learning. Ele fornece um local centralizado para trabalhar com todos os artefatos que você cria quando usa o Machine Learning. O espaço de trabalho mantém um histórico de todos os trabalhos, incluindo logs, métricas, saída e um instantâneo de seus scripts. O espaço de trabalho armazena referências a recursos como armazenamentos de dados e computação. Ele também detém todos os ativos, como modelos, ambientes, componentes e ativos de dados.

Próximos passos

O que é o Azure Machine Learning?