Share via


Trazer suas cargas de trabalho do R

APLICA-SE A:Extensão de ML da CLI do Azure v2 (atual)SDK do Python azure-ai-ml v2 (atual)

Não há nenhum SDK do Azure Machine Learning para R. Em vez disso, você usará a CLI ou um script de controle do Python para executar os scripts R.

Este artigo descreve os principais cenários do R com suporte no Azure Machine Learning e as limitações conhecidas.

Fluxo de trabalho típico do R

Um fluxo de trabalho típico para usar o R com o Azure Machine Learning:

  • Desenvolva scripts R de maneira interativa usando Jupyter Notebooks em uma instância de computação. (Embora você também possa adicionar o Posit ou o RStudio a uma instância de computação, atualmente, não é possível acessar ativos de dados no workspace desses aplicativos na instância de computação. Portanto, por enquanto, é melhor realizar o trabalho interativo em um Jupyter notebook).

    • Ler dados de tabela de um ativo de dados ou um armazenamento de dados registrado
    • Instalar bibliotecas adicionais do R
    • Salvar artefatos no armazenamento de arquivos do workspace
  • Adaptar seu script para executá-lo como um trabalho de produção no Azure Machine Learning

    • Remover qualquer código que possa exigir a interação do usuário
    • Adicionar parâmetros de entrada de linha de comando ao script conforme necessário
    • Incluir e gerar o script azureml_utils.R no mesmo diretório de trabalho do script R a ser executado
    • Usar crate para empacotar o modelo
    • Incluir as funções R/MLflow no script para registrar em log artefatos, modelos, parâmetros e/ou marcas no trabalho do MLflow
  • Enviar trabalhos assíncronos e remotos do R (os trabalhos são enviados por meio da CLI ou do SDK do Python, não do R)

    • Criar um ambiente
    • Registrar em log artefatos, parâmetros, marcas e modelos do trabalho
  • Registrar seu modelo usando o Estúdio do Azure Machine Learning

  • Implantar modelos do R registrados em pontos de extremidade online gerenciados

    • Usar os pontos de extremidade implantados para inferência/pontuação em tempo real

Limitações conhecidas

 

Limitação Em vez disso, faça
Não há nenhum SDK do painel de controle do R. Use a CLI do Azure ou o script de controle do Python para enviar os trabalhos.
O RStudio em execução como um aplicativo personalizado (como o Posit ou o RStudio) em um contêiner na instância de computação não pode acessar os ativos de workspace nem o MLflow. Use Jupyter Notebooks com o kernel do R na instância de computação.
Não há suporte para a consulta interativa do registro do MLflow do workspace no R.
Não há suporte para execuções aninhadas do MLflow no R.
Não há suporte para a etapa de trabalho paralelo. Execute um script em tempos paralelos n usando parâmetros de entrada diferentes. No entanto, você precisará fazer uma metaprogramação para gerar chamadas n do YAML ou da CLI para fazer isso.
Não há suporte para o registro/a gravação de modelo programático em um trabalho em execução com o R.
Atualmente, não há suporte para a implantação de código zero (ou seja, implantação automática) de um modelo do R no MLflow. Crie um contêiner personalizado com plumber para implantação.
Não há suporte para a pontuação de um modelo do R com pontos de extremidade em lote.
Um YML de implantação online do Azure Machine Learning só pode usar URIs de imagem diretamente do Registro para a especificação de ambiente, não os ambientes predefinidos do mesmo Dockerfile. Siga as etapas descritas em Como implantar um modelo do R registrado em um ponto de extremidade online (em tempo real) para ver a maneira correta de implantá-lo.

Próximas etapas

Saiba mais sobre o R no Azure Machine Learning: