Incorporación de cargas de trabajo de R

SE APLICA A:Extensión ML de la CLI de Azure v2 (actual)SDK de Python azure-ai-ml v2 (actual)

No hay ningún SDK de Azure Machine Learning para R. En su lugar, usará la CLI o un script de control de Python para ejecutar los scripts de R.

En este artículo se describen los escenarios clave de R que se admiten en Azure Machine Learning y las limitaciones conocidas.

Flujo de trabajo típico de R

Un flujo de trabajo típico para usar R con Azure Machine Learning:

  • Desarrolle scripts de R de forma interactiva mediante cuadernos de Jupyter Notebook en una instancia de proceso. (Aunque también puede agregar Posit o RStudio a una instancia de proceso, actualmente no puede acceder a los recursos de datos en el área de trabajo desde estas aplicaciones en la instancia de proceso. Por ahora, el trabajo interactivo se realiza mejor en un cuaderno de Jupyter Notebook).

    • Leer datos tabulares de recursos de datos registrados o almacenes de datos
    • Instalar bibliotecas de R adicionales
    • Guardar artefactos en el almacenamiento de archivos del área de trabajo
  • Adaptación del script para que se ejecute como un trabajo de producción en Azure Machine Learning

    • Quitar cualquier código que pueda requerir la interacción del usuario
    • Agregar parámetros de entrada de línea de comandos al script según sea necesario
    • Incluir y generar el script azureml_utils.R en el mismo directorio de trabajo del script de R que se va a ejecutar
    • Usar crate para empaquetar el modelo
    • Incluir las funciones de R/MLflow en el script para registrar artefactos, modelos, parámetros o etiquetas en el trabajo en MLflow
  • Envío de trabajos remotos asincrónicos de R (se envían trabajos a través de la CLI o el SDK de Python, no R)

    • Crear un entorno
    • Registrar artefactos de trabajo, parámetros, etiquetas y modelos
  • Registro del modelo mediante Estudio de Azure Machine Learning

  • Implementación de modelos de R registrados en puntos de conexión en línea administrados

    • Usar los puntos de conexión implementados para la inferencia o puntuación en tiempo real

Restricciones conocidas

 

Limitación Haga esto en su lugar
No hay ningún SDK del plano de control de R. Use la CLI de Azure o el script de control de Python para enviar trabajos.
RStudio, cuando se ejecuta como una aplicación personalizada (como Posit o RStudio) dentro de un contenedor de la instancia de proceso, no puede acceder a los recursos del área de trabajo ni a MLflow. Use Jupyter Notebooks con el kernel de R en la instancia de proceso.
No se admite la consulta interactiva del registro de MLflow del área de trabajo desde R.
No se admiten ejecuciones de MLflow anidadas en R.
No se admite el paso de trabajo paralelo. Ejecute un script en paralelo n veces mediante distintos parámetros de entrada. Sin embargo, para hacerlo, tendrá que realizar una metaprogramación para generar n llamadas YAML o de la CLI.
No se admite el registro o la grabación de modelos mediante programación desde un trabajo en ejecución con R.
Actualmente no se admite la implementación de código cero (es decir, la implementación automática) de un modelo MLflow de R. Cree un contenedor personalizado con plumber para la implementación.
No se admite la puntuación de un modelo de R con puntos de conexión por lotes.
El archivo YML de implementación en línea de Azure Machine Learning solo puede usar URI de imagen directamente desde el registro para la especificación del entorno; no entornos precompilados desde el mismo Dockerfile. Siga los pasos descritos en Implementación de un modelo de R registrado en un punto de conexión en línea (en tiempo real) para ver la manera correcta de realizar la implementación.

Pasos siguientes

Más información sobre R en Azure Machine Learning: