Apporter vos charges de travail R
S’APPLIQUE À :Extension Azure CLI v2 (actuelle)Kit de développement logiciel (SDK) Python azure-ai-ml v2 (version actuelle)
Il n’existe pas de kit SDK Azure Machine Learning pour R. À la place, vous allez utiliser l’interface CLI ou un script de contrôle Python pour exécuter vos scripts R.
Cet article décrit les principaux scénarios qui sont pris en charge pour R dans Azure Machine Learning, et les limitations connues.
Workflow R classique
Workflow classique pour l’utilisation de R avec Azure Machine Learning :
Développez des scripts R de manière interactive à l’aide de Jupyter Notebooks sur une instance de calcul. (Bien que vous puissiez également ajouter Posit ou RStudio à une instance de calcul, vous ne pouvez actuellement pas accéder aux ressources de données dans l’espace de travail à partir de ces applications sur l’instance de calcul. Pour l’instant, il est préférable de travailler de manière interactive dans un notebook Jupyter.)
- Lisez les données tabulaires à partir d’une ressource de données ou d’un magasin de données inscrit.
- Installez des bibliothèques R supplémentaires.
- Enregistrez des artefacts dans le stockage de fichiers de l’espace de travail.
Adaptez votre script pour qu’il s’exécute en tant que travail de production dans Azure Machine Learning.
- Supprimez tout code pouvant nécessiter une interaction de l’utilisateur.
- Ajoutez des paramètres d’entrée de ligne de commande au script si nécessaire.
- Incluez le script
azureml_utils.R
et utilisez-le comme source dans le même répertoire de travail que le script R à exécuter. - Utilisez
crate
pour empaqueter le modèle. - Incluez les fonctions R/MLflow dans le script pour journaliser des artefacts, des modèles, des paramètres et/ou des étiquettes dans le travail sur MLflow.
Envoyez des travaux R asynchrones distants (vous envoyez des travaux via l’interface CLI ou le kit SDK Python, mais pas avec R)
- Créez un environnement.
- Journalisez les artefacts, paramètres, étiquettes et modèles de travail.
Inscrivez votre modèle à l’aide d’Azure Machine Learning studio.
Déployez les modèles R inscrits sur des points de terminaison en ligne managés.
- Utilisez les points de terminaison déployés pour l’inférence/le scoring en temps réel.
Limites connues
Limitation | Faites plutôt ceci |
---|---|
Il n’existe pas de kit SDK control-plane (plan de contrôle) pour R. | Utilisez le script de contrôle Azure CLI ou Python pour envoyer les travaux. |
RStudio, exécuté sous forme d’application personnalisée (telle que Posit ou RStudio) dans un conteneur sur l’instance de calcul, ne peut pas accéder aux ressources de l’espace de travail ou à MLflow. | Utilisez Jupyter Notebooks avec le noyau R sur l’instance de calcul. |
L’interrogation interactive du registre MLflow de l’espace de travail à partir de R n’est pas prise en charge. | |
Les exécutions MLflow imbriquées dans R ne sont pas prises en charge. | |
L’étape de travail parallèle n’est pas prise en charge. | Exécutez un script en parallèle n fois à l’aide de différents paramètres d’entrée. Par contre, vous devrez méta-programmer pour générer n appels YAML ou CLI pour ce faire. |
L’inscription/l’enregistrement de modèles par programmation à partir d’un travail en cours d’exécution avec R n’est pas pris en charge. | |
Aucun déploiement de code (autrement dit, déploiement automatique) d’un modèle R MLflow n’est actuellement pris en charge. | Créez un conteneur personnalisé avec plumber pour le déploiement. |
Le scoring d’un modèle R avec des points de terminaison de lot n’est pas pris en charge. | |
Le fichier yml du déploiement en ligne Azure Machine Learning ne peut utiliser que des URI d’image directement du registre pour la spécification de l’environnement, et non des environnements prédéfinis à partir du même Dockerfile. | Suivez les étapes décrites dans le Guide pratique pour déployer un modèle R inscrit sur un point de terminaison (en temps réel) en ligne pour le déploiement approprié. |
Étapes suivantes
Pour en savoir plus sur R dans Azure Machine Learning :