Pendant la période estivale, avec les carnets de vacances, n’oubliez pas Azure ML ;-)
La période estivale et celle donc des congés d’été 2015 bat son plein. Rien de tel pour se prêter à de nouvelles expériences (inédites ?!).
Avec les carnets de vacances classiques, nous souhaitons partager avec vous - quelques « ateliers pratiques » pour aborder, si ce n’était pas déjà encore le cas, Azure Machine Learning (Azure ML). (Si vous suivez ce blog régulièrement, cela ne devrait pas être le cas !!)
Tout cela bien sur si vous avez peur de vous ennuyer ou si la chaleur ambiante vous impose de rester confiner à l’intérieur ;-)
Ces ateliers exigent seulement un navigateur Internet et 30 minutes chacun pour les réaliser. Rien de plus facile pour tenter avec succès une nouvelle expérience.
Pour accéder à l’environnement Azure ML, rendez-vous ici et cliquez sur Mise en route immédiate.
Un dialogue vous propose ensuite un accès invité (GUEST ACCESS) ou de vous signer avec votre compte Microsoft (SIGN IN). Sélectionnez l’option, la mieux appropriée et suivez les instructions associées. Vous êtes alors fin prêt(e)s pour les ateliers suivants.
Atelier « Introduction à Azure Machine Learning »
Ce premier atelier pratique est destiné à servir d'introduction à la création d'un modèle prédictif avec Azure ML. Ce dernier illustre l’accès à l'environnement de développement visuel et collaboratif Azure ML Studio, l’exploration et la visualisation des données dans Azure ML ainsi que la création d’un modèle prédictif simple.
Les consommateurs évaluent souvent des produits similaires par des critères spécifiques qui les intéressent. Dans l'industrie automobile, la consommation (en nombres de litres aux 100 kilomètres, miles par gallon (MPG), etc. selon les pays), quel que soit le type de carburant, s’impose toujours comme élément de mesure et critère de choix importants pour les choix d’un véhicule. (Pour les véhicules électriques, il serait plutôt question évidemment d’autonomie). Ainsi, par exemple, comment les constructeurs automobiles peuvent–ils déterminer quelle serait une valeur de MPG acceptable pour le véhicule qu'ils s’apprêtent à produire ? En utilisant l’analytique avancée, les constructeurs peuvent utiliser diverses caractéristiques de véhicules similaires d’ores et déjà disponibles sur le marché et MPG associé et prédire ce qui serait un MPG acceptable pour leur voiture sortie des chaines de montage.
Pour illustrer cela, cet atelier vous propose donc de travailler avec un jeu de données qui inclut diverses informations sur les automobiles depuis les années 1970 et début des années 1980. Le jeu de données comprend des caractéristiques tels que la consommation en MPG, la puissance, l’accélération, la masse à vide, etc. – il s’agit d’une illustration et les caractéristiques actuelles sont bien différentes : à la hausse ou la baisse, c’est selon… – Valeur numérique oblige, l’atelier utilise un algorithme de régression linéaire pour prédire un MPG acceptable pour une automobile.
Atelier « Déployer un Modèle avec Azure Machine Learning »
Si l’expérience précédente vous a plu, n’hésitez pas à continuer sur votre lancée avec ce second atelier. Cet atelier explore cette fois l'apprentissage non supervisé dans Azure ML et le déploiement d'un modèle prédictif en tant que service web. Il débute par la copie d'une expérience depuis la galerie communautaire d’Azure ML vers ML Studio, il se poursuit par la création d’une expérience de notation (scoring), et se conclut par le déploiement d'un modèle comme service web et l’interaction avec l'API REST résultante à l'aide de l'interface web incluse.
« Où dois-je ouvrir mon prochain restaurant ? » Il est souvent difficile d’apporter une réponse à une telle question. Un bon choix pourrait conduire à une augmentation des recettes et donc des profits si le tout est bien géré, mais un mauvais choix pourrait faire perdre à celle ou à celui qui s’y prête une bonne partie si ce n’est l’ensemble d’un investissement majeur... Essayer de prendre une telle décision en passant manuellement au crible des centaines voire même des milliers de villes possibles ou les quartiers de celles-ci s’avère être presque impossible.
Le Machine Learning peut aider dans cette tâche par l’analyse de gros volumes de données sur les différents endroits envisageables, la détermination de caractéristiques communes entre les sites possibles et le regroupement ensemble ou partitionnement de ces emplacements aux attributs communs. Les groupes peuvent alors être comparées aux implantations de restaurant précédemment réussies pour aider à affiner le choix pour savoir où ensuite ouvrir.
Dans cet atelier, vous travaillerez avec un jeu de données qui inclut des données géographiques, économiques et démographiques sur les différentes villes américaines. Le modèle que vous explorerez utilise un algorithme K-Moyennes ou K-Means pour le partitionnement (clusters) des villes en groupes/compartiments distinctifs.
Atelier « Fouille de texte avec R et Azure Machine Learning »
Vous souhaitez parfaire l’expérience. Passez à ce troisième et dernier atelier sur le langage de programmation et environnement statistique R.
Pour cela, cet atelier explore cette fois l’analyse de textes et l'intégration de R avec Azure ML. Il vous guidera dans le chargement de données depuis une source externe, l’utilisation de scripts R dans ML Studio, ainsi que dans les tâches courantes d’analyse/fouille de texte et bien sûr les visualisations.
Les réseaux/médias sociaux sont devenus une plate-forme très influente pour les entreprises, les professionnels et les consommateurs quels qu’ils soient pour exprimer des idées et des opinions, commercialiser de nouveaux produits et faire ensuite de la publicité sur leurs ventes, ou pour partager n'importe quelle autre nouvelle importante ou information. La plupart des sites de réseaux/médias sociaux incluent des mots clés ou des hashtags vis-à-vis desquels les utilisateurs peuvent envoyer des contenus associés. Si les entreprises sont en capacité d’effectuer des analyses avancées sur les postes de mots clés qui se rapportent à elles, elles peuvent dès lors apprendre différentes choses telles que le sentiment client, les produits connexes, qui achète quel produit et à partir d’où, etc.
Pour ce dernier atelier, vous travaillerez avec des données réelles de Twitter, extraites à partir d'une API de Twitter. Les données incluent des Tweets réels qui utilise le hashtag Azure. Le langage R dispose d’une vaste collection de paquets et de fonctions avancées d’analyse et de fouille de texte. L’atelier utilisera donc des scripts R qui seront exécutées dans ML Studio. Dans la pratique, ces scripts exécutent des tâches de préparation des données, d’exploration et de visualisation communes à la fouille de texte. Le résultat final sera une visualisation du résultat.
Nous en avons terminé avec cette vue d’ensemble des ateliers proposés et des expériences associées qui vous tendent la main pour un tour d’horizon d’Azure ML.
Vous souhaitez vous lancer pour ces vacances ? L'ensemble de ces ateliers pratiques sont mis à disposition ci-dessous sous forme d’un fichier archive .ZIP à télécharger.
Dans le même temps, les expériences correspondantes prêtes à l’emploi sont disponibles dans la galerie communautaire d’Azure ML ici.
Bons ateliers et très bonnes vacances !!