Épisode

Science des données reproductible avec Machine Learning

Être en mesure d’expliquer votre propre code quelques mois après l’écriture est difficile. Imagine avoir à expliquer les décisions d’un algorithme IA quelques années après son exécution ! Toutefois, il est relativement facile de configurer votre flux de travail de développement pour rendre cela possible, tant que vous réalisez que la façon dont nous construisons ML et l’IA est fondamentalement différente de l’ingénierie logicielle traditionnelle. En quelques mots, il s’agit de : la recherche, le développement et le déploiement reproductibles. Il est rendu possible par une utilisation intelligente des environnements de notebook modernes, notamment Azure ML Compute Instances, par opposition aux IDEs plus traditionnels, comme Visual Studio Code. Rafal Lukawiecki travaille activement dans la science des données, le Machine Learning et l’exploration de données depuis plus d’une décennie, et il a étudié et utilisé l’intelligence artificielle depuis longtemps avant qu’il soit populaire, dans les années 90. Regardez cet épisode pour savoir comment il organise son flux de travail reproductible.

Accédez à :

  • [02:30] Apprendre la recherche reproductible avec Rafal Lukawiecki
  • [03:01] Modélisation et exploration et développement logiciel
  • [09:28] Étapes d’un flux de travail reproductible
  • Démonstration [15:20] : Flux de travail à l’aide de RStudio et RMarkdown s’exécutant localement
  • [22:25] Démonstration : notebooks RMarkdown dans  Azure ML Compute Instance

Informations complémentaires :

Ne manquez pas de nouveaux épisodes,  abonnez-vous à l’IA Show