Comprendre le problème de l’entreprise

Effectué

Proseware est une jeune start-up spécialisée dans le secteur médical. L’une de ses équipes travaille sur une nouvelle application web qui aidera les praticiens à diagnostiquer les patients plus rapidement. Des recherches ont montré que le diabète est l’un des diagnostics courants, et qu’il est facilement détectable lorsqu’un certain schéma dans les données médicales d’un patient est apparent.

Pour lancer la nouvelle application web qui aidera les praticiens à diagnostiquer les patients, la première fonctionnalité à déployer dans l’application est un détecteur de diabète. La fonctionnalité permettra à un praticien de collecter des données médicales relatives à un patient, de les renseigner dans l’application et d’apprendre s’il y a une forte probabilité que ce patient souffre de diabète. Les praticiens utiliseront ces insights et leur expertise pour donner à leurs patients des conseils sur les prochaines étapes.

L’équipe de science des données a créé un modèle de classification qui prédit avec précision si quelqu’un a du diabète ou non en fonction de données anonymisées. L’entraînement du modèle est défini dans un notebook Jupyter. Il vous appartient maintenant, en tant qu’ingénieur Machine Learning, de prendre le travail de l’équipe de science des données et de le mettre en production.

Pour opérationnaliser le modèle, vous devez :

  • Convertir l’entraînement du modèle en pipeline robuste et reproductible.
  • Tester le code et le modèle dans un environnement de développement.
  • Déployer le modèle dans un environnement de production.
  • Automatiser le processus de bout en bout.

Bien qu’un notebook Jupyter soit idéal pour l’expérimentation, il n’est pas adapté aux charges de travail de production. Votre première tâche consistera à convertir les notebooks en scripts, et à exécuter l’entraînement du modèle en tant que tâche Azure Machine Learning, afin que le workflow puisse être facilement déclenché et automatisé.