Aflevering

Reproduceerbare Datawetenschap met Machine Learning

Het is moeilijk om uw eigen code een paar maanden na het schrijven uit te leggen. Stel dat u de beslissingen van een AI-algoritme een paar jaar nadat het is uitgevoerd moet uitleggen. Het is echter relatief eenvoudig om uw ontwikkelwerkstroom in te stellen om dat mogelijk te maken, zolang u zich realiseert dat de manier waarop we ML en AI bouwen fundamenteel verschilt van traditionele software-engineering. In een notendop gaat het allemaal om: reproduceerbaar onderzoek, ontwikkeling en implementatie. Het wordt mogelijk gemaakt door slim gebruik te maken van moderne notebookomgevingen, waaronder Azure ML Compute Instances, in plaats van de meer traditionele IDE's, zoals Visual Studio Code. Rafal Azure is al ruim tien jaar actief bezig met data science, machine learning en data mining, en hij heeft formeel kunstmatige intelligentie bestudeerd en gebruikt lang voordat het populair was, terug in de jaren '90. Bekijk deze aflevering om erachter te komen hoe hij zijn reproduceerbare werkstroom organiseert.

Ga naar:

  • [02:30] Meer informatie over reproduceerbaar onderzoek met Rafal Azure-
  • [03:01] Modellering en verkenning versus softwareontwikkeling
  • [09:28] Stappen naar een reproduceerbare werkstroom
  • [15:20] Demo: Werkstroom met RStudio en RMarkdown lokaal uitgevoerd
  • [22:25] Demo: RMarkdown-notebooks in een Azure ML Compute-exemplaar

Meer informatie:

Mis geen nieuwe afleveringen,  abonneer u op de AI-show