Aflevering

Reproduceerbare gegevenswetenschap met Machine Learning

Het is moeilijk om uw eigen code een paar maanden uit te leggen nadat u deze hebt geschreven. Imagine de beslissingen van een AI-algoritme een paar jaar na uitvoering moeten uitleggen. Het is echter relatief eenvoudig om uw ontwikkelwerkstroom in te stellen om dat mogelijk te maken, zolang u zich realiseert dat de manier waarop we ML bouwen en AI fundamenteel verschilt van traditionele software-engineering. In een notendop gaat het om: reproduceerbaar onderzoek, ontwikkeling en implementatie. Het wordt mogelijk gemaakt door een slim gebruik van moderne notebookomgevingen, waaronder Azure ML Compute Instances, in tegenstelling tot de meer traditionele IDE's, zoals Visual Studio Code. Rafal Tenantki werkt al meer dan tien jaar actief in data science, machine learning en data mining en hij heeft kunstmatige intelligentie formeel bestudeerd en gebruikt voordat het populair was, terug in de jaren '90. Bekijk deze aflevering om erachter te komen hoe hij zijn reproduceerbare werkstroom organiseert.

Ga naar:

  • [02:30] Meer informatie over reproduceerbaar onderzoek met Rafal Extensęki
  • [03:01] Modellering en verkenning versus softwareontwikkeling
  • [09:28] Stappen naar een reproduceerbare werkstroom
  • [15:20] Demo: Werkstroom met RStudio en RMarkdown die lokaal wordt uitgevoerd
  • [22:25] Demo: RMarkdown-notebooks inan  Azure ML Compute Instance

Meer informatie:

Mis geen nieuwe afleveringen,  abonneer u op de AI-show