Aan de slag met MLflow-experimenten

Deze verzameling quickstart-notebooks laat zien hoe u aan de slag kunt gaan met MLflow-experimentuitvoeringen.

MLflow-onderdelen

MLflow is een open source-platform voor het beheer van de end-to-end levenscyclus van machine learning. MLflow heeft drie primaire onderdelen:

  • Tracering
  • Modellen
  • Projecten

Met het onderdeel MLflow Tracking kunt u trainingssessies (uitvoeringen) voor machinemodellen registreren en opvragen met behulp van de volgende API's:

Een MLflow-uitvoering is een verzameling parameters, metrische gegevens, tags en artefacten die zijn gekoppeld aan een trainingsproces voor een machine learning-model.

Wat zijn experimenten in MLflow?

Experimenten zijn de primaire eenheid van de organisatie in MLflow; alle MLflow-uitvoeringen behoren tot een experiment. Met elk experiment kunt u uitvoeringen visualiseren, zoeken en vergelijken, en uitvoeringsartefacten of metagegevens downloaden voor analyse in andere hulpprogramma's. Experimenten worden onderhouden op een door Azure Databricks gehoste MLflow-traceringsserver.

Experimenten bevinden zich in de bestandsstructuur van de werkruimte navigeren. U beheert experimenten met dezelfde hulpprogramma's die u gebruikt voor het beheren van andere werkruimteobjecten, zoals mappen, notebooks en bibliotheken.

Snelstartnotitieblokken voor MLflow

In de volgende quickstart-notebooks ziet u hoe u een MLflow-uitvoering maakt en aanmeldt met behulp van de MLflow-api's voor tracering, en hoe u de gebruikersinterface van het experiment gebruikt om de uitvoering weer te geven. Deze notebooks zijn beschikbaar in Python, Scala en R.

De Python- en R-notebooks maken gebruik van een notebook-experiment. Het Scala-notebook maakt een experiment in de Shared map.

Notitie

Met Databricks Runtime 10.3 ML en hoger is Automatische logboekopname van Databricks standaard ingeschakeld voor Python-notebooks.