Aan de slag met MLflow-experimenten
Deze verzameling quickstart-notebooks laat zien hoe u aan de slag kunt gaan met MLflow-experimentuitvoeringen.
MLflow-onderdelen
MLflow is een open source-platform voor het beheer van de end-to-end levenscyclus van machine learning. MLflow heeft drie primaire onderdelen:
- Tracering
- Modellen
- Projecten
Met het onderdeel MLflow Tracking kunt u trainingssessies (uitvoeringen) voor machinemodellen registreren en opvragen met behulp van de volgende API's:
Een MLflow-uitvoering is een verzameling parameters, metrische gegevens, tags en artefacten die zijn gekoppeld aan een trainingsproces voor een machine learning-model.
Wat zijn experimenten in MLflow?
Experimenten zijn de primaire eenheid van de organisatie in MLflow; alle MLflow-uitvoeringen behoren tot een experiment. Met elk experiment kunt u uitvoeringen visualiseren, zoeken en vergelijken, en uitvoeringsartefacten of metagegevens downloaden voor analyse in andere hulpprogramma's. Experimenten worden onderhouden op een door Azure Databricks gehoste MLflow-traceringsserver.
Experimenten bevinden zich in de bestandsstructuur van de werkruimte navigeren. U beheert experimenten met dezelfde hulpprogramma's die u gebruikt voor het beheren van andere werkruimteobjecten, zoals mappen, notebooks en bibliotheken.
Snelstartnotitieblokken voor MLflow
In de volgende quickstart-notebooks ziet u hoe u een MLflow-uitvoering maakt en aanmeldt met behulp van de MLflow-api's voor tracering, en hoe u de gebruikersinterface van het experiment gebruikt om de uitvoering weer te geven. Deze notebooks zijn beschikbaar in Python, Scala en R.
De Python- en R-notebooks maken gebruik van een notebook-experiment. Het Scala-notebook maakt een experiment in de Shared
map.
Notitie
Met Databricks Runtime 10.3 ML en hoger is Automatische logboekopname van Databricks standaard ingeschakeld voor Python-notebooks.