Handleiding voor MLflow

MLflow is een open source-platform voor het beheer van de end-to-end levenscyclus van machine learning. Het bestaat uit de volgende hoofdcomponenten:

  • Tracering: Hiermee kunt u experimenten volgen om parameters en resultaten vast te leggen en te vergelijken.
  • Modellen: Hiermee kunt u modellen beheren en implementeren, van verschillende ML-bibliotheken tot verschillende modelbedienings- en inferentieplatforms.
  • Projecten: Hiermee kunt u ML-code verpakken in een herbruikbare, reproduceerbare vorm om te delen met andere datawetenschappers of over te zetten naar productie.
  • Modelregister: Hiermee kunt u een modelwinkel centraliseren voor het beheren van de overgangen van de volledige levenscyclus van modellen: van staging naar productie, met mogelijkheden voor versiebeheer en annotatie.
  • Modellen aanbieden: Hiermee kunt u MLflow-modellen als REST-eindpunten hosten.

Azure Databricks biedt een volledig beheerde en gehoste versie van MLflow, geïntegreerd met beveiligingsfuncties voor bedrijven, hoge beschikbaarheid en andere Azure Databricks-werkruimtefuncties zoals experimenter- en runbeheer en het vastleggen van revisies van notebooks. MLflow op Azure Databricks biedt een geïntegreerde ervaring voor het volgen en beveiligen van machine learning-modeltrainingen en het uitvoeren van machine learning-projecten.

Nieuwe gebruikers moeten beginnen met de quickstart, waarin de basis-API's voor MLflow-tracering worden gedemonstreert. In de volgende artikelen wordt elke MLflow-component geïntroduceerd met voorbeeldnotitieblokken en wordt beschreven hoe deze componenten worden gehost binnen Azure Databricks.

MLflow ondersteunt Java, Python, R en REST-API's.

MLflow-gegevens worden versleuteld door Azure Databricks met behulp van een door het platform beheerde sleutel. Versleuteling met door de klant beheerde sleutels inschakelen voor beheerde services wordt niet ondersteund.