Začínáme s experimenty v MLflow

Tato kolekce poznámkových bloků ukazuje, jak můžete začít spouštět experimenty MLflow.

Komponenty MLflow

MLflow je open source platforma pro správu kompletního životního cyklu strojového učení. MLflow má tři primární komponenty:

  • Sledování
  • Modely
  • Projekty

Komponenta MLflow Tracking umožňuje protokolovat a dotazovat se na trénovací relace (spuštění) modelu počítače pomocí následujících rozhraní API:

Spuštění MLflow je kolekce parametrů, metrik, značek a artefaktů přidružených k procesu trénování modelu strojového učení.

Co jsou experimenty v MLflow?

Experimenty jsou primární jednotkou organizace v MLflow. Všechna spuštění MLflow patří do experimentu. Každý experiment umožňuje vizualizovat, prohledávat a porovnávat spuštění a stahovat artefakty nebo metadata spuštění pro analýzu v jiných nástrojích. Experimenty se spravují na serveru pro sledování MLflow hostovaného v Azure Databricks.

Experimenty se nacházejí ve stromu souborů pracovního prostoru . Experimenty spravujete pomocí stejných nástrojů, které používáte ke správě jiných objektů pracovního prostoru, jako jsou složky, poznámkové bloky a knihovny.

Ukázkové poznámkové bloky MLflow

Následující poznámkové bloky ukazují, jak vytvořit a přihlásit ke spuštění MLflow pomocí rozhraní API pro sledování MLflow a jak pomocí uživatelského rozhraní experimentu zobrazit spuštění. Tyto poznámkové bloky jsou dostupné v Pythonu, Scalě a R.

Poznámkové bloky Pythonu a R používají experiment poznámkového bloku. Poznámkový blok Scala vytvoří ve Shared složce experiment.

Poznámka:

S modulem Databricks Runtime 10.4 LTS ML a novějším je automatickélogování Databricks ve výchozím nastavení povolené pro poznámkové bloky Pythonu.