Sdílet prostřednictvím


Uspořádání trénovacích běhů pomocí experimentů MLflow

Experimenty jsou jednotky organizace pro trénovací běhy modelu. Existují dva typy experimentů: pracovní prostor a poznámkový blok.

  • Experiment pracovního prostoru můžete vytvořit z uživatelského rozhraní Databricks Mosaic AI nebo rozhraní API MLflow. Experimenty pracovního prostoru nejsou přidružené k žádnému poznámkovému bloku a každý poznámkový blok může do těchto experimentů protokolovat spuštění pomocí ID experimentu nebo názvu experimentu.
  • Experiment poznámkového bloku je přidružený ke konkrétnímu poznámkovému bloku. Azure Databricks automaticky vytvoří experiment poznámkového bloku, pokud při spuštění pomocí mlflow.start_run() neexistuje žádný aktivní experiment.

Pokud chcete zobrazit všechny experimenty v pracovním prostoru, ke kterému máte přístup, vyberte na bočním panelu experimenty služby Machine Learning>.

Stránka Experimenty

Vytvoření experimentu pracovního prostoru

Tato část popisuje, jak vytvořit experiment pracovního prostoru pomocí uživatelského rozhraní Azure Databricks. Experiment pracovního prostoru můžete vytvořit přímo z pracovního prostoru nebo ze stránky Experimenty.

Můžete také použít rozhraní API MLflow nebo poskytovatele Databricks Terraform s databricks_mlflow_experiment.

Pokyny k protokolování spuštění do experimentů pracovního prostoru najdete v ukázkovém poznámkovém bloku protokolování.

  1. Na bočním panelu klikněte na Ikona pracovního prostoru Pracovní prostor.

  2. Přejděte do složky, ve které chcete experiment vytvořit.

  3. Klikněte pravým tlačítkem myši na složku a vyberte Vytvořit > experiment MLflow.

  4. V dialogovém okně Vytvořit experiment MLflow zadejte název experimentu a volitelné umístění artefaktu. Pokud nezadáte umístění artefaktů, artefakty se ukládají v úložišti artefaktů spravovaných MLflow: dbfs:/databricks/mlflow-tracking/<experiment-id>.

    Azure Databricks podporuje svazky katalogu Unity, úložiště objektů blob v Azure a umístění artefaktů služby Azure Data Lake Storage.

    V MLflow 2.15.0 a novějších můžete ukládat artefakty ve svazku katalogu Unity. Při vytváření experimentu MLflow zadejte cestu ke svazkům formuláře dbfs:/Volumes/catalog_name/schema_name/volume_name/user/specified/path jako umístění artefaktu experimentu MLflow.

    Pokud chcete ukládat artefakty ve službě Azure Blob Storage, zadejte identifikátor URI formuláře wasbs://<container>@<storage-account>.blob.core.windows.net/<path>. Artefakty uložené ve službě Azure Blob Storage se nezobrazují v uživatelském rozhraní MLflow; musíte je stáhnout pomocí klienta úložiště objektů blob.

    Poznámka:

    Když artefakt uložíte do jiného umístění než DBFS, artefakt se nezobrazí v uživatelském rozhraní MLflow. Modely uložené v jiných umístěních než DBFS nelze zaregistrovat v registru modelů.

  5. Klikněte na Vytvořit. Zobrazí se prázdný experiment.

Nový experiment pracovního prostoru můžete vytvořit také ze stránky Experimenty. Pokud chcete vytvořit nový experiment, použijte rozevírací seznam vytvoření experimentu rozevírací nabídku. V rozevírací nabídce můžete vybrat experiment AutoML nebo prázdný (prázdný).

  • Experiment AutoML Zobrazí se stránka konfigurace experimentu AutoML. Informace o použití AutoML naleznete v tématu Trénování modelů ML s využitím uživatelského rozhraní Puzzle AutoML.

  • Prázdný experiment Zobrazí se dialogové okno Vytvořit experiment MLflow. Zadáním názvu a volitelného umístění artefaktu v dialogovém okně vytvořte nový experiment pracovního prostoru. Výchozí umístění artefaktu je dbfs:/databricks/mlflow-tracking/<experiment-id>.

    Pokud chcete protokolovat spuštění do tohoto experimentu, zavolejte mlflow.set_experiment() cestu experimentu. Cesta k experimentu se zobrazí v horní části stránky experimentu. Podrobnosti a ukázkový poznámkový blok najdete v ukázkovém poznámkovém bloku protokolování.

Vytvoření experimentu poznámkového bloku

Když v poznámkovém bloku použijete příkaz mlflow.start_run(), protokoluje spuštění metriky a parametry do aktivního experimentu. Pokud není žádný experiment aktivní, Azure Databricks vytvoří experiment poznámkového bloku. Experiment poznámkového bloku sdílí stejný název a ID jako odpovídající poznámkový blok. ID poznámkového bloku je číselný identifikátor na konci adresy URL a ID poznámkového bloku.

Alternativně můžete předat cestu pracovního prostoru Azure Databricks k existujícímu poznámkovému bloku v mlflow.set_experiment() a vytvořit pro něj experiment poznámkového bloku.

Pokyny k protokolování spuštění do experimentů poznámkových bloků najdete v ukázkovém poznámkovém bloku.

Poznámka:

Pokud odstraníte experiment poznámkového bloku pomocí rozhraní API (například MlflowClient.tracking.delete_experiment() v Pythonu), přesune se samotný poznámkový blok do složky Koš.

Zobrazení experimentů

Každý experiment, ke kterému máte přístup, se zobrazí na stránce experimentů. Na této stránce můžete zobrazit libovolný experiment. Kliknutím na název experimentu zobrazíte stránku experimentu.

Další způsoby přístupu ke stránce experimentu:

  • Na stránku experimentu pro experiment pracovního prostoru se dostanete z nabídky pracovního prostoru.
  • Na stránku experimentu pro experiment poznámkového bloku se dostanete z poznámkového bloku.

Pokud chcete hledat experimenty, zadejte text do pole Filtrovat experimenty a stiskněte Enter nebo klikněte na ikonu lupy. Seznam experimentů se změní tak, aby zobrazoval pouze experimenty, které obsahují hledaný text ve sloupci Název, Autor, Umístění nebo Popis .

Kliknutím na název libovolného experimentu v tabulce zobrazte jeho stránku experimentu:

Zobrazení experimentu

Na stránce experimentu jsou uvedeny všechna spuštění přidružená k experimentu. V tabulce můžete otevřít stránku spuštění pro jakékoli spuštění přidružené k experimentu kliknutím na jeho název spuštění. Sloupec Zdroj poskytuje přístup k verzi poznámkového bloku, která vytvořila spuštění. Spuštění můžete také prohledávat a filtrovat podle metrik nebo nastavení parametrů.

Zobrazení experimentu pracovního prostoru

  1. Na bočním panelu klikněte na Ikona pracovního prostoru Pracovní prostor.
  2. Přejděte do složky obsahující experiment.
  3. Klikněte na název experimentu.

Zobrazení experimentu poznámkového bloku

Na pravém bočním panelu poznámkového bloku klikněte na ikonu Ikona experimentuExperiment .

Zobrazí se boční panel Spuštění experimentu a zobrazí souhrn jednotlivých spuštění přidružených k experimentu poznámkového bloku, včetně parametrů spuštění a metrik. V horní části bočního panelu je název experimentu, do kterého se poznámkový blok naposledy protokoloval (buď experiment poznámkového bloku, nebo experiment pracovního prostoru).

Zobrazení parametrů spuštění a metrik

Na bočním panelu můžete přejít na stránku experimentu nebo přímo na spuštění.

  • Pokud chcete experiment zobrazit, klikněte Externí odkaz úplně vpravo vedle možnosti Spuštění experimentu.
  • Chcete-li zobrazit spuštění, klikněte na název spuštění.

Správa experimentů

Oprávnění k experimentu, který vlastníte, můžete přejmenovat, odstranit nebo spravovat ze stránky experimentů, stránky experimentu nebo nabídky pracovního prostoru.

Poznámka:

Oprávnění k experimentu MLflow, který byl vytvořený poznámkovým blokem ve složce Databricks Git, nemůžete přímo přejmenovat, odstranit ani spravovat. Tyto akce musíte provést na úrovni složky Git.

Přejmenování experimentu ze stránky experimentů nebo na stránce experimentu

Důležité

Tato funkce je ve verzi Public Preview.

Pokud chcete experiment přejmenovat na stránce experimentů nebo na stránce experimentu, klikněte Ikona se třemi tlačítky a vyberte Přejmenovat.

Přejmenování experimentu z nabídky pracovního prostoru

  1. Na bočním panelu klikněte na Ikona pracovního prostoru Pracovní prostor.
  2. Přejděte do složky obsahující experiment.
  3. Klikněte pravým tlačítkem myši na název experimentu a vyberte Přejmenovat.

Kopírovat název experimentu

Pokud chcete název experimentu zkopírovat, klikněte Ikona kopírovat v horní části stránky experimentu. Tento název můžete použít v příkazu set_experiment MLflow k nastavení aktivního experimentu MLflow.

Ikona názvu experimentu

Název experimentu můžete také zkopírovat z bočního panelu experimentu v poznámkovém bloku.

Odstranění experimentu poznámkového bloku

Experimenty poznámkových bloků jsou součástí poznámkového bloku a nelze je odstranit samostatně. Když odstraníte poznámkový blok, odstraní se přidružený experiment poznámkového bloku. Když odstraníte experiment poznámkového bloku pomocí uživatelského rozhraní, poznámkový blok se odstraní také.

Pokud chcete odstranit experimenty poznámkového bloku pomocí rozhraní API, použijte rozhraní API pracovního prostoru, abyste zajistili, že se poznámkový blok i experiment odstraní z pracovního prostoru.

Odstranění experimentu pracovního prostoru z nabídky pracovního prostoru

  1. Na bočním panelu klikněte na Ikona pracovního prostoru Pracovní prostor.
  2. Přejděte do složky obsahující experiment.
  3. Klikněte pravým tlačítkem myši na název experimentu a vyberte Přesunout do koše.

Odstranění pracovního prostoru nebo experimentu poznámkového bloku ze stránky experimentů nebo na stránce experimentu

Důležité

Tato funkce je ve verzi Public Preview.

Pokud chcete experiment odstranit ze stránky experimentů nebo ze stránky experimentu, klikněte aIkona se třemi tlačítky vyberte Odstranit.

Když odstraníte experiment poznámkového bloku, poznámkový blok se odstraní také.

Změna oprávnění pro experiment

Pokud chcete změnit oprávnění pro experiment ze stránky experimentu, klikněte na Sdílet.

Tlačítko Oprávnění stránky experimentu

Oprávnění pro experiment, který vlastníte, můžete změnit na stránce experimentů. Klikněte Ikona se třemi tlačítky do sloupce Akce a vyberte Oprávnění.

Informace o úrovních oprávnění experimentu najdete v tématu Seznamy ACL experimentu MLflow.

Kopírování experimentů mezi pracovními prostory

K migraci experimentů MLflow mezi pracovními prostory můžete použít opensourcový opensourcový projekt MLflow Export-Import řízený komunitou.

Pomocí těchto nástrojů můžete:

  • Sdílejte a spolupracujte s dalšími datovými vědci na stejném nebo jiném sledovacím serveru. Do pracovního prostoru můžete například naklonovat experiment od jiného uživatele.
  • Zkopírujte experimenty MLflow a spuštění z místního sledovacího serveru do pracovního prostoru Databricks.
  • Zálohujte klíčové experimenty a modely do jiného pracovního prostoru Databricks.