Uspořádání trénovacích běhů pomocí experimentů MLflow
Experimenty jsou jednotky organizace pro trénovací běhy modelu. Existují dva typy experimentů: pracovní prostor a poznámkový blok.
- Experiment pracovního prostoru můžete vytvořit z uživatelského rozhraní Databricks Mosaic AI nebo rozhraní API MLflow. Experimenty pracovního prostoru nejsou přidružené k žádnému poznámkovému bloku a každý poznámkový blok může do těchto experimentů protokolovat spuštění pomocí ID experimentu nebo názvu experimentu.
- Experiment poznámkového bloku je přidružený ke konkrétnímu poznámkovému bloku. Azure Databricks automaticky vytvoří experiment poznámkového bloku, pokud při spuštění pomocí mlflow.start_run() neexistuje žádný aktivní experiment.
Pokud chcete zobrazit všechny experimenty v pracovním prostoru, ke kterému máte přístup, vyberte na bočním panelu experimenty služby Machine Learning>.
Vytvoření experimentu pracovního prostoru
Tato část popisuje, jak vytvořit experiment pracovního prostoru pomocí uživatelského rozhraní Azure Databricks. Experiment pracovního prostoru můžete vytvořit přímo z pracovního prostoru nebo ze stránky Experimenty.
Můžete také použít rozhraní API MLflow nebo poskytovatele Databricks Terraform s databricks_mlflow_experiment.
Pokyny k protokolování spuštění do experimentů pracovního prostoru najdete v ukázkovém poznámkovém bloku protokolování.
Na bočním panelu klikněte na Pracovní prostor.
Přejděte do složky, ve které chcete experiment vytvořit.
Klikněte pravým tlačítkem myši na složku a vyberte Vytvořit > experiment MLflow.
V dialogovém okně Vytvořit experiment MLflow zadejte název experimentu a volitelné umístění artefaktu. Pokud nezadáte umístění artefaktů, artefakty se ukládají v úložišti artefaktů spravovaných MLflow:
dbfs:/databricks/mlflow-tracking/<experiment-id>
.Azure Databricks podporuje svazky katalogu Unity, úložiště objektů blob v Azure a umístění artefaktů služby Azure Data Lake Storage.
V MLflow 2.15.0 a novějších můžete ukládat artefakty ve svazku katalogu Unity. Při vytváření experimentu MLflow zadejte cestu ke svazkům formuláře
dbfs:/Volumes/catalog_name/schema_name/volume_name/user/specified/path
jako umístění artefaktu experimentu MLflow.Pokud chcete ukládat artefakty ve službě Azure Blob Storage, zadejte identifikátor URI formuláře
wasbs://<container>@<storage-account>.blob.core.windows.net/<path>
. Artefakty uložené ve službě Azure Blob Storage se nezobrazují v uživatelském rozhraní MLflow; musíte je stáhnout pomocí klienta úložiště objektů blob.Poznámka:
Když artefakt uložíte do jiného umístění než DBFS, artefakt se nezobrazí v uživatelském rozhraní MLflow. Modely uložené v jiných umístěních než DBFS nelze zaregistrovat v registru modelů.
Klikněte na Vytvořit. Zobrazí se prázdný experiment.
Nový experiment pracovního prostoru můžete vytvořit také ze stránky Experimenty. Pokud chcete vytvořit nový experiment, použijte rozevírací nabídku. V rozevírací nabídce můžete vybrat experiment AutoML nebo prázdný (prázdný).
Experiment AutoML Zobrazí se stránka konfigurace experimentu AutoML. Informace o použití AutoML naleznete v tématu Trénování modelů ML s využitím uživatelského rozhraní Puzzle AutoML.
Prázdný experiment Zobrazí se dialogové okno Vytvořit experiment MLflow. Zadáním názvu a volitelného umístění artefaktu v dialogovém okně vytvořte nový experiment pracovního prostoru. Výchozí umístění artefaktu je
dbfs:/databricks/mlflow-tracking/<experiment-id>
.Pokud chcete protokolovat spuštění do tohoto experimentu, zavolejte
mlflow.set_experiment()
cestu experimentu. Cesta k experimentu se zobrazí v horní části stránky experimentu. Podrobnosti a ukázkový poznámkový blok najdete v ukázkovém poznámkovém bloku protokolování.
Vytvoření experimentu poznámkového bloku
Když v poznámkovém bloku použijete příkaz mlflow.start_run(), protokoluje spuštění metriky a parametry do aktivního experimentu. Pokud není žádný experiment aktivní, Azure Databricks vytvoří experiment poznámkového bloku. Experiment poznámkového bloku sdílí stejný název a ID jako odpovídající poznámkový blok. ID poznámkového bloku je číselný identifikátor na konci adresy URL a ID poznámkového bloku.
Alternativně můžete předat cestu pracovního prostoru Azure Databricks k existujícímu poznámkovému bloku v mlflow.set_experiment() a vytvořit pro něj experiment poznámkového bloku.
Pokyny k protokolování spuštění do experimentů poznámkových bloků najdete v ukázkovém poznámkovém bloku.
Poznámka:
Pokud odstraníte experiment poznámkového bloku pomocí rozhraní API (například MlflowClient.tracking.delete_experiment()
v Pythonu), přesune se samotný poznámkový blok do složky Koš.
Zobrazení experimentů
Každý experiment, ke kterému máte přístup, se zobrazí na stránce experimentů. Na této stránce můžete zobrazit libovolný experiment. Kliknutím na název experimentu zobrazíte stránku experimentu.
Další způsoby přístupu ke stránce experimentu:
- Na stránku experimentu pro experiment pracovního prostoru se dostanete z nabídky pracovního prostoru.
- Na stránku experimentu pro experiment poznámkového bloku se dostanete z poznámkového bloku.
Pokud chcete hledat experimenty, zadejte text do pole Filtrovat experimenty a stiskněte Enter nebo klikněte na ikonu lupy. Seznam experimentů se změní tak, aby zobrazoval pouze experimenty, které obsahují hledaný text ve sloupci Název, Autor, Umístění nebo Popis .
Kliknutím na název libovolného experimentu v tabulce zobrazte jeho stránku experimentu:
Na stránce experimentu jsou uvedeny všechna spuštění přidružená k experimentu. V tabulce můžete otevřít stránku spuštění pro jakékoli spuštění přidružené k experimentu kliknutím na jeho název spuštění. Sloupec Zdroj poskytuje přístup k verzi poznámkového bloku, která vytvořila spuštění. Spuštění můžete také prohledávat a filtrovat podle metrik nebo nastavení parametrů.
Zobrazení experimentu pracovního prostoru
- Na bočním panelu klikněte na Pracovní prostor.
- Přejděte do složky obsahující experiment.
- Klikněte na název experimentu.
Zobrazení experimentu poznámkového bloku
Na pravém bočním panelu poznámkového bloku klikněte na ikonu Experiment .
Zobrazí se boční panel Spuštění experimentu a zobrazí souhrn jednotlivých spuštění přidružených k experimentu poznámkového bloku, včetně parametrů spuštění a metrik. V horní části bočního panelu je název experimentu, do kterého se poznámkový blok naposledy protokoloval (buď experiment poznámkového bloku, nebo experiment pracovního prostoru).
Na bočním panelu můžete přejít na stránku experimentu nebo přímo na spuštění.
- Pokud chcete experiment zobrazit, klikněte úplně vpravo vedle možnosti Spuštění experimentu.
- Chcete-li zobrazit spuštění, klikněte na název spuštění.
Správa experimentů
Oprávnění k experimentu, který vlastníte, můžete přejmenovat, odstranit nebo spravovat ze stránky experimentů, stránky experimentu nebo nabídky pracovního prostoru.
Poznámka:
Oprávnění k experimentu MLflow, který byl vytvořený poznámkovým blokem ve složce Databricks Git, nemůžete přímo přejmenovat, odstranit ani spravovat. Tyto akce musíte provést na úrovni složky Git.
Přejmenování experimentu ze stránky experimentů nebo na stránce experimentu
Důležité
Tato funkce je ve verzi Public Preview.
Pokud chcete experiment přejmenovat na stránce experimentů nebo na stránce experimentu, klikněte a vyberte Přejmenovat.
Přejmenování experimentu z nabídky pracovního prostoru
- Na bočním panelu klikněte na Pracovní prostor.
- Přejděte do složky obsahující experiment.
- Klikněte pravým tlačítkem myši na název experimentu a vyberte Přejmenovat.
Kopírovat název experimentu
Pokud chcete název experimentu zkopírovat, klikněte v horní části stránky experimentu. Tento název můžete použít v příkazu set_experiment
MLflow k nastavení aktivního experimentu MLflow.
Název experimentu můžete také zkopírovat z bočního panelu experimentu v poznámkovém bloku.
Odstranění experimentu poznámkového bloku
Experimenty poznámkových bloků jsou součástí poznámkového bloku a nelze je odstranit samostatně. Když odstraníte poznámkový blok, odstraní se přidružený experiment poznámkového bloku. Když odstraníte experiment poznámkového bloku pomocí uživatelského rozhraní, poznámkový blok se odstraní také.
Pokud chcete odstranit experimenty poznámkového bloku pomocí rozhraní API, použijte rozhraní API pracovního prostoru, abyste zajistili, že se poznámkový blok i experiment odstraní z pracovního prostoru.
Odstranění experimentu pracovního prostoru z nabídky pracovního prostoru
- Na bočním panelu klikněte na Pracovní prostor.
- Přejděte do složky obsahující experiment.
- Klikněte pravým tlačítkem myši na název experimentu a vyberte Přesunout do koše.
Odstranění pracovního prostoru nebo experimentu poznámkového bloku ze stránky experimentů nebo na stránce experimentu
Důležité
Tato funkce je ve verzi Public Preview.
Pokud chcete experiment odstranit ze stránky experimentů nebo ze stránky experimentu, klikněte a vyberte Odstranit.
Když odstraníte experiment poznámkového bloku, poznámkový blok se odstraní také.
Změna oprávnění pro experiment
Pokud chcete změnit oprávnění pro experiment ze stránky experimentu, klikněte na Sdílet.
Oprávnění pro experiment, který vlastníte, můžete změnit na stránce experimentů. Klikněte do sloupce Akce a vyberte Oprávnění.
Informace o úrovních oprávnění experimentu najdete v tématu Seznamy ACL experimentu MLflow.
Kopírování experimentů mezi pracovními prostory
K migraci experimentů MLflow mezi pracovními prostory můžete použít opensourcový opensourcový projekt MLflow Export-Import řízený komunitou.
Pomocí těchto nástrojů můžete:
- Sdílejte a spolupracujte s dalšími datovými vědci na stejném nebo jiném sledovacím serveru. Do pracovního prostoru můžete například naklonovat experiment od jiného uživatele.
- Zkopírujte experimenty MLflow a spuštění z místního sledovacího serveru do pracovního prostoru Databricks.
- Zálohujte klíčové experimenty a modely do jiného pracovního prostoru Databricks.