Použití scikit-learn v Azure Databricks
Tato stránka obsahuje příklady použití balíčku k trénování modelů strojového scikit-learn
učení v Azure Databricks. scikit-learn je jednou z nejoblíbenějších knihoven Pythonu pro strojové učení s jedním uzlem a je součástí Databricks Runtime a Databricks Runtime ML. Přečtěte si poznámky k verzi modulu Databricks Runtime pro verzi knihovny scikit-learn, která je součástí modulu runtime vašeho clusteru.
Tyto poznámkové bloky můžete importovat a spustit v pracovním prostoru Azure Databricks.
Další ukázkové poznámkové bloky, které vám pomůžou rychle začít pracovat s Azure Databricks, najdete v kurzech : Začínáme s AI a strojovým učením.
Základní příklad scikit-learn
Tento poznámkový blok poskytuje rychlý přehled trénování modelu strojového učení v Azure Databricks. Tento balíček používá scikit-learn
k trénování jednoduchého klasifikačního modelu. Ukazuje také použití MLflow ke sledování procesu vývoje modelů a Optuna k automatizaci ladění hyperparametrů.
Pokud je pro katalog Unity povolený váš pracovní prostor, použijte tuto verzi poznámkového bloku:
poznámkový blok klasifikace scikit-learn (Katalog Unity)
Pokud pro katalog Unity není povolený váš pracovní prostor, použijte tuto verzi poznámkového bloku:
Poznámkový blok klasifikace scikit-learn
Kompletní příklad s využitím scikit-learn v Azure Databricks
Tento poznámkový blok používá scikit-learn k ilustraci kompletního příkladu načítání dat, trénování modelu, distribuovaného ladění hyperparametrů a odvozování modelů. Ilustruje také správu životního cyklu modelu pomocí registru modelů MLflow k protokolování a registraci modelu.
Pokud je pro katalog Unity povolený váš pracovní prostor, použijte tuto verzi poznámkového bloku:
Použití knihovny scikit-learn s integrací MLflow v Databricks (katalog Unity)
Pokud pro katalog Unity není povolený váš pracovní prostor, použijte tuto verzi poznámkového bloku: