Strojové učení na Azure Databricks

Sestavte, nasaďte a spravujte aplikace strojového učení na Azure Databricks. Integrovaná platforma sjednocuje celý životní cyklus strojového učení od přípravy dat až po monitorování produkčního prostředí.

Hledáte generativní AI a AI agenty? Viz Vytváření agentů AI v Azure Databricks.

Začínáme

Vyzkoušejte rychlý start, připravte si data nebo vytvořte model s nízkým kódem.

Guide Description
Začínáme: Vytvoření prvního modelu strojového učení v Databricks Vytvoření jednoduchého klasifikačního modelu pomocí kompletní sady scikit-learn
AutoML Automatické sestavování vysoce kvalitních modelů s minimálním kódem pomocí automatizovaného inženýrství funkcí a ladění hyperparametrů.
Načtení dat pro strojové učení a hluboké učení Načtěte a připravte data pro procesy strojového učení a hlubokého učení.
Trénování modelů doporučovačů Natrénujte doporučovací model pomocí dvouvěžové architektury nebo architektury DLRM.

Trénování klasických modelů strojového učení

Vytvářejte modely strojového učení pomocí automatizovaných nástrojů a prostředí pro vývoj pro spolupráci.

Feature Description
Databricks Runtime pro ML Předem nakonfigurované clustery se scikit-learn, XGBoost, MLflow a dalšími knihovnami ML a podporou architektur hlubokého učení.
Sledování MLflow Sledujte experimenty, porovnejte výkon modelu a spravujte kompletní životní cyklus vývoje modelu.
Příprava funkcí Vytvářejte, spravujte a obsluhujte funkce pomocí automatizovaných datových kanálů a zjišťování funkcí.
Poznámkové bloky Databricks Vývojové prostředí pro spolupráci s podporou Pythonu, R, Scaly a SQL pro pracovní postupy ML

Trénování modelů hlubokého učení

Použití spravovaných výpočetních a integrovaných architektur k vývoji modelů hlubokého učení

Feature Description
Distribuované trénování Příklady distribuovaného hlubokého učení pomocí Raye, TorchDistributoru a DeepSpeed
AI Runtime Bezserverové výpočty na GPU pro vlastní úlohy trénování hlubokého učení a inference.
Osvědčené postupy DL Pokyny pro výběr architektury, načítání dat, distribuované škálování a správu životního cyklu modelu hlubokého učení
PyTorch Jednouzlové a distribuované vzdělávání pomocí PyTorchu.

Nasazení a obsluha modelů

Nasaďte modely do produkčního prostředí se škálovatelnými koncovými body, odvozováním v reálném čase a monitorováním na podnikové úrovni.

Feature Description
Obsluha modelu Nasaďte vlastní modely a LLM jako škálovatelné koncové body REST s podporou automatického škálování a GPU.
AI Gateway Řízení a monitorování přístupu k modelům obsluhovaných na Azure Databricks pomocí sledování využití, protokolování datové části a bezpečnostních prvků
Externí modely Integrujte modely třetích stran hostované mimo Databricks s jednotným řízením a monitorováním.
Rozhraní API základního modelu Přístup k špičkovým otevřeným modelům hostovaným Databricks a jejich dotazování.

Monitorování a řízení systémů ML

Zajistěte kvalitu modelu, integritu dat a dodržování předpisů pomocí komplexních nástrojů pro monitorování a zásady správného řízení.

Feature Description
Katalog Unity Řiďte data, vlastnosti, modely a funkce s jednotným řízením přístupu, sledováním původu a objevováním.
Profilace dat Monitorování kvality dat, výkonu modelu a odchylky předpovědí pomocí automatizovaných výstrah a analýzy původní příčiny
Detekce anomálií Sledujte aktuálnost a úplnost dat na úrovni katalogu.
MLflow pro modely Sledujte experimenty, spravujte modely v katalogu Unity, nasaďte a vyhodnocujte modely strojového učení v průběhu životního cyklu vývoje.

Uvedení workflow strojového učení do produkčního provozu

Škálování operací strojového učení pomocí automatizovaných pracovních postupů, integrace CI/CD a kanálů připravených pro produkční prostředí

Feature Description
Modely v katalogu Unity Registr modelů v katalogu Unity slouží k centralizovaným zásadám správného řízení a ke správě životního cyklu modelu, včetně nasazení.
Lakeflow Úlohy Vytváření automatizovaných pracovních postupů a kanálů ETL připravených pro produkční prostředí pro zpracování dat ML
Ray na Databricks Škálování úloh ML pomocí distribuovaných výpočtů pro trénování a odvozování modelů ve velkém měřítku
Pracovní postupy MLOps Implementujte kompletní MLOps s automatizovanými pipelines pro trénování, testování a nasazení.