Co je AutoML?

Databricks AutoML pomáhá automaticky aplikovat strojové učení na datovou sadu. Zadáte datovou sadu a identifikujete cíl předpovědi, zatímco AutoML připraví datovou sadu na trénování modelu. AutoML pak provede a zaznamená sadu pokusů, které vytváří, ladí a vyhodnocuje více modelů. Po vyhodnocení modelu autoML zobrazí výsledky a poskytne poznámkový blok Pythonu se zdrojovým kódem pro každé zkušební spuštění, abyste mohli kód zkontrolovat, reprodukovat a upravit. AutoML také vypočítá souhrnné statistiky datové sady a uloží tyto informace do poznámkového bloku, který si můžete prohlédnout později.

Databricks AutoML můžete použít k problémům s regresí, klasifikací a prognózou. Přečtěte si další informace o tom, jak Azure Databricks AutoML funguje.

Požadavky

  • Databricks Runtime 9.1 ML nebo novější Pro obecnou verzi (GA) databricks Runtime 10.4 LTS ML nebo vyšší.
    • Pro prognózování časových řad databricks Runtime 10.0 ML nebo vyšší.
    • S modulem Databricks Runtime 9.1 LTS ML a novějším závisí AutoML na databricks-automl-runtime balíčku, který obsahuje komponenty, které jsou užitečné mimo AutoML, a také pomáhá zjednodušit poznámkové bloky generované trénováním AutoML. databricks-automl-runtime je k dispozici na PyPI.
  • V clusteru by se neměly instalovat žádné další knihovny, které jsou předinstalované v prostředí Databricks Runtime pro machine Učení.
    • Jakékoli změny (odebrání, upgrady nebo downgrady) na stávající verze knihoven způsobí selhání spuštění kvůli nekompatibilitě.
  • AutoML není kompatibilní s clustery režimu sdíleného přístupu.
  • Pokud chcete používat katalog Unity s AutoML, musí být režim přístupu ke clusteru jeden uživatel a musíte být určeným jediným uživatelem clusteru.

Další kroky