Sdílet prostřednictvím


Trénování modelů AI a ML

V této části se dozvíte, jak trénovat modely strojového učení a AI na platformě Mosaic AI.

Trénování modelu AI v systému Mosaic zjednodušuje a sjednocuje proces trénování a nasazování tradičních modelů STROJOVÉho učení prostřednictvím úloh jemného ladění modelů AutoML a základních modelů.

automatizované strojové učení

AutoML zjednodušuje proces použití strojového učení u datových sad tím, že automaticky vyhledá nejlepší algoritmus a konfiguraci hyperparametrů za vás. AutoML nabízí uživatelské rozhraní bez kódu a také rozhraní PYTHON API.

Vyladění základního modelu

Základní vyladění modelu (nyní součástí trénování modelu AI v systému Mosaic AI) v Databricks umožňuje přizpůsobit velké jazykové modely (LLM) pomocí vlastních dat. Tento proces zahrnuje vyladění trénování předem existujícího základního modelu, což výrazně snižuje objem dat, času a výpočetních prostředků požadovaných v porovnání s trénováním modelu od začátku. Mezi klíčové funkce patří:

  • Vyladění instrukcí: Přizpůsobte model novým úkolům trénováním pomocí strukturovaných dat výzva-odpověď.
  • Pokračování předběžného trénování: Vylepšete model o další textová data, abyste mohli přidat nové znalosti nebo se zaměřit na konkrétní doménu.
  • Dokončení chatu: Trénování modelu v protokolech chatu za účelem zlepšení konverzačních schopností.

Příklady knihoven otevřeného softwaru

Podívejte se na příklady trénování strojového učení ze široké škály opensourcových knihoven strojového učení, včetně příkladů ladění hyperparametrů pomocí Optuna a Hyperoptu.

Hluboké učení

Podívejte se na příklady a osvědčené postupy pro distribuované trénování hlubokého učení, abyste mohli vyvíjet a vyladit modely hlubokého učení v Azure Databricks.

Doporučovatelé

Naučte se trénovat modely doporučení založené na hlubokém učení v Azure Databricks. V porovnání s tradičními modely doporučení můžou modely hlubokého učení dosáhnout vyšších výsledků kvality a škálovat na větší objemy dat.