Co je Azure Machine Learning?

Azure Machine Learning je cloudová služba pro urychlení a správu životního cyklu projektu strojového učení. Odborníci na strojové učení, datoví vědci a inženýři ho můžou používat ve svých každodenních pracovních postupech: trénování a nasazování modelů a správa MLOps.

Model můžete vytvořit ve službě Azure Machine Learning nebo použít model vytvořený z opensourcové platformy, jako je Pytorch, TensorFlow nebo scikit-learn. Nástroje MLOps pomáhají monitorovat, přetrénovat a znovu nasadí modely.

Tip

Bezplatná zkušební verze! Pokud nemáte předplatné Azure, vytvořte si před zahájením bezplatného účtu. Vyzkoušejte bezplatnou nebo placenou verzi služby Azure Machine Learning. Získáte kredity, které můžete využít na služby Azure. Po jejich vyčerpání si můžete účet ponechat a používat bezplatné služby Azure. Nikdy vám nebudeme účtovat žádné poplatky, pokud si sami nezměníte nastavení a nezačnete používat placené služby.

Pro koho je Azure Machine Learning?

Azure Machine Learning je pro jednotlivce a týmy, které implementují MLOps v rámci své organizace, aby se modely strojového učení přenesly do produkčního prostředí v zabezpečeném a auditovatelném produkčním prostředí.

Datoví vědci a inženýři strojového učení najdou nástroje pro zrychlení a automatizaci každodenních pracovních postupů. Vývojáři aplikací najdou nástroje pro integraci modelů do aplikací nebo služeb. Vývojáři platforem najdou robustní sadu nástrojů založených na odolných rozhraních API azure Resource Manager pro vytváření pokročilých nástrojů ML.

Podniky pracující v cloudu Microsoft Azure najdou známé zabezpečení a řízení přístupu na základě role (RBAC) pro infrastrukturu. Můžete nastavit projekt tak, aby odepřel přístup k chráněným datům a vybral operace.

Produktivita pro všechny členy týmu

Projekty strojového učení často vyžadují tým s různými dovednostmi, které je potřeba sestavit a udržovat. Azure Machine Learning obsahuje nástroje, které vám pomůžou:

  • Spolupráce s týmem prostřednictvím sdílených poznámkových bloků, výpočetních prostředků, dat a prostředí

  • Vývoj modelů pro zajištění spravedlnosti a vysvětlitelnosti, sledování a auditovatelnosti pro splnění požadavků na dodržování předpisů v rodokmenu a auditu

  • Nasazujte modely ML rychle a snadno ve velkém a efektivně je spravujte a spravujte pomocí MLOps.

  • Spouštění úloh strojového učení kdekoli s integrovanými zásadami správného řízení, zabezpečením a dodržováním předpisů

Nástroje pro různé kompatibilní platformy, které vyhovují vašim potřebám

Každý člen týmu ML může k dokončení práce použít své upřednostňované nástroje. Bez ohledu na to, jestli spouštíte rychlé experimenty, ladění hyperparametrů, vytváříte kanály nebo spravujete odvozování, můžete použít známá rozhraní, mezi která patří:

Když model vylepšujete a spolupracujete s ostatními v průběhu celého vývojového cyklu služby Machine Learning, můžete sdílet a vyhledávat prostředky, zdroje a metriky pro své projekty v uživatelském rozhraní studio Azure Machine Learning.

Studio

Studio Azure Machine Learning nabízí několik možností vytváření v závislosti na typu projektu a úrovni vašeho předchozího prostředí ML, aniž byste museli cokoli instalovat.

  • Poznámkové bloky: Na spravovaných Jupyter Notebook serverech, které jsou přímo integrované ve studiu, můžete psát a spouštět vlastní kód.

  • Vizualizace metrik spuštění: Analýza a optimalizace experimentů pomocí vizualizace

    Snímek obrazovky s metrikami pro trénovací běh

  • Návrhář služby Azure Machine Learning: Pomocí návrháře můžete trénovat a nasazovat modely strojového učení bez psaní kódu. Přetažením datových sad a komponent vytvořte kanály ML. Vyzkoušejte kurz návrháře.

  • Uživatelské rozhraní automatizovaného strojového učení: Naučte se vytvářet automatizované experimenty strojového učení pomocí snadno použitelného rozhraní.

  • Popisování dat: Popisování dat ve službě Azure Machine Learning slouží k efektivní koordinaci projektů popisování obrázků nebo popisování textu .

Připravenost a zabezpečení pro podniky

Azure Machine Learning se integruje s cloudovou platformou Azure a přidává do projektů ML zabezpečení.

Mezi integrace zabezpečení patří:

  • Virtuální sítě Azure se skupinami zabezpečení sítě
  • Azure Key Vault, kde můžete ukládat tajné kódy zabezpečení, jako jsou přístupové informace k účtům úložiště
  • Azure Container Registry nastavení za virtuální sítí

Viz Kurz: Nastavení zabezpečeného pracovního prostoru.

Integrace Azure pro kompletní řešení

Další integrace se službami Azure podporují projekt strojového učení od konce do konce. Mezi ně patří:

  • Azure Synapse Analytics ke zpracování a streamování dat pomocí Sparku
  • Azure Arc, kde můžete spouštět služby Azure v prostředí Kubernetes
  • Možnosti úložiště a databáze, jako jsou Azure SQL Database, Azure Storage Blobs atd.
  • Azure App Service umožňující nasazení a správu aplikací využívajících ML

Důležité

Azure Machine Learning neukládá ani nezpracovává vaše data mimo oblast, ve které nasazujete.

Pracovní postup projektu strojového učení

Modely se obvykle vyvíjejí jako součást projektu s cílem a cíli. Projekty často zahrnují více než jednu osobu. Při experimentování s daty, algoritmy a modely je vývoj iterativní.

Životní cyklus projektu

I když se životní cyklus projektu může lišit podle projektu, bude často vypadat takto:

Diagram životního cyklu projektu strojového učení

Pracovní prostor organizuje projekt a umožňuje spolupráci mnoha uživatelům, kteří pracují na společném cíli. Uživatelé v pracovním prostoru můžou snadno sdílet výsledky svých spuštění z experimentování v uživatelském rozhraní studia nebo používat prostředky s verzí pro úlohy, jako jsou prostředí a odkazy na úložiště.

Další informace najdete v tématu Správa pracovních prostorů služby Azure Machine Learning.

Když je projekt připravený na zprovoznění, je možné práci uživatelů automatizovat v kanálu strojového učení a aktivovat podle plánu nebo požadavku HTTPS.

Modely je možné nasadit do spravovaného řešení odvozování pro nasazení v reálném čase i v dávkovém nasazení, což abstrahuje správu infrastruktury, která se obvykle vyžaduje pro nasazování modelů.

Trénování modelů

Ve službě Azure Machine Learning můžete spustit trénovací skript v cloudu nebo vytvořit model od začátku. Zákazníci často přinášejí modely, které vytvořili a vytrénovali v opensourcových architekturách, aby je mohli zprovoznit v cloudu.

Otevřené a interoperabilní

Datoví vědci můžou ve službě Azure Machine Learning používat modely, které vytvořili v běžných architekturách Pythonu, například:

  • PyTorch
  • TensorFlow
  • scikit-learn
  • XGBoost
  • LightGBM

Podporují se také další jazyky a architektury, mezi které patří:

  • R
  • .NET

Viz Opensourcová integrace se službou Azure Machine Learning.

Automatizované funkce a výběr algoritmů (AutoML)

V opakujícím se a časově náročném procesu využívají datoví vědci klasického strojového učení předchozí zkušenosti a intuici k výběru správné funkce funkce a algoritmu pro trénování dat. Automatizované strojové učení (AutoML) tento proces zrychluje a dá se použít prostřednictvím uživatelského rozhraní studia nebo sady Python SDK.

Viz Co je automatizované strojové učení?

Optimalizace hyperparametrů

Optimalizace hyperparametrů nebo ladění hyperparametrů může být zdlouhavý úkol. Azure Machine Learning dokáže automatizovat tuto úlohu pro libovolné parametrizované příkazy s malou úpravou definice úlohy. Výsledky jsou vizualizovány ve studiu.

Viz Postup ladění hyperparametrů.

Distribuované trénování s více uzly

Efektivitu trénování pro hluboké učení a někdy i úlohy klasického trénování strojového učení je možné výrazně zlepšit prostřednictvím distribuovaného trénování s více uzly. Výpočetní clustery Azure Machine Learning nabízejí nejnovější možnosti GPU.

Podpora prostřednictvím Azure ML Kubernetes a výpočetních clusterů Azure ML:

  • PyTorch
  • TensorFlow
  • MPI

Distribuci MPI je možné použít pro logiku Horovod nebo vlastní logiku s více uzly. Kromě toho se Apache Spark podporuje prostřednictvím clusterů Spark Azure Synapse Analytics (Preview).

Viz Distribuované trénování s využitím služby Azure Machine Learning.

Trapně paralelní trénování

Škálování projektu strojového učení může vyžadovat škálování trapně paralelního trénování modelu. Tento model je běžný ve scénářích, jako je prognóza poptávky, kdy se model může vytrénovat pro mnoho obchodů.

Modely nasazení

Model se nasadí do produkčního prostředí. Spravované koncové body služby Azure Machine Learning abstrahují požadovanou infrastrukturu pro dávkové vyhodnocování (odvozování) modelů v reálném čase (online).

Bodování v reálném čase a dávkové vyhodnocování (odvozování)

Dávkové vyhodnocování neboli dávkové odvozování zahrnuje vyvolání koncového bodu s odkazem na data. Dávkový koncový bod spouští úlohy asynchronně, aby paralelně zpracovávaly data na výpočetních clusterech a ukládaly data pro další analýzu.

Bodování v reálném čase nebo online odvozování zahrnuje vyvolání koncového bodu s jedním nebo více nasazeními modelu a přijetí odpovědi téměř v reálném čase prostřednictvím protokolu HTTPs. Provoz je možné rozdělit mezi několik nasazení, což umožňuje testování nových verzí modelu tím, že na začátku přesměruje určitý objem provozu a zvýší se, jakmile se vytvoří důvěra v nový model.

Přečtěte si:

MLOps: DevOps pro strojové učení

DevOps pro modely strojového učení, často označovaný jako MLOps, je proces pro vývoj modelů pro produkční prostředí. Životní cyklus modelu od trénování po nasazení musí být auditovatelný, pokud není reprodukovatelný.

Životní cyklus modelu ML

Životní cyklus modelu strojového učení * MLOps

Přečtěte si další informace o MLOps ve službě Azure Machine Learning.

Integrace povolování MLOPS

Služba Azure Machine Learning je vytvořená s ohledem na životní cyklus modelu. Životní cyklus modelu můžete auditovat až na konkrétní potvrzení a prostředí.

Mezi klíčové funkce, které umožňují MLOps, patří:

  • git Integrace
  • Integrace MLflow
  • Plánování kanálů strojového učení
  • integrace Azure Event Grid pro vlastní triggery
  • Snadné použití s nástroji CI/CD, jako jsou GitHub Actions nebo Azure DevOps

Azure Machine Learning také obsahuje funkce pro monitorování a auditování:

  • Artefakty úloh, jako jsou snímky kódu, protokoly a další výstupy
  • Rodokmen mezi úlohami a prostředky, jako jsou kontejnery, data a výpočetní prostředky

Další kroky

Začněte používat Azure Machine Learning: