Sdílet prostřednictvím


Co je Azure Machine Learning?

Azure Machine Learning je cloudová služba pro urychlení a správu životního cyklu projektu strojového učení (ML). Odborníci na strojové učení, datoví vědci a technici ho můžou použít ve svých každodenních pracovních postupech k trénování a nasazování modelů a správě operací strojového učení (MLOps).

Model můžete vytvořit ve službě Machine Learning nebo použít model vytvořený z opensourcové platformy, jako je PyTorch, TensorFlow nebo scikit-learn. Nástroje MLOps pomáhají monitorovat, přetrénovat a nasazuje modely.

Tip

Bezplatná zkušební verze! Pokud ještě nemáte předplatné Azure, vytvořte si napřed bezplatný účet. Vyzkoušejte bezplatnou nebo placenou verzi služby Azure Machine Learning. Získáte kredity, které můžete využít na služby Azure. Po jejich vyčerpání si můžete účet ponechat a používat bezplatné služby Azure. Nikdy vám nebudeme účtovat žádné poplatky, pokud si sami nezměníte nastavení a nezačnete používat placené služby.

Kdo je Azure Machine Learning?

Machine Learning je určený pro jednotlivce a týmy, které implementují MLOps v rámci své organizace, aby v zabezpečeném a auditovatelném produkčním prostředí přenesly modely ML do produkčního prostředí.

Datoví vědci a inženýři ML můžou pomocí nástrojů zrychlit a automatizovat každodenní pracovní postupy. Vývojáři aplikací můžou používat nástroje pro integraci modelů do aplikací nebo služeb. Vývojáři platforem můžou k vytváření pokročilých nástrojů ML používat robustní sadu nástrojů, která jsou zajištěná trvalými rozhraními API Azure Resource Manageru.

Podniky pracující v cloudu Microsoft Azure můžou používat známé řízení přístupu na základě role a zabezpečení pro infrastrukturu. Můžete nastavit projekt tak, aby odepřel přístup k chráněným datům a vybral operace.

Produktivita pro všechny členy týmu

Projekty STROJOVÉho učení často vyžadují tým s různou dovedností, která je nastavená k vytváření a údržbě. Machine Learning obsahuje nástroje, které vám pomůžou:

  • Spolupráce s týmem prostřednictvím sdílených poznámkových bloků, výpočetních prostředků, bezserverových výpočetních prostředků, dat a prostředí

  • Vývoj modelů pro nestrannost a vysvětlitelnost, sledování a auditovatelnost pro splnění požadavků na dodržování předpisů rodokmenu a auditu

  • Rychle a snadno nasaďte modely ML a spravujte je a spravujte je efektivně pomocí MLOps.

  • Spouštění úloh strojového učení kdekoli s integrovanými zásadami správného řízení, zabezpečením a dodržováním předpisů

Nástroje pro různé platformy, které vyhovují vašim potřebám

Každý, kdo je v týmu ML, může k dokončení práce použít své upřednostňované nástroje. Bez ohledu na to, jestli spouštíte rychlé experimenty, ladění hyperparametrů, vytváření kanálů nebo správu odvozování, můžete používat známá rozhraní, mezi která patří:

Když model zpřesňujete a spolupracujete s ostatními ve zbytku vývojového cyklu strojového učení, můžete sdílet a najít prostředky, zdroje a metriky pro své projekty v uživatelském rozhraní nástroje Machine Learning Studio.

Studio

Machine Learning Studio nabízí více prostředí pro vytváření obsahu v závislosti na typu projektu a úrovni prostředí strojového učení, aniž byste museli nic instalovat.

  • Poznámkové bloky: Můžete psát a spouštět vlastní kód na spravovaných serverech Jupyter Notebook, které jsou přímo integrované v sadě Studio. Nebo otevřete poznámkové bloky ve VS Code na webu nebo na ploše.

  • Vizualizace metrik spuštění: Analýza a optimalizace experimentů pomocí vizualizace

    Snímek obrazovky znázorňující metriky pro trénovací běh

  • Návrhář azure Machine Learning: Pomocí návrháře můžete trénovat a nasazovat modely ML bez psaní kódu. Přetažením datových sad a komponent vytvoříte kanály ML.

  • Uživatelské rozhraní automatizovaného strojového učení: Naučte se vytvářet experimenty automatizovaného strojového učení pomocí snadno použitelného rozhraní.

  • Popisování dat: Efektivní koordinaci popisků obrázků nebo projektů popisků textu pomocí popisků dat ve službě Machine Learning

Práce s LLM a generování umělé inteligence

Azure Machine Learning obsahuje nástroje, které vám pomůžou vytvářet aplikace Generative AI využívající velké jazykové modely (LLM). Řešení zahrnuje katalog modelů, tok výzvy a sadu nástrojů pro zjednodušení vývojového cyklu aplikací AI.

Azure Machine Learning Studio i Azure AI Studio umožňují pracovat s LLM. V tomto průvodci můžete určit , které studio byste měli použít.

Katalog modelů

Katalog modelů v studio Azure Machine Learning je centrem pro zjišťování a používání široké škály modelů, které umožňují vytvářet aplikace Generative AI. Katalog modelů nabízí stovky modelů od poskytovatelů modelů, jako je služba Azure OpenAI, Mistral, Meta, Cohere, Nvidia, Hugging Face, včetně modelů natrénovaných Microsoftem. Modely od jiných poskytovatelů než Microsoft jsou produkty jiné společnosti než Microsoft, jak jsou definovány v podmínkách produktů společnosti Microsoft, a podléhají podmínkám poskytnutým s modelem.

Tok výzvy

Tok výzvy azure Machine Learning je vývojový nástroj navržený tak, aby zjednodušil celý vývojový cyklus aplikací umělé inteligence využívajících velké jazykové modely (LLM). Tok instrukcí poskytuje komplexní řešení, které zjednodušuje proces vytváření prototypů, experimentování, iterace a nasazování aplikací umělé inteligence.

Připravenost a zabezpečení podniku

Machine Learning se integruje s cloudovou platformou Azure a přidává zabezpečení do projektů ML.

Mezi integrace zabezpečení patří:

  • Virtuální sítě Azure se skupinami zabezpečení sítě
  • Azure Key Vault, kde můžete ukládat tajné kódy zabezpečení, jako jsou například informace o přístupu pro účty úložiště.
  • Služba Azure Container Registry je nastavená za virtuální sítí.

Další informace najdete v tématu Kurz: Nastavení zabezpečeného pracovního prostoru.

Integrace Azure pro kompletní řešení

Další integrace se službami Azure podporují projekt ML od konce do konce. Patří sem:

Důležité

Azure Machine Learning neukládá ani nezpracuje vaše data mimo oblast, ve které nasazujete.

Pracovní postup projektu strojového učení

Modely se obvykle vyvíjejí jako součást projektu s cílem a cíli. Projekty často zahrnují více než jednu osobu. Při experimentování s daty, algoritmy a modely je vývoj iterativní.

Životní cyklus projektu

Životní cyklus projektu se může lišit podle projektu, ale často vypadá jako tento diagram.

Diagram znázorňující životní cyklus projektu strojového učení

Pracovní prostor uspořádá projekt a umožňuje spolupráci pro mnoho uživatelů, kteří pracují na společném cíli. Uživatelé v pracovním prostoru můžou snadno sdílet výsledky svých spuštění z experimentování v uživatelském rozhraní studia. Nebo můžou používat prostředky s verzí pro úlohy, jako jsou prostředí a odkazy na úložiště.

Další informace najdete v tématu Správa pracovních prostorů Azure Machine Learning.

Když je projekt připravený k operacionalizaci, může být práce uživatelů automatizovaná v kanálu ML a aktivována podle plánu nebo požadavku HTTPS.

Modely můžete nasadit do spravovaného řešení odvozování, a to jak pro nasazení v reálném čase, tak pro dávkové nasazení, což odvozuje správu infrastruktury obvykle potřebné pro nasazování modelů.

Trénování modelů

Ve službě Azure Machine Learning můžete spustit trénovací skript v cloudu nebo vytvořit model úplně od začátku. Zákazníci často přinášejí modely, které vytvořili a vytrénovali v opensourcových architekturách, aby je mohli zprovoznit v cloudu.

Otevřenost a interoperabilita

Datoví vědci můžou používat modely ve službě Azure Machine Learning, které vytvořili v běžných architekturách Pythonu, například:

  • PyTorch
  • TensorFlow
  • scikit-learn
  • XGBoost
  • LightGBM

Podporují se také další jazyky a architektury:

  • R
  • .NET

Další informace najdete v tématu Open source integrace se službou Azure Machine Learning.

Automatizovaná featurizace a výběr algoritmu

V opakujícím se časově náročném procesu v klasickém strojovém učení používají datoví vědci předchozí zkušenosti a intuitivně k výběru správné funkce a algoritmu pro trénování dat. Automatizované strojové učení (AutoML) tento proces urychlí. Můžete ho použít prostřednictvím uživatelského rozhraní nástroje Machine Learning Studio nebo sady Python SDK.

Další informace najdete v tématu Co je automatizované strojové učení?

Optimalizace hyperparametrů

Optimalizace hyperparametrů nebo ladění hyperparametrů může být zdlouhavá úloha. Machine Learning může tuto úlohu automatizovat pro libovolné parametrizované příkazy s malou úpravou definice úlohy. Výsledky jsou vizualizovány v sadě Studio.

Další informace naleznete v tématu Ladění hyperparametrů.

Víceuzlu distribuované trénování

Efektivita trénování hlubokého učení a někdy i klasické úlohy trénování strojového učení se dají výrazně vylepšit prostřednictvím vícenode distribuovaného trénování. Výpočetní clustery Azure Machine Learning a bezserverové výpočetní prostředky nabízejí nejnovější možnosti GPU.

Podporováno prostřednictvím Kubernetes služby Azure Machine Learning, výpočetních clusterů Azure Machine Learning a bezserverových výpočetních prostředků:

  • PyTorch
  • TensorFlow
  • MPI

Distribuci MPI můžete použít pro Horovod nebo vlastní logiku multinode. Apache Spark se podporuje prostřednictvím bezserverového výpočetního prostředí Spark a připojeného fondu Synapse Spark, který používá clustery Spark služby Azure Synapse Analytics.

Další informace najdete v tématu Distribuované trénování pomocí služby Azure Machine Learning.

Trapné paralelní trénování

Škálování projektu ML může vyžadovat trapné škálování paralelního trénování modelu. Tento model je běžný pro scénáře, jako je prognóza poptávky, kdy se model může trénovat pro mnoho obchodů.

Modely nasazení

Pokud chcete model přenést do produkčního prostředí, nasadíte ho. Spravované koncové body služby Azure Machine Learning abstrahují požadovanou infrastrukturu pro bodování modelů v dávkovém i reálném čase (online) (odvozování).

Bodování v reálném čase a dávkové vyhodnocování (odvozování)

Dávkové vyhodnocování neboli dávkové odvozování zahrnuje vyvolání koncového bodu s odkazem na data. Dávkové koncové body spouští úlohy asynchronně, aby zpracovávaly data paralelně na výpočetních clusterech a ukládaly data pro další analýzu.

Bodování v reálném čase nebo online odvozování zahrnuje vyvolání koncového bodu s jedním nebo více nasazeními modelu a přijetí odpovědi téměř v reálném čase prostřednictvím protokolu HTTPS. Provoz je možné rozdělit napříč několika nasazeními, což umožňuje testování nových verzí modelu tím, že se na začátku rozbíhají určité objemy provozu a po vytvoření nového modelu se zvýší.

Další informace naleznete v tématu:

MLOps: DevOps pro strojové učení

DevOps pro modely ML, často označované jako MLOps, je proces vývoje modelů pro produkční prostředí. Životní cyklus modelu od trénování po nasazení musí být auditovatelný, pokud není reprodukovatelný.

Životní cyklus modelu ML

Diagram znázorňující životní cyklus modelu strojového učení * MLOps

Přečtěte si další informace o MLOps ve službě Azure Machine Learning.

Integrace umožňující MLOPs

Machine Learning je sestavený s ohledem na životní cyklus modelu. Životní cyklus modelu můžete auditovat až do konkrétního potvrzení a prostředí.

Mezi klíčové funkce, které umožňují MLOps, patří:

  • git integrace.
  • Integrace MLflow
  • Plánování kanálu strojového učení
  • Integrace azure Event Gridu pro vlastní triggery
  • Snadné použití s nástroji CI/CD, jako jsou GitHub Actions nebo Azure DevOps

Machine Learning také obsahuje funkce pro monitorování a auditování:

  • Artefakty úloh, jako jsou snímky kódu, protokoly a další výstupy.
  • Rodokmen mezi úlohami a prostředky, jako jsou kontejnery, data a výpočetní prostředky.

Pokud používáte Apache Airflow, balíček airflow-provider-azure-machinelearning je zprostředkovatel, který umožňuje odesílat pracovní postupy do Azure Machine Learning z Apache AirFlow.

Začněte používat Azure Machine Learning: