Volba vhodného cílového výpočetního objektu
Ve službě Azure Machine Learning jsou cílové výpočetní objekty fyzické nebo virtuální počítače, na kterých se spouští úlohy.
Pochopení dostupných typů výpočetní techniky
Azure Machine Learning podporuje více typů výpočetních prostředků pro experimentování, trénování a nasazení. Pokud máte více typů výpočetních prostředků, můžete pro své potřeby vybrat nejvhodnější typ cílového výpočetního objektu.
- Výpočetní instance: Chová se podobně jako virtuální počítač a primárně se používá ke spouštění poznámkových bloků. Je ideální pro experimentování.
- Výpočetní clustery: Clustery s více uzly virtuálních počítačů, které automaticky vertikálně navyšují nebo sníží kapacitu podle poptávky. Nákladově efektivní způsob spouštění skriptů, které potřebují zpracovávat velké objemy dat. Clustery také umožňují používat paralelní zpracování k distribuci úlohy a zkrátit dobu potřebnou ke spuštění skriptu.
- Clustery Kubernetes: Cluster založený na technologii Kubernetes a poskytuje větší kontrolu nad konfigurací a správou výpočetních prostředků. Můžete připojit svůj vlastní cluster Azure Kubernetes (AKS) pro cloudové výpočetní prostředky nebo cluster Arc Kubernetes pro místní úlohy.
- Připojené výpočetní prostředky: Umožňuje připojit existující výpočetní prostředky, jako jsou virtuální počítače Azure nebo clustery Azure Databricks, k vašemu pracovnímu prostoru.
- Bezserverové výpočetní prostředky: Plně spravovaný výpočetní výkon na vyžádání, který můžete použít pro trénovací úlohy.
Poznámka:
Azure Machine Learning nabízí možnost vytvářet a spravovat vlastní výpočetní prostředky nebo používat výpočetní prostředky, které jsou plně spravované službou Azure Machine Learning.
Kdy použít jaký typ výpočetních prostředků?
Obecně platí, že při práci s cílovými výpočetními objekty můžete postupovat podle některých osvědčených postupů. Abyste pochopili, jak zvolit vhodný typ výpočetních prostředků, najdete několik příkladů. Mějte na paměti, že typ výpočetních prostředků, který používáte, vždy závisí na konkrétní situaci.
Volba cílového výpočetního objektu pro experimentování
Představte si, že jste datový vědec a budete požádáni o vývoj nového modelu strojového učení. Pravděpodobně máte malou podmnožinu trénovacích dat, se kterými můžete experimentovat.
Během experimentování a vývoje dáváte přednost práci v poznámkovém bloku Jupyter. Notebookové prostředí těží nejvíce z výpočetního výkonu, který běží nepřetržitě.
Mnozí datoví vědci znají spouštění poznámkových bloků na místním zařízení. Cloudová alternativa spravovaná službou Azure Machine Learning je výpočetní instance. Pokud chcete využít distribuovaný výpočetní výkon Sparku, můžete se také rozhodnout pro bezserverové výpočetní prostředky Sparku , abyste mohli spouštět kód Sparku v poznámkových blocích.
Volba cílového výpočetního prostředí pro produkční prostředí
Po experimentování můžete modely trénovat spuštěním skriptů Pythonu pro přípravu na produkční prostředí. Skripty budou snazší automatizovat a plánovat, kdy chcete model průběžně trénovat. Skripty můžete spouštět jako úlohy pipeline.
Při přechodu do produkčního prostředí chcete, aby byl cílový výpočetní objekt připravený ke zpracování velkých objemů dat. Čím více dat použijete, tím lépe bude model strojového učení pravděpodobně.
Při trénování modelů pomocí skriptů chcete cílový výpočetní objekt na vyžádání. Výpočetní cluster se automaticky škáluje, když je třeba skripty spustit, a po dokončení jejich provádění se znovu škáluje dolů. Pokud chcete alternativu, kterou nemusíte vytvářet a spravovat, můžete použít bezserverové výpočetní prostředky služby Azure Machine Learning.
Volba cílového výpočetního prostředí pro nasazení
Typ výpočetních prostředků, který potřebujete při použití modelu ke generování předpovědí, závisí na tom, jestli chcete dávkové nebo předpovědi v reálném čase.
Pro dávkové předpovědi můžete spustit pipelinovou úlohu ve službě Azure Machine Learning. Cílové výpočetní objekty, jako jsou výpočetní clustery a bezserverové výpočty služby Azure Machine Learning, jsou ideální pro úlohy pipeline, protože jsou na vyžádání a škálovatelné.
Pokud chcete predikce v reálném čase, potřebujete typ výpočetních prostředků, který běží nepřetržitě. Nasazení v reálném čase proto využívají odlehčeného (a nákladově efektivnějšího) výpočetního prostředí. Kontejnery jsou ideální pro nasazení v reálném čase. Když model nasadíte do spravovaného online koncového bodu, Azure Machine Learning vytvoří a spravuje kontejnery, které můžete spustit. Případně můžete připojit clustery Kubernetes ke správě potřebných výpočetních prostředků pro generování předpovědí v reálném čase.