Poznámka:
Přístup k této stránce vyžaduje autorizaci. Můžete se zkusit přihlásit nebo změnit adresáře.
Přístup k této stránce vyžaduje autorizaci. Můžete zkusit změnit adresáře.
Cílový výpočetní objekt je určený výpočetní prostředek nebo prostředí, ve kterém spouštíte trénovací skript nebo hostujete nasazení služby. Toto umístění může být místní počítač nebo cloudový výpočetní prostředek. Použití cílových výpočetních prostředků usnadňuje pozdější změnu výpočetního prostředí bez nutnosti měnit kód.
Azure Machine Learning podporuje různé cílové výpočetní objekty. V typickém životním cyklu vývoje modelu můžete:
- Začněte vývojem a experimentováním s malým množstvím dat. V této fázi jako cíl výpočetních prostředků použijte místní prostředí, jako je místní počítač nebo cloudový virtuální počítač.
- Vertikálně navyšte kapacitu na větší data nebo proveďte distribuované trénování pomocí jednoho z těchto trénovacích výpočetních cílů.
- Jakmile je model připravený, nasaďte ho do hostitelského prostředí webu s jedním z těchto cílových výpočetních prostředků nasazení.
Výpočetní prostředky, které použijete pro své výpočetní cíle, připojíte k pracovnímu prostoru. Uživatelé pracovního prostoru sdílejí jiné výpočetní prostředky než místní počítač.
Trénování cílových výpočetních prostředků
Při vertikálním navýšení kapacity trénování u větších datových sad nebo provádění distribuovaného trénování můžete pomocí výpočetních prostředků Azure Machine Learning vytvořit cluster s jedním uzlem nebo více uzly, který se automaticky škáluje při každém odeslání úlohy. Můžete také připojit vlastní výpočetní prostředek, i když se podpora pro různé scénáře může lišit.
Výpočetní cíle můžete znovu použít z jedné trénovací úlohy na další. Například po připojení vzdáleného virtuálního počítače k pracovnímu prostoru ho můžete znovu použít pro více úloh.
Pro kanály strojového učení použijte příslušný krok kanálu pro každý cílový výpočetní objekt.
Pro trénovací cílový výpočetní objekt pro většinu úloh můžete použít libovolný z následujících prostředků. Ne všechny prostředky se dají použít pro automatizované strojové učení, kanály strojového učení nebo návrháře. Azure Databricks se dá použít jako trénovací prostředek pro místní spuštění a kanály strojového učení, ale ne jako vzdálený cíl pro jiné trénování.
| Cíle trénování | Automatizované strojové učení | Kanály strojového učení | Návrhář služby Azure Machine Learning |
|---|---|---|---|
| Výpočetní cluster Azure Machine Learning | Ano | Ano | Ano |
| Bezserverové výpočetní prostředí služby Azure Machine Learning | Ano | Ano | Ano |
| Výpočetní instance služby Azure Machine Learning | Ano (prostřednictvím sady SDK) | Ano | Ano |
| Azure Machine Learning Kubernetes | Ano | Ano | |
| Vzdálený virtuální počítač | Ano | Ano | |
| Fondy Apache Sparku (Preview) | Ano (pouze místní režim sady SDK) | Ano | |
| Azure Databricks | Ano (pouze místní režim sady SDK) | Ano | |
| Azure Data Lake Analytics | Ano | ||
| Azure HDInsight | Ano | ||
| Azure Batch | Ano |
| Cíle trénování | Automatizované strojové učení | Kanály strojového učení | Návrhář služby Azure Machine Learning |
|---|---|---|---|
| Místní počítač | Ano | ||
| Výpočetní cluster Azure Machine Learning | Ano | Ano | Ano |
| Výpočetní instance služby Azure Machine Learning | Ano (prostřednictvím sady SDK) | Ano | Ano |
| Azure Machine Learning Kubernetes | Ano | Ano | |
| Vzdálený virtuální počítač | Ano | Ano | |
| Fondy Apache Sparku (Preview) | Ano (pouze místní režim sady SDK) | Ano | |
| Azure Databricks | Ano (pouze místní režim sady SDK) | Ano | |
| Azure Data Lake Analytics | Ano | ||
| Azure HDInsight | Ano | ||
| Azure Batch | Ano |
Návod
Výpočetní instance má 120GB disk s operačním systémem. Pokud vám dojde místo na disku, před zastavením nebo restartováním výpočetní instance pomocí terminálu vymažte alespoň 1 až 2 GB.
Cílové výpočetní objekty pro odvozování
Když provádíte odvozování, Azure Machine Learning vytvoří kontejner Dockeru, který je hostitelem modelu a přidružených prostředků potřebných k jeho použití. Tento kontejner použijete v cílovém výpočetním objektu.
Cílový výpočetní objekt, který používáte k hostování modelu, ovlivňuje náklady a dostupnost nasazeného koncového bodu. Tato tabulka slouží k výběru vhodného cílového výpočetního objektu.
| Cílový výpočetní objekt | Použití | Podpora GPU | Popis |
|---|---|---|---|
| Koncové body služby Azure Machine Learning | Odvození v reálném čase Dávkové odvozování |
Ano | Plně spravované výpočetní prostředky pro výpočetní prostředky bez serveru (spravované online koncové body) a dávkové vyhodnocování (dávkové koncové body). |
| Azure Machine Learning Kubernetes | Odvození v reálném čase Dávkové odvozování |
Ano | Spouštění úloh odvození v místních clusterech, cloudech a hraničních clusterech Kubernetes |
| Cílový výpočetní objekt | Použití | Podpora GPU | Popis |
|---|---|---|---|
| Místní webová služba | Testování/ladění | Slouží k omezenému testování a řešení potíží. Hardwarová akcelerace závisí na použití knihoven v místním systému. | |
| Azure Machine Learning Kubernetes | Odvozování v reálném čase | Ano | Spouštění úloh odvození v cloudu |
| Azure Container Instances | Odvození v reálném čase Doporučuje se pouze pro účely vývoje/testování. |
Používá se pro úlohy založené na procesoru s nízkou škálou, které vyžadují méně než 48 GB paměti RAM. Cluster nemusíte spravovat. Vhodné pouze pro modely menší než 1 GB. Podporováno v návrháři. |
Poznámka:
Při výběru konfigurace clusteru nejprve navyšte kapacitu a poté rozdělte zátěž. Začněte s počítačem, který má 150 % paměti RAM potřebné pro váš model, analyzujte výsledek a najděte počítač s požadovaným výkonem. Jakmile se to naučíte, zvyšte počet počítačů tak, aby vyhovoval vaší potřebě pro souběžné odvozování.
Výpočetní prostředky služby Azure Machine Learning (spravované)
Azure Machine Learning vytváří a spravuje spravované výpočetní prostředky. Tento typ výpočetních prostředků je optimalizovaný pro úlohy strojového učení. Jedinými spravovanými výpočetními prostředky jsou výpočetní clustery Azure Machine Learning, bezserverové výpočetní služby a výpočetní instance.
Nemusíte vytvářet bezserverové výpočetní prostředky. Výpočetní instance služby Azure Machine Learning nebo výpočetní clustery můžete vytvořit z:
- Azure Machine Learning Studio
- Sada Python SDK a Azure CLI:
- Šablona Azure Resource Manageru. Příklad šablony najdete v tématu Vytvoření výpočetního clusteru Azure Machine Learning.
Poznámka:
Místo vytváření výpočetního clusteru využijte bezserverové výpočetní prostředky k přesměrování správy životního cyklu výpočetního cyklu do služby Azure Machine Learning.
Při vytváření těchto výpočetních prostředků se automaticky stanou součástí vašeho pracovního prostoru, na rozdíl od jiných typů cílových výpočetních prostředků.
| Schopnost | Výpočtový cluster | Výpočetní instance |
|---|---|---|
| Cluster s jedním uzlem nebo více uzly | ✓ | Cluster s jedním uzlem |
| Automatické škálování při každém odeslání úlohy | ✓ | |
| Automatická správa clusteru a plánování úloh | ✓ | ✓ |
| Podpora prostředků PROCESORu i GPU | ✓ | ✓ |
Poznámka:
Abyste se vyhnuli poplatkům za nečinnost výpočetních prostředků:
- V případě výpočetního clusteru se ujistěte, že je minimální počet uzlů nastavený na 0, nebo použijte bezserverové výpočetní prostředky.
- U výpočetní instance povolte vypnutí nečinnosti. Přestože zastavení výpočetní instance zastaví fakturaci za výpočetní hodiny, nicméně stále platíte za disk, veřejnou IP adresu a standardní nástroj pro vyrovnávání zatížení.
Podporované řady a velikosti virtuálních počítačů
Důležité
Pokud jsou vaše výpočetní instance nebo výpočetní clustery založené na některé z těchto řad, vytvořte znovu jinou velikost virtuálního počítače.
Tyto série byly vyřazeny 31. srpna 2023:
Tyto série byly vyřazeny 31. srpna 2024:
Tyto série byly vyřazeny 30. září 2025:
Když vyberete velikost uzlu pro spravovaný výpočetní prostředek ve službě Azure Machine Learning, můžete si vybrat z vybraných velikostí virtuálních počítačů dostupných v Azure. Azure nabízí řadu velikostí pro Linux a Windows pro různé úlohy. Další informace najdete v tématu Typy a velikosti virtuálních počítačů.
Při výběru velikosti virtuálního počítače existuje několik výjimek a omezení:
- Azure Machine Learning nepodporuje některé řady virtuálních počítačů.
- Některé řady virtuálních počítačů, jako jsou GPU a jiné speciální skladové položky, se nemusí zpočátku zobrazovat v seznamu dostupných virtuálních počítačů. Přesto je ale můžete použít, jakmile požádáte o změnu kvóty. Další informace o vyžádání kvót najdete v tématu Žádost o navýšení kvóty a limitu.
Další informace o podporovaných řadách najdete v následující tabulce.
| Podporovaná řada virtuálních počítačů | Kategorie | Podporováno |
|---|---|---|
| DDSv4 | Obecné účely | Výpočetní clustery a instance |
| Dv2 | Obecné účely | Výpočetní clustery a instance |
| Dv3 | Obecné účely | Výpočetní clustery a instance |
| DSv2 | Obecné účely | Výpočetní clustery a instance |
| DSv3 | Obecné účely | Výpočetní clustery a instance |
| EAv4 | Optimalizované pro paměť | Výpočetní clustery a instance |
| Ev3 | Optimalizované pro paměť | Výpočetní clustery a instance |
| ESv3 | Optimalizované pro paměť | Výpočetní clustery a instance |
| FSv2 | Optimalizované pro výpočty | Výpočetní clustery a instance |
| Trh zahraničních měn | Optimalizované pro výpočty | Výpočetní clustery |
| H | Vysokovýkonné výpočetní prostředí | Výpočetní clustery a instance |
| HEMOGLOBIN | Vysokovýkonné výpočetní prostředí | Výpočetní clustery a instance |
| HBv2 | Vysokovýkonné výpočetní prostředí | Výpočetní clustery a instance |
| HBv3 | Vysokovýkonné výpočetní prostředí | Výpočetní clustery a instance |
| HC | Vysokovýkonné výpočetní prostředí | Výpočetní clustery a instance |
| LSv2 | Optimalizované pro úložiště | Výpočetní clustery a instance |
| M | Optimalizované pro paměť | Výpočetní clustery a instance |
| NC | GPU | Výpočetní clustery a instance |
| NC Promo | GPU | Výpočetní clustery a instance |
| NCv2 | GPU | Výpočetní clustery a instance |
| NCv3 | GPU | Výpočetní clustery a instance |
| ND | GPU | Výpočetní clustery a instance |
| NDv2 | GPU | Výpočetní clustery a instance |
| NV | GPU | Výpočetní clustery a instance |
| NVv3 | GPU | Výpočetní clustery a instance |
| NCasT4_v3 | GPU | Výpočetní clustery a instance |
| NDasrA100_v4 | GPU | Výpočetní clustery a instance |
| ND-H100-v5 | GPU | Výpočetní clustery a instance |
| ND-H200-v5 | GPU | Výpočetní clustery a instance |
Azure Machine Learning sice tyto řady virtuálních počítačů podporuje, ale nemusí být dostupné ve všech oblastech Azure. Pokud chcete zkontrolovat, jestli jsou řady virtuálních počítačů dostupné, podívejte se na produkty dostupné v jednotlivých oblastech.
Poznámka:
Azure Machine Learning nepodporuje všechny velikosti virtuálních počítačů, které Azure Compute podporuje. Pokud chcete zobrazit seznam dostupných velikostí virtuálních počítačů, použijte následující metodu:
Poznámka:
Azure Machine Learning nepodporuje všechny velikosti virtuálních počítačů, které Azure Compute podporuje. Pokud chcete zobrazit seznam dostupných velikostí virtuálních počítačů podporovaných konkrétními typy výpočetních virtuálních počítačů, použijte jednu z následujících metod:
- REST API
- Rozšíření Azure CLI 2.0 pro příkaz strojového učení az ml compute list-sizes.
Pokud používáte cílové výpočetní objekty s podporou GPU, je důležité zajistit, aby byly v trénovacím prostředí nainstalované správné ovladače CUDA. Pomocí následující tabulky určete správnou verzi CUDA, která se má použít:
| Architektura GPU | Řada virtuálních počítačů Azure | Podporované verze CUDA |
|---|---|---|
| Ampér | NDA100_v4 | 11.0+ |
| Turing | NCT4_v3 | 10.0+ |
| Volta | NCv3, NDv2 | 9.0+ |
| Pascal | NCv2, ND | 9.0+ |
| Maxwell | NV, NVv3 | 9.0+ |
| Kepler | NC, NC Promo | 9.0+ |
Kromě zajištění kompatibility verze a hardwaru CUDA se také ujistěte, že je verze CUDA kompatibilní s verzí architektury strojového učení, kterou používáte:
- V případě PyTorch zkontrolujte kompatibilitu na stránce předchozích verzí PyTorchu.
- V případě TensorFlow zkontrolujte kompatibilitu tak, že navštívíte build TensorFlow ze zdrojové stránky.
Izolace výpočetních prostředků
Výpočetní prostředí Azure Machine Learning nabízí velikosti virtuálních počítačů, které jsou izolované od konkrétního typu hardwaru a vyhrazené pro jednoho zákazníka. Velikosti izolovaných virtuálních počítačů jsou nejvhodnější pro úlohy, které vyžadují vysokou míru izolace od úloh jiných zákazníků z důvodů, které zahrnují dodržování předpisů a zákonné požadavky. Pokud používáte izolovanou velikost, je váš virtuální počítač jediným spuštěným na této konkrétní instanci serveru.
Mezi aktuální nabídky izolovaných virtuálních počítačů patří:
- Standard_M128ms
- Standard_F72s_v2
- Standard_NC24s_v3
- Standard_NC24rs_v3 (s podporou RDMA)
Další informace o izolaci najdete v tématu Izolace ve veřejném cloudu Azure.
Nespravované výpočetní prostředky
Azure Machine Learning nespravuje nespravovaný cílový výpočetní objekt. Tento typ cílového výpočetního objektu vytvoříte mimo službu Azure Machine Learning a pak ho připojíte ke svému pracovnímu prostoru. Možná budete muset provést další kroky k údržbě nespravovaných výpočetních prostředků nebo ke zlepšení výkonu úloh strojového učení.
Azure Machine Learning podporuje následující typy nespravovaných výpočetních prostředků:
- Vzdálené virtuální počítače
- Azure HDInsight
- Azure Databricks
- Azure Data Lake Analytics
- Služba Azure Kubernetes
- Fond Azure Synapse Spark (zastaralý)
Další informace najdete v tématu Správa výpočetních prostředků.