Velikosti virtuálních počítačů pro vysokovýkonné výpočetní prostředí (HPC)

Platí pro: ✔️ Virtuální počítače s Linuxem ✔️ – Flexibilní škálovací sady virtuálních počítačů ✔️ s ✔️ Windows – uniformní škálovací sady

Tip

Vyzkoušejte nástroj pro výběr virtuálních počítačů a vyhledejte další velikosti, které nejlépe vyhovují vaší úloze.

Virtuální počítače řady Azure H-series jsou navržené tak, aby poskytovaly špičkový výkon, škálovatelnost a nákladovou efektivitu pro různé úlohy prostředí HPC z reálného světa.

Řada HBv3 Virtuální počítače jsou optimalizované pro aplikace hpc, jako je dynamika tekutin, explicitní a implicitní analýza konečných prvků, modelování počasí, seismické zpracování, simulace nádrží a simulace RTL. Virtuální počítače HBv3 mají až 120 procesorů AMD EPYC™ řady 7003 (Milán), 448 GB paměti RAM a žádné hyperthreading. Virtuální počítače řady HBv3 také poskytují šířku pásma paměti 350 GB/s, až 32 MB mezipaměti L3 na jádro, výkon až 7 GB/s jednotky SSD blokového zařízení a frekvence taktu až 3,5 GHz.

Všechny virtuální počítače řady HBv3 jsou vybaveny 200 Gb/s HDR InfiniBand od společnosti NVIDIA Networking, aby bylo možné provádět úlohy MPI v měřítku superpočítače. Tyto virtuální počítače jsou připojené do neblokujícího stromu fat pro optimalizovaný a konzistentní výkon RDMA. Prostředky infrastruktury HDR InfiniBand také podporují adaptivní směrování a dynamický připojený přenos (DCT) kromě standardních přenosů RC a UD. Tyto funkce zvyšují výkon, škálovatelnost a konzistenci aplikací a jejich použití se důrazně doporučuje.

Řada HBv2 Virtuální počítače jsou optimalizované pro aplikace řízené šířkou pásma paměti, jako je dynamika tekutin, analýza konečných prvků a simulace zásobníku. Virtuální počítače HBv2 mají 120 procesorových jader AMD EPYC 7742, 4 GB paměti RAM na jádro procesoru a žádné souběžné multithreading. Každý virtuální počítač HBv2 poskytuje až 340 GB/s šířku pásma paměti a až 4 teraFLOPS výpočetních prostředků FP64.

Virtuální počítače HBv2 mají 200 Gb/s Mellanox HDR InfiniBand, zatímco virtuální počítače řady HB i HC 100 Gb/s Mellanox EDR InfiniBand. Každý z těchto typů virtuálních počítačů je připojený do neblokujícího stromu tuku pro optimalizovaný a konzistentní výkon RDMA. Virtuální počítače HBv2 podporují kromě standardních přenosů RC a UD také adaptivní směrování a dynamický připojený přenos (DCT). Tyto funkce zvyšují výkon, škálovatelnost a konzistenci aplikací a jejich použití se důrazně doporučuje.

Řada HB Virtuální počítače jsou optimalizované pro aplikace řízené šířkou pásma paměti, jako je dynamika tekutin, explicitní analýza konečných prvků a modelování počasí. Virtuální počítače HB mají 60 procesorových jader AMD EPYC 7551, 4 GB paměti RAM na jádro procesoru a žádné hyperthreading. Platforma AMD EPYC poskytuje více než 260 GB/s šířku pásma paměti.

Řada HC Virtuální počítače jsou optimalizované pro aplikace řízené hustými výpočty, jako je implicitní analýza konečných prvků, molekulární dynamika a výpočetní chemie. Virtuální počítače HC mají 44 jader procesoru Intel Xeon Platinum 8168, 8 GB paměti RAM na jádro procesoru a žádné hyperthreading. Platforma Intel Xeon Platinum podporuje bohatý ekosystém softwarových nástrojů společnosti Intel, jako je knihovna Intel Math Kernel Library.

Poznámka

Všechny virtuální počítače řady HBv3, HBv2, HB a HC-series mají výhradní přístup k fyzickým serverům. Pro každý fyzický server existuje pouze 1 virtuální počítač a pro tyto velikosti virtuálních počítačů neexistuje žádná sdílená víceklientská architektura s jinými virtuálními počítači.

Instance s podporou RDMA

Většina velikostí virtuálních počítačů HPC obsahuje síťové rozhraní pro připojení vzdáleného přímého přístupu do paměti (RDMA). U vybraných velikostí N-series označených jako r je také možné použít RDMA. Toto rozhraní doplňuje standardní síťové rozhraní Azure Ethernet dostupné v ostatních velikostech virtuálních počítačů.

Toto sekundární rozhraní umožňuje instancím s podporou RDMA komunikovat přes síť InfiniBand (IB) a pracovat s rychlostmi HDR pro HBv3, HBv2, EDR pro HB, HC, NDv2 a FDR pro H16r, H16mr a další virtuální počítače N-series s podporou RDMA. Tyto funkce RDMA mohou zvýšit škálovatelnost a výkon aplikací založených na rozhraní MPI (Message Passing Interface).

Poznámka

Podpora SR-IOV: V Prostředí Azure HPC v současné době existují dvě třídy virtuálních počítačů v závislosti na tom, jestli jsou pro InfiniBand povolené rozhraní SR-IOV. V současné době téměř všechny novější generace virtuálních počítačů s podporou RDMA nebo InfiniBand v Azure mají povolenou technologii SR-IOV s výjimkou H16r, H16mr a NC24r. RDMA je povolený jenom přes síť InfiniBand (IB) a podporuje se pro všechny virtuální počítače s podporou RDMA. IP adresa přes IB se podporuje jenom na virtuálních počítačích s podporou SR-IOV. V síti Ethernet není povolen přístup RDMA.

  • Operační systém – běžně se používají linuxové distribuce, jako jsou CentOS, RHEL, Ubuntu, SUSE. Windows Server 2016 a novější verze jsou podporovány na všech virtuálních počítačích řady HPC. Mějte na paměti, že Windows Server 2012 R2 se nepodporuje ve verzi HBv2 jako virtuální počítače s více než 64 (virtuálními nebo fyzickými) jádry. Seznam podporovaných imagí virtuálních počítačů na Marketplace a jejich správnou konfiguraci najdete v tématu Image virtuálních počítačů. Na příslušných stránkách velikostí virtuálních počítačů je také seznam podpory zásobníku softwaru.

  • InfiniBand a ovladače – na virtuálních počítačích s podporou InfiniBand se k povolení RDMA vyžadují příslušné ovladače. Seznam podporovaných imagí virtuálních počítačů na Marketplace a jejich správnou konfiguraci najdete v tématu Image virtuálních počítačů. Informace o rozšířeních virtuálních počítačů nebo ruční instalaci ovladačů InfiniBand najdete také v tématu povolení InfiniBand .

  • MPI – Velikosti virtuálních počítačů s podporou SR-IOV v Azure umožňují použít s Mellanox OFED téměř jakoukoli variantu MPI. Další podrobnosti o nastavení MPI na virtuálních počítačích HPC v Azure najdete v tématu Nastavení MPI pro PROSTŘEDÍ HPC .

    Poznámka

    Síťový adresní prostor RDMA: Síť RDMA v Azure si vyhrazuje adresní prostor 172.16.0.0/16. Pokud chcete spouštět aplikace MPI na instancích nasazených ve virtuální síti Azure, ujistěte se, že adresní prostor virtuální sítě nepřekrývá síť RDMA.

Možnosti konfigurace clusteru

Azure nabízí několik možností, jak vytvořit clustery virtuálních počítačů HPC, které můžou komunikovat pomocí sítě RDMA, mezi které patří:

  • Virtuální počítače – Nasaďte virtuální počítače HPC s podporou RDMA ve stejné škálovací sadě nebo skupině dostupnosti (při použití modelu nasazení Azure Resource Manager). Pokud používáte model nasazení Classic, nasaďte virtuální počítače ve stejné cloudové službě.

  • Škálovací sady virtuálních počítačů – Ve škálovací sadě virtuálních počítačů se ujistěte, že jste nasazení omezili na jednu skupinu umístění pro komunikaci infiniBand v rámci škálovací sady. Například v šabloně Resource Manager nastavte singlePlacementGroup vlastnost na true. Všimněte si, že maximální velikost škálovací sady, kterou je možné vytvořit, singlePlacementGroup=true je ve výchozím nastavení omezena na 100 virtuálních počítačů. Pokud jsou vaše potřeby škálování úloh HPC vyšší než 100 virtuálních počítačů v jednom tenantovi, můžete požádat o navýšení a zdarma otevřít online žádost o zákaznickou podporu . Limit počtu virtuálních počítačů v jedné škálovací sadě je možné zvýšit na 300. Při nasazování virtuálních počítačů pomocí skupin dostupnosti je maximální limit 200 virtuálních počítačů na skupinu dostupnosti.

    Poznámka

    MPI mezi virtuálními počítači: Pokud se mezi virtuálními počítači vyžaduje RDMA (např. pomocí komunikace MPI), ujistěte se, že jsou virtuální počítače ve stejné škálovací sadě nebo skupině dostupnosti virtuálních počítačů.

  • Azure CycleCloud – Vytvořte cluster HPC pomocí Azure CycleCloudu ke spouštění úloh MPI.

  • Azure Batch – Vytvořte fond Azure Batch pro spouštění úloh MPI. Pokud chcete při spouštění aplikací MPI s Azure Batch používat instance náročné na výpočetní prostředky, přečtěte si téma Použití úloh s více instancemi ke spouštění aplikací rozhraní MPI (Message Passing Interface) v Azure Batch.

  • Microsoft HPC Pack - Sada HPC Pack zahrnuje běhové prostředí pro MS-MPI, které při nasazení na virtuálních počítačích s Linuxem s podporou RDMA používá síť Azure RDMA. Například nasazení najdete v tématu Nastavení clusteru RDMA s Linuxem pomocí sady HPC Pack pro spouštění aplikací MPI.

Aspekty nasazování

  • Předplatné Azure – Pokud chcete nasadit více než několik instancí náročných na výpočetní výkon, zvažte předplatné s průběžným platbami nebo jiné možnosti nákupu. Pokud používáte bezplatný účet Azure, můžete použít pouze omezený počet výpočetních jader Azure.

  • Ceny a dostupnost – Zkontrolujte ceny a dostupnostvirtuálních počítačů podle oblastí Azure.

  • Kvóta jader – Možná budete muset zvýšit kvótu jader ve vašem předplatném Azure z výchozí hodnoty. Vaše předplatné může také omezit počet jader, která můžete nasadit v určitých řadách velikostí virtuálních počítačů, včetně řady H-series. Pokud chcete požádat o navýšení kvóty, otevřete bezplatně online žádost o zákaznickou podporu . (Výchozí limity se můžou lišit v závislosti na vaší kategorii předplatného.)

    Poznámka

    Pokud máte velké požadavky na kapacitu, kontaktujte podporu Azure. Kvóty Azure jsou limity kreditů, nikoli záruky kapacity. Bez ohledu na kvótu se vám účtují jenom jádra, která používáte.

  • Virtuální síť – K použití instancí náročných na výpočetní výkon se nevyžaduje virtuální síť Azure. Pro mnoho nasazení ale potřebujete alespoň cloudovou virtuální síť Azure nebo připojení typu site-to-site, pokud potřebujete přístup k místním prostředkům. V případě potřeby vytvořte novou virtuální síť pro nasazení instancí. Přidání virtuálních počítačů náročných na výpočetní výkon do virtuální sítě ve skupině vztahů se nepodporuje.

  • Změna velikosti – Vzhledem k jejich specializovanému hardwaru můžete změnit velikost pouze instancí náročných na výpočetní výkon v rámci stejné řady velikostí (řady H nebo N-series). Můžete například změnit velikost virtuálního počítače řady H-series jenom z jedné velikosti řady H-series na jinou. U některých virtuálních počítačů může být potřeba zvážit další aspekty týkající se podpory ovladačů InfiniBand a disků NVMe.

Jiné velikosti

Další kroky