Cvičení – vytvoření clusteru HPC z vestavěných šablon

Dokončeno

Nové clustery můžete vytvářet přímo z grafického rozhraní webové aplikace Azure CycleCloud. CycleCloud nabízí mnoho předdefinovaných šablon specifických pro plánovače, které zjednodušují zřizování clusterů pro odpovídající plánovače.

Teď, když jste zřídili virtuální počítač Azure, který hostuje webové aplikace CycleCloud, jste připraveni vyhodnotit jeho použití pro nasazení HPC clusteru založeného na Slurmu do Azure. Nejprve musíte zajistit, aby vaše předplatné Azure vyhovovalo požadavkům na prostředky clusteru. Chcete také zvážit, jestli váš tým pro správu chce zachovat náklady na cluster v rámci rozpočtu projektu. Takže po dokončení vyhodnocení plánujete nastavit upozornění rozpočtu CycleCloudu a zrušit zřízení testovacího prostředí.

V tomto cvičení si projdete nasazení HPC clusteru založeného na Slurmu do Azure pomocí Azure CycleCloud. Cvičení se skládá z následujících úkolů:

  • Úloha 1: Příprava na nasazení HPC clusteru
  • Úloha 2: Vytvoření clusteru PROSTŘEDÍ HPC pomocí Azure CycleCloudu
  • Úloha 3: Konfigurace a spuštění clusteru PROSTŘEDÍ HPC pomocí Azure CycleCloudu
  • Úloha 4: Vyčištění testovacího prostředí

Úloha 1: Příprava na nasazení HPC clusteru

Než nasadíte HPC cluster, měli byste nejprve zajistit, abyste měli dostatek síťových a výpočetních prostředků, aby pokryly jeho využívání.

Poznámka

K dokončení tohoto cvičení nepotřebujete splnit požadavky na kvótu, abyste vyhověli zřizování výpočetních uzlů, protože v clusteru, který vytvoříte, nespustíte žádné úlohy. Pokud to ale tak je, můžete si všimnout neshody mezi snímky obrazovky v tomto cvičení a webovým rozhraním CycleCloud, protože CycleCloud nebude předem vytvářet zástupné výpočetní uzly, pokud nemáte dostatečný počet dostupných jader.

  1. Na počítači přepněte do okna webového prohlížeče zobrazující portál Azure.

  2. Na webu Azure Portal pomocí vyhledávacího pole v horní části rozhraní portálu vyhledejte skupinu prostředků cyclecloud-rg.

  3. Na webu Azure Portal na stránce cyclecloud-rg vyberte v seznamu prostředků položku cyclecloud-rg-vnet představující virtuální síť, kterou jste zřídili v předchozím cvičení tohoto modulu.

  4. Na stránce cyclecloud-rg-vnet vyberte ve svislé nabídce na levé straně podsítě.

  5. Na cyclecloud-rg-vnet | Podsítě okno, vyberte + podsíť.

  6. V podokně Přidat podsíť zadejte do textového pole název název contoso-slurm-lab-cluster-cluster-subnet, přijměte výchozí rozsah podsítě a vyberte Uložit.

    Poznámka

    Doporučujeme oddělit podsíť hostující virtuální počítač Azure CycleCloud od podsítí hostujících výpočetní prostředky clusteru. U větších clusterů byste měli přidělit dostatečně velké rozsahy IP adres.

  7. Na webu Azure Portal pomocí vyhledávacího pole vyhledejte Předplatná.

  8. Na stránce Předplatná vyberte předplatné Azure, které používáte pro cvičení v rámci tohoto modulu.

  9. Na stránce zobrazující předplatné Azure v nabídce svislé na levé straně v části Nastavení vyberte Využití a kvóty.

  10. V podokně Využití a kvóty nakonfigurujte následující nastavení filtrování (ostatní nechte výchozí hodnoty):

    Nastavení Hodnota
    Výběr služby Vyberte záznamy Standard Dv3 Family vCPUs, Standard FSv2 Family vCPUsa Total Regional vCPUs.
    Výběr poskytovatele Vyberte položku Microsoft.Compute.
    Výběr umístění Vyberte název oblasti Azure, ve které chcete cluster nasadit v tomto cvičení.
  11. Zkontrolujte výstup a určete počet dostupných virtuálních procesorů v každé skupině.

    snímek obrazovky znázorňující podokno Využití a kvóty na webu Azure Portal

Úloha 2: Vytvoření clusteru PROSTŘEDÍ HPC pomocí Azure CycleCloudu

Teď máte webovou aplikaci CycleCloud nainstalovanou na virtuálním počítači Azure, dostatek jader virtuálních procesorů dostupných ve vašem předplatném Azure a určená síťová podsíť umožňující automatické škálování uzlů clusteru. Jste připraveni pokračovat v nasazení clusteru založeného na Slurmu.

  1. Na počítači, v okně webového prohlížeče zobrazujícím stránku Předplatná webové aplikace Azure CycleCloud, vyberte v levém horním rohu odkaz Zpět ke clusterům.

  2. Na stránce Vytvořit nový cluster zkontrolujte dostupné možnosti a v části Plánovače vyberte Slurm.

    snímek obrazovky se stránkou Vytvořit nový cluster webové aplikace Azure CycleCloud

  3. Na kartě O na stránce Nový klastr Slurm zadejte do textového pole Název klastru hodnotu contoso-slurm-lab-cluster.

    Snímek obrazovky, který zobrazuje záložku O aplikaci na stránce Nového clusteru Slurm webové aplikace Azure CycleCloud

  4. Na kartě Požadované nastavení na stránce Nový cluster Slurm do textového pole Název clusteru nakonfigurujte následující nastavení (nechte ostatní na jejich výchozích hodnotách):

    Nastavení Hodnota
    Oblast Vyberte název oblasti Azure, ve které chcete cluster nasadit v tomto cvičení.
    Typ plánovacího virtuálního počítače Vyberte Zvoltea potom v automaticky otevíraném okně Vyberte typ počítače, do textového pole pro hledání skladové položky zadejte "D2ds_v5". V seznamu výsledků zaškrtněte políčko vedle položky D2ds_v5 a pak vyberte Použít.

    Snímek obrazovky, který zobrazuje kartu vyskakovacího okna Vybrat typ počítače na stránce Nový cluster Slurm webové aplikace Azure CycleCloud.

    Nastavení Hodnota
    Maximální počet jader HPC Zadejte 100
    Max HTC Cores Zadejte 100
    Maximální počet virtuálních počítačů na škálovací sadu Zadejte 40
    ID podsítě Vyberte cyclecloud-rg: cyclecloud-rg-vnet-contoso-slurm-lab-cluster-subnet

    snímek obrazovky, který zobrazuje kartu Požadovaná nastavení na stránce Nový cluster Slurm webové aplikace Azure CycleCloud

    Poznámka

    Nastavení Maximální počet virtuálních počítačů na škálovací sadu omezuje maximální velikost úlohy rozhraní Message Passing, která se dá spustit v clusteru, protože škálovací sada je aktuálně hranicí InfiniBand fabric.

  5. Na kartě Network Attached Storage na stránce New Slurm Cluster ověřte, že je typ systému souborů NFS nastavený na Builtin. Přijměte výchozí hodnotu Velikost (GB) nastavenou na 100a vyberte Další.

    Snímek obrazovky ukazující kartu Síťové úložiště na stránce Nového clusteru Slurm webové aplikace Azure CycleCloud

  6. Na kartě Upřesnit nastavení na stránce Nový cluster Slurm zkontrolujte dostupné možnosti, aniž byste museli provádět změny, a pak vyberte Další.

    snímek obrazovky zobrazující kartu Rozšířená nastavení na stránce Nový cluster Slurm webové aplikace Azure CycleCloud

  7. Na kartě Cloud-init na stránce Nový cluster Slurm zkontrolujte dostupné možnosti, aniž byste prováděli změny, a pak vyberte Uložit.

Úloha 3: Konfigurace a spuštění clusteru PROSTŘEDÍ HPC pomocí Azure CycleCloudu

Pokud se chcete připravit na zprovoznění clusteru, nastavte výstrahy, které vás upozorní, když náklady na využití clusteru dosáhnou rozpočtu přiděleného nákladům na prostředky Azure. Nasazení také ověříte spuštěním clusteru pomocí grafického rozhraní webové aplikace CycleCloud.

  1. Ve webovém prohlížeči, který zobrazuje grafické rozhraní webové aplikace Azure CycleCloud, zkontrolujte vlastnosti nově nasazeného clusteru.

    snímek obrazovky se stránkou contoso-slurm-lab-cluster v vypnutém stavu ve webové aplikaci Azure CycleCloud

  2. Na stránce contoso-slurm-lab-cluster vyberte možnost Vytvořit novou výstrahu.

  3. V automaticky otevíraných oken využití clusteru contoso-slurm-lab-cluster zadejte následující nastavení a pak vyberte Uložit:

    Nastavení Hodnota
    Rozpočet $100,00
    Za měsíc
    Odeslat oznámení Povoleno
    Příjemci cc-admin@contoso.com

    snímek obrazovky s upozorněním na využití clusteru pro otevírané okno clusteru contoso-slurm-lab-cluster ve webové aplikaci Azure CycleCloud

  4. Zpět na stránce contoso-slurm-lab-cluster vyberte odkaz Spustit a po zobrazení výzvy k potvrzení vyberte OK.

  5. Monitorujte proces spuštění.

    Poznámka

    Tento proces zahrnuje zřízení virtuálního počítače Azure obsluhujícího roli hlavního uzlu clusteru a instalaci a konfiguraci plánovače Slurm. Může to trvat asi pět minut.

    snímek obrazovky zobrazující stránku se záložkou Uzly cloustru contoso-slurm-lab-cluster ve spuštěném stavu ve webové aplikaci Azure CycleCloud

Úloha 4: Vyčištění testovacího prostředí

Dokončili jste testování procesu nasazení clusteru pomocí aplikace Azure CycleCloud. Abyste se vyhnuli zbytečným nákladům spojeným s používáním prostředků Azure, ukončete cluster a odeberte všechny prostředky, které jste zřídili v průběhu cvičení tohoto kurzu.

  1. Na vašem počítači, ve webovém prohlížeči, který zobrazuje grafické rozhraní webové aplikace Azure CycleCloud, na stránce contoso-slurm-lab-cluster vyberte odkaz Ukončit a po zobrazení výzvy k potvrzení vyberte OK.

  2. Monitorujte proces ukončení.

    Poznámka

    Tento proces zahrnuje odstranění virtuálního počítače Azure, který obsluhuje roli hlavního uzlu clusteru. Může to trvat asi pět minut.

    Poznámka

    Měli byste odstranit prostředky, které jste nasadili v rámci tohoto cvičení, jak je popsáno v tomto úkolu. Pokud prostředky neodstraníte, můžou se vám účtovat další poplatky za vaše předplatné.

    Poznámka

    Pokud chcete odstranit všechny ostatní prostředky, které jste v tomto cvičení zřídili, odstraňte skupinu prostředků cyclecloud-rg.

  3. Na počítači přepněte do okna prohlížeče se zobrazeným webem Azure Portal.

  4. Na webu Azure Portal přejděte do okna cyclecloud-rg. Vyberte položku Odstranit skupinu prostředků na panelu nástrojů a do textového pole ZADEJTE NÁZEV SKUPINY PROSTŘEDKŮ zadejte cyclecloud-rg, a poté vyberte Odstranit.

  5. Opakováním předchozího kroku odstraňte skupinu prostředků s názvem začínajícím contoso-slurm-lab-cluster-, která obsahuje prostředek disku používaný clusterem.

Blahopřejeme! Úspěšně jste dokončili druhé cvičení tohoto modulu. Zajistili jste dostupnost výpočetních a síťových prostředků, které jsou potřeba pro nasazení nového clusteru. Pak jste cluster nasadili pomocí Azure CycleCloudu, nakonfigurovali upozornění na rozpočet a spustili ho tak, aby ověřili jeho funkčnost. Nakonec jste cluster ukončili a odstranili všechny prostředky, které jste v tomto modulu zřídili, abyste se vyhnuli zbytečným nákladům.