Övning – Skapa ett HPC-kluster från inbyggda mallar

25 minuter

Du kan skapa nya kluster direkt från det grafiska gränssnittet i Azure CycleCloud-webbappen. CycleCloud erbjuder många fördefinierade, schemaläggarspecifika mallar, vilket förenklar klusteretablering för motsvarande schemaläggare.

Nu när du har etablerat en virtuell Azure-dator som är värd för CycleCloud-webbprogrammen är du redo att utvärdera dess användning för distribution av ett Slurm-baserat HPC-kluster till Azure. Du måste först se till att azure-prenumerationen uppfyller klustrets resurskrav. Du vill också överväga om din ledningsgrupp vill behålla klustrets kostnad inom projektets budget. Därför planerar du att konfigurera CycleCloud-budgetaviseringar och avetablera labbmiljön när du har slutfört utvärderingen.

I den här övningen går du igenom distributionen av ett Slurm-baserat HPC-kluster till Azure med hjälp av Azure CycleCloud. Övningen består av följande uppgifter:

Uppgift 1: Förbereda distributionen av ett HPC-kluster
Uppgift 2: Skapa ett HPC-kluster med hjälp av Azure CycleCloud
Uppgift 3: Konfigurera och starta ett HPC-kluster med hjälp av Azure CycleCloud
Uppgift 4: Rensa labbmiljön

Uppgift 1: Förbereda distributionen av ett HPC-kluster

Innan du distribuerar ett HPC-kluster bör du först se till att du har tillräckligt med nätverks- och beräkningsresurser för att hantera dess användning.

Notera

För att slutföra den här övningen behöver du inte uppfylla kvotkraven för etablering av beräkningsnoderna eftersom du inte kör några jobb i klustret som du skapar. Men om så är fallet kanske du ser ett matchningsfel mellan skärmbilderna i den här övningen och ditt CycleCloud-webbgränssnitt, eftersom CycleCloud inte skapar platshållarberäkningsnoder i förväg om du inte har tillräckligt många tillgängliga kärnor.

På datorn växlar du till webbläsarfönstret som visar Azure-portalen.
I Azure-portalen använder du sökrutan överst i portalgränssnittet för att söka efter cyclecloud-rg resursgrupp.
På sidan cyclecloud-rg i Azure-portalen, i listan över resurser, väljer du posten cyclecloud-rg-vnet, som representerar det virtuella nätverk som du etablerade i föregående övning i den här modulen.
På sidan cyclecloud-rg-vnet går du till den lodräta menyn till vänster och väljer undernät.
På cyclecloud-rg-vnet | Undernät fönster väljer du + undernät.
I fönstret Lägg till undernät i textrutan Namn anger du contoso-slurm-lab-cluster-subnet, godkänner standardintervallet för undernätet och väljer Spara.

Not

Vi rekommenderar att du separerar undernätet som är värd för den virtuella Datorn CycleCloud Azure från undernäten som är värdar för klusterberäkningsresurser. För större kluster bör du allokera TILLRÄCKLIGT stora IP-adressintervall.
I Azure-portalen använder du sökrutan för att söka efter Prenumerationer.
På sidan Prenumerationer väljer du den Azure-prenumeration som du använder för övningar i den här modulen.
På sidan som visar Azure-prenumerationen går du till den lodräta menyn till vänster och i avsnittet Inställningar väljer du Användning + kvoter.

I fönstret Användning + kvoter konfigurerar du följande filtreringsinställningar (lämna andra med sina standardvärden):

Inställning	Värde
Välj en tjänst	Välj vCPU:er i Standard Dv3 Family, vCPU:er i Standard FSv2 Familyoch totalt antal regionala vCPU:er.
Välj en leverantör	Välj posten Microsoft.Compute.
Välj en plats	Välj namnet på den Azure-region där du tänker distribuera klustret i den här övningen.

Granska utdata och identifiera antalet tillgängliga vCPU:er i varje grupp.

Uppgift 2: Skapa ett HPC-kluster med hjälp av Azure CycleCloud

Nu har du CycleCloud-webbprogrammet installerat på en virtuell Azure-dator, tillräckligt med vCPU-kärnor i din Azure-prenumeration och ett särskilt nätverksundernät som kan hantera automatisk skalning av klusternoder. Du är redo att få igång distributionen av ett Slurm-baserat kluster.

På datorn, i webbläsarfönstret som visar sidan Prenumerationer i Azure CycleCloud-webbprogrammet, i det övre vänstra hörnet, väljer du länken Tillbaka till kluster.
På sidan Skapa ett nytt kluster granskar du de tillgängliga alternativen och i avsnittet Schedulers väljer du Slurm.
På fliken Om på sidan Nytt Slurm-kluster anger du contoso-slurm-lab-clusteri textrutan Klusternamn .

På fliken Nödvändiga inställningar på sidan Nytt Slurm-kluster i textrutan Klusternamn konfigurerar du följande inställningar (låt andra ha sina standardvärden):

Inställning	Värde
Region	Välj namnet på den Azure-region där du tänker distribuera klustret i den här övningen.
Vm-typ för Scheduler	Välj Väljoch i popup-fönstret Välj en datortyp anger du "D2ds_v5" i textrutan SKU Search. I listan med resultat markerar du kryssrutan bredvid posten D2ds_v5 och väljer sedan Använd.

Skärmbild som visar popup-fönstret Välj en datortyp på sidan Nytt Slurm-kluster i Azure CycleCloud-webbprogrammet.

Inställning	Värde
Maximalt antal HPC-kärnor	Ange 100
Maximalt antal HTC-kärnor	Ange 100
Maximalt antal virtuella datorer per skalningsuppsättning	Ange 40
Undernäts-ID	Välj cyclecloud-rg: cyclecloud-rg-vnet-contoso-slurm-lab-cluster-subnet

Skärmbild som visar fliken Obligatoriska inställningar på sidan Nytt Slurm-kluster i Azure CycleCloud-webbprogrammet.

Not

Inställningen Maximalt antal virtuella datorer per skalningsuppsättning begränsar den maximala storleken på ett meddelandeöverföringsgränssnittsjobb som kan köras i klustret, eftersom skalningsuppsättningen för närvarande är infiniBand-infrastrukturgränsen.

På fliken Nätverksansluten lagring på sidan Nytt Slurm-kluster kontrollerar du att NFS-typ är inställd på Builtin. Acceptera standardvärdet för Storlek (GB) inställt på 100och välj Nästa.
På fliken Avancerade inställningar på sidan Nytt Slurm-kluster granskar du de tillgängliga alternativen utan att göra några ändringar och väljer sedan Nästa.
På fliken Cloud-init på sidan Nytt Slurm-kluster granskar du de tillgängliga alternativen utan att göra några ändringar och väljer sedan Spara.

Uppgift 3: Konfigurera och starta ett HPC-kluster med hjälp av Azure CycleCloud

Förbered för operationalisering av klustret genom att ställa in aviseringar som meddelar dig när klusteranvändningskostnaderna når den budget som allokerats mot kostnaden för Azure-resurser. Du kan också verifiera distributionen genom att starta klustret med det grafiska gränssnittet för CycleCloud-webbprogrammet.

På datorn går du till webbläsaren och visar det grafiska gränssnittet för Azure CycleCloud-webbprogrammet och granskar egenskaperna för det nyligen distribuerade klustret.
På sidan contoso-slurm-lab-cluster väljer du länken Skapa ny avisering.
I popup-fönstret Cluster usage alert for contoso-slurm-lab-cluster anger du följande inställningar och väljer sedan Spara:

Inställning Värde

Budget 100,00 USD

Per månad

Skicka meddelande aktiverat

Mottagare cc-admin@contoso.com
På sidan contoso-slurm-lab-cluster väljer du länken Start och när du uppmanas att bekräfta väljer du OK.
Övervaka startprocessen.

Notera

Processen omfattar etablering av den virtuella Azure-datorn som hanterar rollen för klustrets huvudnod samt installation och konfiguration av Slurm-schemaläggaren. Det kan ta ungefär fem minuter.

Inställning	Värde
Budget	100,00 USD
Per	månad
Skicka meddelande	aktiverat
Mottagare	cc-admin@contoso.com

Uppgift 4: Rensa labbmiljön

Du har slutfört testningen av klusterdistributionsprocessen med hjälp av Azure CycleCloud-programmet. För att undvika onödiga kostnader i samband med användning av Azure-resurser avslutar du klustret och tar bort alla resurser som du har etablerat under övningarna i den här kursen.

På din dator, i webbläsaren som visar det grafiska gränssnittet för Azure CycleCloud-webbapplikationen, går du till sidan contoso-slurm-lab-cluster. Välj länken Avsluta och när du uppmanas att bekräfta, välj OK.
Övervaka avslutningsprocessen.

Not

Processen omfattar avetablering av den virtuella Azure-datorn som hanterar rollen för klustrets huvudnod. Det kan ta ungefär fem minuter.

Not

Du bör ta bort de resurser som du distribuerade som en del av den här övningen, enligt beskrivningen i den här uppgiften. Om du inte tar bort resurserna kan du debiteras ytterligare avgifter för din prenumeration.

Not

Om du vill ta bort alla andra resurser som du har etablerat i den här labbuppgiften tar du bort cyclecloud-rg resursgrupp.
På datorn växlar du till webbläsarfönstret som visar Azure-portalen.
I Azure-portalen går du till bladet cyclecloud-rg. Välj posten Ta bort resursgrupp i verktygsfältet. I textrutan SKRIV RESURSGRUPPENS NAMN anger du cyclecloud-rgoch väljer sedan Ta bort.
Upprepa föregående steg för att ta bort resursgruppen med namnet som börjar med contoso-slurm-lab-cluster– som innehåller diskresursen som används av klustret.

Grattis! Du har slutfört den andra övningen i den här modulen. Du har säkerställt tillgängligheten för beräknings- och nätverksresurser som krävs för distribution av ett nytt kluster. Sedan distribuerade du klustret med hjälp av Azure CycleCloud, konfigurerade dess budgetaviseringar och startade det för att verifiera dess funktioner. Slutligen avslutade du klustret och tog bort alla resurser som du etablerade i den här modulen för att undvika onödiga kostnader.

Övning – Skapa ett HPC-kluster från inbyggda mallar

Uppgift 1: Förbereda distributionen av ett HPC-kluster

Uppgift 2: Skapa ett HPC-kluster med hjälp av Azure CycleCloud

Uppgift 3: Konfigurera och starta ett HPC-kluster med hjälp av Azure CycleCloud

Uppgift 4: Rensa labbmiljön

Feedback