Övning – Skapa ett HPC-kluster från inbyggda mallar
Du kan skapa nya kluster direkt från det grafiska gränssnittet i Azure CycleCloud-webbappen. CycleCloud erbjuder många fördefinierade, schemaläggarspecifika mallar, vilket förenklar klusteretablering för motsvarande schemaläggare.
Nu när du har etablerat en virtuell Azure-dator som är värd för CycleCloud-webbprogrammen är du redo att utvärdera dess användning för distribution av ett Slurm-baserat HPC-kluster till Azure. Du måste först se till att azure-prenumerationen uppfyller klustrets resurskrav. Du vill också överväga om din ledningsgrupp vill behålla klustrets kostnad inom projektets budget. Därför planerar du att konfigurera CycleCloud-budgetaviseringar och avetablera labbmiljön när du har slutfört utvärderingen.
I den här övningen går du igenom distributionen av ett Slurm-baserat HPC-kluster till Azure med hjälp av Azure CycleCloud. Övningen består av följande uppgifter:
- Uppgift 1: Förbereda distributionen av ett HPC-kluster
- Uppgift 2: Skapa ett HPC-kluster med hjälp av Azure CycleCloud
- Uppgift 3: Konfigurera och starta ett HPC-kluster med hjälp av Azure CycleCloud
- Uppgift 4: Rensa labbmiljön
Uppgift 1: Förbereda distributionen av ett HPC-kluster
Innan du distribuerar ett HPC-kluster bör du först se till att du har tillräckligt med nätverks- och beräkningsresurser för att hantera dess användning.
Kommentar
För att slutföra den här övningen behöver du inte uppfylla kvotkraven för etablering av beräkningsnoderna eftersom du inte kör några jobb i klustret som du skapar. Men om så är fallet kanske du ser ett matchningsfel mellan skärmbilderna i den här övningen och ditt CycleCloud-webbgränssnitt, eftersom CycleCloud inte skapar platshållarberäkningsnoder i förväg om du inte har tillräckligt många tillgängliga kärnor.
På datorn växlar du till webbläsarfönstret som visar Azure-portalen.
I Azure-portalen använder du sökrutan överst i portalgränssnittet för att söka efter resursgruppen cyclecloud-rg .
I Azure-portalen går du till sidan cyclecloud-rg och i listan över resurser väljer du posten cyclecloud-rg-vnet som representerar det virtuella nätverk som du etablerade i föregående övning i den här modulen.
På sidan cyclecloud-rg-vnet går du till den lodräta menyn till vänster och väljer Undernät.
På cyclecloud-rg-vnet | I fönstret Undernät väljer du + Undernät.
I fönstret Lägg till undernät i textrutan Namn anger du contoso-slurm-lab-cluster-subnet, accepterar standardintervallet för undernätet och väljer Spara.
Kommentar
Vi rekommenderar att du separerar undernätet som är värd för den virtuella Datorn CycleCloud Azure från undernäten som är värdar för klusterberäkningsresurser. För större kluster bör du allokera TILLRÄCKLIGT stora IP-adressintervall.
I Azure-portalen använder du sökrutan för att söka efter prenumerationer.
På sidan Prenumerationer väljer du den Azure-prenumeration som du använder för övningar i den här modulen.
På sidan som visar Azure-prenumerationen går du till den lodräta menyn till vänster och i avsnittet Inställningar väljer du Användning + kvoter.
I fönstret Användning + kvoter konfigurerar du följande filtreringsinställningar (lämna andra med sina standardvärden):
Inställning Värde Välj en tjänst Välj Standard Dv3 Family vCPU:er, Standard FSv2 Family vCPU:er och Totalt antal regionala vCPU:er . Välj en leverantör Välj posten Microsoft.Compute. Välj en plats Välj namnet på den Azure-region där du tänker distribuera klustret i den här övningen. Granska utdata och identifiera antalet tillgängliga vCPU:er i varje grupp.
Uppgift 2: Skapa ett HPC-kluster med hjälp av Azure CycleCloud
Nu har du CycleCloud-webbprogrammet installerat på en virtuell Azure-dator, tillräckligt med vCPU-kärnor i din Azure-prenumeration och ett särskilt nätverksundernät som kan hantera automatisk skalning av klusternoder. Du är redo att fortsätta med distributionen av ett Slurm-baserat kluster.
Välj länken Tillbaka till kluster i det övre vänstra hörnet i webbläsarfönstret som visar sidan Prenumerationer i Azure CycleCloud-webbprogrammet.
På sidan Skapa ett nytt kluster granskar du de tillgängliga alternativen och i avsnittet Schemaläggare väljer du Slurm.
På fliken Om på sidan Nytt Slurm-kluster går du till textrutan Klusternamn och anger contoso-slurm-lab-cluster.
På fliken Obligatoriskt Inställningar på sidan Nytt Slurm-kluster i textrutan Klusternamn konfigurerar du följande inställningar (låt andra ha sina standardvärden):
Inställning Värde Region Välj namnet på den Azure-region där du tänker distribuera klustret i den här övningen. Vm-typ för Scheduler Välj Välj och i popup-fönstret Välj en datortyp går du till textrutan SKU Search och anger "D2ds_v5". I listan med resultat markerar du kryssrutan bredvid posten D2ds_v5 och väljer sedan Använd. Inställning Värde Maximalt antal HPC-kärnor Ange 100 Maximalt antal HTC-kärnor Ange 100 Maximalt antal virtuella datorer per skalningsuppsättning Ange 40 Undernäts-ID Välj cyclecloud-rg: cyclecloud-rg-vnet-contoso-slurm-lab-cluster-subnet Kommentar
Inställningen Maximalt antal virtuella datorer per skalningsuppsättning begränsar den maximala storleken på ett meddelandeöverföringsgränssnittsjobb som kan köras i klustret, eftersom skalningsuppsättningen för närvarande är infiniBand-infrastrukturgränsen.
På fliken Nätverksansluten lagring på sidan Nytt Slurm-kluster kontrollerar du att NFS-typen är inställd på Inbyggd. Acceptera standardvärdet för Storlek (GB) inställt på 100 och välj Nästa.
På fliken Avancerat Inställningar på sidan Nytt Slurm-kluster granskar du de tillgängliga alternativen utan att göra några ändringar och väljer sedan Nästa.
På fliken Cloud-init på sidan Nytt Slurm-kluster granskar du de tillgängliga alternativen utan att göra några ändringar och väljer sedan Spara.
Uppgift 3: Konfigurera och starta ett HPC-kluster med hjälp av Azure CycleCloud
Förbered för operationalisering av klustret genom att ställa in aviseringar som meddelar dig när klusteranvändningskostnaderna når den budget som allokerats mot kostnaden för Azure-resurser. Du kan också verifiera distributionen genom att starta klustret med det grafiska gränssnittet för CycleCloud-webbprogrammet.
På datorn går du till webbläsaren och visar det grafiska gränssnittet för Azure CycleCloud-webbprogrammet och granskar egenskaperna för det nyligen distribuerade klustret.
På sidan contoso-slurm-lab-cluster väljer du länken Skapa ny avisering.
I popup-fönstret Klusteranvändningsavisering för contoso-slurm-lab-cluster anger du följande inställningar och väljer sedan Spara:
Inställning Värde Budget 100,00 USD Per Month Skicka meddelande Aktiverad Mottagare cc-admin@contoso.com På sidan contoso-slurm-lab-cluster väljer du startlänken och väljer OK när du uppmanas att bekräfta.
Övervaka startprocessen.
Kommentar
Processen omfattar etablering av den virtuella Azure-datorn som hanterar rollen för klustrets huvudnod samt installation och konfiguration av Slurm-schemaläggaren. Det kan ta ungefär fem minuter.
Uppgift 4: Rensa labbmiljön
Du har slutfört testningen av klusterdistributionsprocessen med hjälp av Azure CycleCloud-programmet. För att undvika onödiga kostnader i samband med användning av Azure-resurser avslutar du klustret och tar bort alla resurser som du har etablerat under övningarna i den här kursen.
På datorn går du till webbläsaren och visar det grafiska gränssnittet för Azure CycleCloud-webbprogrammet, på sidan contoso-slurm-lab-cluster väljer du länken Avsluta och väljer OK när du uppmanas att bekräfta.
Övervaka avslutningsprocessen.
Kommentar
Processen omfattar avetablering av den virtuella Azure-datorn som hanterar rollen för klustrets huvudnod. Det kan ta ungefär fem minuter.
Kommentar
Du bör ta bort de resurser som du distribuerade som en del av den här övningen, enligt beskrivningen i den här uppgiften. Om du inte tar bort resurserna kan du debiteras ytterligare avgifter för din prenumeration.
Kommentar
Om du vill ta bort alla andra resurser som du har etablerat i den här labbuppgiften tar du bort resursgruppen cyclecloud-rg .
På datorn växlar du till webbläsarfönstret som visar Azure-portalen.
Gå till bladet cyclecloud-rg i Azure-portalen. Välj posten Ta bort resursgrupp i verktygsfältet. I textrutan SKRIV RESURSGRUPPENS NAMN anger du cyclecloud-rg och väljer sedan Ta bort.
Upprepa föregående steg för att ta bort resursgruppen med namnet som börjar med contoso-slurm-lab-cluster – som innehåller diskresursen som används av klustret.
Grattis! Du har slutfört den andra övningen i den här modulen. Du har säkerställt tillgängligheten för beräknings- och nätverksresurser som krävs för distribution av ett nytt kluster. Sedan distribuerade du klustret med hjälp av Azure CycleCloud, konfigurerade dess budgetaviseringar och startade det för att verifiera dess funktioner. Slutligen avslutade du klustret och tog bort alla resurser som du etablerade i den här modulen för att undvika onödiga kostnader.