Dela via


Tillverkning av HPC-lagring

Lagringsåtkomst är en viktig del av planeringen för HPC-arbetsbelastningsprestanda. Följande material hjälper dig att effektivisera din beslutsprocess och minimera eventuella missförstånd kring en viss lagringslösnings funktioner (eller brist på funktioner).

Utformningsbeaktanden

Det är viktigt att se till att nödvändiga data kommer till HPC-klusterdatorerna vid rätt tidpunkt. Du vill också se till att resultaten från de enskilda datorerna snabbt sparas och blir tillgängliga för ytterligare analys.

Distribution av arbetsbelastningstrafik

Ta hänsyn till de typer av trafik som din HPC-miljö genererar och bearbetar. Det här steget är särskilt viktigt om du planerar att köra flera typer av arbetsbelastningar och planerar att använda lagringen för andra ändamål. Överväg och registrera följande trafiktyper:

  • Enkel ström jämfört med flera strömmar
  • Förhållandet mellan lästrafik och skrivtrafik
  • Genomsnittliga filstorlekar och antal
  • Slumpmässiga eller sekventiella åtkomstmönster

Datalokalitet

Nästa kategori står för platsen för data. Lokalitetsmedvetenhet hjälper dig att avgöra om du kan använda kopiering, cachelagring eller synkronisering som din strategi för dataflytt. Följande är lokala objekt att kontrollera i förväg:

  • Källdata lokalt, i Azure eller både och?
  • Resulterar data lokalt, i Azure eller både och?
  • HPC-arbetsbelastningar i Azure som ska samordnas med tidslinjer för ändring av källdata?
  • Känsliga/HIPAA-data?

Prestandakrav

Prestandakrav för lagringslösningar sammanfattas vanligtvis på följande sätt:

  • Dataflöde med en dataström (i Gb/ps)
  • Dataflöde för flera dataströmmar (i Gb/ps)
  • Förväntat maximalt IOPS
  • Genomsnittlig svarstid (ms)

Varje övervägande påverkar prestanda, så dessa siffror representerar en guide som en viss lösning bör uppnå. Du kan till exempel ha en HPC-arbetsbelastning som utför omfattande skapande och borttagning av filer som en del av arbetsflödet. Dessa åtgärder kan påverka det totala dataflödet.

Åtkomstmetoder

Ta hänsyn till det protokoll för klientåtkomst som krävs och var tydlig med vilka funktioner i protokollet du behöver. Det finns olika versioner av NFS och SMB.

Här är några saker att tänka på:

  • NFS/SMB-versioner krävs
  • Förväntade protokollfunktioner (ACL:er, kryptering)
  • Parallell filsystemlösning

Totalt kapacitetskrav

Lagringskapacitet i Azure är nästa övervägande. Det hjälper till att informera den totala kostnaden för lösningen. Om du planerar att lagra en stor mängd data under en lång tid kanske du vill överväga nivåindelning som en del av lagringslösningen. Nivåindelning ger lagringsalternativ med lägre kostnad i kombination med lagring med högre kostnad men högre prestanda på en frekvent nivå. Utvärdera därför kapacitetskraven enligt följande:

  • Total kapacitet krävs
  • Total kapacitet på frekvent nivå som krävs
  • Total kapacitet på varm nivå som krävs
  • Total kapacitet på kall nivå som krävs

Autentiserings- och auktoriseringsmetod

När det gäller autentiserings- och auktoriseringskrav, som att använda en LDAP-server eller Active Directory-miljö, ser du till att du inkluderar lämpliga stödsystem för arkitekturen. Om du behöver stöd för funktioner som UID/GID-mappning till Active Directory-användare kontrollerar du att lagringslösningen stöder den funktionen.

Här är några saker att tänka på:

  • Lokalt (endast UID/GID på filservern)
  • Katalog (LDAP, Active Directory)
  • UID/GID-mappning till Active Directory-användare?

Jämförelse av vanliga Azure-lagringslösningar

Kategori Azure Blob Storage Azure Files Azure Managed Lustre Azure NetApp Files
Användningsfall Azure Blob Storage passar bäst för storskaliga, läsintensiva sekventiella åtkomstarbetsbelastningar där data matas in en gång med få eller inga ytterligare ändringar.

Blob Storage erbjuder den lägsta totala ägandekostnaden om det finns lite eller inget underhåll.

Några exempelscenarier är: Storskaliga analysdata, dataflödeskänslig databehandling med höga prestanda, säkerhetskopiering och arkiv, autonom körning, medierendering eller genomisk sekvensering.
Azure Files är en tjänst med hög tillgänglighet som passar bäst för arbetsbelastningar med slumpmässig åtkomst.

För NFS-resurser tillhandahåller Azure Files fullständigt stöd för POSIX-filsystem. Du kan enkelt använda den från containerplattformar som Azure Container Instance (ACI) och Azure Kubernetes Service (AKS) med den inbyggda CSI-drivrutinen och VM-baserade plattformar.

Några exempelscenarier är: Delade filer, databaser, hemkataloger, traditionella program, ERP, CMS, NAS-migreringar som inte kräver avancerad hantering och anpassade program som kräver skalbar fillagring.
Azure Managed Lustre är ett fullständigt hanterat parallellt filsystem som passar bäst för medelstora till stora HPC-arbetsbelastningar.

Aktiverar HPC-program i molnet utan att bryta programkompatibiliteten genom att tillhandahålla välbekanta funktioner, beteenden och prestanda för Lustre-parallella filsystem, vilket skyddar långsiktiga programinvesteringar.
Fullständigt hanterad filtjänst i molnet, som drivs av NetApp, med avancerade hanteringsfunktioner.

NetApp Files passar för arbetsbelastningar som kräver slumpmässig åtkomst och ger bred protokollstöd och dataskyddsfunktioner.

Några exempelscenarier är: Lokal NAS-migrering för företag som kräver omfattande hanteringsfunktioner, svarstidskänsliga arbetsbelastningar som SAP HANA, svarstidskänslig eller IOPS-intensiv beräkning med höga prestanda eller arbetsbelastningar som kräver samtidig åtkomst med flera protokoll.
Tillgängliga protokoll NFS 3.0

RESTEN

Data Lake Storage Gen2
SMB

NFS 4.1

(Ingen samverkan mellan något av protokollen)
Lustre NFS 3.0 och 4.1

SMB
Nyckelfunktioner Integrerad med HPC-cache för arbetsbelastningar med låg svarstid.

Integrerad hantering, inklusive livscykel, oföränderliga blobar, dataredundans och metadataindex.
Zonredundant för hög tillgänglighet.

Konsekvent svarstid på ensiffrigt millisekunder.

Förutsägbar prestanda och kostnad som skalas med kapacitet.
Hög lagringskapacitet på upp till 2,5PB.

Kort svarstid (~2 ms).

Starta nya kluster på några minuter.

Stöder containerbaserade arbetsbelastningar med AKS.
Extremt låg svarstid (så låg som under ms).

Rich NetApp ONTAP-hanteringskapacitet, till exempel SnapMirror i molnet.

Konsekvent hybridmolnupplevelse.
Prestanda (per volym) Upp till 20 000 IOPS, upp till 100 GiB/s-dataflöde. Upp till 100 000 IOPS, upp till 80 GiB/s-dataflöde. Upp till 100 000 IOPS, upp till 500 GiB/s-dataflöde. Upp till 460 000 IOPS, upp till 36 GiB/s-dataflöde.
Prissättning Prissättning för Azure Blob Storage Priser för Azure Files Prissättning för Azure Managed Lustre Prissättning för Azure NetApp Files

Rulla ditt eget parallella filsystem

Precis som med NFS kan du skapa ett BeeGFS- eller Lustre-filsystem med flera noder. Prestanda för sådana system beror till stor del på vilken typ av virtuella datorer du väljer. Du kan använda avbildningar som finns på Azure Marketplace för BeeGFS eller en Lustre-implementering av DDN med namnet Whamcloud. Med avbildningar från tredje part från leverantörer som BeeGFS eller DDN kan du köpa deras support. Annars kan du använda både BeeGFS och Lustre via deras GPL-licenser utan andra avgifter (utöver datorer och diskar). De här verktygen är enkla att distribuera med Hjälp av Azure HPC-skript med antingen tillfälliga lokala diskar (för scratch) eller Premium/Ultra SSD för beständig lagring.

Cray ClusterStor

En av de största utmaningarna med större arbetsbelastningar är att replikera den rena "bare-metal"-prestandan för stora beräkningskluster som fungerar tillsammans med stora Lustre-miljöer (när det gäller TB/s-dataflöde och eventuellt Petabyte lagring). Nu kan du köra dessa arbetsbelastningar med Azure Cray ClusterStor-lösningen. Den här metoden är en ren lustre-distribution utan operativsystem som placeras i relevant Azure-datacenter. Parallella filsystem som BeeGFS och Lustre ger högsta prestanda på grund av deras arkitektur. Men den arkitekturen har ett högt hanteringspris och det gör även användningen av dessa tekniker.

Nästa steg

Följande artiklar innehåller vägledning om varje steg i molnimplementeringsresan för tillverkning av HPC-miljöer.