Bewerken

Delen via


SAS Grid 9.4 implementeren in Azure NetApp Files

Azure NetApp Files
Azure Virtual Machines

SAS-analysesoftware biedt een reeks services en hulpprogramma's voor het tekenen van inzichten uit gegevens en het nemen van intelligente beslissingen. SAS-oplossingen bieden analyses, kunstmatige intelligentie, business intelligence, klantinformatie, gegevensbeheer en fraude en beveiligingsinformatie.

Als u SAS Grid in Azure implementeert, is Azure NetApp Files een bruikbare primaire opslagoptie. Wanneer u de schaalbare services van Azure NetApp Files gebruikt, kunt u de opslagtoewijzingen op elk gewenst moment omhoog of omlaag schalen zonder onderbreking van de services. U kunt ook het opslagserviceniveau dynamisch aanpassen aan de prestatievereisten.

SAS biedt deze primaire platforms, die Door Microsoft zijn gevalideerd:

  • SAS Grid 9.4
  • SAS Viya

SAS Grid 9.4 is gevalideerd in Linux.

Dit artikel bevat algemene informatie over het uitvoeren van SAS Grid 9.4 in Azure, met behulp van Azure NetApp Files voor SASDATA-opslag. Het biedt ook richtlijnen voor opslagopties voor SASWORK. Deze richtlijnen zijn gebaseerd op de veronderstelling dat u uw eigen SAS-oplossing in Azure host, in uw eigen tenant. SAS biedt geen hosting voor SAS Grid in Azure.

Architectuur

Diagram met een architectuur voor het uitvoeren van SAS Grid in Azure.

Download een PowerPoint-bestand van alle diagrammen in dit artikel.

Gegevensstroom

De rekenlaag maakt gebruik van SASDATA-volumes (en optioneel SASWORK)-volumes om gegevens over het raster te delen. SASDATA is een volume dat is verbonden met NFS in Azure NetApp Files.

  • Een rekenknooppunt leest invoergegevens van SASDATA en schrijft resultaten terug naar SASDATA.
  • Een volgend deel van de analysetaak kan worden uitgevoerd door een ander knooppunt in de rekenlaag. Deze gebruikt dezelfde procedure om de informatie te verkrijgen en op te slaan die nodig is om te verwerken.

Potentiële gebruikscases

Een schaalbare SAS Grid-implementatie die gebruikmaakt van Azure NetApp Files is van toepassing op deze use cases:

  • Financiële analyse
  • Fraudedetectie
  • Tracering en bescherming van bedreigde soorten
  • Wetenschap en geneeskunde
  • Analyse en AI

Vereisten voor opslagprestaties

Voor SAS 9.4-implementaties (SAS Grid of SAS Analytics Pro) in Azure is Azure NetApp Files een bruikbare primaire opslagoptie voor SAS Grid-clusters van beperkte grootte. SAS raadt 100 MiB/s-doorvoer per fysieke kern aan. Gezien deze aanbeveling zijn SAS Grid-clusters die gebruikmaken van een Azure NetApp Files-volume voor SASDATA (permanente SAS-gegevensbestanden) schaalbaar tot 32 tot 48 fysieke kernen op twee of meer virtuele Azure-machines. SAS-clustergrootten zijn gebaseerd op de architectuurbeperking van één SASDATA-naamruimte per SAS-cluster en de beschikbare bandbreedte voor één Azure NetApp Files-volume. De richtlijnen voor het aantal kernen worden opnieuw bekeken naarmate de Azure-infrastructuur (reken-, netwerk- en opslagbandbreedte per bestandssysteem) in de loop van de tijd toeneemt.

Azure NetApp Files-volumetypen

Azure NetApp Files biedt twee verschillende typen volumes voor NAS-workloads (network-attached storage).

Reguliere volumes bieden:

  • Maximaal 4500 MiB/s aan leesbewerkingen.
  • Maximaal 1500 MiB/s schrijfbewerkingen.
  • 460.000 invoer-/uitvoerbewerkingen per seconde (IOPS).
  • Maximaal 100 TiB aan totale capaciteit.
  • Een minimumgrootte van 100 GiB.

Grote volumes, die in mei 2024 algemeen beschikbaar zijn, bieden:

  • Maximaal 10.000 GiB/s aan doorvoer.
  • Maximaal 800.000 IOPS.
  • 1000 TiB van totale capaciteit.
  • Een minimumcapaciteit van 50 TiB.

Zie Vereisten en overwegingen voor grote volumes voor meer informatie.

Normale volumeprestaties van Azure NetApp Files

Eén normaal Volume van Azure NetApp Files kan maximaal 4.500 MiB/s aan leesbewerkingen en 1500 MiB/s aan schrijfbewerkingen verwerken. Gezien een Azure-exemplaartype met voldoende bandbreedte voor uitgaand verkeer, kan één virtuele machine (VM) alle schrijfbandbreedte van één normaal Azure NetApp Files-volume verbruiken. Alleen de grootste vm die beschikbaar is in Azure, kan echter alle leesbandbreedte van één volume verbruiken. Als u meer bandbreedte nodig hebt voor de workload, kunt u overwegen om een groot volume van Azure NetApp Files te gebruiken.

SASDATA, de belangrijkste gedeelde workload van SAS 9.4, heeft een lees-/schrijfverhouding van 80:20. De belangrijke cijfers per volume voor een workload van 80:20 met 64 KiB voor lezen/schrijven zijn:

  • 2400 MiB/s van leesdoorvoer en 600 MiB/s van schrijfdoorvoer die gelijktijdig worden uitgevoerd. De gecombineerde doorvoer is ongeveer 3000 MiB/s.

Zie Prestatiebenchmarks voor Azure NetApp Files voor Linux voor meer informatie.

Grote volumeprestaties voor SAS Grid

Eén groot volume van Azure NetApp Files kan maximaal 10 GiB/s aan totale doorvoer verwerken, wat betekent dat het prestatiepotentieel voor SAS Grid veel groter kan zijn wanneer u grotere schalen gebruikt.

In de volgende tabel ziet u prestatieresultaten voor workloads die GEBRUIKMAKEN van SAS Grid op een groot volume van Azure NetApp Files met verschillende voorbeeld-VM-grootten. De lijst met voorbeelden bevat exemplaren, threads per exemplaar en nconnect waarden die gebruikmaken van Red Hat Enterprise Linux (RHEL) 8.4.

VM-exemplaar Aantal exemplaren Threads per exemplaar nconnect waarde MiB/s per thread lezen MiB/s per thread schrijven Totaal aantal leesbewerkingen van MiB/s Totaal aantal schrijfbewerkingen voor MiB/s
E32s_v5 1 16 8 465 113 7,440 1,808
E32s_v5 2 16 8 411 113 13,152 3,616
E32s_v5 3 16 8 223 113 10,704 5,424
E32s_v5 6 16 8 117 107 11,232 10,272
E104id_v5 1 52 8 161 47 8,372 2,444
E104id_v5 1 52 16 192 50 9,984 2,600

Notitie

Als u meer prestaties nodig hebt voor uw SASDATA- of SASWORK-volumes, gebruikt u Grote volumes van Azure NetApp Files. Zie Vereisten en overwegingen voor grote volumes voor meer informatie.

Aanbevelingen voor capaciteit

De Azure NetApp Files-prestatiecalculator kan richtlijnen bieden voor het aanpassen van de grootte van SASDATA-volumes.

Het is belangrijk om een geschikt serviceniveau te kiezen, omdat:

  • Volumebandbreedte is gebaseerd op volumecapaciteit.
  • Capaciteitskosten zijn gebaseerd op het serviceniveau.
  • Uw keuze voor serviceniveau is gebaseerd op capaciteit versus bandbreedtebehoeften.

Selecteer geavanceerd in de rekenmachine, selecteer een regio en voer de volgende waarden in.

  • Volumegrootte: Gewenste capaciteit
  • Doorvoer: Gewenste doorvoer, rekening houdend met 100 MiB/s per kern
  • Leespercentage: 80%
  • IOPS: 0
  • I/O grootte: 64KiB Sequentiële

De uitvoer onderaan het scherm biedt aanbevolen capaciteitsvereisten op elk serviceniveau en de kosten per maand, op basis van de prijs voor de geselecteerde regio:

  • Doorvoer. De bandbreedte van het volume, op basis van de workloadmix. Voor een 80% 64-KiB sequentiële leesworkload is 3096 MiB/s het verwachte maximum.
  • IOPS. Het aantal IOPS dat het volume levert bij de opgegeven doorvoer.
  • Volumegrootte. De hoeveelheid capaciteit die nodig is voor het volume op de opgegeven serviceniveaus om de vereiste doorvoer te bereiken. Volumecapaciteit (gerapporteerd in GiBs) kan gelijk zijn aan of kleiner zijn dan de grootte van de capaciteitspool. Deze aanbeveling is gebaseerd op de veronderstelling dat u automatische typen QoS-capaciteitspools gebruikt. Als u de capaciteit en doorvoerdistributie tussen volumes binnen een capaciteitspool verder wilt optimaliseren, kunt u handmatige typen QoS-capaciteitspools overwegen.
  • Grootte van capaciteitspool. De grootte van het zwembad. De capaciteit van een volume wordt uitgesneden uit een capaciteitspool. Capaciteitspools zijn in stappen van 1 TiB groot.
  • Kosten voor capaciteitspool (USD/maand). De kosten per maand van de capaciteitspool op de opgegeven grootte en het serviceniveau.
  • Volume Show Back (USD/maand). De kosten per maand van de capaciteit voor het volume bij de opgegeven capaciteit. De kosten zijn gebaseerd op de toegewezen capaciteitspoolgrootten. Het volume geeft de volumehoeveelheid weer.

Notitie

De gebruikerservaring is hetzelfde, ongeacht het serviceniveau, zolang er voldoende bandbreedte is ingericht.

Beheer de kosten indien nodig met behulp van volumevorming in Azure NetApp Files. Er zijn twee dynamische opties beschikbaar om de prestaties en kosten te beïnvloeden:

Meer informatie over het kostenmodel van Azure NetApp Files.

Gegevensbescherming

Azure NetApp Files maakt gebruik van momentopnamen om uw gegevens te beveiligen. Momentopnamen bieden ruimte-efficiënte, crashconsistente, bijna onmiddellijk gemaakte installatiekopieën van uw Azure NetApp Files-volumes. U kunt momentopnamen op elk gewenst moment handmatig maken of plannen met behulp van een momentopnamebeleid op het volume.

Gebruik een momentopnamebeleid om geautomatiseerde gegevensbeveiliging toe te voegen aan uw volumes. U kunt momentopnamen snel herstellen door momentopnamen terug te zetten. Of u kunt een momentopname herstellen naar een nieuw volume voor snel gegevensherstel. U kunt ook herstellen naar nieuwe volumefunctionaliteit gebruiken om test-/ontwikkelomgevingen met huidige gegevens te bieden.

Voor extra gegevensbeschermingsniveaus kunt u oplossingen voor gegevensbeveiliging gebruiken die gebruikmaken van Back-up- of partnerback-upsoftware van Azure NetApp Files.

Onderdelen

  • Virtuele Azure-machines: VOOR SAS Grid is een hoge geheugen-, opslag- en I/O-bandbreedte vereist, in een juiste verhouding met het aantal kernen. Azure biedt vooraf gedefinieerde VM-grootten (virtuele machines) met lagere vCPU-aantallen die kunnen helpen bij het verdelen van het aantal kernen dat nodig is met de hoeveelheid geheugen, opslag en I/O-bandbreedte.

    Zie Beperkte VM-grootten die geschikt zijn voor vCPU's voor meer informatie. Het is belangrijk om grondig te begrijpen welke rekenresources beschikbaar zijn voor elk exemplaar. Als u SAS Grid wilt uitvoeren in Azure met Azure NetApp Files, raden we deze exemplaartypen aan:

    • Standard_E64-16ds_v4 of Standard_E64-16ds_v5
    • Standard_E64-32ds_v4 of Standard_E64-32ds_v5

    Bekijk de aanbevolen procedures voor het gebruik van SAS in Azure, inclusief de updates in de opmerkingen.

  • Azure NetApp Files: U kunt SASDATA opslaan op een Azure NetApp Files-volume, gedeeld in het rekencluster.

    U kunt eventueel ook Azure NetApp Files NFS-volumes voor SASWORK gebruiken.

    Azure NetApp Files is beschikbaar in drie prestatieserviceniveaus:

    • Standaard
    • Premium
    • Ultra

    De volumeprestaties worden meestal gedefinieerd door het serviceniveau. De grootte van uw volume is ook een factor, omdat de haalbare doorvoer wordt bepaald door het serviceniveau en de grootte van het volume.

Opslagopties voor SASDATA

Omdat Azure NetApp Files hoge doorvoer en toegang met lage latentie tot opslag kan bieden, is het een levensvatbaar en sneller alternatief voor Premium Disk. Opslag die is gekoppeld aan het netwerk, wordt niet beperkt op VM-niveau, omdat deze zich bij beheerde schijven bevindt, zodat u hogere doorvoer naar opslag krijgt.

Als u de vereiste laag voor uw SASDATA-capaciteit wilt schatten, gebruikt u de Azure NetApp Files Performance Calculator. (Zorg ervoor dat u geavanceerd selecteert.)

Omdat Azure NetApp Files NFS-volumes worden gedeeld, zijn ze een goede kandidaat voor het hosten van SASDATA, wanneer ze worden gebruikt met de typen VM-exemplaren en RHEL-distributie, die verderop in dit artikel worden besproken.

Opslagopties voor SASWORK

In de volgende tabel ziet u de meest voorkomende opslagopties voor het implementeren van SASWORK in Azure. Afhankelijk van uw grootte (capaciteit) en snelheid (bandbreedte) hebt u drie opties: tijdelijke opslag, beheerde schijf en Azure NetApp Files.

Tijdelijke opslag Beheerde schijf Azure NetApp Files
Tekengrootte Klein Groot Extra groot
Snelheid Extra groot Klein Gemiddeld

Houd rekening met deze overwegingen bij het kiezen van een optie:

  • Tijdelijke opslag (of tijdelijke opslag) biedt de hoogste bandbreedte, maar is alleen beschikbaar in kleinere grootten. (Grootte is afhankelijk van de VM-SKU.) Afhankelijk van de beschikbare en vereiste capaciteiten, is deze optie mogelijk het beste.
  • Als de vereiste SASWORK-capaciteit de tijdelijke opslaggrootte overschrijdt van de VM-SKU die u hebt geselecteerd, kunt u overwegen om een beheerde Azure-schijf te gebruiken om SASWORK te hosten. Houd er echter rekening mee dat de doorvoer naar een beheerde schijf per ontwerp wordt beperkt door de VM-architectuur en dat deze afhankelijk is van de VM-SKU. Daarom is deze opslagoptie alleen geschikt voor omgevingen met lagere SASWORK-prestatievereisten.
  • Voor de hoogste SASWORK-capaciteitsvereisten en een gemiddelde prestatievereiste buiten wat Azure Managed Disks kan bieden, kunt u Azure NetApp Files voor SASWORK overwegen. Het biedt een grote grootte samen met snelle doorvoer.

Belangrijk

Houd er in elk scenario rekening mee dat SASWORK niet kan worden gedeeld tussen VM-rekenknooppunten, dus u moet afzonderlijke SASWORK-volumes maken voor elk rekenknooppunt. Volumes moeten worden gekoppeld aan NFS op slechts één rekenknooppunt.

Als u de voorgaande tabel wilt gebruiken, moet u bepalen of uw behoeften klein, groot, gemiddeld of extra groot zijn, rekening houden met de schaal van de implementatie, het aantal VM's en kernen en de bijbehorende capaciteits- en prestatievereisten. U moet deze evaluaties uitvoeren voor elke implementatie.

De opties in de tabel komen overeen met implementaties die worden beschreven in de volgende architecturen. In alle scenario's wordt SASDATA gehost op een Azure NetApp Files NFS-volume en gedeeld over de rekenknooppunten. Voor sommige RHEL-distributies raden we u aan om de optie NFS nconnect te gebruiken om meerdere netwerkstromen naar het volume te maken. Zie de sectie NFS-koppelingsopties van dit artikel voor meer informatie.

Architectuur voor tijdelijke opslag

Diagram met een tijdelijke opslagarchitectuur.

Voor kleinere SASWORK-capaciteitsvereisten is tijdelijke opslag van Azure-VM's een snelle en rendabele oplossing. In deze architectuur is elke VIRTUELE machine in de rekenlaag uitgerust met tijdelijke opslag. Raadpleeg de documentatie van azure-VM's om de tijdelijke opslaggrootten te bepalen voor de VM's die u gebruikt.

Gegevensstroom

  • Een rekenknooppunt leest invoergegevens van SASDATA en schrijft resultaten terug naar SASDATA.
  • Een volgend deel van de analysetaak kan worden uitgevoerd door een ander knooppunt in de rekenlaag. Deze gebruikt dezelfde procedure om de informatie te verkrijgen en op te slaan die nodig is om te verwerken.
  • De SASWORK voor tijdelijke werkmappen wordt niet gedeeld. Het wordt opgeslagen in tijdelijke opslag op elk rekenknooppunt.

Architectuur van beheerde schijven

Diagram met een beheerde schijfarchitectuur.

Als uw capaciteitsvereisten voor SASWORK de capaciteiten overschrijden die beschikbaar zijn in tijdelijke opslag, zijn beheerde Azure-schijven een goed alternatief. Beheerde schijven zijn beschikbaar in verschillende grootten en prestatieniveaus. Zie schaalbaarheids- en prestatiedoelen voor VM-schijven voor meer informatie.

Gegevensstroom

  • Een rekenknooppunt leest invoergegevens van SASDATA en schrijft resultaten terug naar SASDATA.
  • Een volgend deel van de analysetaak kan worden uitgevoerd door een ander knooppunt in de rekenlaag. Deze gebruikt dezelfde procedure om de informatie te verkrijgen en op te slaan die nodig is om te verwerken.
  • De SASWORK voor tijdelijke werkmappen wordt niet gedeeld. Het wordt opgeslagen op beheerde schijven die zijn gekoppeld aan elk rekenknooppunt.

Azure NetApp Files-architectuur

Diagram met een Azure NetApp Files-architectuur.

Overweeg azure NetApp Files te gebruiken voor hogere SASWORK-capaciteit of gemiddelde prestatievereisten. Azure NetApp Files biedt volumecapaciteiten tot 100 TiB met een normaal volume en 1 PiB met een groot volume. Elk knooppunt in de rekenlaag moet een eigen SASWORK-volume hebben. De volumes mogen niet worden gedeeld.

Gegevensstroom

  • Een rekenknooppunt leest invoergegevens van SASDATA en schrijft resultaten terug naar SASDATA.
  • Een volgend deel van de analysetaak kan worden uitgevoerd door een ander knooppunt in de rekenlaag. Deze gebruikt dezelfde procedure om de informatie te verkrijgen en op te slaan die nodig is om te verwerken.
  • De SASWORK voor tijdelijke werkmappen wordt niet gedeeld. Het wordt opgeslagen op afzonderlijke Azure NetApp Files-volumes die zijn gekoppeld aan elk rekenknooppunt.

Aanbevelingen voor schalen en configuratie

RHEL-distributies en NFS-instellingen

RHEL-distributies

RHEL is de aanbevolen distributie voor het uitvoeren van SAS 9 op Linux. Elke kernel die door Red Hat wordt ondersteund, heeft een eigen bandbreedtebeperkingen voor NFS.

Zie Aanbevolen procedures voor het gebruik van SAS in Azure voor meer informatie over het uitvoeren van SAS in Azure.

Azure Standard_E64-16ds_v4- en Standard_E64-32ds_v4-VM's, of hun v5-equivalenten, worden aanbevolen voor SAS. Als u rekening houdt met deze aanbevelingen, bevat deze sectie enkele richtlijnen voor het gebruik van SAS met Azure NetApp Files.

  • Als u RHEL 7 gebruikt, is Standard_E64-16ds_v4 of Standard_E64-16ds_v5 de beste keuze, op basis van het doel van 100 MiB/s per fysieke kern voor SASDATA.

    • Standard_E64-16ds_v4: 90-100 MiB/s per kern
    • Standard_E64-32ds_v4: 45-50 MiB/s per kern
  • Als u RHEL 8.2 gebruikt, zijn Standard_E64-16ds_v4 of Standard_E64-32ds_v4, of de bijbehorende v5-equivalenten, mogelijke opties. Standard_E64-16ds_v4 verdient de voorkeur, gezien het doel van 100 MiB/s per kern voor SASDATA.

    • Standard_E64-16ds_v4: 150-160 MiB/s per kern
    • Standard_E64-32ds_v4: 75-80 MiB/s per kern
  • Als u RHEL 8.3 gebruikt, zijn zowel Standard_E64-16ds_v4 als Standard_E64-32ds_v4, of hun v5-equivalenten, volledig acceptabel, gezien het doorvoerdoel per kern:

    • Validatie geeft 3.200 MiB/s aan van leesbewerkingen.
    • Deze resultaten worden bereikt met de NFS-koppelingsoptie nconnect .

Uit het testen blijkt dat één RHEL 7-exemplaar niet meer dan ongeveer 750-800 MiB/s van leesdoorvoer behaalt ten opzichte van één Azure NetApp Files-opslageindpunt (dat wil gezegd, tegen een netwerksocket). 1500 MiB/s aan schrijfbewerkingen zijn mogelijk tegen hetzelfde eindpunt als u opties voor 64 KiB rsize - en wsize NFS-koppeling gebruikt. Sommige bewijzen suggereren dat het eerder genoteerde plafond voor leesdoorvoer een artefact is van de 3.10-kernel. Zie RHEL CVE-2019-11477 voor meer informatie.

Testen laten zien dat één RHEL 8.2-exemplaar, met de 4.18-kernel, vrij is van de beperkingen die zijn genoteerd in de 3.10-kernel. Dus 1.200-1.300 MiB/s met leesverkeer is haalbaar als u een 64-KiB rsize - en wsize NFS-koppelingsoptie gebruikt. Voor grote opeenvolgende schrijfbewerkingen kunt u dezelfde 1500 MiB/s van haalbare doorvoer verwachten die u op RHEL 7 zou krijgen.

Met één RHEL 8.3-exemplaar, met de koppelingsoptie nconnect (die nieuw is in de RHEL 8.3-distributie), is ongeveer 3.200 MiB/s leesdoorvoer mogelijk vanaf één Azure NetApp Files-volume. Verwacht niet meer dan 1500 MiB/s schrijfbewerkingen naar een azure NetApp Files-volume, zelfs niet wanneer u dit toepast nconnect.

Kerneltunables

Vermeldingen in sitetabel

NFSv3 heeft geen mechanisme om te onderhandelen over gelijktijdigheid tussen de client en de server. De client en de server definiëren hun limieten zonder kennis van de andere. Voor de beste prestaties moet u het maximum aantal vermeldingen in de sitetabel aan de clientzijde sunrpc afstemmen met die worden ondersteund zonder pushback op de server. Wanneer een client de mogelijkheid van de servernetwerkstack om een workload te verwerken overweldigt, reageert de server door de venstergrootte voor de verbinding te verlagen, wat niet ideaal is voor prestaties.

Standaard definiëren moderne Linux-kernels de invoergrootte sunrpc.max_tcp_slot_table_entries per verbindingssitetabel sunrpc ter ondersteuning van 65.536 openstaande bewerkingen. Deze sitetabelvermeldingen definiëren de limieten voor gelijktijdigheid. Waarden die dit hoog zijn, zijn niet nodig omdat Azure NetApp Files standaard 128 openstaande bewerkingen heeft.

U wordt aangeraden de client af te stemmen op hetzelfde nummer:

  • Kerneltunables (via /etc/sysctl.conf)
    • sunrpc.tcp_max_slot_table_entries=128

De cache van het bestandssysteem kan niet worden uitgevoerd

U moet ook de volgende factoren begrijpen over de tunables in de bestandssysteemcache:

  • Het leegmaken van een vuile buffer laat de gegevens in een schone toestand, bruikbaar voor toekomstige leesbewerkingen totdat geheugendruk leidt tot verwijdering.
  • Er zijn drie triggers voor een asynchrone flush-bewerking:
    • Op basis van tijd: Wanneer een buffer de leeftijd bereikt die is gedefinieerd door de vm.dirty_expire_centisecs of vm.dirty_writeback_centisecs niet in staat is, moet deze worden gemarkeerd voor reiniging (dat wil gezegd, leegmaken of schrijven naar opslag).
    • Geheugendruk: Zie vm.dirty_ratio | vm.dirty_bytes voor meer informatie.
    • Sluiten: Wanneer een bestandsgreep wordt gesloten, worden alle vuile buffers asynchroon leeggemaakt naar de opslag.

Deze factoren worden bepaald door vier tunables. U kunt elk bestand dynamisch en permanent afstemmen met behulp van tuned of in het bestand /etc/sysctl.confsysctl. Het afstemmen van deze variabelen verbetert de prestaties voor SAS Grid:

  • Kerneltunables (via aangepast afgestemd profiel)
    • include = throughput-performance
    • vm.dirty_bytes = 31457280
    • vm.dirty_expire_centisecs = 100
    • vm.dirty_writeback_centisecs = 300

NFS-koppelingsopties

We raden de volgende NFS-koppelingsopties aan voor gedeelde NFS-bestandssystemen die worden gebruikt voor permanente SASDATA-bestanden :

RHEL 7 en 8.2

bg,rw,hard,rsize=65536,wsize=65536,vers=3,noatime,nodiratime,rdirplus,acdirmin=0,tcp,_netdev

RHEL 8.3

bg,rw,hard,rsize=65536,wsize=65536,vers=3,noatime,nodiratime,rdirplus,acdirmin=0,tcp,_netdev,nconnect=8

We raden de volgende koppelingsopties aan voor SASWORK-volumes , waarbij de respectieve volumes uitsluitend worden gebruikt voor SASWORK en niet worden gedeeld tussen knooppunten:

RHEL 7 en 8.2

bg,rw,hard,rsize=65536,wsize=65536,vers=3,noatime,nodiratime,rdirplus,acdirmin=0,tcp,_netdev,nocto

RHEL 8.3

bg,rw,hard,rsize=65536,wsize=65536,vers=3,noatime,nodiratime,rdirplus,acdirmin=0,tcp,_netdev,nocto,nconnect=8

Zie Close-to-open consistentie- en cachekenmerktimers voor meer informatie over de voordelen en kosten van de nocto koppelingsoptie.

U moet ook Azure NetApp Files bekijken : een gedeeld bestandssysteem voor gebruik met SAS Grid op MS Azure, inclusief alle updates in de opmerkingen.

Instellingen voor lezen in NFS

Het is raadzaam dat u de NFS-leesbewerking voor alle RHEL-distributies instelt op 15.360 KiB. Zie Voor meer informatie het permanent instellen van read-ahead voor NFS-koppelingen.

Alternatieven

De opslagoplossing in de voorgaande architecturen is maximaal beschikbaar, zoals is opgegeven door de Service Level Agreement van Azure NetApp Files. Voor extra beveiliging en beschikbaarheid kunt u de opslagvolumes repliceren naar een andere Azure-regio met behulp van Replicatie tussen regio's van Azure NetApp Files.

Er zijn twee belangrijke voordelen voor het repliceren van de volumes via de opslagoplossing:

  • De toepassings-VM's worden niet extra belast.
  • Met deze oplossing hoeft u geen VM's in de doelregio uit te voeren tijdens normale bewerkingen.

De inhoud van de opslag wordt gerepliceerd zonder gebruik te maken van rekeninfrastructuurresources en de doelregio hoeft de SAS-software niet uit te voeren. De doel-VM's hoeven niet te worden uitgevoerd om dit scenario te ondersteunen.

In de volgende architectuur ziet u hoe de opslaginhoud in Azure NetApp Files wordt gerepliceerd naar een tweede regio, waar de opslag wordt gevuld met een replica van de productiegegevens. Als er een failover is, wordt de secundaire regio online gebracht en worden de VM's gestart, zodat de productie kan worden hervat in de tweede regio. U moet verkeer omleiden naar de tweede regio door load balancers die niet in het diagram worden weergegeven, opnieuw te configureren.

Diagram met een architectuur met replicatie tussen regio's.

De gebruikelijke RPO voor deze oplossing is minder dan 20 minuten wanneer het update-interval voor replicatie tussen regio's is ingesteld op 10 minuten.

Gegevensstroom

  • Een rekenknooppunt leest invoergegevens van SASDATA en schrijft resultaten terug naar SASDATA.
  • Een volgend deel van de analysetaak kan worden uitgevoerd door een ander knooppunt in de rekenlaag. Deze gebruikt dezelfde procedure om de informatie te verkrijgen en op te slaan die nodig is om te verwerken.
  • De SASWORK voor tijdelijke werkmappen wordt niet gedeeld. Het wordt opgeslagen op afzonderlijke Azure NetApp Files-volumes die zijn gekoppeld aan elk rekenknooppunt.
  • Azure NetApp Files replicatie tussen regio's repliceert asynchroon het SASDATA-volume, inclusief alle momentopnamen, naar een DR-regio om failover te vergemakkelijken als er een regionale noodgeval is.

Overwegingen

Met deze overwegingen worden de pijlers van het Azure Well-Architected Framework geïmplementeerd, een set richtlijnen die u kunt gebruiken om de kwaliteit van een workload te verbeteren. Zie Microsoft Azure Well-Architected Framework voor meer informatie.

Betrouwbaarheid

Betrouwbaarheid zorgt ervoor dat uw toepassing kan voldoen aan de toezeggingen die u aan uw klanten hebt gedaan. Zie Overzicht van de betrouwbaarheidspijler voor meer informatie.

Azure NetApp Files biedt een standaard SLA voor 99,99% beschikbaarheid voor alle lagen en alle ondersteunde regio's. Azure NetApp Files ondersteunt ook inrichtingsvolumes in beschikbaarheidszones die u kiest en ha-implementaties tussen zones.

Voor verbeterde RPO/RTO SLA's is geïntegreerde gegevensbeveiliging met momentopnamen en back-ups opgenomen in de service. Replicatie tussen regio's biedt dezelfde voordelen in Azure-regio's.

Beveiliging

Beveiliging biedt zekerheid tegen opzettelijke aanvallen en misbruik van uw waardevolle gegevens en systemen. Zie Overzicht van de beveiligingspijler voor meer informatie.

Azure NetApp Files biedt een beveiligingsniveau omdat volumes worden ingericht en gegevensverkeer binnen uw virtuele netwerken blijft. Er is geen openbaar adresseerbaar eindpunt. Alle gegevens worden at-rest altijd versleuteld. U kunt eventueel gegevens in transit versleutelen.

Met Azure Policy kunt u organisatiestandaarden afdwingen en naleving op schaal beoordelen. Azure NetApp Files ondersteunt Azure Policy via aangepaste en ingebouwde beleidsdefinities.

Prestatie-efficiëntie

Prestatie-efficiëntie is de mogelijkheid om op efficiënte wijze uw werkbelasting te schalen om te voldoen aan de vereisten die gebruikers eraan stellen. Zie overzicht van de pijler Prestatie-efficiëntie voor meer informatie.

Prestaties

Houd rekening met de volgende overwegingen, afhankelijk van uw vereisten voor doorvoer en capaciteit:

Notitie

De azure NetApp Files-functie voor grote volumes is nu beschikbaar. Deze functie biedt een hogere doorvoer per volume dan normale Azure NetApp Files-volumes. Deze mogelijkheid kan worden overwogen als er meer prestaties vereist zijn voor uw SASDATA-volumes (of SASWORK). Raadpleeg deze documentatie voor meer informatie.

Schaalbaarheid

U kunt de rekenprestaties eenvoudig schalen door VM's toe te voegen aan de schaalsets waarop de drie lagen van de SAS-oplossing worden uitgevoerd.

U kunt de opslag van Azure NetApp Files-volumes dynamisch schalen. Als u automatische QoS gebruikt, worden de prestaties tegelijkertijd geschaald. Voor een gedetailleerdere controle van elk volume kunt u ook de prestaties van elk volume afzonderlijk beheren met behulp van handmatige QoS voor uw capaciteitspools .

Azure NetApp Files-volumes zijn beschikbaar in drie prestatielagen: Ultra, Premium en Standard. Kies de laag die het beste past bij uw prestatievereisten, rekening houdend met de schaal van de beschikbare prestatiebandbreedte met de grootte van een volume. U kunt het serviceniveau van een volume op elk gewenst moment wijzigen. Zie deze prijsvoorbeelden voor meer informatie over het kostenmodel van Azure NetApp Files.

U kunt de Azure NetApp Files Performance Calculator gebruiken om aan de slag te gaan.

Kostenoptimalisatie

Kostenoptimalisatie gaat over het verminderen van onnodige uitgaven en het verbeteren van operationele efficiëntie. Zie Overzicht van de pijler kostenoptimalisatie voor meer informatie.

Kostenmodel

Inzicht in het kostenmodel voor Azure NetApp Files kan u helpen bij het beheren van uw uitgaven.

Azure NetApp Files-facturering is gebaseerd op ingerichte opslagcapaciteit die u toewijst door capaciteitspools te maken. Capaciteitspools worden maandelijks gefactureerd op basis van een vaste kosten per toegewezen GiB per uur.

Als de groottevereisten voor uw capaciteitspool fluctueren (bijvoorbeeld vanwege variabele capaciteit of prestatiebehoeften), kunt u overwegen om het formaat van uw volumes en capaciteitspools dynamisch te wijzigen om de kosten te verdelen met uw capaciteits- en prestatiebehoeften.

Als de groottevereisten voor uw capaciteitspool hetzelfde blijven, maar de prestatievereisten fluctueren, kunt u overwegen het serviceniveau van een volume dynamisch te wijzigen. U kunt capaciteitspools van verschillende typen gedurende de maand inrichten en de inrichting ervan ongedaan maken, waardoor Just-In-Time-prestaties worden geboden en de kosten tijdens perioden worden verlaagd wanneer u geen hoge prestaties nodig hebt.

Prijzen

Bepaal op basis van uw capaciteits- en prestatievereisten welk Azure NetApp Files-serviceniveau u nodig hebt (Standard, Premium of Ultra). Gebruik vervolgens de Azure-prijscalculator om de kosten voor deze onderdelen te evalueren:

  • SAS in Azure-onderdelen
  • Azure NetApp Files
  • Beheerde schijf (optioneel)
  • Virtueel netwerk

Operationele uitmuntendheid

Operationele uitmuntendheid omvat de operationele processen die een toepassing implementeren en deze in productie houden. Zie Overzicht van de operationele uitmuntendheidpijler voor meer informatie.

SAS Grid in Azure biedt flexibiliteit en een snelle implementatie. Hier volgen enkele voordelen:

  • Voldoen aan veranderende zakelijke vereisten met dynamische workloadverdeling
  • Een maximaal beschikbare SAS-computingomgeving maken
  • Sneller resultaten krijgen van uw bestaande IT-infrastructuur
  • Rekenresources incrementeel en rendabel vergroten
  • Al uw analytische workloads beheren
  • Eenvoudig overstappen van een siloserver of een omgeving met meerdere pc's naar een SAS-rasteromgeving

Dit scenario implementeren

U kunt de workloads het beste implementeren met behulp van een IaC-proces (Infrastructure as Code). SAS-workloads kunnen gevoelig zijn voor onjuiste configuraties die vaak voorkomen in handmatige implementaties en de productiviteit verminderen.

Als u een begin wilt maken met het ontwerpen van uw SAS Grid in Azure-oplossing, bekijkt u SAS in Azure Architecture en automatiseert u de SAS-implementatie in Azure met behulp van GitHub Actions.

Medewerkers

Dit artikel wordt onderhouden door Microsoft. De tekst is oorspronkelijk geschreven door de volgende Inzenders.

Belangrijkste auteurs:

Andere Inzenders:

Als u niet-openbare LinkedIn-profielen wilt zien, meldt u zich aan bij LinkedIn.

Volgende stappen