SAS Grid 9.4 implementeren op Azure NetApp Files

Azure NetApp Files
Azure Virtual Machines

SAS-analysesoftware biedt een reeks services en hulpprogramma's voor het verkrijgen van inzichten uit gegevens en het nemen van intelligente beslissingen. SAS-oplossingen bieden analyses, kunstmatige intelligentie, business intelligence, klantinformatie, gegevensbeheer en fraude- en beveiligingsinformatie.

Als u SAS Grid in Azure implementeert, is Azure NetApp Files een haalbare primaire opslagoptie. Wanneer u de schaalbare services van Azure NetApp Files gebruikt, kunt u de opslagtoewijzingen op elk gewenst moment omhoog of omlaag schalen zonder de services te onderbreken. U kunt ook het opslagserviceniveau dynamisch aanpassen aan de prestatievereisten.

SAS biedt deze primaire platforms, die Door Microsoft zijn gevalideerd:

  • SAS Grid 9.4
  • SAS Viya

SAS Grid 9.4 is gevalideerd in Linux.

Dit artikel bevat algemene informatie voor het uitvoeren van SAS Grid 9.4 in Azure, met behulp van Azure NetApp Files voor SASDATA-opslag. Het biedt ook richtlijnen voor opslagopties voor SASWORK. Deze richtlijnen zijn gebaseerd op de veronderstelling dat u uw eigen SAS-oplossing host in Azure, in uw eigen tenant. SAS biedt geen hosting voor SAS Grid in Azure.

Architectuur

Diagram met een architectuur voor het uitvoeren van SAS Grid in Azure.

Download een PowerPoint-bestand met alle diagrammen in dit artikel.

Gegevensstroom

De rekenlaag maakt gebruik van SASDATA-volumes (en optioneel SASWORK) om gegevens in het raster te delen. SASDATA is een volume dat is verbonden met NFS op Azure NetApp Files.

  • Een rekenknooppunt leest invoergegevens uit SASDATA en schrijft resultaten terug naar SASDATA.
  • Een volgend deel van de analysetaak kan worden uitgevoerd door een ander knooppunt in de rekenlaag. Dezelfde procedure wordt gebruikt voor het verkrijgen en opslaan van de informatie die moet worden verwerkt.

Potentiële gebruikscases

Een schaalbare SAS Grid-implementatie die gebruikmaakt van Azure NetApp Files is van toepassing op deze use cases:

  • Financiële analyses
  • Fraudedetectie
  • Tracering en bescherming van bedreigde diersoorten
  • Wetenschap en geneeskunde
  • Analyse en AI

Vereisten voor opslagprestaties

Voor SAS 9.4-implementaties (SAS Grid of SAS Analytics Pro) in Azure is Azure NetApp Files een levensvatbare primaire opslagoptie voor SAS Grid-clusters van beperkte grootte. SAS raadt 100 MiB/s doorvoer per fysieke kern aan. Op basis van deze aanbeveling zijn SAS Grid-clusters die gebruikmaken van een Azure NetApp Files volume voor SASDATA (permanente SAS-gegevensbestanden) schaalbaar tot 32 tot 48 fysieke kernen op twee of meer virtuele Azure-machines. SAS-clustergrootten zijn gebaseerd op de architecturale beperking van één SASDATA-naamruimte per SAS-cluster en de beschikbare bandbreedte voor één Azure NetApp Files volume. De richtlijnen voor het aantal kernen worden opnieuw bekeken naarmate de Azure-infrastructuur (rekenkracht, netwerk en opslagbandbreedte per bestandssysteem) in de loop van de tijd toeneemt.

verwachtingen voor Azure NetApp Files volumeprestaties

Eén Azure NetApp Files volume kan maximaal 4500 MiB/s leesbewerkingen en 1500 MiB/s schrijfbewerkingen verwerken. Gezien een Azure-exemplaartype met voldoende uitgaande bandbreedte, kan één virtuele machine alle schrijfbandbreedte van één Azure NetApp Files volume verbruiken. Alleen de grootste virtuele machine kan echter alle leesbandbreedte van één volume verbruiken.

SASDATA, de belangrijkste gedeelde workload van SAS 9.4, heeft een lees-/schrijfverhouding van 80:20. De belangrijke nummers per volume voor een 80:20-workload met 64KiB lezen/schrijven zijn:

  • 2400 MiB/s leesdoorvoer en 600 MiB/s schrijfdoorvoer die gelijktijdig wordt uitgevoerd (~3.000 MiB/s gecombineerd).

Zie prestatiebenchmarks voor Linux Azure NetApp Files voor meer informatie.

Notitie

Azure NetApp Files functie voor grote volumes is nu beschikbaar. Deze functie biedt een hogere doorvoer per volume dan normale Azure NetApp Files volumes. Deze mogelijkheid kan worden overwogen als er meer prestaties vereist zijn voor uw SASDATA-volumes (of SASWORK). Raadpleeg deze documentatie voor meer informatie.

Aanbevelingen voor capaciteit

De Azure NetApp Files prestatiecalculator kan richtlijnen bieden voor het aanpassen van de grootte van SASDATA-volumes.

Het is belangrijk om een geschikt serviceniveau te kiezen, omdat:

  • De volumebandbreedte is gebaseerd op de volumecapaciteit.
  • Capaciteitskosten zijn gebaseerd op het serviceniveau.
  • Uw keuze voor serviceniveau is gebaseerd op capaciteit versus bandbreedtebehoeften.

Selecteer geavanceerd in de calculator, selecteer een regio en voer de volgende waarden in.

  • Volumegrootte: gewenste capaciteit
  • Doorvoer: gewenste doorvoer, rekening houdend met 100 MiB/s per kern
  • Leespercentage: 80%
  • IOPS: 0
  • I/O-grootte: 64KiB Sequentiële

De uitvoer onder aan het scherm bevat de aanbevolen capaciteitsvereisten voor elk serviceniveau en de kosten per maand, op basis van de prijs voor de geselecteerde regio:

  • Doorvoer. De bandbreedte van het volume, op basis van de workloadmix. Voor een 80% 64-KiB sequentiële leesworkload is 3096 MiB/s het verwachte maximum.
  • IOPS. Het aantal IOPS dat het volume levert bij de opgegeven doorvoer.
  • Volumegrootte. De hoeveelheid capaciteit die het volume nodig heeft op de opgegeven serviceniveaus om de vereiste doorvoer te bereiken. De volumecapaciteit (gerapporteerd in GiB's) kan gelijk zijn aan of kleiner zijn dan de grootte van de capaciteitspool. Deze aanbeveling is gebaseerd op de veronderstelling dat u automatische QoS-capaciteitspooltypen gebruikt. Als u de capaciteit versus de doorvoerdistributie over volumes binnen een capaciteitspool verder wilt optimaliseren, kunt u handmatigE QoS-capaciteitspooltypen overwegen.
  • Capaciteitspoolgrootte. De grootte van het zwembad. De capaciteit van een volume wordt gesneden uit een capaciteitspool. Capaciteitspools hebben de grootte in stappen van 1 TiB.
  • Kosten capaciteitspool (USD/maand). De kosten per maand van de capaciteitspool op de opgegeven grootte en serviceniveau.
  • Volume Weergeven terug (USD/maand). De kosten per maand van de capaciteit voor het volume op de opgegeven capaciteit. Kosten zijn gebaseerd op de grootte van de toegewezen capaciteitspools. Het volume dat wordt weergegeven, geeft de hoeveelheid van het volume aan.

Notitie

De gebruikerservaring is hetzelfde, ongeacht het serviceniveau, mits er voldoende bandbreedte is ingericht.

Beheer de kosten indien nodig door volume shaping te gebruiken in Azure NetApp Files. Er zijn twee dynamische opties beschikbaar om de prestaties en kosten te beïnvloeden:

Meer informatie over het Azure NetApp Files-kostenmodel.

Gegevensbescherming

Azure NetApp Files maakt gebruik van momentopnamen om uw gegevens te beveiligen. Momentopnamen bieden ruimte-efficiënte, crashconsistente, vrijwel onmiddellijk installatiekopieën van uw Azure NetApp Files volumes. U kunt momentopnamen op elk gewenst moment handmatig maken of ze plannen met behulp van een momentopnamebeleid op het volume.

Gebruik een momentopnamebeleid om geautomatiseerde gegevensbeveiliging toe te voegen aan uw volumes. U kunt momentopnamen snel herstellen door momentopnamen terug te zetten. U kunt ook een momentopname herstellen naar een nieuw volume voor snel gegevensherstel. U kunt ook herstel naar nieuwe volumefunctionaliteit gebruiken om test-/ontwikkelomgevingen te voorzien van actuele gegevens.

Voor extra niveaus van gegevensbeveiliging kunt u oplossingen voor gegevensbeveiliging gebruiken die gebruikmaken van Azure NetApp Files back-up- of partnerback-upsoftware.

Onderdelen

  • Azure Virtual Machines: SAS Grid vereist veel geheugen, opslag en I/O-bandbreedte, in een geschikte verhouding met het aantal kernen. Azure biedt vooraf gedefinieerde vm-grootten (VM's) met lagere vCPU-aantallen die kunnen helpen om het aantal vereiste kernen te balancen met de hoeveelheid geheugen, opslag en I/O-bandbreedte.

    Zie Vm-grootten die geschikt zijn voor beperkte vCPU's voor meer informatie. Het is belangrijk om goed te begrijpen welke rekenresources beschikbaar zijn voor elk exemplaar. Als u SAS Grid wilt uitvoeren in Azure met Azure NetApp Files, raden we de volgende typen exemplaren aan:

    • Standard_E64 16ds_v4 of Standard_E64 16ds_v5
    • Standard_E64 32ds_v4 of Standard_E64 32ds_v5

    Lees de best practices voor het gebruik van SAS in Azure, inclusief de updates in de opmerkingen.

  • Azure NetApp Files: U kunt SASDATA opslaan op een Azure NetApp Files volume, gedeeld in het rekencluster.

    U kunt eventueel ook Azure NetApp Files NFS-volumes gebruiken voor SASWORK.

    Azure NetApp Files is beschikbaar in drie prestatieserviceniveaus:

    • Standard
    • Premium
    • Ultra

    Uw volumeprestaties worden voornamelijk bepaald door het serviceniveau. De grootte van uw volume is ook een factor, omdat de haalbare doorvoer wordt bepaald door het serviceniveau en de grootte van het volume.

Opslagopties voor SASDATA

Omdat Azure NetApp Files toegang tot opslag met hoge doorvoer en lage latentie kan bieden, is het een haalbaar en sneller alternatief voor Premium Disk. Aan het netwerk gekoppelde opslag wordt niet beperkt op VM-niveau, zoals bij beheerde schijven, zodat u een hogere doorvoer naar opslag krijgt.

Als u de vereiste laag voor uw SASDATA-capaciteit wilt schatten, gebruikt u de Azure NetApp Files Prestatiecalculator. (Zorg ervoor dat u geavanceerd selecteert.)

Omdat Azure NetApp Files NFS-volumes worden gedeeld, zijn ze een goede kandidaat voor het hosten van SASDATA, wanneer ze worden gebruikt met de juiste vm-exemplaartypen en Red Hat Enterprise Linux-distributie (RHEL), verderop in dit artikel besproken.

Opslagopties voor SASWORK

In de volgende tabel ziet u de meest voorkomende opslagopties voor het implementeren van SASWORK in Azure. Afhankelijk van uw vereisten voor grootte (capaciteit) en snelheid (bandbreedte), hebt u drie opties: tijdelijke opslag, beheerde schijf en Azure NetApp Files.

Tijdelijke opslag Beheerde schijf Azure NetApp Files
Grootte Klein Groot Extra groot
Snelheid Extra groot Klein Normaal

Houd rekening met deze overwegingen bij het kiezen van een optie:

  • Tijdelijke opslag (of kortstondige opslag) biedt de hoogste bandbreedte, maar is alleen beschikbaar in kleinere formaten. (De grootte is afhankelijk van de VM-SKU.) Afhankelijk van de beschikbare en vereiste capaciteiten is deze optie mogelijk het beste.
  • Als de vereiste SASWORK-capaciteit de tijdelijke opslaggrootte overschrijdt van de VM-SKU die u hebt geselecteerd, kunt u overwegen om een beheerde Azure-schijf te gebruiken om SASWORK te hosten. Houd er echter rekening mee dat de doorvoer naar een beheerde schijf wordt beperkt door de VM-architectuur en dat deze varieert, afhankelijk van de VM-SKU. Daarom is deze opslagoptie alleen haalbaar voor omgevingen met lagere SASWORK-prestatievereisten.
  • Voor de hoogste SASWORK-capaciteitsvereisten en een gemiddelde prestatievereiste die verder gaat dan wat Azure Managed Disks kunnen bieden, kunt u overwegen Azure NetApp Files voor SASWORK. Het biedt een groot formaat in combinatie met snelle doorvoer.

Belangrijk

Houd er in elk scenario rekening mee dat SASWORK niet kan worden gedeeld tussen VM-rekenknooppunten, dus u moet afzonderlijke SASWORK-volumes maken voor elk rekenknooppunt. Volumes moeten op slechts één rekenknooppunt worden gekoppeld aan NFS.

Als u in de voorgaande tabel wilt bepalen of uw behoeften klein, groot, gemiddeld of extra groot zijn, moet u rekening houden met de schaal van de implementatie, het aantal VM's en kernen en de bijbehorende capaciteits- en prestatievereisten. U moet deze evaluaties uitvoeren voor elke implementatie.

De opties in de tabel komen overeen met implementaties die worden beschreven in de volgende architecturen. In alle scenario's wordt SASDATA gehost op een Azure NetApp Files NFS-volume en gedeeld tussen de rekenknooppunten. Voor sommige RHEL-distributies raden we u aan de optie NFS nconnect te gebruiken om meerdere netwerkstromen naar het volume te maken. Zie de sectie NFS-koppelingsopties van dit artikel voor meer informatie.

Architectuur voor tijdelijke opslag

Diagram met een tijdelijke opslagarchitectuur.

Voor kleinere SASWORK-capaciteitsvereisten is tijdelijke opslag van Azure VM een snelle en kosteneffectieve oplossing. In deze architectuur is elke VM in de rekenlaag uitgerust met tijdelijke opslag. Raadpleeg de documentatie voor azure-VM's om de tijdelijke opslaggrootten te bepalen voor de VM's die u gebruikt.

Gegevensstroom

  • Een rekenknooppunt leest invoergegevens uit SASDATA en schrijft resultaten terug naar SASDATA.
  • Een volgend deel van de analysetaak kan worden uitgevoerd door een ander knooppunt in de rekenlaag. Dezelfde procedure wordt gebruikt om de informatie te verkrijgen en op te slaan die moet worden verwerkt.
  • De tijdelijke werkmap SASWORK wordt niet gedeeld. Het wordt opgeslagen in tijdelijke opslag op elk rekenknooppunt.

Architectuur van beheerde schijven

Diagram met een architectuur van een beheerde schijf.

Als uw capaciteitsvereisten voor SASWORK groter zijn dan de capaciteiten die beschikbaar zijn in tijdelijke opslag, zijn beheerde Azure-schijven een goed alternatief. Beheerde schijven zijn beschikbaar in verschillende grootten en prestatieniveaus. Zie Schaalbaarheids- en prestatiedoelen voor VM-schijven voor meer informatie.

Gegevensstroom

  • Een rekenknooppunt leest invoergegevens uit SASDATA en schrijft resultaten terug naar SASDATA.
  • Een volgend deel van de analysetaak kan worden uitgevoerd door een ander knooppunt in de rekenlaag. Dezelfde procedure wordt gebruikt om de informatie te verkrijgen en op te slaan die moet worden verwerkt.
  • De tijdelijke werkmap SASWORK wordt niet gedeeld. Het wordt opgeslagen op beheerde schijven die zijn gekoppeld aan elk rekenknooppunt.

Azure NetApp Files-architectuur

Diagram met een Azure NetApp Files-architectuur.

Voor een hogere SASWORK-capaciteit en/of gemiddelde prestatievereisten kunt u overwegen om Azure NetApp Files te gebruiken. Azure NetApp Files biedt volumecapaciteiten tot 100 TiB. Elk knooppunt in de rekenlaag moet een eigen SASWORK-volume hebben. De volumes mogen niet worden gedeeld.

Gegevensstroom

  • Een rekenknooppunt leest invoergegevens uit SASDATA en schrijft resultaten terug naar SASDATA.
  • Een volgend deel van de analysetaak kan worden uitgevoerd door een ander knooppunt in de rekenlaag. Dezelfde procedure wordt gebruikt om de informatie te verkrijgen en op te slaan die moet worden verwerkt.
  • De tijdelijke werkmap SASWORK wordt niet gedeeld. Het wordt opgeslagen op afzonderlijke Azure NetApp Files volumes die zijn gekoppeld aan elk rekenknooppunt.

Aanbevelingen voor schalen en configuratie

RHEL-distributies en NFS-instellingen

RHEL-distributies

RHEL is de aanbevolen distributie voor het uitvoeren van SAS 9 op Linux. Elke kernel die door Red Hat wordt ondersteund, heeft zijn eigen bandbreedtebeperkingen voor NFS.

Zie Best practices voor het gebruik van SAS in Azure voor meer informatie over het uitvoeren van SAS in Azure.

Azure Standard_E64-16ds_v4 en Standard_E64-32ds_v4 VM's, of hun v5-equivalenten, worden aanbevolen voor SAS. Rekening houdend met deze aanbevelingen, bevat deze sectie enkele richtlijnen voor het gebruik van SAS met Azure NetApp Files.

  • Als u RHEL 7 gebruikt, is Standard_E64-16ds_v4 of Standard_E64-16ds_v5 de beste keuze, op basis van de 100 MiB/s per fysiek kerndoel voor SASDATA.

    • Standard_E64-16ds_v4: 90-100 MiB/s per kern
    • Standard_E64 32ds_v4: 45-50 MiB/s per kern
  • Als u RHEL 8.2 gebruikt, zijn Standard_E64-16ds_v4 of Standard_E64-32ds_v4, of de bijbehorende v5-equivalenten, mogelijke opties. Standard_E64-16ds_v4 verdient de voorkeur, gezien de 100 MiB/s per kerndoel voor SASDATA.

    • Standard_E64-16ds_v4: 150-160 MiB/s per kern
    • Standard_E64 32ds_v4: 75-80 MiB/s per kern
  • Als u RHEL 8.3 gebruikt, zijn zowel Standard_E64-16ds_v4 als Standard_E64-32ds_v4, of de bijbehorende v5-equivalenten, volledig acceptabel, gezien het doorvoerdoel per kern:

    • Validatie geeft 3.200 MiB/s aan leesbewerkingen aan.
    • Deze resultaten worden bereikt met de NFS-koppelingsoptie nconnect .

Testen tonen aan dat één RHEL 7-exemplaar niet meer dan ongeveer 750-800 MiB/s leesdoorvoer behaalt voor één Azure NetApp Files opslageindpunt (dat wil gezegd, tegen een netwerksockets). 1500 MiB/s schrijfbewerkingen zijn haalbaar voor hetzelfde eindpunt, als u 64 KiB rsize - en wsize NFS-koppelingsopties gebruikt. Er zijn aanwijzingen dat het eerder genoteerde maximum voor leesdoorvoer een artefact is van de kernel 3.10. Zie RHEL CVE-2019-11477 voor meer informatie.

Testen toont aan dat één RHEL 8.2-exemplaar, met de kernel 4.18, vrij is van de beperkingen die zijn vermeld in de 3.10-kernel. Dus 1.200-1.300 MiB/s aan leesverkeer is haalbaar als u een koppelingsoptie van 64 KiB rsize en wsize NFS gebruikt. Voor grote opeenvolgende schrijfbewerkingen kunt u dezelfde 1500 MiB/s aan haalbare doorvoer verwachten als bij RHEL 7.

Met één RHEL 8.3-exemplaar, met de koppelingsoptie nconnect (nieuw in de RHEL 8.3-distributie), is ongeveer 3.200 MiB/s leesdoorvoer mogelijk vanaf één Azure NetApp Files volume. Verwacht niet meer dan 1500 MiB/s schrijfbewerkingen naar een Azure NetApp Files enkel volume, zelfs niet wanneer u toepastnconnect.

Kernel-tunables

Vermeldingen in de sleuftabel

NFSv3 heeft geen mechanisme om te onderhandelen over gelijktijdigheid tussen de client en de server. De client en de server definiëren elk hun limieten zonder zich bewust te zijn van de andere. Voor de beste prestaties moet u het maximum aantal vermeldingen in de sleuftabel op de client uitlijnen sunrpc met de vermeldingen die worden ondersteund zonder pushback op de server. Wanneer een client de mogelijkheid van de servernetwerkstack om een workload te verwerken overbelast, reageert de server door de venstergrootte voor de verbinding te verkleinen, wat niet ideaal is voor prestaties.

Standaard definiëren moderne Linux-kernels de vermeldingsgrootte sunrpc.max_tcp_slot_table_entries van de sitetabel per verbinding sunrpc om 65.536 openstaande bewerkingen te ondersteunen. Deze vermeldingen in de sitetabel definiëren de limieten van gelijktijdigheid. Waarden die zo hoog zijn, zijn niet nodig omdat Azure NetApp Files standaard 128 openstaande bewerkingen heeft.

We raden u aan om de client af te stemmen op hetzelfde nummer:

  • Kernel tunables (via /etc/sysctl.conf)
    • sunrpc.tcp_max_slot_table_entries=128

Bestandssysteemcache kan niet worden gebruikt

U moet ook de volgende factoren begrijpen over het inschakelen van de bestandssysteemcache:

  • Het leegmaken van een vuile buffer zorgt ervoor dat de gegevens in een schone staat blijven en bruikbaar zijn voor toekomstige leesbewerkingen totdat geheugendruk leidt tot verwijdering.
  • Er zijn drie triggers voor een asynchrone flush-bewerking:
    • Op basis van tijd: Wanneer een buffer de leeftijd bereikt die is gedefinieerd door de vm.dirty_expire_centisecs of vm.dirty_writeback_centisecs niet kan worden gebruikt, moet deze worden gemarkeerd voor reiniging (dat wil gezegd, spoelen of schrijven naar opslag).
    • Geheugendruk: zie vm.dirty_ratio | vm.dirty_bytes voor meer informatie.
    • Sluiten: wanneer een bestandsgreep wordt gesloten, worden alle vuile buffers asynchroon naar de opslag gespoeld.

Deze factoren worden bepaald door vier tunables. U kunt elke afstelbare dynamisch en permanent afstemmen met behulp van tuned of sysctl in het bestand /etc/sysctl.conf . Het afstemmen van deze variabelen verbetert de prestaties voor SAS Grid:

  • Kernel tunables (via aangepast afgestemd profiel)
    • include = throughput-performance
    • vm.dirty_bytes = 31457280
    • vm.dirty_expire_centisecs = 100
    • vm.dirty_writeback_centisecs = 300

NFS-koppelingsopties

We raden de volgende NFS-koppelingsopties aan voor gedeelde NFS-bestandssystemen die worden gebruikt voor permanente SASDATA-bestanden :

RHEL 7 en 8.2

bg,rw,hard,rsize=65536,wsize=65536,vers=3,noatime,nodiratime,rdirplus,acdirmin=0,tcp,_netdev

RHEL 8.3

bg,rw,hard,rsize=65536,wsize=65536,vers=3,noatime,nodiratime,rdirplus,acdirmin=0,tcp,_netdev,nconnect=8

We raden de volgende koppelingsopties aan voor SASWORK-volumes , waarbij de respectieve volumes uitsluitend worden gebruikt voor SASWORK en niet worden gedeeld tussen knooppunten:

RHEL 7 en 8.2

bg,rw,hard,rsize=65536,wsize=65536,vers=3,noatime,nodiratime,rdirplus,acdirmin=0,tcp,_netdev,nocto

RHEL 8.3

bg,rw,hard,rsize=65536,wsize=65536,vers=3,noatime,nodiratime,rdirplus,acdirmin=0,tcp,_netdev,nocto,nconnect=8

Zie Close-to-open consistentie en timers voor cachekenmerken voor meer informatie over de voordelen en kosten van de nocto koppelingsoptie.

Bekijk ook Azure NetApp Files: een gedeeld bestandssysteem voor gebruik met SAS Grid in MS Azure, inclusief alle updates in de opmerkingen.

NFS-instellingen voor vooruitlezen

We raden u aan om de NFS-lees-vooruit-afstelbare optie voor alle RHEL-distributies in te stellen op 15.360 KiB. Zie Permanent vooruit lezen instellen voor NFS-koppelingen voor meer informatie.

Alternatieven

De opslagoplossing in de voorgaande architecturen is maximaal beschikbaar, zoals opgegeven in de Azure NetApp Files service level agreement. Voor extra beveiliging en beschikbaarheid kunt u de opslagvolumes repliceren naar een andere Azure-regio met behulp van Azure NetApp Files replicatie tussen regio's.

Er zijn twee belangrijke voordelen aan het repliceren van de volumes via de opslagoplossing:

  • De toepassings-VM's worden niet extra belast.
  • Deze oplossing elimineert de noodzaak om vm's uit te voeren in de doelregio tijdens de normale werking.

De opslaginhoud wordt gerepliceerd zonder het gebruik van resources voor de rekeninfrastructuur en de doelregio hoeft de SAS-software niet uit te voeren. De doel-VM's hoeven niet te worden uitgevoerd om dit scenario te ondersteunen.

De volgende architectuur laat zien hoe de opslaginhoud op Azure NetApp Files wordt gerepliceerd naar een tweede regio, waar de opslag wordt gevuld met een replica van de productiegegevens. Als er een failover is, wordt de secundaire regio online gebracht en worden de VM's gestart, zodat de productie in de tweede regio kan worden hervat. U moet verkeer omleiden naar de tweede regio door load balancers die niet in het diagram worden weergegeven, opnieuw te configureren.

Diagram met een architectuur met replicatie tussen regio's.

De typische RPO voor deze oplossing is minder dan 20 minuten wanneer het interval voor replicatie tussen regio's is ingesteld op 10 minuten.

Gegevensstroom

  • Een rekenknooppunt leest invoergegevens uit SASDATA en schrijft resultaten terug naar SASDATA.
  • Een volgend deel van de analysetaak kan worden uitgevoerd door een ander knooppunt in de rekenlaag. Dezelfde procedure wordt gebruikt om de informatie te verkrijgen en op te slaan die moet worden verwerkt.
  • De tijdelijke werkmap SASWORK wordt niet gedeeld. Het wordt opgeslagen op afzonderlijke Azure NetApp Files volumes die zijn gekoppeld aan elk rekenknooppunt.
  • Azure NetApp Files replicatie tussen regio's repliceert het SASDATA-volume, inclusief alle momentopnamen, asynchroon naar een DR-regio om failover te vergemakkelijken als er zich een regionaal noodgeval voordoet.

Overwegingen

Deze overwegingen implementeren de pijlers van het Azure Well-Architected Framework, een set richtlijnen die u kunt gebruiken om de kwaliteit van een workload te verbeteren. Zie Microsoft Azure Well-Architected Framework voor meer informatie.

Betrouwbaarheid

Betrouwbaarheid zorgt ervoor dat uw toepassing kan voldoen aan de toezeggingen die u aan uw klanten doet. Zie Overzicht van de betrouwbaarheidspijler voor meer informatie.

Azure NetApp Files biedt een standaard SLA voor beschikbaarheid van 99,99% voor alle lagen en alle ondersteunde regio's. Azure NetApp Files biedt ook ondersteuning voor het inrichten van volumes in beschikbaarheidszones die u kiest en implementaties met hoge beschikbaarheid in verschillende zones.

Voor verbeterde RPO-/RTO-SLA's is geïntegreerde gegevensbeveiliging met momentopnamen en back-ups opgenomen in de service. Replicatie tussen regio's biedt dezelfde voordelen in Azure-regio's.

Beveiliging

Beveiliging biedt zekerheid tegen opzettelijke aanvallen en misbruik van uw waardevolle gegevens en systemen. Zie Overzicht van de beveiligingspijler voor meer informatie.

Azure NetApp Files biedt een beveiligingsniveau omdat volumes worden ingericht en gegevensverkeer binnen uw virtuele netwerken blijft. Er is geen openbaar adresseerbaar eindpunt. Alle gegevens worden te allen tijde versleuteld in rust . U kunt eventueel gegevens in transit versleutelen.

Azure Policy kunt u helpen bij het afdwingen van organisatiestandaarden en het evalueren van naleving op schaal. Azure NetApp Files ondersteunt Azure Policy via aangepaste en ingebouwde beleidsdefinities.

Prestatie-efficiëntie

Prestatie-efficiëntie is de mogelijkheid om op efficiënte wijze uw werkbelasting te schalen om te voldoen aan de vereisten die gebruikers eraan stellen. Zie Overzicht van de pijler Prestatie-efficiëntie voor meer informatie.

Prestaties

Houd rekening met de volgende overwegingen, afhankelijk van uw vereisten voor doorvoer en capaciteit:

Notitie

Azure NetApp Files functie voor grote volumes is nu beschikbaar. Deze functie biedt een hogere doorvoer per volume dan normale Azure NetApp Files volumes. Deze mogelijkheid kan worden overwogen als er meer prestaties vereist zijn voor uw SASDATA-volumes (of SASWORK). Raadpleeg deze documentatie voor meer informatie.

Schaalbaarheid

U kunt de rekenprestaties eenvoudig schalen door VM's toe te voegen aan de schaalsets waarop de drie lagen van de SAS-oplossing worden uitgevoerd.

U kunt de opslag van Azure NetApp Files volumes dynamisch schalen. Als u automatische QoS gebruikt, worden de prestaties tegelijkertijd geschaald. Voor een gedetailleerdere controle van elk volume kunt u ook de prestaties van elk volume afzonderlijk regelen met behulp van handmatige QoS voor uw capaciteitspools.

Azure NetApp Files volumes zijn beschikbaar in drie prestatielagen: Ultra, Premium en Standard. Kies de laag die het beste past bij uw prestatievereisten, rekening houdend met de schaal van de beschikbare prestatiebandbreedte met de grootte van een volume. U kunt het serviceniveau van een volume op elk gewenst moment wijzigen. Zie deze prijsvoorbeelden voor meer informatie over het Azure NetApp Files-kostenmodel.

U kunt de Azure NetApp Files Prestatiecalculator gebruiken om aan de slag te gaan.

Kostenoptimalisatie

Kostenoptimalisatie gaat over het verminderen van onnodige kosten en het verbeteren van de operationele efficiëntie. Zie Overzicht van de pijler kostenoptimalisatie voor meer informatie.

Kostenmodel

Als u het kostenmodel voor Azure NetApp Files begrijpt, kunt u uw uitgaven beheren.

Azure NetApp Files facturering is gebaseerd op ingerichte opslagcapaciteit, die u toewijst door capaciteitsgroepen te maken. Capaciteitspools worden maandelijks gefactureerd op basis van een ingestelde kosten per toegewezen GiB per uur.

Als de vereisten voor de grootte van uw capaciteitspool fluctueren (bijvoorbeeld vanwege variabele capaciteit of prestatiebehoeften), kunt u overwegen om de grootte van uw volumes en capaciteitspools dynamisch te wijzigen om de kosten in balans te houden met uw capaciteits- en prestatiebehoeften.

Als de vereisten voor de grootte van uw capaciteitspool hetzelfde blijven, maar de prestatievereisten fluctueren, kunt u overwegen het serviceniveau van een volume dynamisch te wijzigen. U kunt gedurende de maand verschillende typen capaciteitspools inrichten en de inrichting ongedaan maken, waardoor Just-In-Time-prestaties worden geboden en de kosten worden verlaagd tijdens perioden waarin u geen hoge prestaties nodig hebt.

Prijzen

Bepaal op basis van uw capaciteits- en prestatievereisten welke Azure NetApp Files serviceniveau u nodig hebt (Standard, Premium of Ultra). Gebruik vervolgens de Azure-prijscalculator om de kosten voor deze onderdelen te evalueren:

  • SAS in Azure-onderdelen
  • Azure NetApp Files
  • Beheerde schijf (optioneel)
  • Virtueel netwerk

Operationele uitmuntendheid

Operationele uitmuntendheid omvat de operationele processen die een toepassing implementeren en deze in productie houden. Zie Overzicht van de pijler operationele uitmuntendheid voor meer informatie.

SAS Grid in Azure biedt flexibiliteit en een snelle implementatie. Hier volgen enkele voordelen:

  • Tegemoetkomen aan veranderende bedrijfsbehoeften met dynamische workloadverdeling
  • Een maximaal beschikbare SAS-computingomgeving maken
  • Sneller resultaten halen uit uw bestaande IT-infrastructuur
  • Rekenresources incrementeel en rendabel vergroten
  • Al uw analytische workloads beheren
  • Stap eenvoudig over van een siloserver of omgeving met meerdere pc's naar een SAS-rasteromgeving

Dit scenario implementeren

U kunt de workloads het beste implementeren met behulp van een IaC-proces (infrastructure as code). SAS-workloads kunnen gevoelig zijn voor onjuiste configuraties die vaak optreden bij handmatige implementaties en verminderen de productiviteit.

Als u een begin wilt maken met het ontwerpen van uw SAS Grid on Azure-oplossing, raadpleegt u SAS in Azure-architectuur en SAS-implementatie automatiseren in Azure met behulp van GitHub Actions.

Medewerkers

Dit artikel wordt onderhouden door Microsoft. Het is oorspronkelijk geschreven door de volgende inzenders.

Hoofdauteurs:

Andere inzenders:

Als u niet-openbare LinkedIn-profielen wilt zien, meldt u zich aan bij LinkedIn.

Volgende stappen