Bearbeiten

Freigeben über


Architektur von SAS in Azure

Azure Virtual Machines
Azure Virtual Network
Azure Files

Diese Lösung führt SAS-Analyseworkloads in Azure aus. Der Leitfaden behandelt verschiedene Bereitstellungsszenarien. So sind beispielsweise mehrere SAS-Versionen verfügbar. Sie können SAS-Software auf selbst verwalteten virtuellen Computern (VMs) ausführen. Sie können ebenfalls containerbasierte Versionen mithilfe von Azure Kubernetes Service (AKS) bereitstellen.

Aufbau

Architekturdiagramm, das zeigt, wie SAS-Produkte in Azure bereitgestellt werden.

Das Diagramm zeigt ein großes Rechteck, das als Azure Virtual Network gekennzeichnet ist. Darin befindet sich noch ein großes Rechteck mit der Bezeichnung Näherungsplatzierungsgruppe. Darin befinden sich zwei weitere Rechtecke. Diese sind übereinander angeordnet und jeweils mit Netzwerksicherheitsgruppe bezeichnet. Jedes Sicherheitsgruppenrechteck enthält mehrere Computersymbole, die nebeneinander in Zeilen angeordnet sind. Die Computersymbole im oberen Rechteck auf der linken Seite der oberen Zeile werden mit „Mid tier“ (Mittlere Ebene) bezeichnet. Die Symbole auf der rechten Seite werden mit „Metadata Tier“(Metadatenebene) bezeichnet. Die untere Symbolzeile wird als „Compute Tier“ (Computeebene) bezeichnet. Die obere Zeile der Computersymbole im unteren Rechteck hat die Bezeichnung MGS- und MDS-Server. Die untere Zeile hat die Bezeichnung OST- und OSS-Server.

Laden Sie eine Visio-Datei dieser Architektur herunter.

Workflow

SAS-Azure-Bereitstellungen umfassen in der Regel drei Ebenen:

  • Eine API- oder Visualisierungsebene. Innerhalb dieser Ebene:

    • Bietet die Metadatenebene den Client-Apps Zugriff auf Metadaten über Datenquellen, Ressourcen, Server und Benutzer.
    • Bieten Web-Apps Zugriff auf Intelligence-Daten in der mittleren Ebene.
  • Eine Computeplattform, auf der SAS-Server Daten verarbeiten.

  • Eine Speicherebene, die SAS als permanenten Speicher verwendet. Beliebte Optionen in Azure sind:

    • Lustre
    • IBM Spectrum Scale
    • Network File System (NFS)

Ein Azure Virtual Network isoliert das System in der Cloud. Innerhalb dieses Netzwerks:

  • Verringert eine Näherungsplatzierungsgruppe die Latenz zwischen VMs.
  • Schützen Netzwerksicherheitsgruppen SAS-Ressourcen vor unerwünschtem Datenverkehr.

Voraussetzungen

Stellen Sie vor der Bereitstellung einer SAS-Workload sicher, dass die folgenden Komponenten vorhanden sind bzw. umgesetzt wurden:

  • Die Größenempfehlung eines entsprechenden SAS-Beratungsteams
  • Eine SAS-Lizenzdatei
  • Zugriff auf eine Ressourcengruppe, um Ihre Ressourcen bereitzustellen
  • Ein vCPU-Abonnementkontingent (Virtual Central Processing Unit), in dem Ihr Größendokument und Ihre VM-Auswahl berücksichtigt werden
  • Zugriff auf einen sicheren LDAP-Server (Lightweight Directory Access Protocol)

Szenariodetails

Dieser Leitfaden dient der Erörterung verschiedener Implementierungsoptionen und richtet sich nach den Grundsätzen des Microsoft Azure Well-Architected Frameworks, um eine hervorragende Leistung in den Bereichen Kosten, DevOps, Resilienz, Skalierbarkeit und Sicherheit zu erzielen. Sie sollten jedoch nicht nur diesen Leitfaden nutzen, sondern auch ein SAS-Team zu Rate ziehen, um ihren speziellen Anwendungsfall zusätzlich zu überprüfen.

Microsoft und SAS arbeiten gemeinsam an der Erstellung einer Roadmap für Organisationen, die innovative Cloudlösungen entwickeln. Beide Unternehmen sind bestrebt, eine qualitativ hochwertige Bereitstellung von SAS-Produkten und -Lösungen in Azure sicherzustellen.

Einführung in SAS

Die SAS-Analysesoftware bietet eine Sammlung von Diensten und Tools, mit denen Erkenntnissen aus Daten gewonnen und intelligente Entscheidungen getroffen werden können. SAS-Plattformen bieten eine umfassende Unterstützung der Lösungen, insbesondere in den Bereichen Datenverwaltung, Betrugserkennung, Risikoanalyse und Visualisierung. SAS stellt diese primären Plattformen zur Verfügung, die von Microsoft validiert wurden:

  • SAS Grid 9.4
  • SAS Viya

Die folgenden Architekturen wurden getestet:

  • SAS Grid 9.4 für Linux
  • SAS 9 Foundation
  • SAS Viya 3.5 mit SMP- (symmetrisches Multiprocessing) und MPP-Architekturen (parallele Massenverarbeitung) für Linux
  • SAS Viya 2020 und höhere Versionen mit einer MPP-Architektur für AKS

Dieser Leitfaden enthält allgemeine Informationen über das Ausführen von SAS in Azure. Plattformspezifische Informationen sind nicht enthalten. In den hierin enthaltenen Richtlinien wird angenommen, dass Sie Ihre eigene SAS-Lösung in Azure in Ihrem eigenen Mandanten hosten. SAS kann keine Lösung für Sie in Azure hosten. Weitere Informationen über die Hosting- und Verwaltungsdienste für Azure, die von SAS bereitgestellt werden, finden Sie unter Verwaltete Anwendungsdienste von SAS.

Empfehlungen

Berücksichtigen Sie beim Entwerfen Ihrer Implementierung die Informationen in den folgenden Abschnitten.

Die SAS-Dokumentation umfasst Anforderungen pro Kern, d. h. pro physischem CPU-Kern. Azure umfasst jedoch vCPU-Auflistungen. Auf den VMs, die wir für die Verwendung mit SAS empfehlen, gibt es zwei virtuelle CPUs (vCPUs) für jeden physischen Kern. Verwenden Sie daher zum Berechnen des Werts einer vCPU-Anforderung die Hälfte des Anforderungswerts für den Kern. Eine Anforderung von 150 MBit/s für einen physischen Kern ergibt beispielsweise 75 MBit/s pro vCPU. Weitere Informationen über die Azure Computing-Leistung finden Sie unter Azure-Compute-Einheit (ACU).

Hinweis

Wenn Sie Daten in einer SAS-Einzelknotenbereitstellung (und nicht in einem externalisierten Dateisystem) hochskalieren und beibehalten, empfiehlt die SAS-Dokumentation eine Bandbreite von mindestens 150 MB/s. Um diese Bandbreite zu erzielen, müssen Sie ein Stripeset aus mehreren P30 Premium-Datenträgern (oder größer) erzeugen.

Betriebssysteme

Linux ist am besten für die Ausführung von SAS-Workloads geeignet. SAS unterstützt 64-Bit-Versionen der folgenden Betriebssysteme:

  • Red Hat 7 oder höher
  • SUSE Linux Enterprise Server (SLES) 12.2
  • Oracle Linux 6 oder höher

Weitere Informationen über bestimmte SAS-Releases finden Sie in der SAS-Unterstützungsmatrix für Betriebssysteme. In Umgebungen mit mehreren Computern empfiehlt es sich, die gleiche Linux-Version auf allen Computern auszuführen. 32-Bit-Bereitstellungen von Linux werden von Azure nicht unterstützt.

Beginnen Sie mit einem Betriebssystemimage aus dem Azure Marketplace, um die Kompatibilität und Integration mit Azure zu optimieren. Die Verwendung eines benutzerdefinierten Images ohne zusätzliche Konfigurationen kann die SAS-Leistung beeinträchtigen.

Kernelprobleme

Beachten Sie bei der Auswahl eines Betriebssystems, das bei der gesamten Red Hat 7.x-Serie ein Softlockup-Problem auftreten kann. Das Problem tritt in diesen Kernels auf:

  • Linux 3.x-Kernel
  • Versionen vor 4.4

Es wird durch ein Problem mit der Speicher- und E/A-Verwaltung von Linux und Hyper-V verursacht. Wenn dieses Problem auftritt, enthalten die Systemprotokolle Einträge wie diesen, in denen ein nicht maskierbarer Interrupt (NMI) aufgeführt ist:

Message from syslogd@ronieuwe-sas-e48-2 at Sep 13 08:26:08
kernel:NMI watchdog: BUG: soft lockup - CPU#12 stuck for 22s! [swapper/12:0]

Ein weiteres Problem betrifft ältere Red Hat-Versionen. Es kann insbesondere bei Versionen auftreten, die die folgenden Bedingungen erfüllen:

  • Sie verfügen über eine Linux-Kernelversion, die älter als Version 3.10.0-957.27.2 ist.
  • Sie nutzen NVMe-Laufwerke (Non-Volatile Memory Express).

Wenn die Arbeitsspeicherauslastung des Systems hoch ist, weist der generische Linux NVMe-Treiber Schreibvorgängen möglicherweise nicht genügend Arbeitsspeicher zu. Daher meldet das System ein Softlockup-Problem, das tatsächlich auf einen Deadlock zurückzuführen ist.

Aktualisieren Sie Ihren Kernel, um beide Probleme zu vermeiden. Alternativ können Sie auch diese mögliche Problemumgehung ausprobieren:

  • Legen Sie /sys/block/nvme0n1/queue/max_sectors_kb auf 128 fest, anstatt den Standardwert 512 zu verwenden.
  • Ändern Sie diese Einstellung auf jedem NVMe-Gerät des virtuellen Computers und bei jedem VM-Start.

Führen Sie die folgenden Befehle aus, um diese Einstellung anzupassen:

# cat /sys/block/nvme0n1/queue/max_sectors_kb
512
# echo 128 >/sys/block/nvme0n1/queue/max_sectors_kb
# cat /sys/block/nvme0n1/queue/max_sectors_kb
128

Größenempfehlungen für VMs

SAS-Bereitstellungen verwenden häufig die folgenden VM-SKUs:

Edsv5-Serie

Virtuelle Computer der Edsv5-Serie sind die SAS-Standardcomputer für Viya und Grid. Sie bieten die folgenden Funktionen:

  • Eingeschränkte Kerne. Mit vielen Computern dieser Reihe können Sie die vCPU-Anzahl der VMs einschränken.
  • Ein gutes Verhältnis von CPU zu Arbeitsspeicher.
  • Ein lokal angefügter Datenträger mit hohem Durchsatz. Die E/A-Geschwindigkeit ist wichtig für Ordner wie SASWORK und den Cloud Analytics Services-Cache (CAS), CAS_CACHE, der von SAS für temporäre Dateien verwendet wird.

Sollten die virtuellen Computer der Edsv5-Serie nicht verfügbar sein, empfiehlt es sich, die vorherige Generation zu verwenden. Die virtuellen Computer der Edsv4-Serie wurden getestet und eignen sich gut für SAS-Workloads.

Ebsv5-Serie

Manchmal verfügt der lokal angefügte Datenträger nicht über ausreichenden Speicherplatz für SASWORK oder CAS_CACHE. Verwenden Sie virtuelle Computer der Ebsv5-Serie mit angefügten Premium-Datenträgern, um ein größeres Arbeitsverzeichnis zu erhalten. Diese virtuellen Computer bieten folgende Features:

  • Gleiche Spezifikationen wie virtuelle Computer der Edsv5- und Esv5-Serie
  • Hoher Durchsatz von bis zu 4 GB/s für angefügten Remotedatenträger, wodurch die Größe von SASWORK oder CAS_CACHE die E/A-Anforderungen von SAS erfüllt.

Wenn die virtuellen Computer der Edsv5-Serie über genügend Speicherplatz verfügen, empfiehlt es sich, diese zu verwenden, da sie kosteneffizienter sind.

M-Serie

Viele Workloads verwenden VMs der M-Serie, einschließlich:

  • Implementierungen der SAS Programming Runtime Environment (SPRE), bei denen ein Viya-Ansatz für die Softwarearchitektur zum Einsatz kommt.
  • Bestimmte SAS Grid-Workloads.

VMs der M-Serie bieten die folgenden Funktionen:

  • Eingeschränkte Kerne
  • Bis zu 3,8 TiB Arbeitsspeicher, besonders geeignet für Workloads, die eine große Menge an Arbeitsspeicher benötigen
  • Hoher Durchsatz von Daten zu Remote-Datenträgern, besonders gut für den SASWORK-Ordner geeignet, wenn der lokal verfügbare Datenträger nicht ausreicht

Ls-Serie

In bestimmten E/A-intensiven Umgebungen sollten virtuelle Computer der Lsv2-Serie oder der Lsv3-Serie verwendet werden. Insbesondere Implementierungen, die eine hohe E/A-Geschwindigkeit mit geringer Wartezeit sowie eine große Menge an Arbeitsspeicher erfordern, profitieren von diesem Computertyp. Beispiele hierfür sind Systeme, die verstärkt den SASWORK-Ordner oder CAS_CACHE nutzen.

Hinweis

SAS optimiert seine Dienste für die Verwendung mit der Intel Math Kernel-Bibliothek (MKL).

  • Bei rechenintensiven Workloads sollten keine virtuellen Computer ohne Intel-Prozessoren (Lsv2- und Lasv3-Serie) verwendet werden.
  • Überprüfen Sie bei Verwendung einer AMD-CPU die damit verbundene Leistungsfähigkeit der MKL.

Warnung

Lsv2-VMs sollten nach Möglichkeit nicht verwendet werden. Verwenden Sie stattdessen die virtuellen Computer der Lsv3-Serie mit Intel-Chipsätzen.

Mit Azure können Sie SAS Viya-Systeme nach Bedarf skalieren, um Fristen einzuhalten. Dabei haben Sie folgende Möglichkeiten:

  • Die Computekapazität des Knotenpools erhöhen.
  • Die automatische AKS-Clusterskalierung nutzen, um Knoten hinzuzufügen und horizontal zu skalieren.
  • Die Infrastruktur vorübergehend hochskalieren, um eine SAS-Workload zu beschleunigen.

Hinweis

Bei der Skalierung Ihrer Computingkomponenten sollten Sie auch das Hochskalieren des Speichers in Erwägung ziehen, um Speicher-E/A-Engpässe zu vermeiden.

Azure unterstützt derzeit keine horizontale oder vertikale Skalierung von Viya 3.5- und Grid-Workloads. Viya 2022 unterstützt horizontale Skalierung.

Überlegungen zum Netzwerk und zur VM-Platzierung

SAS-Workloads sind in der Regel sehr aktiv („geschwätzig“). Deshalb kann es sein, dass sie erhebliche Datenmengen übertragen. Befolgen Sie bei allen SAS-Plattformen die folgenden Empfehlungen, um die Auswirkungen sehr aktiver („geschwätziger“) Workloads zu reduzieren:

  • Stellen Sie SAS- und Speicherplattformen in demselben virtuellen Netzwerk bereit. Mit diesem Ansatz können ebenfalls Peeringkosten vermieden werden.
  • Platzieren Sie SAS-Computer in einer Näherungsplatzierungsgruppe, um die Latenz zwischen Knoten zu reduzieren.
  • Stellen Sie nach Möglichkeit SAS-Computer und VM-basierte Datenspeicherplattformen in derselben Näherungsplatzierungsgruppe bereit.
  • Stellen Sie SAS- und Speichergeräte in derselben Verfügbarkeitszone bereit, um zonenübergreifende Latenzen zu vermeiden. Wenn Sie nicht bestätigen können, dass Ihre Lösungskomponenten in derselben Zone bereitgestellt werden, wenden Sie sich an den Azure-Support.

SAS stellt spezifische FQDN-Anforderungen an VMs. Legen Sie die FQDNs (vollqualifizierte Domänennamen) des Computers ordnungsgemäß fest und stellen Sie sicher, dass die Domain Name System-Dienste (DNS) funktionieren. Sie können die Namen mithilfe von Azure DNS festlegen. Sie können die hosts-Datei ebenfalls im etc-Konfigurationsordner bearbeiten.

Hinweis

Aktivieren Sie den beschleunigten Netzwerkbetrieb auf allen Knoten der SAS-Bereitstellung. Wenn Sie dieses Feature deaktivieren, wird die Leistung erheblich beeinträchtigt.

Sie können den beschleunigten Netzwerkbetrieb auf einem virtuellen Computer wie folgt aktivieren:

  1. Führen Sie diesen Befehl in der Azure CLI aus, um die Zuordnung des virtuellen Computers aufzuheben:

    az vm deallocate --resource-group <resource_group_name> --name <VM_name>

  2. Deaktivieren Sie den virtuellen Computer.

  3. Führen Sie diesen Befehl in der CLI aus:

    az network nic update -n <network_interface_name> -g <resource_group_name> --accelerated-networking true

Wenn Sie Daten migrieren oder mit SAS in Azure interagieren, sollten Sie eine dieser Lösungen für die Verbindung von lokalen Ressourcen mit Azure verwenden:

Für SAS-Produktionsworkloads in Azure bietet ExpressRoute eine private, dedizierte und zuverlässige Verbindung, die gegenüber einem Site-to-Site-VPN folgende Vorteile hat:

  • Höhere Geschwindigkeit
  • Geringere Latenz
  • Verbesserte Sicherheit

Berücksichtigen Sie Schnittstellen zwischen SAS- und anderen Anwendungen, die anfällig für Wartezeiten sind. Ziehen Sie in Betracht, Datenquellen und -senken in die Nähe von SAS zu verschieben.

Identitätsverwaltung

SAS-Plattformen können lokale Benutzerkonten verwenden. Sie können ebenfalls einen sicheren LDAP-Server verwenden, um Benutzer zu überprüfen. Wir empfehlen den Einsatz eines Domänencontrollers in Azure. Über die Funktion „Domänenbeitritt“ können Sie dann den Sicherheitszugriff ordnungsgemäß verwalten. Wenn Sie keine Domänencontroller eingerichtet haben, sollten Sie die Bereitstellung von Microsoft Entra Domain Services in Erwägung ziehen. Wenn Sie die Funktion „Domänenbeitritt“ verwenden, müssen Sie sicherstellen, dass die Computernamen den Grenzwert von 15 Zeichen nicht überschreiten.

Hinweis

In einigen Umgebungen ist es erforderlich, dass sich lokale und in Azure gehostete SAS-Umgebungen Datasets teilen, oder es muss eine lokale Konnektivität sichergestellt werden. In solchen Situationen wird die Bereitstellung eines Domänencontrollers in Azure dringend empfohlen.

Die Microsoft Entra Domain Services-Gesamtstruktur erstellt Benutzer*innen, die sich zwar bei Microsoft Entra-Geräten authentifizieren können, aber nicht bei lokalen Ressourcen und umgekehrt.

Datenquellen

SAS-Lösungen greifen häufig auf Daten aus mehreren Systemen zu. Diese Datenquellen lassen sich in zwei Kategorien unterteilen:

  • SAS-Datasets, die von SAS im SASDATA-Ordner gespeichert werden
  • Datenbanken, die durch SAS stark ausgelastet werden

Für eine optimale Leistung:

  • Platzieren Sie die Datenquellen so nah wie möglich an der SAS-Infrastruktur.
  • Begrenzen Sie die Anzahl von Netzwerkhops und -geräten zwischen den Datenquellen und der SAS-Infrastruktur.

Hinweis

Wenn Sie die Datenquellen nicht in die Nähe der SAS-Infrastruktur verschieben können, vermeiden Sie die Durchführung von Analysen für diese Quellen. Führen Sie stattdessen zunächst ETL-Prozesse (Extrahieren, Transformieren, Laden) und erst später Analysen durch. Verfolgen Sie den gleichen Ansatz bei Datenquellen, die stark ausgelastet sind.

Permanenter Remotespeicher für SAS-Daten

SAS und Microsoft haben verschiedene Datenplattformen getestet, die Sie zum Hosten von SAS-Datasets verwenden können. In den SAS-Blogs werden die entsprechenden Ergebnisse und die Leistungsmerkmale ausführlich dokumentiert. Die folgenden Plattformen wurden getestet:

SAS bietet Leistungstestskripts für die Viya- und GRID-Architekturen. In den SAS-Foren stehen Dokumentationsunterlagen zu den Tests mit den Skripts auf diesen Plattformen zur Verfügung.

Sycomp Storage Fueled by IBM Spectrum Scale (GPFS)

Informationen darüber, wie Sycomp Storage Fueled by IBM Spectrum Scale die Leistungsanforderungen erfüllt, finden Sie unter SAS-Beurteilung von Sycomp für SAS Grid.

Für Sycomp gelten die folgenden Größenempfehlungen:

  • Stellen Sie pro acht Kernen einen GPFS-Skalierungsknoten mit einer Konfiguration von 150 MBit/s pro Kern bereit.
  • Verwenden Sie mindestens fünf P30-Laufwerke pro Instanz.
Azure Managed Lustre

Azure Managed Lustre ist ein verwaltetes Dateisystem für High Performance Computing (HPC)- und KI-Workloads. Managed Lustre kann SAS 9- und Viya-Workloads parallel ausführen. Befolgen Sie diese Empfehlungen, um die Leistung Ihres Dateisystems zu optimieren:

  • Wenn Sie Managed Lustre bereitstellen, führen Sie die Optimierung auf allen Clientknoten durch, um den Read-Ahead-Wert des Lustre-Clients zu erhöhen und die Parallelität für SAS-E/A-Muster zu optimieren. Verwenden Sie zum Durchführen der Optimierung den folgenden Befehl:

    lctl set_param mdc.*.max_rpcs_in_flight=128 osc.*.max_pages_per_rpc=16M osc.*.max_rpcs_in_flight=16 osc.*.max_dirty_mb=1024 llite.*.max_read_ahead_mb=2048 osc.*.checksums=0  llite.*.max_read_ahead_per_file_mb=256
    
  • Aktivieren Sie auf allen SAS-VMs die Option Beschleunigter Netzwerkbetrieb.

  • Platzieren Sie die SAS-VMs zum Reduzieren der Netzwerklatenz in derselben Verfügbarkeitszone, in der Managed Lustre bereitgestellt wird.

Azure Files Premium-Tarif

Der Azure Files Premium-Tarif ist ein verwalteter Dienst, der das NFS 4.1-Protokoll unterstützt. Er bietet ein kostengünstiges, elastisches, leistungsfähiges und POSIX (Portable Operating System Interface)-kompatibles Dateisystem. IOPS und Durchsatz von NFS-Freigaben werden mit der bereitgestellten Kapazität skaliert. SAS hat den Premium-Tarif von Azure Files umfassend getestet und festgestellt, dass die Leistung mehr als ausreichend ist, um SAS-Installationen zu unterstützen.

Sie können nconnect verwenden, um die Leistung zu verbessern. Bei dieser Einbindungsoption werden E/A-Anforderungen auf mehrere Kanäle verteilt. Weitere Informationen finden Sie unter NFS-Leistung.

Berücksichtigen Sie bei der Verwendung einer Azure-NFS-Dateifreigabe in Azure Files die folgenden Punkte:

  • Passen Sie die bereitgestellte Kapazität entsprechend den Leistungsanforderungen an. IOPS und Durchsatz von NFS-Freigaben werden mit der bereitgestellten Kapazität skaliert. Weitere Informationen finden Sie unter NFS-Leistung.
  • Verwenden Sie nConnect in Ihren Einbindungen mit der Einstellung nconnect=4, um bei der Verwendung paralleler Kanäle eine optimale Leistung zu erzielen.
  • Optimieren Sie die Read-Ahead-Einstellungen, indem Sie sie auf das 15-Fache der rsize- und wsize-Werte festlegen. Für die meisten Workloads werden ein rsize- und wsize-Wert von 1 MB und eine read-ahead-Einstellung von 15 MB empfohlen. Weitere Informationen finden Sie unter Erhöhen der Vorauslesegröße.
Azure NetApp Files (NFS)

Im Rahmen der Tests von SAS wurde die Leistung von NetApp für SAS Grid bestätigt. Die Tests zeigten insbesondere, dass es sich bei Azure NetApp Files um eine geeignete primäre Speicheroption für SAS Grid-Cluster mit bis zu 32 physischen Kernen auf mehreren Computern handelt. Wenn von NetApp bereitgestellte Optimierungen und Linux-Features verwendet werden, kann Azure NetApp Files die primäre Option für Cluster mit bis zu 48 physischen Kernen auf mehreren Computern sein.

Folgendes sollte bei der Nutzung dieses Diensts beachtet werden:

  • Azure NetApp Files funktioniert gut mit Viya-Bereitstellungen. Verwenden Sie Azure NetApp Files jedoch nicht für den CAS-Cache in Viya, da der Schreibdurchsatz dafür nicht ausreichend ist. Verwenden Sie stattdessen nach Möglichkeit den lokalen kurzlebigen Datenträger Ihres virtuellen Computers.
  • Bei SAS 9 Foundation mit Grid 9.4 ist die Leistung von Azure NetApp Files mit SAS für SASDATA-Dateien gut für Cluster mit bis zu 32 physischen Kernen geeignet. Wenn die Optimierung angewendet wird, eignet sie sich für bis zu 48 Kerne.
  • Um eine gute Leistung sicherzustellen, sollten Sie für die Bereitstellung von Azure NetApp Files mindestens einen Servicelevel der Premium- oder Ultra-Speicherebene auswählen. Sie können den Standard-Servicelevel für sehr große Volumes auswählen. Sie können mit dem Premium-Servicelevel beginnen, und später zu Ultra oder Standard wechseln. Änderungen des Servicelevels können online ohne Unterbrechungen oder Datenmigrationen durchgeführt werden.
  • Die Lese- und Schreibleistung ist bei Azure NetApp Files unterschiedlich. Der Schreibdurchsatz für SAS erreicht Grenzwerte von ca. 1.600 MiB/s, während der Lesedurchsatz diesen Wert noch übersteigt und ca. 4.500 MiB/s erreicht. Wenn Sie einen kontinuierlich hohen Schreibdurchsatz benötigen, ist Azure NetApp Files möglicherweise keine geeignete Lösung.
Optimieren der NFS-Read-Ahead-Einstellung

Um die Leistung Ihrer SAS-Workload zu verbessern, ist es wichtig, die Kerneleinstellung read-ahead zu optimieren. Diese Einstellung wirkt sich darauf aus, wie NFS-Freigaben eingebunden werden. Wenn „Read-Ahead” aktiviert ist, kann der Linux-Kernel vor jedem tatsächlichen E/A-Vorgang der Anwendung Blöcke anfordern. Das Ergebnis ist ein verbesserter sequenzieller Lesedurchsatz. Die meisten SAS-Workloads lesen viele große Dateien zur weiteren Verarbeitung, sodass SAS erheblich von großen Read-Ahead-Puffern profitiert.

Bei Linux-Kerneln ab Version 5.4 wurde der Read-Ahead-Standardwert von 15 MB in 128 KB geändert. Der neue Standardwert reduziert die Leseleistung für SAS. Um die Leistung zu maximieren, erhöhen Sie die Read-Ahead-Einstellung auf Ihren SAS-Linux-VMs. SAS und Microsoft empfehlen, den Read-Ahead-Wert auf das 15-Fache des rsize- und wsize-Werts festzulegen. Im Idealfall sind rsize und wsize 1 MB und read-ahead 15 MB.

Das Festlegen der Read-Ahead-Einstellung auf einer VM ist einfach. Es erfordert das Hinzufügen einer udev-Regel.

Für Kubernetes ist dieser Prozess komplexer, da er auf dem Host und nicht auf dem Pod durchgeführt werden muss. SAS stellt Skripts für Viya auf AKS bereit, die den Read-Ahead-Wert bei der Bereitstellung automatisch festlegen. Weitere Informationen finden Sie unter Using NFS Premium shares in Azure Files for SAS Viya on Kubernetes (Verwenden von NFS-Premium-Freigaben in Azure Files für SAS Viya auf Kubernetes).

Andere Datenquellen

SAS-Plattformen unterstützen verschiedene Datenquellen:

Überlegungen

Diese Überlegungen beruhen auf den Säulen des Azure Well-Architected Frameworks, d. h. einer Reihe von Grundsätzen, mit denen die Qualität von Workloads verbessert werden kann. Weitere Informationen finden Sie unter Microsoft Azure Well-Architected Framework.

Sicherheit

Sicherheit bietet Schutz vor vorsätzlichen Angriffen und dem Missbrauch Ihrer wertvollen Daten und Systeme. Weitere Informationen finden Sie unter Übersicht über die Säule „Sicherheit“.

Bei der Ausgabe Ihrer SAS-Workloads kann es sich um eine für Ihre Organisation kritische Ressource handeln. Die SAS-Ausgabe gibt Aufschluss über die interne Effizienz und kann eine wichtige Rolle bei Ihrer Berichterstellungsstrategie spielen. Deshalb ist es wichtig, den Zugriff auf Ihre SAS-Architektur zu sichern. Um dieses Ziel zu erreichen, sollten Sie eine sichere Authentifizierungsmethode nutzen und Netzwerksicherheitsrisiken beheben. Verwenden Sie eine Verschlüsselung, um sämtliche ein- und ausgehenden Daten in Ihrer Architektur zu schützen.

Azure stellt SAS mithilfe eines IaaS-Cloudmodells (Infrastructure-as-a-Service) bereit. Auf den folgenden Ebenen wurden Sicherheitsmaßnahmen von Microsoft in den Dienst integriert:

  • Physisches Rechenzentrum
  • Physisches Netzwerk
  • Physischer Host
  • Hypervisor

Bewerten Sie die Dienste und Technologien, die Sie für die Bereiche oberhalb des Hypervisors auswählen (z. B. das Gastbetriebssystem für SAS) sehr sorgfältig. Stellen Sie sicher, dass Sie die richtigen Sicherheitskontrollen für Ihre Architektur einsetzen.

SAS unterstützt Microsoft Entra ID derzeit nicht vollständig. Sie können Microsoft Entra ID für die Authentifizierung in der Visualisierungsebene von SAS verwenden. Für die Back-End-Autorisierung sollten Sie jedoch eine Strategie nutzen, die einer lokalen Authentifizierung ähnelt. Wenn Sie IaaS-Ressourcen verwalten, können Sie Microsoft Entra ID für die Authentifizierung und Autorisierung beim Azure-Portal verwenden. Wenn Sie Microsoft Entra Domain Services verwenden, können Sie keine Gastkonten authentifizieren. Anmeldeversuche als Gast werden dementsprechend fehlschlagen.

Nutzen Sie Netzwerksicherheitsgruppen, um Netzwerkdatenverkehr von und zu Ressourcen in Ihrem virtuellen Netzwerk zu filtern. Mit diesen Gruppen können Sie Regeln definieren, auf deren Grundlage der Zugriff auf Ihre SAS-Dienste gewährt oder verweigert wird. Beispiele:

  • Zugriff von lokalen IP-Adressbereichen auf CAS-Workerports gewähren.
  • Zugriff aus dem Internet auf SAS-Dienste blockieren.

Sie können Azure Disk Encryption für die Verschlüsselung innerhalb des Betriebssystems verwenden. Diese Lösung verwendet die DM-Crypt-Funktion von Linux. Die Verwendung von Azure Disk Encryption wird derzeit jedoch nicht empfohlen. Die Leistung kann dadurch erheblich beeinträchtigt werden, insbesondere wenn Sie SASWORK-Dateien lokal nutzen.

Die serverseitige Verschlüsselung (Server-Side Encryption, SSE) von Azure Disk Storage schützt Ihre Daten. Die Funktion unterstützt Sie ebenfalls bei der Erfüllung der Sicherheits- und Complianceverpflichtungen Ihrer Organisation. Bei verwalteten Azure-Datenträgern verschlüsselt SSE die ruhenden Daten, wenn diese in der Cloud gespeichert werden. Dieses Verhalten gilt standardmäßig für Betriebssystem- und andere Datenträger. Sie können entweder plattformverwaltete Schlüssel oder Ihre eigenen Schlüssel für die Verschlüsselung Ihres verwalteten Datenträgers verwenden.

Schützen Ihrer Infrastruktur

Kontrollieren Sie den Zugriff auf die von Ihnen bereitgestellten Azure-Ressourcen. Jedes Azure-Abonnement verfügt über eine Vertrauensbeziehung zu einem Microsoft Entra-Mandanten. Verwenden Sie die rollenbasierte Zugriffssteuerung von Azure (Azure Role-Based Access Control, Azure RBAC), um Benutzern in Ihrer Organisation die richtigen Berechtigungen für Azure-Ressourcen zu gewähren. Gewähren Sie Zugriff, indem Sie Benutzern oder Gruppen die entsprechenden Azure-Rollen für einen bestimmten Bereich zuweisen. Bei dem Bereich kann es sich um ein Abonnement, eine Ressourcengruppe oder eine einzelne Ressource handeln. Stellen Sie sicher, dass Sie alle Änderungen an der Infrastruktur überwachen.

Verwalten Sie den Remotezugriff auf Ihre VMs über Azure Bastion. Machen Sie keine dieser Komponenten über das Internet verfügbar:

  • VMs
  • SSH-Ports (Secure Shell-Protokoll)
  • RDP-Ports (Remotedesktopprotokoll)

Bereitstellen dieses Szenarios

Es empfiehlt sich, Workloads mithilfe eines IaC-Prozesses (Infrastructure-as-Code) bereitzustellen. SAS-Workloads können anfällig für Fehlkonfigurationen sein. Diese treten vor allem bei manuellen Bereitstellungen auf und verringern die Produktivität deutlich.

Nutzen Sie zum Erstellen Ihrer Umgebung das Schnellstart-Referenzmaterial unter CoreCompete SAS 9 oder Viya in Azure.

Beitragende

Dieser Artikel wird von Microsoft gepflegt. Er wurde ursprünglich von folgenden Mitwirkenden geschrieben:

Hauptautoren:

Andere Mitwirkende:

Melden Sie sich bei LinkedIn an, um nicht öffentliche LinkedIn-Profile anzuzeigen.

Nächste Schritte

Hilfe für die ersten Schritte finden Sie in den folgenden Artikeln:

Hilfe zum Automatisierungsprozess finden Sie in den folgenden von SAS zur Verfügung gestellten Vorlagen: