Parallele Data Warehouse-Komponenten: Analyseplattformsystem

In diesem Artikel werden die Anwendung Software und die nicht Anwendung Softwarekomponenten des Analytics Platform Systems erläutert.

Parallel Data Warehouse software

Appliance-Software – Abfrageverarbeitung und Benutzerdatenspeicherung

Steuerknoten

MPP-Modul
Die MPP Engine ist das Gehirn des Massively Parallel Processing (MPP)-Systems. Sie führt die folgenden Aktionen aus:

  • Erstellt parallele Abfragepläne und koordiniert die parallele Abfrageausführung auf den Computeknoten.

  • Speichert Und koordiniert Metadaten und Konfigurationsdaten für alle Datenbanken.

  • Verwaltet die SQL Server PDW-Datenbankauthentifizierung und -Autorisierung.

  • Verfolgt den Hardware- und Softwarestatus nach.

Data Movement Service (DMS)

Data Movement Service (DMS) ist Teil der "geheimen Sauce" von PDW. Sie führt die folgenden Aktionen aus:

  • Überträgt Daten an und von den SQL Server-PDW-Knoten.

  • Verarbeitet Abfragevorgänge, die das Übertragen von Daten zwischen den Knoten erfordern.

  • Verbessert die Abfrageleistung, indem die Datenübertragungsgeschwindigkeiten optimiert werden.

Verwaltungskonsole

Die Admin-Konsole ist eine Webanwendung, die die Anwendung Status-, Integritäts- und Leistungsinformationen darstellt.

Konfigurations-Manager

Der Configuration Manager (dwconfig.exe) ist das Tool, das Anwendung Administratoren zum Konfigurieren des Analytics Platform-Systems verwenden.

Steuerelementknotendatenbanken

SQL Server verwaltet alle Datenbanken auf dem Knoten "Steuerelement".

  • Die Shelldatenbank verwaltet die Metadaten für alle verteilten Benutzerdatenbanken.

  • TempDB enthält die Metadaten für alle temporären Benutzertabellen in den Anwendung.

  • Master ist die Mastertabelle für SQL Server auf dem Knoten "Steuerelement".

Computeknoten

Die Computeknoten sind parallele Datenverarbeitungs- und Speichereinheiten. Sie verfügen über direkten angefügten Speicher und verwenden SQL Server zum Verwalten von Benutzerdaten.

Data Movement Service (DMS)

Der Data Movement Service (DMS) wird auf jedem Computeknoten ausgeführt, um Folgendes auszuführen:

  • Im Rahmen der Verarbeitung paralleler Abfragen übertragen DMS Daten an und von anderen Computerknoten und dem Steuerelementknoten.

  • DMS, die auf jedem Computeknoten ausgeführt wird, empfängt datenladevorgänge parallel. Daten werden parallel vom Ladeserver in die Computeknoten geladen.

  • DMS überträgt Daten von jedem Computeknoten direkt an den Sicherungsserver.

  • Mithilfe von PolyBase überträgt DMS Daten an und von einem externen Hadoop-Cluster oder Azure Storage Blob.

Computeknotendatenbanken

Jeder Computeknoten führt eine Instanz von SQL Server aus, um Abfragen zu verarbeiten und Benutzerdaten zu verwalten.

Appliance Fabric

Die Anwendung Fabric stellt das Betriebssystem, die Dienste und die Netzwerkinfrastruktur für die Anwendung bereit.

Domänencontroller

Active Directory (AD) Do Standard Services (DS)
Das Analytics Platform System führt die Authentifizierung zwischen den Analytics Platform System-Knoten durch und verwaltet die Authentifizierung von SQL Server PDW-Windows-Authentifizierungsanmeldungen.

DNS-Dienst
Windows Do Standard Name Service (DNS) löst Namen Standard in IP-Adressen für das Analytics Platform System Anwendung auf.

Windows-Bereitstellungsdienst

Der Windows-Bereitstellungsdienst (Windows Deployment Service, WDS) stellt das Windows Server-Betriebssystem auf dem Anwendung bereit. Sie wird auf jedem Host und virtuellen Computer über die Anwendung bereitgestellt.

Der DHCP-Dienst erstellt IP-Adressen, sodass die Hosts innerhalb der Anwendung dies tun Standard können dem Anwendung Netzwerk beitreten, ohne dass eine vorkonfigurierte IP-Adresse vorhanden ist.

Virtual Machine Manager

Analytics Platform System verwendet Virtualisierung, um hohe Verfügbarkeit zu erzielen. Der Virtual Machine Manager hostt System Center, um das Betriebssystem auf den physischen Hosts bereitzustellen.

Windows Server Update Services (WSUS), um Windows-Updates auf allen Hosts und virtuellen Computern anzuwenden oder zu entfernen.

Windows Server

Alle Hosts und virtuellen Computer im Anwendung Windows Server-Betriebssystem ausführen.

Failoverclustering

Windows-Failoverclustering bietet die Möglichkeit, Prozesse auf einem passiven Host neu zu starten, wenn ein Host fehlschlägt.

Speicherplätze

Windows Speicherplätze verwaltet Benutzerdaten als Speicherpool für eine kleine Gruppe von Computeknoten. Wenn ein Computeknoten fehlschlägt, kann auf die Daten weiterhin über einen anderen Computeknoten in der Gruppe zugegriffen werden.

Hyper-V

Microsoft Hyper-V Server bietet eine einfache und zuverlässige Virtualisierungslösung. Analytics Platform System verwendet Virtualisierungen zum Ausgleich von CPU-Ressourcen und zur Bereitstellung einer hohen Verfügbarkeit für die PDW-Knoten und Anwendung Fabric-Komponenten.

Nicht relationale Daten

Die PolyBase-Technologie integriert SQL Server-PDW-Daten in externe Hadoop-Daten. Die Hadoop-Daten können in einer dieser Hadoop-Datenquellen gespeichert werden:

  • Hortonworks Hadoop Distribution

  • Cloudera Distribution von Hadoop

  • HDInsight-Daten, die in Azure Storage Blob gespeichert sind

Abfragetools

Abfragen werden mit Transact-SQL geändert, um die MPP-Natur der Abfragen anzupassen. Alle Abfragen werden an den Knoten "Control" übermittelt, der einen parallelen Abfrageplan generiert, um die Abfrage über die Computeknoten hinweg auszuführen.

SQL Server Data Tools (SSDT)

SQL Server Data Tools wird in Visual Studio ausgeführt und ist unser empfohlenes GUI-Tool zum Übermitteln von Abfragen an SQL Server PDW. Es ähnelt SQL Server Management Studio, indem Sie durch einen Objekt-Explorer navigieren können.

Wenn Sie noch nicht über Visual Studio verfügen, können Sie die tools herunterladen, die Sie kostenlos benötigen.

sqlcmd-Befehlszeilenabfragetool

sqlcmd ist das SQL Server-Befehlszeilentool zum Ausführen von Transact-SQL-Anweisungen und Systembefehlen. Es funktioniert mit SQL Server PDW und ist unser empfohlenes Befehlszeilentool zum Abfragen von SQL Server PDW. Mit sqlcmd können Sie Transact-SQL-Anweisungen interaktiv über die Befehlszeile, als Batchdatei oder über Windows PowerShell ausführen.

Integrationsdienste

Sie können Integration Services verwenden, um SQL Server PDW abzufragen.

Verknüpfter Server

Mithilfe einer SQL Server-Verknüpften Serververbindung können Sie SQL Server verwenden, um Transact-SQL-Anweisungen an SQL Server PDW zu übermitteln.

Business Intelligence-Tools

Analysis Services

SQL Server PDW ist eine gültige Datenquelle für Analysis Services-Datenbanken und Excel PowerPivot-Modelle. Mit dem OLE DB-Anbieter können Sie einen Analysis Services-Cube so konfigurieren, dass entweder mehrdimensionale Onlineanalyseverarbeitung (MOLAP) oder relationaler RoLAP-Speicher (Online Analytical Processing) verwendet wird.

Report Builder (Berichts-Generator)

Sie können SQL Server PDW als SQL Server-Datenquelle für Berichte verwenden, die Sie für Reporting Services mithilfe von SQL Server Berichts-Generator entwickeln. Sie können SQL Server PDW auch als SQL Server-Quelle für Berichtsmodelle verwenden. Mithilfe des Berichts-Managers oder der Berichtsserver-API können Sie ein Modell aus einer SQL Server-PDW-Datenbank generieren.

Power Pivot für Excel

Sie können eine Verbindung mit SQL Server PDW mit PowerPivot für Excel herstellen, einem kostenlosen Download, der die Datenanalysefunktionen von Excel erheblich erweitert.

Laden von Tools

Integrationsdienste

Installieren Sie analytics Platform System (PDW)-spezifische Zieladapter, mit denen Sie SQL Server Integration Services verwenden können, um Daten in Analytics Platform System (PDW) zu laden.

Dwloader-Befehlszeilenladeprogramm

dwloader ist ein Befehlszeilenladetool, das Daten parallel vom Ladeserver in die SQL Server PDW Compute-Knoten lädt.

PolyBase für Hadoop-Integration

Mit polyBase-Technologie können Sie nicht relationale Daten aus einem Hadoop-Cluster in eine relationale Tabelle in SQL Server PDW laden. Die Hadoop-Daten können sich in einem externen Hadoop-Cluster oder in Azure Blob Storage befinden.

Datenbanksicherung und -wiederherstellung

SQL Server PDW verwendet Transact-SQL-Datenbanksicherungs- und Wiederherstellungsbefehle zum Sichern und Wiederherstellen von Benutzerdatenbanken parallel zu und von einem Sicherungsserver. SQL Server PDW schreibt die Sicherung in ein Verzeichnis in einer Windows-Dateifreigabe und stellt dann auch Daten aus einer Windows-Dateifreigabe wieder her.

Weitere Informationen finden Sie unter Plan for Backup and Loading Hardware and Backup and Restore Overview

Remotetabellenkopie

Mit dem Feature "Remotetabellenkopie" können Sie Tabellen aus SQL Server-PDW-Datenbanken in Remotedatenbanken (nicht Anwendung) SMP SQL Server-Datenbanken kopieren. Dies ermöglicht Hub- und Speichenszenarien für SQL Server PDW.

Überwachung

Analytics Platform System verfügt über verschiedene Möglichkeiten, Anwendung Aktivitäten zu überwachen.

Verwaltungskonsole

Mit der Admin-Konsole können Sie den aktuellen Status zu Anwendung Integrität anzeigen. Dies wird als Webanwendung auf dem Knoten "Steuerelement" ausgeführt und kann über https zugänglich sein.

Weitere Informationen finden Sie unter Überwachen der Appliance mithilfe der Admin Console (Analytics Platform System)

Systemansichten

Die Verwaltungskonsole basiert auf Systemansichtsabfragen. Sie können die Systemansichten einzeln abfragen, um die spezifischen Informationen abzurufen, die Sie benötigen.

Weitere Informationen finden Sie unter Überwachen der Appliance mithilfe von Systemansichten (Analytics Platform System)

System Center Operations Manager

Es gibt System Center Operations Manager (SCOM) Management Packs für SQL Server PDW.

Informationen zum Konfigurieren der Anwendung für SCOM finden Sie unter Überwachen der Appliance mithilfe von System Center Operations Manager (Analytics Platform System)