Componenti del Parallel Data Warehouse - piattaforma di strumenti analitici

Questo articolo illustra il software dell'appliance e i componenti software non appliance della piattaforma di strumenti analitici.

Parallel Data Warehouse software

Software appliance - Elaborazione query e Archiviazione dati utente

Nodo di controllo

motore MPP
Il motore MPP è il cervello del sistema Massively Parallel Processing (MPP). Esegue le operazioni seguenti:

  • Crea piani di query paralleli e coordina l'esecuzione di query parallele nei nodi di calcolo.

  • Archivia e coordina i metadati e i dati di configurazione per tutti i database.

  • Gestisce l'autenticazione e l'autorizzazione del database SQL Server PDW.

  • Tiene traccia dello stato hardware e software.

Servizio postamento dati (DMS)

Servizio postamento dati (DMS) è "l’ingrediente segreto" di PDW. Esegue le operazioni seguenti:

  • Trasferisce i dati da e verso i nodi SQL Server PDW.

  • Elabora le operazioni di query che richiedono il trasferimento dei dati tra i nodi.

  • Migliora le prestazioni delle query ottimizzando la velocità di trasferimento dei dati.

Console di amministrazione

La console di amministrazione è un'applicazione Web che presenta le informazioni sullo stato dell'appliance, l'integrità e le prestazioni.

Gestione configurazione

Gestione configurazione (dwconfig.exe) è lo strumento usato dagli amministratori dell'appliance per configurare la piattaforma di strumenti analitici.

Controllare i database dei nodi

SQL Server gestisce tutti i database nel nodo di controllo.

  • Il database shell gestisce i metadati per tutti i database utente distribuiti.

  • TempDB contiene i metadati per tutte le tabelle temporanee dell'utente nell'appliance.

  • Master è la tabella master per SQL Server nel nodo di controllo.

Nodo di calcolo

I nodi di calcolo sono unità di elaborazione dati parallele e di archiviazione. Hanno una risorsa di archiviazione collegata diretta e usano SQL Server per gestire i dati utente.

Servizio postamento dati (DMS)

Il Servizio postamento dati (DMS) viene eseguito su ogni nodo di calcolo per svolgere le seguenti funzioni:

  • Nell'ambito dell'elaborazione delle query parallele, i DMS trasferiscono i dati da e verso gli altri nodi del computer e il nodo di controllo.

  • DMS, in esecuzione su ciascun nodo di calcolo, riceve i carichi di dati in parallelo. I dati vengono caricati in parallelo direttamente dal server di caricamento ai nodi di calcolo

  • DMS trasferisce i dati da ciascun nodo di calcolo direttamente al server di backup.

  • Utilizzando PolyBase, DMS trasferisce i dati da e verso un cluster Hadoop esterno o un BLOB del servizio di archiviazione di Azure.

Database dei nodi di calcolo

Ogni nodo di calcolo esegue un'istanza di SQL Server per elaborare le query e gestire i dati utente.

Infrastruttura dell'appliance

L'infrastruttura dell'appliance fornisce il sistema operativo, i servizi e l'infrastruttura di rete per l'appliance.

Controller di dominio

Active Directory (AD) Domain Services (DS)
La piattaforma di strumenti analitici esegue l'autenticazione tra i nodi della piattaforma di strumenti analitici e gestisce l'autenticazione degli account di accesso di Autenticazione windows di SQL Server PDW.

Servizio DNS
Windows Domain Name Service (DNS) risolve i nomi di dominio negli indirizzi IP per l'appliance della piattaforma di strumenti analitici.

Windows Deployment Services

Windows Deployment Service (WDS) distribuisce il sistema operativo Windows Server nell'appliance. Viene distribuito in ogni host e macchina virtuale nell'appliance.

Il servizio DHCP crea indirizzi IP in modo che gli host all'interno del dominio dell'appliance possano essere aggiunti alla rete dell'appliance senza avere un indirizzo IP preconfigurato.

Virtual Machine Manager

La piattaforma di strumenti analitici usa la virtualizzazione per ottenere disponibilità elevata. Virtual Machine Manager ospita System Center per distribuire il sistema operativo negli host fisici.

Windows Server Update Services (WSUS) per applicare o rimuovere Windows Update in tutti gli host e le macchine virtuali.

Windows Server

Tutti gli host e le macchine virtuali nell'appliance eseguono il sistema operativo Windows Server.

Clustering di failover

Windows Failover Clustering consente di riavviare i processi in un host passivo nel caso in cui un host fallisca.

Spazi di archiviazione

Windows Storage Spaces gestisce i dati degli utenti come pool di archiviazione per un piccolo gruppo di nodi di calcolo. Se un nodo di calcolo si guasta, i dati sono ancora accessibili attraverso un altro nodo di calcolo del gruppo.

Hyper-V

Microsoft Hyper-V Server offre una soluzione di virtualizzazione semplice e affidabile. La piattaforma di strumenti analitici utilizza le virtualizzazioni per bilanciare le risorse della CPU e fornire un'elevata disponibilità ai nodi PDW e ai componenti dell’infrastruttura dell'appliance.

Dati non relazionali

La tecnologia PolyBase integra i dati SQL Server PDW con dati Hadoop esterni. I dati hadoop possono essere archiviati in una di queste origini dati Hadoop:

  • Distribuzione di Hortonworks Hadoop

  • Distribuzione cloudera di Hadoop

  • Dati di HDInsight archiviati su BLOB del servizio di archiviazione di Azure

Strumenti di query

Le query vengono scritte con Transact-SQL modificato per adattarsi alla natura MPP delle query. Tutte le query vengono inviate al nodo di controllo, che genera un piano di query parallelo per eseguire la query tra i nodi di calcolo.

SQL Server Data Tools (SSDT)

SQL Server Data Tools viene eseguito all'interno di Visual Studio ed è lo strumento GUI consigliato per l'invio di query a SQL Server PDW. È simile a SQL Server Management Studio e consente di navigare attraverso un esploratore di oggetti.

Se Visual Studio non è già disponibile, è possibile scaricare gratuitamente gli strumenti necessari.

Strumento di query da riga di comando sqlcmd

sqlcmd è lo strumento da riga di comando di SQL Server per l'esecuzione di istruzioni Transact-SQL e comandi di sistema. Funziona con SQL Server PDW ed è lo strumento da riga di comando consigliato per l'esecuzione di query su SQL Server PDW. Con sqlcmd è possibile eseguire istruzioni Transact-SQL in modo interattivo dalla riga di comando, come file batch o da Windows PowerShell.

Integration Services

È possibile usare Integration Services per eseguire query su SQL Server PDW.

Server collegato

Usando una connessione al server collegato di SQL Server, è possibile usare SQL Server per inviare istruzioni Transact-SQL a SQL Server PDW.

Strumenti di business intelligence

Analysis Services

SQL Server PDW è un'origine dati valida per i database di Analysis Services e i modelli PowerPivot di Excel. Utilizzando il provider OLE DB, è possibile configurare un cubo di Analysis Services per utilizzare l'elaborazione analitica online multidimensionale (archiviazione MOLAP) o l'elaborazione analitica online relazionale (archiviazione ROLAP).

Generatore report

È possibile usare SQL Server PDW come origine dati di SQL Server per i report sviluppati per servizio di creazione report tramite SQL Server Generatore report. È anche possibile usare SQL Server PDW come origine di SQL Server per i modelli di report. Usando Gestione report o l'API del server di report, è possibile generare un modello da un database SQL Server PDW.

Power Pivot per Excel

È possibile connettersi a SQL Server PDW con PowerPivot per Excel, un download gratuito che espande significativamente le funzionalità di analisi dei dati di Excel.

Strumenti di caricamento

Integration Services

Installare gli adattatori di destinazione specifici per la piattaforma di strumenti analitici (PDW) che consentono di utilizzare SQL Server Integration Services per caricare i dati nella piattaforma di strumenti analitici (PDW).

Caricatore da riga di comando dwloader

dwloader è uno strumento di caricamento da riga di comando che carica i dati in parallelo dal server di caricamento ai nodi di calcolo SQL Server PDW.

Integrazione di PolyBase per Hadoop

Con la tecnologia PolyBase è possibile caricare dati non relazionali da un cluster Hadoop a una tabella relazionale in SQL Server PDW. I dati Hadoop possono trovarsi in un cluster Hadoop esterno o in Archiviazione BLOB di Azure.

Backup e ripristino di database

SQL Server PDW utilizza i comandi Transact-SQL di backup e ripristino dei database per eseguire il backup e il ripristino dei database utente, in parallelo, da e verso un server di backup. SQL Server PDW scrive il backup in una directory in una condivisione file di Windows e quindi ripristina i dati da una condivisione file di Windows.

Per ulteriori informazioni, vedere Pianificazione del backup e del caricamento dell'hardware e Panoramica su backup e ripristino.

Copia di tabelle remote

La funzionalità Copia tabella remota consente di copiare tabelle da database SQL Server PDW a database SMP SQL Server remoti (non appliance). Ciò consente scenari hub-spoke per SQL Server PDW.

Monitoraggio

La piattaforma di strumenti analitici offre diversi modi per monitorare l'attività dell'appliance

Console di amministrazione

La console di amministrazione consente di visualizzare lo stato corrente sull'integrità dell'appliance. Questa operazione viene eseguita come applicazione Web nel nodo di controllo ed è accessibile tramite https.

Per altre informazioni, vedere Monitorare l'appliance usando la console di amministrazione (piattaforma di strumenti analitici)

Visualizzazioni di sistema

La console di amministrazione si basa sulle query di visualizzazione di sistema. È possibile eseguire query sulle visualizzazioni di sistema singolarmente per ottenere le informazioni specifiche necessarie.

Per altre informazioni, vedere Monitorare l'appliance usando visualizzazioni di sistema (piattaforma di strumenti analitici)

System Center Operations Manager

Sono disponibili Management Pack di System Center Operations Manager (SCOM) per SQL Server PDW.

Per configurare l'appliance per SCOM, vedere Monitorare l'appliance usando System Center Operations Manager (piattaforma di strumenti analitici)