Cluster di Big Data
Cluster Big Data di SQL Server 2019 è la piattaforma dati aperta e multicloud per l'analisi su qualsiasi scala. Cluster Big Data unisce SQL Server con Apache Spark per offrire i migliori motori di calcolo disponibili per l'analisi in un'unica distribuzione facile da usare. Con questi motori, cluster Big Data è la piattaforma dati ideale per intelligenza artificiale, ML, M/R, Streaming, BI, T-SQL e Spark. Distribuito come parte della versione di SQL Server 2019, cluster Big Data è una soluzione nativa del cloud orchestrata da Kubernetes. La nostra missione è accelerare, deliziare e potenziare i nostri utenti in modo da soddisfare la loro sete di informazioni dettagliate basate sui dati. Il componente aggiuntivo per i cluster Big Data di Microsoft SQL Server 2019 verrà ritirato. Il supporto per i cluster Big Data di SQL Server 2019 terminerà il 28 febbraio 2025.
Informazioni sui Cluster Big Data
Architettura
Panoramica
Novità
video
Avvio rapido
Caricare i dati
Guida pratica
Concetto
Esercitazione
Big Data e ML
Concetto
Guida pratica
- Creare, esportare e assegnare punteggi ai modelli Spark ML
- Gestione delle librerie Spark
- Sparklyr da RStudio
- Guida a Spark Streaming
- Delta Lake
Esercitazione
Architetto
Architettura
Guida pratica
- Distribuzione
- Distribuzione su AKS con Notebook
- Configurare le impostazioni di distribuzione
- Configurare le impostazioni dopo la distribuzione
- Eseguire la distribuzione offline
- Distribuire un cluster privato
- Aggiornamento
Avvio rapido
- Distribuire nel servizio Azure Kubernetes
- Distribuire su Azure Red Hat OpenShift (ARO)
- Distribuire in OpenShift
Esercitazione
Amministrazione e registrazione
Panoramica
Concetto
- Monitorare il cluster con Grafana
- Visualizzare i log con Kibana
- Notebook di monitoraggio del cluster
Esercitazione
Guida pratica
Protezione
Panoramica
Guida pratica
- Connessione
- Connessione in modalità AD
- Distribuire Active Directory
- Gestire le autorizzazioni HDFS
- Rotazione delle password di AD