Komponen Gudang Data Paralel - Sistem Platform Analitik
Artikel ini menjelaskan perangkat lunak appliance dan komponen perangkat lunak non-appliance dari Analytics Platform System.
Perangkat Lunak Appliance - Pemrosesan Kueri dan Penyimpanan Data Pengguna
Simpul Kontrol
Mesin MPP
Mesin MPP adalah otak dari sistem Massively Parallel Processing (MPP). Langkah tersebut dapat:
Membuat rencana kueri paralel dan mengoordinasikan eksekusi kueri paralel pada simpul Komputasi.
Menyimpan dan mengoordinasikan metadata dan data konfigurasi untuk semua database.
Mengelola autentikasi dan otorisasi database PDW SQL Server.
Melacak status perangkat keras dan perangkat lunak.
Layanan Pergerakan Data (DMS)
Data Movement Service (DMS) adalah bagian dari "saringan rahasia" PDW. Langkah tersebut dapat:
Mentransfer data ke dan dari simpul SQL Server PDW.
Memproses operasi kueri yang memerlukan transfer data di antara simpul.
Meningkatkan performa kueri dengan mengoptimalkan kecepatan transfer data.
Konsol Admin
Konsol Admin adalah aplikasi web yang menyajikan status appliance, kesehatan, dan informasi performa.
Manajer Konfigurasi
Configuration Manager (dwconfig.exe), adalah alat yang digunakan administrator appliance untuk mengonfigurasi Sistem Platform Analitik.
Mengontrol database simpul
SQL Server mengelola semua database pada simpul Kontrol.
Database Shell mengelola metadata untuk semua database pengguna terdistribusi.
TempDB berisi metadata untuk semua tabel sementara pengguna di seluruh appliance.
Master adalah tabel master untuk SQL Server pada simpul Kontrol.
Simpul Komputasi
Simpul Komputasi adalah unit pemrosesan data dan penyimpanan paralel. Mereka memiliki penyimpanan terlampir langsung dan menggunakan SQL Server untuk mengelola data pengguna.
Layanan Pergerakan Data (DMS)
Data Movement Service (DMS) berjalan pada setiap simpul Komputasi untuk melakukan hal berikut:
Sebagai bagian dari pemrosesan kueri paralel, DMS mentransfer data ke dan dari simpul Komputer lainnya dan simpul Kontrol.
DMS, yang berjalan pada setiap simpul Komputasi, menerima pemuatan data secara paralel. Data dimuat secara paralel langsung dari server pemuatan ke simpul Komputasi
DMS mentransfer data dari setiap simpul Komputasi langsung ke server cadangan.
Menggunakan PolyBase, DMS mentransfer data ke dan dari kluster Hadoop eksternal atau Azure Storage Blob.
Database simpul komputasi
Setiap simpul Komputasi menjalankan instans SQL Server untuk memproses kueri dan mengelola data pengguna.
Appliance Fabric
Fabric appliance menyediakan sistem operasi, layanan, dan infrastruktur jaringan untuk appliance.
Pengendali Domain
Active Directory (AD) Domain Services (DS)
Sistem Platform Analitik melakukan autentikasi di antara simpul Sistem Platform Analitik, dan mengelola autentikasi login Autentikasi Windows SQL Server PDW.
Layanan DNS
Windows Domain Name Service (DNS) menyelesaikan nama domain ke alamat IP untuk appliance Sistem Platform Analitik.
Windows Deployment Service
Windows Deployment Service (WDS) menyebarkan sistem operasi Windows Server ke appliance. Ini disebarkan pada setiap host dan komputer virtual di seluruh appliance.
Layanan DHCP membuat alamat IP sehingga host dalam domain appliance dapat bergabung dengan jaringan appliance tanpa memiliki alamat IP yang telah dikonfigurasi sebelumnya.
Pengelola Mesin Virtual
Sistem Platform Analitik menggunakan virtualisasi untuk mencapai ketersediaan tinggi. Manajer Komputer Virtual menghosting Pusat Sistem untuk menyebarkan sistem operasi pada host fisik.
Windows Server Update Services (WSUS) untuk menerapkan atau menghapus Pembaruan Windows di semua host dan komputer virtual.
Windows Server
Semua host dan komputer virtual dalam appliance menjalankan sistem operasi Windows Server.
Pengklusteran Failover
Pengklusteran Failover Windows menyediakan kemampuan untuk memulai ulang proses pada host pasif jika host gagal.
Ruang Penyimpanan
Ruang Penyimpanan Windows mengelola data pengguna sebagai kumpulan penyimpanan untuk sekelompok kecil simpul Komputasi. Jika simpul Komputasi gagal, data masih dapat diakses melalui simpul Komputasi lain dalam grup.
Hyper-V
Microsoft Hyper-V Server menyediakan solusi virtualisasi yang sederhana dan andal. Sistem Platform Analitik menggunakan virtualisasi untuk menyeimbangkan sumber daya CPU dan menyediakan ketersediaan tinggi untuk node PDW dan komponen kain appliance.
Data non-relasional
Teknologi PolyBase mengintegrasikan data SQL Server PDW dengan data Hadoop eksternal. Data Hadoop dapat disimpan di salah satu sumber Data Hadoop ini:
Distribusi Hortonworks Hadoop
Distribusi Cloudera Hadoop
Data HDInsight yang disimpan di Azure Storage Blob
Alat Kueri
Kueri ditulis dengan Transact-SQL yang dimodifikasi agar sesuai dengan sifat MPP kueri. Semua kueri dikirimkan ke simpul Kontrol, yang menghasilkan rencana kueri paralel untuk menjalankan kueri di seluruh simpul Komputasi.
SQL Server Data Tools (SSDT)
SQL Server Data Tools berjalan di dalam Visual Studio dan merupakan alat GUI yang direkomendasikan untuk mengirimkan kueri ke SQL Server PDW. Ini mirip dengan SQL Server Management Studio dengan memungkinkan Anda menavigasi melalui penjelajah objek.
Jika Anda belum memiliki Visual Studio, Anda dapat mengunduh alat yang Anda butuhkan secara gratis.
Alat Kueri Baris Perintah sqlcmd
sqlcmd adalah alat baris perintah SQL Server untuk menjalankan pernyataan Transact-SQL dan perintah sistem. Ini berfungsi dengan SQL Server PDW dan merupakan alat baris perintah yang direkomendasikan untuk mengkueri SQL Server PDW. Dengan sqlcmd Anda dapat menjalankan pernyataan Transact-SQL secara interaktif dari baris perintah, sebagai file batch, atau dari Windows PowerShell.
Layanan Integrasi
Anda dapat menggunakan Integration Services untuk mengkueri SQL Server PDW.
Server yang Ditautkan
Dengan menggunakan koneksi server tertaut SQL Server, Anda dapat menggunakan SQL Server untuk mengirimkan pernyataan Transact-SQL ke SQL Server PDW.
Alat Kecerdasan Bisnis
Analysis Services
SQL Server PDW adalah sumber data yang valid untuk database Analysis Services dan model Excel PowerPivot. Dengan menggunakan penyedia OLE DB, Anda dapat mengonfigurasi kubus Analysis Services untuk menggunakan penyimpanan pemrosesan analitik online multidimensi (MOLAP) atau pemrosesan analitik online relasional (ROLAP).
Pembuat Laporan
Anda dapat menggunakan SQL Server PDW sebagai sumber data SQL Server untuk laporan yang Anda kembangkan untuk Reporting Services dengan menggunakan SQL Server Report Builder. Anda juga dapat menggunakan SQL Server PDW sebagai sumber SQL Server untuk model laporan. Dengan menggunakan Manajer Laporan atau API server laporan, Anda dapat menghasilkan model dari database SQL Server PDW.
Power Pivot untuk Excel
Anda bisa menyambungkan ke SQL Server PDW dengan PowerPivot untuk Excel, unduhan gratis yang secara signifikan memperluas kemampuan analisis data Excel.
Alat Pemuatan
Layanan Integrasi
Instal adaptor tujuan khusus Analytics Platform System (PDW) yang memungkinkan Anda menggunakan SQL Server Integration Services untuk memuat data ke Dalam Sistem Platform Analitik (PDW).
dwloader Command Line Loader
dwloader adalah alat pemuatan baris perintah yang memuat data secara paralel dari server pemuatan Anda ke simpul Komputasi PDW SQL Server.
Integrasi PolyBase for Hadoop
Dengan teknologi PolyBase, Anda dapat memuat data non-relasional dari Kluster Hadoop ke dalam tabel relasional di SQL Server PDW. Data Hadoop dapat ditemukan di Kluster Hadoop eksternal atau di Azure Blob Storage.
Pencadangan dan Pemulihan Database
SQL Server PDW menggunakan perintah pencadangan dan pemulihan database Transact-SQL untuk mencadangkan dan memulihkan database pengguna, secara paralel, ke dan dari server cadangan. SQL Server PDW menulis cadangan ke direktori dalam berbagi file Windows, lalu juga memulihkan data dari berbagi file Windows.
Untuk informasi selengkapnya, lihat Rencana Pencadangan dan Pemuatan Perangkat Keras dan Gambaran Umum Pencadangan dan Pemulihan
Salinan Tabel Jarak Jauh
Fitur Salin Tabel Jarak Jauh memungkinkan Anda menyalin tabel dari database SQL Server PDW ke database SMP SQL Server jarak jauh (non-appliance). Ini memungkinkan skenario hub dan spoke untuk SQL Server PDW.
Pemantauan
Sistem Platform Analitik memiliki beberapa cara untuk memantau aktivitas appliance
Konsol Admin
Konsol Admin memungkinkan Anda melihat status saat ini tentang kesehatan appliance. Ini berjalan sebagai aplikasi web pada node Kontrol dan dapat diakses melalui https.
Untuk informasi selengkapnya, lihat Memantau Appliance dengan Menggunakan Konsol Admin (Sistem Platform Analitik)
Tampilan Sistem
Konsol Admin didasarkan pada kueri tampilan sistem. Anda bisa mengkueri tampilan sistem satu per satu untuk mendapatkan informasi tertentu yang Anda butuhkan.
Untuk informasi selengkapnya, lihat Memantau Appliance dengan Menggunakan Tampilan Sistem (Sistem Platform Analitik)
Manajer Pengoperasian Pusat Sistem
Ada Paket Manajemen System Center Operations Manager (SCOM) untuk SQL Server PDW.
Untuk mengonfigurasi appliance untuk SCOM, lihat Memantau Appliance dengan Menggunakan System Center Operations Manager (Analytics Platform System)
Saran dan Komentar
https://aka.ms/ContentUserFeedback.
Segera hadir: Sepanjang tahun 2024 kami akan menghentikan penggunaan GitHub Issues sebagai mekanisme umpan balik untuk konten dan menggantinya dengan sistem umpan balik baru. Untuk mengetahui informasi selengkapnya, lihat:Kirim dan lihat umpan balik untuk