Catatan
Akses ke halaman ini memerlukan otorisasi. Anda dapat mencoba masuk atau mengubah direktori.
Akses ke halaman ini memerlukan otorisasi. Anda dapat mencoba mengubah direktori.
Untuk memberikan analitik yang cepat dan andal dari platform Lakehouse, penting untuk mengonfigurasi dan mengoperasikan gudang SQL untuk performa BI yang optimal. Gudang SQL di Azure Databricks dibuat khusus untuk melayani beban kerja kecerdasan bisnis, memungkinkan penskalaan dinamis, pemrosesan kueri yang efisien, dan manajemen sumber daya yang kuat.
Halaman ini menguraikan praktik yang direkomendasikan untuk menyediakan, mengelola, dan memantau gudang SQL untuk memastikan dasbor responsif, penggunaan sumber daya hemat biaya, dan integrasi yang lancar dengan alat BI perusahaan.
Konten ini ditujukan untuk teknisi data, pengembang BI, dan administrator ruang kerja yang bertanggung jawab untuk mengonfigurasi, mengoptimalkan, dan memelihara gudang SQL untuk analitik dan performa dasbor. Banyak tugas memerlukan izin ruang kerja tingkat lanjut yang memungkinkan Anda membuat atau mengelola gudang SQL.
Penyajian SQL
| Praktik terbaik | Dampak | Docs | Tugas tindakan |
|---|---|---|---|
| Menggunakan komputasi tanpa server untuk memulai, menghentikan, dan menskalakan sumber daya secara otomatis | Mengurangi biaya dengan menghentikan sumber daya yang tidak aktif. | Mengaktifkan Pemberhentian otomatis untuk gudang pengembangan | |
| Gunakan gudang SQL untuk beban kerja BI apa pun (disarankan tanpa server) | Gudang SQL dioptimalkan untuk beban kerja BI. | Mengonfigurasi gudang SQL untuk beban kerja BI | |
| Sesuaikan ukuran gudang Anda | Menyeimbangkan performa dan biaya untuk beban kerja Anda. | Mulai dengan ukuran M, pantau performa, dan sesuaikan jika diperlukan | |
| Gunakan ukuran kluster yang lebih tinggi untuk himpunan data yang lebih besar | Semakin besar kluster (M, L, XL, dll.), semakin cepat kueri kompleks berjalan. Jika Anda hanya memiliki kueri yang sederhana dan berdurasi pendek, jangan menambah ukuran (mungkin lebih lambat karena pertukaran data). | Mengevaluasi kompleksitas kueri dan ukuran himpunan data | |
| Menggunakan penskalaan gudang SQL | Gudang SQL diskalakan untuk menangani peningkatan beban kerja. Ketika gudang mencapai batas kapasitasnya, kueri akan diproses dalam antrean, bukan ditolak. | Mengaktifkan penskalaan untuk beban kerja produksi | |
| Jika mengantisipasi banyak kueri bersamaan, meningkatkan jumlah minimum kluster. | Mencegah kueri diantrekan saat menunggu peluasan skala. | Mengonfigurasi kluster min berdasarkan beban kerja yang diharapkan | |
| Gunakan gudang SQL terpisah untuk beban kerja atau unit bisnis yang berbeda | Mengoptimalkan ukuran gudang SQL untuk meningkatkan isolasi dan atribusi biaya. | Membuat gudang khusus per beban kerja | |
| Memantau kinerja kueri | Mengidentifikasi hambatan performa dan masalah menggunakan riwayat kueri. Tabel sistem memungkinkan Anda memantau performa secara terprogram. | Menyiapkan dasbor pemantauan |
Konten terkait
Untuk panduan terperinci tentang menganalisis persyaratan beban kerja BI dan mengonfigurasi gudang SQL untuk pola akses yang berbeda (DirectQuery vs Import/Extract), lihat Pengaturan gudang SQL untuk beban kerja BI.