Catatan
Akses ke halaman ini memerlukan otorisasi. Anda dapat mencoba masuk atau mengubah direktori.
Akses ke halaman ini memerlukan otorisasi. Anda dapat mencoba mengubah direktori.
Performa BI kelas atas tergantung pada seberapa efektif data disiapkan dan dikirimkan dari Lakehouse. Dengan mengadopsi pola arsitektur, menerapkan struktur semantik, dan menggunakan pengoptimalan yang ditargetkan, Anda dapat mengurangi kompleksitas kueri, meningkatkan responsivitas dasbor, dan menurunkan biaya komputasi.
Tabel berikut ini meringkas praktik yang direkomendasikan, dampak yang diharapkan, dokumentasi terkait, dan item tindakan terkait. Konten ini ditujukan untuk teknisi data, pengembang BI, dan penulis dasbor yang merancang, mengoptimalkan, dan memelihara beban kerja analitik di Lakehouse.
Pemrosesan Awal Data
| Praktik terbaik | Dampak | Docs | Tugas tindakan |
|---|---|---|---|
| Mengadopsi arsitektur medali | Mempercepat mengubah data mentah menjadi produk data yang siap digunakan dan andal untuk memudahkan konsumsi. | Meninjau dan mengimplementasikan lapisan medali | |
| Menggunakan pengklusteran cairan | Meningkatkan performa kueri dengan pengoptimalan pemrosesan file dan data. | Terapkan ke tabel besar dengan pola filter | |
| Menggunakan tabel terkelola | Azure Databricks mengatur dan mengoptimalkan lapisan penyimpanan dan performa kueri secara otomatis. | Membuat tabel terkelola untuk data Anda | |
| Menggunakan pengoptimalan prediktif atau mengoptimalkan tabel secara manual | Memungkinkan performa kueri yang lebih baik dengan mengoptimalkan ukuran dan tata letak file, menghapus file lama, dan memperbarui statistik. | Aktifkan untuk tabel produksi atau jadwalkan pengoptimalan reguler dan analisis tabel setelah perubahan data | |
| Pemodelan data dengan pola skema bintang | Membuat data mudah dikueri dan digunakan. | Merancang tabel fakta dan dimensi | |
| Hindari jenis data yang luas dan kolom kardinalitas tinggi | Mengoptimalkan ukuran model data dan konsumsi memori, dan meningkatkan efisiensi kueri. | Meninjau jenis data dan kardinalitas | |
| Mendeklarasikan Kunci Primer dan Asing (dengan RELY) | Mengoptimalkan kueri dengan menghilangkan gabungan dan agregasi yang tidak perlu. | Menentukan kunci pada tabel fakta dan dimensi | |
| Menggunakan kolom yang dihasilkan secara otomatis | Mengurangi kebutuhan untuk menghitung nilai pada waktu kueri. | Mengidentifikasi bidang yang sering dihitung | |
| Menggunakan tampilan materialisasi dan tabel persisten | Meningkatkan performa dengan melakukan pra-agregasi data untuk kueri yang paling umum dan intensif sumber daya. | Membuat tampilan agregat untuk kueri umum |