Panduan Cepat Persiapan Data

Performa BI kelas atas tergantung pada seberapa efektif data disiapkan dan dikirimkan dari Lakehouse. Dengan mengadopsi pola arsitektur, menerapkan struktur semantik, dan menggunakan pengoptimalan yang ditargetkan, Anda dapat mengurangi kompleksitas kueri, meningkatkan responsivitas dasbor, dan menurunkan biaya komputasi.

Tabel berikut ini meringkas praktik yang direkomendasikan, dampak yang diharapkan, dokumentasi terkait, dan item tindakan terkait. Konten ini ditujukan untuk teknisi data, pengembang BI, dan penulis dasbor yang merancang, mengoptimalkan, dan memelihara beban kerja analitik di Lakehouse.

Pemrosesan Awal Data

Praktik terbaik	Dampak	Docs	Tugas tindakan
Mengadopsi arsitektur medali	Mempercepat mengubah data mentah menjadi produk data yang siap digunakan dan andal untuk memudahkan konsumsi.	Arsitektur Medali Glosarium Arsitektur Medallion Konsep pergudangan data	Meninjau dan mengimplementasikan lapisan medali
Menggunakan pengklusteran cairan	Meningkatkan performa kueri dengan pengoptimalan pemrosesan file dan data.	Pengklusteran cairan	Terapkan ke tabel besar dengan pola filter
Menggunakan tabel terkelola	Azure Databricks mengatur dan mengoptimalkan lapisan penyimpanan dan performa kueri secara otomatis.	Tabel yang dikelola Unity Catalog di Azure Databricks	Membuat tabel terkelola untuk data Anda
Menggunakan pengoptimalan prediktif atau mengoptimalkan tabel secara manual	Memungkinkan performa kueri yang lebih baik dengan mengoptimalkan ukuran dan tata letak file, menghapus file lama, dan memperbarui statistik.	Pengoptimalan prediktif Optimalkan tata letak file Menganalisis metrik penyimpanan komputasi tabel	Aktifkan untuk tabel produksi atau jadwalkan pengoptimalan reguler dan analisis tabel setelah perubahan data
Pemodelan data dengan pola skema bintang	Membuat data mudah dikueri dan digunakan.	Glosarium skema bintang Lima langkah sederhana untuk menerapkan skema bintang	Merancang tabel fakta dan dimensi
Hindari jenis data yang luas dan kolom kardinalitas tinggi	Mengoptimalkan ukuran model data dan konsumsi memori, dan meningkatkan efisiensi kueri.	Panduan mengoptimalkan beban kerja data	Meninjau jenis data dan kardinalitas
Mendeklarasikan Kunci Primer dan Asing (dengan RELY)	Mengoptimalkan kueri dengan menghilangkan gabungan dan agregasi yang tidak perlu.	Pengoptimalan kueri dengan batasan	Menentukan kunci pada tabel fakta dan dimensi
Menggunakan kolom yang dihasilkan secara otomatis	Mengurangi kebutuhan untuk menghitung nilai pada waktu kueri.	Kolom yang dihasilkan	Mengidentifikasi bidang yang sering dihitung
Menggunakan tampilan materialisasi dan tabel persisten	Meningkatkan performa dengan melakukan pra-agregasi data untuk kueri yang paling umum dan intensif sumber daya.	Tables Tampilan materialisasi Menggunakan tampilan materialisasi di Databricks SQL	Membuat tampilan agregat untuk kueri umum

Saran dan Komentar

Apakah halaman ini membantu?

Last updated on 2026-02-21

Panduan Cepat Persiapan Data

Pemrosesan Awal Data

Saran dan Komentar

Sumber Daya Tambahan: