Bagikan melalui


Pemodelan dimensi di Microsoft Fabric Warehouse

Berlaku untuk:✅ Titik akhir analitik SQL dan Gudang di Microsoft Fabric

Artikel ini adalah yang pertama dalam seri tentang pemodelan dimensi di dalam gudang. Ini memberikan panduan praktis untuk Gudang di Microsoft Fabric, yang merupakan pengalaman yang mendukung banyak kemampuan T-SQL, seperti membuat tabel dan mengelola data dalam tabel. Jadi, Anda berada dalam kontrol penuh untuk membuat tabel model dimensi Anda dan memuatnya dengan data.

Catatan

Dalam artikel ini, istilah gudang data mengacu pada gudang data perusahaan, yang memberikan integrasi komprehensif data penting di seluruh organisasi. Sebaliknya, istilah gudang mandiri mengacu pada Gudang Fabric, yang merupakan penawaran database relasional software as a service (SaaS) yang dapat Anda gunakan untuk mengimplementasikan gudang data. Untuk kejelasan, dalam artikel ini yang terakhir disebutkan sebagai Fabric Warehouse.

Tip

Jika Anda tidak berpengalaman dengan pemodelan dimensi, pertimbangkan bahwa rangkaian artikel ini adalah langkah pertama Anda. Ini tidak dimaksudkan untuk memberikan diskusi lengkap tentang desain pemodelan dimensi. Untuk informasi selengkapnya, lihat langsung ke konten yang diterbitkan secara luas, seperti Toolkit Gudang Data: Panduan Definitif untuk Pemodelan Dimensi (edisi ke-3, 2013) oleh Ralph Kimball, dan lainnya.

Desain skema bintang

Skema bintang adalah teknik desain pemodelan dimensi yang diadopsi oleh gudang data relasional. Ini adalah pendekatan desain yang direkomendasikan untuk diambil saat membuat Gudang Fabric. Skema bintang terdiri dari tabel fakta dan tabel dimensi.

  • Tabel dimensi menjelaskan entitas yang relevan dengan persyaratan organisasi dan analitik Anda. Secara luas, mereka mewakili hal-hal yang Anda model. Hal-hal bisa berupa produk, orang, tempat, atau konsep lain, termasuk tanggal dan waktu. Untuk informasi selengkapnya dan praktik terbaik desain, lihat Tabel dimensi dalam seri ini.
  • Tabel fakta menyimpan pengukuran yang terkait dengan pengamatan atau peristiwa. Mereka dapat menyimpan pesanan penjualan, saldo saham, nilai tukar, pembacaan suhu, dan banyak lagi. Tabel fakta berisi kunci dimensi bersama dengan nilai terperinci yang dapat dikumpulkan. Untuk informasi selengkapnya dan praktik terbaik desain, lihat Tabel fakta dalam seri ini.

Desain skema bintang dioptimalkan untuk beban kerja kueri analitik. Untuk alasan ini, ini dianggap sebagai prasyarat untuk model semantik Power BI perusahaan. Kueri analitik berkaitan dengan pemfilteran, pengelompokan, pengurutan, dan ringkasan data. Data fakta dirangkum dalam konteks filter dan pengelompokan tabel dimensi terkait.

Alasan mengapa itu disebut skema bintang adalah karena tabel fakta membentuk pusat bintang sementara tabel dimensi terkait membentuk titik-titik bintang.

Diagram menunjukkan ilustrasi skema bintang untuk fakta penjualan. Ada lima dimensi, masing-masing terletak di titik bintang.

Skema bintang sering berisi beberapa tabel fakta, dan oleh karena itu beberapa bintang.

Skema bintang yang dirancang dengan baik memberikan kueri performa tinggi (relasional) karena lebih sedikit gabungan tabel, dan kemungkinan indeks yang berguna yang lebih tinggi. Selain itu, skema bintang sering membutuhkan pemeliharaan rendah saat desain gudang data berevolusi. Misalnya, menambahkan kolom baru ke tabel dimensi untuk mendukung analisis oleh atribut baru adalah tugas yang relatif sederhana untuk dilakukan. Seperti menambahkan fakta dan dimensi baru saat cakupan gudang data berkembang.

Secara berkala, mungkin setiap hari, tabel dalam model dimensi diperbarui dan dimuat oleh proses Ekstrak, Transformasi, dan Muat (ETL). Proses ini menyinkronkan datanya dengan sistem sumber, yang menyimpan data operasional. Untuk informasi selengkapnya, lihat Memuat tabel dalam seri ini.

Pemodelan dimensi untuk Power BI

Untuk solusi perusahaan, model dimensi di Fabric Warehouse adalah prasyarat yang direkomendasikan untuk membuat model semantik Power BI. Model dimensi tidak hanya mendukung model semantik, tetapi juga merupakan sumber data untuk pengalaman lain, seperti model pembelajaran mesin.

Namun, dalam keadaan tertentu mungkin bukan pendekatan terbaik. Misalnya, analis layanan mandiri yang membutuhkan kebebasan dan kelincahan untuk bertindak dengan cepat, dan tanpa dependensi pada IT, dapat membuat model semantik yang terhubung langsung ke data sumber. Dalam kasus seperti itu, teori pemodelan dimensi masih relevan. Teori itu membantu analis membuat model intuitif dan efisien, sekaligus menghindari kebutuhan untuk membuat dan memuat model dimensi di gudang data. Sebagai gantinya, model dimensi kuasi dapat dibuat dengan menggunakan Power Query, yang menentukan logika untuk menyambungkan, dan mengubah, data sumber untuk membuat dan memuat tabel model semantik. Untuk informasi selengkapnya, lihat Memahami skema bintang dan pentingnya Power BI.

Penting

Saat Anda menggunakan Power Query untuk menentukan model dimensi dalam model semantik, Anda tidak dapat mengelola perubahan historis, yang mungkin diperlukan untuk menganalisis masa lalu secara akurat. Jika itu adalah persyaratan, Anda harus membuat gudang data dan mengizinkan proses ETL berkala untuk menangkap dan menyimpan perubahan dimensi dengan tepat.

Merencanakan gudang data

Anda harus mendekati pembuatan gudang data dan desain model dimensi sebagai usaha yang serius dan penting. Itu karena gudang data adalah komponen inti dari platform data Anda. Ini harus membentuk fondasi kuat yang mendukung analitik dan pelaporan—dan oleh karena itu pengambilan keputusan—untuk seluruh organisasi Anda.

Untuk tujuan ini, gudang data Anda harus berusaha untuk menyimpan data yang berkualitas, sesuai, dan akurat secara historis sebagai versi tunggal kebenaran. Ini harus memberikan data yang dapat dimengerti dan dapat dinavigasi dengan performa cepat, dan menerapkan izin sehingga data yang tepat hanya dapat diakses oleh orang yang tepat. Berusahalah untuk merancang gudang data Anda untuk ketahanan, memungkinkannya beradaptasi dengan perubahan seiring berkembangnya kebutuhan Anda.

Keberhasilan implementasi gudang data tergantung pada perencanaan yang baik. Untuk informasi tentang pertimbangan strategis dan taktis, dan item tindakan yang mengarah pada keberhasilan adopsi Fabric dan gudang data Anda, lihat peta jalan adopsi Microsoft Fabric.

Tip

Kami menyarankan agar Anda membangun gudang data perusahaan Anda secara berulang. Mulailah dengan area subjek yang paling penting terlebih dahulu, dan kemudian seiring waktu, sesuai dengan prioritas dan sumber daya, perluas gudang data dengan area subjek lainnya.

Di artikel berikutnya dalam seri ini, pelajari tentang panduan dan praktik terbaik desain untuk tabel dimensi.