Pengenalan tutorial gudang data

Berlaku untuk: Titik akhir analitik SQL dan Gudang di Microsoft Fabric

Microsoft Fabric menyediakan toko serba ada untuk semua kebutuhan analitik untuk setiap perusahaan. Ini mencakup spektrum lengkap layanan termasuk pergerakan data, data lake, rekayasa data, integrasi data dan ilmu data, analitik real time, dan kecerdasan bisnis. Dengan Microsoft Fabric, Anda tidak perlu menyatukan berbagai layanan dari beberapa vendor. Sebagai gantinya, pelanggan menikmati produk komprehensif tunggal end-to-end, sangat terintegrasi yang mudah dipahami, disetorkan, dibuat, dan dioperasikan. Tidak ada produk lain di pasar yang menawarkan luas, kedalaman, dan tingkat integrasi yang ditawarkan Microsoft Fabric. Selain itu, Microsoft Purview disertakan secara default di setiap penyewa untuk memenuhi kebutuhan kepatuhan dan tata kelola.

Tujuan tutorial ini

Meskipun banyak konsep di Microsoft Fabric mungkin akrab bagi profesional data dan analitik, mungkin sulit untuk menerapkan konsep tersebut di lingkungan baru. Tutorial ini telah dirancang untuk berjalan selangkah demi selangkah melalui skenario end-to-end dari akuisisi data ke konsumsi data untuk membangun pemahaman dasar tentang pengalaman pengguna Microsoft Fabric, berbagai pengalaman dan poin integrasi mereka, dan pengalaman pengembang profesional dan warga Microsoft Fabric.

Tutorial tidak dimaksudkan untuk menjadi arsitektur referensi, daftar lengkap fitur dan fungsionalitas, atau rekomendasi praktik terbaik tertentu.

Skenario end-to-end gudang data

Sebagai prasyarat untuk tutorial ini, selesaikan langkah-langkah berikut:

  1. Masuk ke akun online Power BI Anda, atau jika Anda belum memiliki akun, daftar untuk uji coba gratis.
  2. Aktifkan Microsoft Fabric di penyewa Anda.

Dalam tutorial ini, Anda mengambil peran sebagai pengembang Gudang di perusahaan Wide World Importers fiksi dan menyelesaikan langkah-langkah berikut di portal Microsoft Fabric untuk membangun dan menerapkan solusi gudang data end-to-end:

  1. Membuat ruang kerja Microsoft Fabric.
  2. Buat Gudang.
  3. Menyerap data dari sumber ke model dimensi gudang data dengan alur data.
  4. Buat tabel di Gudang Anda.
  5. Muat data dengan T-SQL dengan editor kueri SQL.
  6. Ubah data untuk membuat himpunan data agregat menggunakan T-SQL.
  7. Gunakan editor kueri visual untuk mengkueri gudang data.
  8. Menganalisis data dengan buku catatan.
  9. Membuat dan menjalankan kueri lintas gudang dengan editor kueri SQL.
  10. Buat laporan Power BI menggunakan mode DirectLake untuk menganalisis data di tempat.
  11. Buat laporan dari Hub Data.
  12. Bersihkan sumber daya dengan menghapus ruang kerja dan item lainnya.

Arsitektur end-to-end gudang data

Diagram yang memperlihatkan arsitektur end to end gudang data.

Sumber data - Microsoft Fabric memudahkan dan cepat menyambungkan ke Azure Data Services, platform cloud lainnya, dan sumber data lokal untuk menyerap data.

Penyerapan - Dengan 200+ konektor asli sebagai bagian dari alur Microsoft Fabric dan dengan transformasi data seret dan lepas dengan aliran data, Anda dapat dengan cepat membangun wawasan untuk organisasi Anda. Pintasan adalah fitur baru di Microsoft Fabric yang menyediakan cara untuk terhubung ke data yang ada tanpa harus menyalin atau memindahkannya. Anda dapat menemukan detail selengkapnya tentang fitur Pintasan nanti dalam tutorial ini.

Transformasi dan simpan - Microsoft Fabric menstandarkan format Delta Lake, yang berarti semua mesin Microsoft Fabric dapat membaca dan mengerjakan data yang sama yang disimpan di OneLake - tidak perlu duplikasi data. Penyimpanan ini memungkinkan Anda membangun gudang data atau jala data berdasarkan kebutuhan organisasi Anda. Untuk transformasi, Anda dapat memilih pengalaman kode rendah atau tanpa kode dengan alur/aliran data atau menggunakan T-SQL untuk pengalaman pertama kode.

Konsumsi - Data dari gudang dapat dikonsumsi oleh Power BI, alat kecerdasan bisnis terkemuka di industri, untuk pelaporan dan visualisasi. Setiap gudang dilengkapi dengan titik akhir TDS bawaan untuk dengan mudah menyambungkan dan mengkueri data dari alat pelaporan lainnya, jika diperlukan. Ketika gudang dibuat, item sekunder, yang disebut model semantik default, dihasilkan pada saat yang sama dengan nama yang sama. Anda dapat menggunakan model semantik default untuk mulai memvisualisasikan data hanya dengan beberapa langkah.

Data sampel

Untuk data sampel, kami menggunakan database sampel Wide World Importers (WWI). Untuk skenario end-to-end gudang data kami, kami telah menghasilkan data yang memadai untuk mengintip skala dan kemampuan performa platform Microsoft Fabric.

Wide World Importers (WWI) adalah importir dan distributor barang baru grosir yang beroperasi dari area Teluk San Francisco. Sebagai grosir, pelanggan WWI sebagian besar adalah perusahaan yang menjual kembali ke individu. WWI menjual kepada pelanggan ritel di seluruh Amerika Serikat termasuk toko khusus, supermarket, toko komputasi, toko objek wisata, dan beberapa individu. WWI juga menjual kepada grosir lain melalui jaringan agen yang mempromosikan produk atas nama WWI. Untuk mendapatkan lebih banyak tentang profil dan operasi perusahaan mereka, lihat Database sampel Wide World Importers untuk Microsoft SQL.

Biasanya, Anda akan membawa data dari sistem transaksi (atau aplikasi lini bisnis) ke data lake atau area penahapan gudang data. Namun, untuk tutorial ini, kami menggunakan model dimensi yang disediakan oleh WWI sebagai sumber data awal kami. Kami menggunakannya sebagai sumber untuk menyerap data ke dalam gudang data dan mengubahnya melalui T-SQL.

Model data

Sementara model dimensi WWI berisi beberapa tabel fakta, untuk tutorial ini kami fokus pada fact_sale tabel dan dimensi terkait saja, sebagai berikut, untuk menunjukkan skenario gudang data end-to-end ini:

Diagram yang menunjukkan model data yang Anda gunakan dalam tutorial ini, yang mencakup tabel fact_sale dan dimensi terkait.

Langkah selanjutnya