Bagikan melalui


Apa itu pergudangan data di Microsoft Fabric?

Berlaku untuk:✅ Titik akhir analitik SQL dan Gudang di Microsoft Fabric

Fabric Data Warehouse adalah solusi pergudangan data generasi berikutnya dalam Microsoft Fabric.

Gudang yang berpusat pada danau dibangun di atas mesin pemrosesan terdistribusi tingkat perusahaan yang memungkinkan performa terkemuka di industri dalam skala besar sambil meminimalkan kebutuhan akan konfigurasi dan manajemen. Tinggal di data lake dan dirancang untuk secara asli mendukung format data terbuka, gudang data Fabric memungkinkan kolaborasi yang mulus antara teknisi data dan pengguna bisnis tanpa mengorbankan keamanan atau tata kelola.

Pengalaman SaaS yang mudah digunakan juga terintegrasi erat dengan Power BI untuk analisis dan pelaporan yang mudah, menggabungkan dunia data lake dan gudang dan sangat menyederhanakan investasi organisasi di properti analitik mereka. 

Pelanggan gudang data mendapat manfaat dari:

  • Data yang disimpan dalam format Delta-parquet memungkinkan transaksi ACID dan interoperabilitas dengan beban kerja Fabric lainnya berarti Anda tidak memerlukan beberapa salinan data.
  • Kueri lintas database dapat menggunakan beberapa sumber data untuk wawasan cepat dengan duplikasi data nol.
  • Dengan mudah menyerap, memuat, dan mengubah data dalam skala besar melalui Alur, Aliran Data, kueri lintas database, atau perintah COPY INTO.
  • Manajemen beban kerja otonom dengan mesin pemrosesan kueri terdistribusi terkemuka di industri berarti tidak ada kenop untuk beralih untuk mencapai performa terbaik di kelasnya.
  • Skalakan secara instan untuk memenuhi tuntutan bisnis. Penyimpanan dan komputasi dipisahkan.
  • Mengurangi waktu untuk mendapatkan wawasan dengan model semantik yang mudah dipahami dan selalu terhubung yang terintegrasi dengan Power BI dalam mode Direct Lake. Laporan selalu memiliki data terbaru untuk analisis dan pelaporan.
  • Dibangun untuk semua tingkat keterampilan, dari citizen developer hingga DBA atau insinyur data.

Item gudang data

Fabric Data Warehouse bukan gudang data perusahaan tradisional, ini adalah gudang lake yang mendukung dua item pergudangan yang berbeda: gudang data Fabric dan titik akhir analitik SQL. Keduanya dibuat khusus untuk memenuhi kebutuhan bisnis pelanggan sekaligus memberikan performa terbaik di kelasnya, meminimalkan biaya, dan mengurangi overhead administratif.

Gudang Data Kain

Di ruang kerja Microsoft Fabric, gudang Fabric diberi label sebagai Gudang di kolom Jenis . Ketika Anda membutuhkan kemampuan daya dan transaksi penuh (dukungan kueri DDL dan DML) dari gudang data, ini adalah solusi cepat dan sederhana untuk Anda.

Cuplikan layar memperlihatkan jenis Gudang di ruang kerja.

Gudang dapat diisi oleh salah satu metode penyerapan data yang didukung seperti COPY INTO, Pipelines, Dataflows, atau opsi penyerapan lintas database seperti CREATE TABLE AS SELECT (CTAS), INSERT.. SELECT, atau SELECT INTO.

Untuk mulai menggunakan Gudang, lihat:

Titik akhir analisis SQL dari Lakehouse

Di ruang kerja Microsoft Fabric, setiap Lakehouse memiliki "titik akhir analitik SQL" yang dibuat secara otomatis yang dapat digunakan untuk transisi dari tampilan "Lake" Lakehouse (yang mendukung rekayasa data dan Apache Spark) ke tampilan "SQL" dari Lakehouse yang sama untuk membuat tampilan, fungsi, prosedur tersimpan, dan menerapkan keamanan SQL.

Cuplikan layar memperlihatkan jenis titik akhir analitik SQL di ruang kerja.

Menggunakan teknologi serupa, gudang, database SQL, dan Fabric OneLake semuanya secara otomatis menyediakan titik akhir analitik SQL saat dibuat.

Dengan titik akhir analitik SQL, perintah T-SQL dapat menentukan dan mengkueri objek data tetapi tidak memanipulasi atau memodifikasi data. Anda dapat melakukan tindakan berikut di titik akhir analitik SQL:

  • Melakukan kueri pada tabel yang mengacu data di folder Delta Lake Anda di danau.
  • Buat tampilan, TVF inline, dan prosedur untuk mengemas semantik dan logika bisnis Anda dalam T-SQL.
  • Mengelola izin pada objek.

Untuk mulai menggunakan titik akhir analitik SQL, lihat:

Gudang atau rumah tepi danau

Saat memutuskan antara menggunakan gudang atau lakehouse, penting untuk mempertimbangkan kebutuhan dan konteks spesifik persyaratan manajemen data dan analitik Anda. Sama pentingnya, ini bukan keputusan satu arah!

Anda selalu memiliki kesempatan untuk menambahkan salah satu di kemudian hari jika terjadi perubahan pada kebutuhan bisnis Anda, dan terlepas dari di mana Anda memulai, baik gudang maupun lakehouse menggunakan mesin SQL yang kuat yang sama untuk semua kueri T-SQL.

Berikut adalah beberapa panduan umum untuk membantu Anda membuat keputusan:

  • Pilih gudang data saat Anda memerlukan solusi skala perusahaan dengan format standar terbuka, tanpa performa kenop, dan penyiapan minimal.  Paling cocok untuk format data semi terstruktur dan terstruktur, gudang data cocok untuk profesional data pemula dan berpengalaman, menawarkan pengalaman sederhana dan intuitif.

  • Pilih lakehouse ketika Anda membutuhkan repositori besar data yang sangat tidak terstruktur dari sumber heterogen, memanfaatkan penyimpanan objek berbiaya rendah dan ingin menggunakan SPARK sebagai alat pengembangan utama Anda. Bertindak sebagai gudang data 'ringan', Anda selalu memiliki opsi untuk menggunakan titik akhir SQL dan alat T-SQL untuk memberikan skenario pelaporan dan inteligensi data di lakehouse Anda.

Untuk panduan keputusan yang lebih rinci, lihat Panduan keputusan Microsoft Fabric: Pilih antara Gudang dan Lakehouse.