Bagikan melalui


Tabel di Gudang Data Fabric

Berlaku untuk:✅ Gudang di Microsoft Fabric

Artikel ini merinci konsep utama untuk merancang tabel di Microsoft Fabric.

Dalam tabel, data diatur secara logis dalam format baris dan kolom. Setiap baris mewakili rekaman unik, dan setiap kolom mewakili bidang dalam rekaman.

  • Di Gudang, tabel adalah objek database yang berisi semua data transaksi.

Menentukan kategori tabel

Skema bintang mengatur data ke dalam tabel fakta dan tabel dimensi. Beberapa tabel digunakan untuk data integrasi atau staging sebelum pindah ke tabel fakta atau dimensi. Saat Anda merancang tabel, putuskan apakah data tabel akan berada dalam tabel fakta, dimensi, atau integrasi. Keputusan ini menginformasikan struktur tabel yang sesuai.

  • Tabel fakta berisi data kuantitatif yang umumnya dihasilkan dalam sistem transaksional, lalu dimuat ke dalam gudang data. Misalnya, setiap hari bisnis ritel menghasilkan transaksi penjualan dan kemudian memuat datanya ke dalam tabel fakta gudang data untuk keperluan analisis.

  • Tabel dimensi berisi data atribut yang mungkin berubah tetapi biasanya jarang berubah. Misalnya, nama dan alamat pelanggan disimpan dalam tabel dimensi dan diperbarui hanya jika profil pelanggan berubah. Untuk mengecilkan ukuran tabel fakta yang besar, nama dan alamat pelanggan tidak perlu ada di setiap baris tabel fakta. Sebagai gantinya, tabel fakta dan tabel dimensi dapat berbagi ID pelanggan. Kueri dapat menggabungkan dua tabel untuk mengaitkan profil dan transaksi pelanggan.

  • Tabel integrasi menyediakan tempat untuk mengintegrasikan atau penahapan data. Contohnya, Anda dapat memuat data ke tabel penahapan, melakukan transformasi pada data dalam penahapan, kemudian menyisipkan data ke dalam tabel produksi.

Tabel menyimpan data di OneLake sebagai bagian dari Gudang. Tabel dan data akan tetap ada terlepas dari apakah sesi terbuka atau tidak.

Tabel di Gudang

Untuk memperlihatkan organisasi tabel, Anda dapat menggunakan fact, , dimatau int sebagai awalan untuk nama tabel. Tabel berikut ini memperlihatkan beberapa nama skema dan tabel untuk gudang data sampel WideWorldImportersDW .

Nama Tabel Sumber WideWorldImportersDW Tipe Tabel Nama Tabel Gudang Data
Kota Dimensi wwi.DimCity
Pesanan Fakta wwi.FactOrder
  • Nama tabel tidak boleh berisi / atau \ diakhir .dengan .

Buat tabel

Untuk Gudang, Anda dapat membuat tabel sebagai tabel kosong baru. Anda juga dapat membuat dan mengisi tabel dengan hasil dari pernyataan pilih. Berikut perintah T-SQL untuk membuat tabel.

Pernyataan T-SQL Deskripsi
BUAT TABEL Membuat tabel kosong dengan menentukan semua kolom dan opsi tabel.
BUAT TABEL SEBAGAI PILIH Mengisi tabel baru dengan hasil dari pernyataan pilih. Kolom tabel dan jenis data didasarkan pada hasil pernyataan pilih. Untuk mengimpor data, pernyataan ini dapat memilih dari tabel eksternal.

Contoh ini membuat tabel dengan dua kolom:

CREATE TABLE MyTable (col1 int, col2 int );  

Nama skema

Gudang mendukung pembuatan skema kustom. Seperti di SQL Server, skema adalah cara yang baik untuk mengelompokkan objek yang digunakan dengan cara yang sama. Kode berikut membuat skema yang ditentukan pengguna yang disebut wwi.

  • Nama skema peka huruf besar/kecil.
  • Nama skema tidak boleh berisi / atau \ diakhir .dengan .
CREATE SCHEMA wwi;

Jenis data

Microsoft Fabric mendukung jenis data T-SQL yang paling umum digunakan.

Kolase

Latin1_General_100_BIN2_UTF8 adalah kolasi default untuk tabel dan metadata.

Anda dapat membuat gudang dengan pengurutan (CI) peka huruf besar/kecil Latin1_General_100_CI_AS_KS_WS_SC_UTF8. Untuk informasi selengkapnya, lihat Cara: Membuat database dengan pengurutan tidak peka huruf (CI).

Kolasasi yang didukung dalam API adalah:

  • Latin1_General_100_BIN2_UTF8 (standar)
  • Latin1_General_100_CI_AS_KS_WS_SC_UTF8

Setelah kolase diatur selama pembuatan database, semua objek berikutnya (tabel, kolom, dll.) akan mewarisi kolase default ini.

Statistik

Pengoptimal kueri menggunakan statistik tingkat kolom saat membuat rencana untuk menjalankan kueri. Untuk meningkatkan performa kueri, penting untuk memiliki statistik pada kolom individual, terutama kolom yang digunakan dalam gabungan kueri. Gudang mendukung pembuatan statistik otomatis.

Pembaruan statistik tidak terjadi secara otomatis. Lakukan pembaruan statistik setelah sejumlah besar baris ditambahkan atau diubah. Misalnya, lakukan pembaruan statistik setelah pemuatan. Untuk informasi selengkapnya, lihat Statistik.

Kunci primer, kunci asing, dan kunci unik

Untuk Gudang, KUNCI PRIMER dan batasan UNIK hanya didukung ketika NONCLUSTERED dan NOT ENFORCED keduanya digunakan.

KUNCI ASING hanya didukung ketika NOT ENFORCED digunakan.

tabel sementara di Fabric Data Warehouse

Tabel sementara (#temp) yang dilingkup sesi dapat dibuat di Fabric Data Warehouse. Tabel-tabel ini hanya ada dalam sesi di mana mereka dibuat dan bertahan selama durasi sesi tersebut. Mereka tidak terlihat oleh pengguna atau sesi lain dan secara otomatis dihilangkan dari sistem setelah sesi berakhir atau tabel #temp dihilangkan. Tabel ini dapat diakses oleh semua pengguna tanpa memerlukan izin tingkat artefak tertentu.

Dua jenis tabel #temp dapat dibuat berdasarkan kasus penggunaan tertentu -

Tabel #temp non-terdistribusi yang didukung oleh mdf adalah jenis default. Sintaks untuk membuat dan menggunakan tabel #temp yang tidak terdistribusi di Fabric Data Warehouse mirip dengan tabel pengguna, tetapi Anda perlu mengawali nama tabel sementara dengan #

 CREATE TABLE #table_name (
   Col1 data_type1,
   Col2 data_type2
 );

Tabel sementara terdistribusi (didukung Parquet) dapat dibuat dengan distribusi sama dengan kata kunci round-robin:

CREATE TABLE #table_name ( 
Col1 data_type1, 
Col2 data_type2
) WITH (DISTRIBUTION=ROUND_ROBIN);

data_type1 dan data_type2 adalah placeholder untuk jenis data yang didukung di Warehouse. Untuk informasi selengkapnya, lihat Jenis data di Microsoft Fabric.

Menggunakan tabel #temp terdistribusi disarankan karena selaras sepenuhnya dengan tabel pengguna gudang dalam hal penyimpanan tak terbatas, jenis data yang didukung, operasi yang dapat kita lakukan padanya. Sintaks untuk operasi lainnya mirip dengan tabel pengguna di Gudang Data Fabric, dengan menambahkan awalan '#' ke nama tabel untuk menunjukkan bahwa tabel tersebut adalah tabel #temp yang bercakupan sesi.

Nota

Tabel global sementara tidak didukung saat ini.

Selaraskan data sumber dengan gudang data

Tabel gudang diisi dengan memuat data dari sumber data lain. Untuk mencapai beban yang berhasil, jumlah dan jenis data kolom pada data sumber harus selaras dengan definisi tabel di gudang data.

Jika data berasal dari beberapa penyimpanan data, Anda dapat mentransfer data ke gudang data dan menyimpannya dalam tabel integrasi. Setelah data berada dalam tabel integrasi, Anda dapat menggunakan kekuatan gudang data untuk menerapkan operasi transformasi. Setelah data disiapkan, Anda dapat menyisipkannya ke dalam tabel produksi.

Batasan

Gudang mendukung banyak, tetapi tidak semua, dari fitur tabel yang ditawarkan oleh database lain.

Daftar berikut ini memperlihatkan beberapa fitur tabel yang saat ini tidak didukung.

  • 1024 kolom maksimum per tabel
  • Kolom komputasi
  • Tampilan terindeks
  • Tabel berpartisi
  • Urutan
  • Kolom Tersebar
  • Kunci pengganti pada urutan angka dengan kolom Identitas
  • Sinonim
  • Pemicu
  • Indeks unik
  • Jenis yang ditentukan pengguna
  • Tabel eksternal

Penting

Ada batasan dengan menambahkan batasan tabel atau kolom saat menggunakan Kontrol Sumber dengan Gudang.