Ketersediaan Eventhouse OneLake
Anda dapat membuat satu salinan logis data database KQL di eventhouse dengan mengaktifkan ketersediaan OneLake. Mengaktifkan ketersediaan OneLake berarti Anda dapat mengkueri data dalam database KQL Anda dalam format Delta Lake melalui mesin Fabric lainnya seperti mode Direct Lake di Power BI, Gudang, Lakehouse, Notebook, dan banyak lagi.
Delta Lake adalah format tabel data lake terpadu yang mencapai akses data tanpa hambatan di semua mesin komputasi di Microsoft Fabric. Untuk informasi selengkapnya tentang Delta Lake, lihat Apa itu Delta Lake?.
Dalam artikel ini, Anda mempelajari cara mengaktifkan ketersediaan data KQL Database di OneLake.
Cara kerjanya
Tabel berikut ini menjelaskan perilaku database dan tabel KQL Saat Anda mengaktifkan atau menonaktifkan ketersediaan OneLake.
Penting
Diperlukan waktu hingga beberapa jam agar data muncul di OneLake. Untuk informasi selengkapnya, lihat Perilaku adaptif.
Tidak ada biaya penyimpanan tambahan untuk mengaktifkan ketersediaan OneLake. Untuk informasi selengkapnya, lihat konsumsi sumber daya.
Prasyarat
- Ruang kerja dengan kapasitas yang diaktifkan Microsoft Fabric
- Database KQL dengan izin pengeditan dan data
Mengaktifkan ketersediaan OneLake
Anda dapat mengaktifkan ketersediaan OneLake baik pada database KQL atau tingkat tabel.
Untuk mengaktifkan ketersediaan OneLake, telusuri ke bagian OneLake di panel detail database atau tabel KQL Anda.
Atur Ketersediaan ke Aktif.
Database di-refresh secara otomatis.
Anda mengaktifkan ketersediaan OneLake di database KQL Anda. Sekarang Anda dapat mengakses semua data baru yang ditambahkan ke database Anda di jalur OneLake yang diberikan dalam format Delta Lake. Anda juga dapat memilih untuk membuat pintasan OneLake dari Lakehouse, Gudang Data, atau mengkueri data secara langsung melalui mode Power BI Direct Lake.
Perilaku adaptif
Eventhouse menawarkan mekanisme kuat yang secara cerdas mengumpulkan aliran data masuk ke dalam satu atau beberapa file Parquet, yang disusun untuk analisis. Batching aliran data penting saat berhadapan dengan data yang menetas. Menulis banyak file Parquet kecil ke dalam danau dapat tidak efisien sehingga menghasilkan biaya yang lebih tinggi dan performa yang buruk.
Mekanisme adaptif Eventhouse dapat menunda operasi penulisan hingga beberapa jam jika tidak ada cukup data untuk membuat file Parquet yang optimal. Ini memastikan file Parquet berukuran optimal dan mematuhi praktik terbaik Delta Lake. Mekanisme adaptif Eventhouse memastikan bahwa file Parquet prima untuk analisis dan menyeimbangkan kebutuhan ketersediaan data yang cepat dengan pertimbangan biaya dan performa.
Anda dapat memantau berapa lama data baru ditambahkan di lake dengan memeriksa latensi data Anda menggunakan perintah operasi pencerminan tabel .show.
Hasil diukur dari terakhir kali data ditambahkan. Ketika Latensi menghasilkan 00:00:00, semua data dalam database KQL tersedia di OneLake.
Tampilkan file
Saat Anda mengaktifkan ketersediaan OneLake pada tabel, folder log delta dibuat bersama dengan file JSON dan Parquet yang sesuai. Anda dapat melihat file yang tersedia di OneLake dan propertinya sambil tetap berada dalam Real-Time Intelligence.
Untuk menampilkan file, arahkan mouse ke atas tabel di panel Explorer lalu pilih menu Lainnya [...]>Lihat file.
Untuk melihat properti folder log delta atau file individual, arahkan mouse ke folder atau file lalu pilih menu Lainnya [...]>Properti.
Untuk melihat file di folder log delta:
- Pilih folder _delta_log.
- Pilih file untuk melihat metadata dan skema tabel. Editor yang terbuka dalam format baca-saja.
Mengakses kebijakan pencerminan
Secara default, saat ketersediaan OneLake diaktifkan, kebijakan pencerminan diaktifkan. Anda dapat menggunakan kebijakan untuk memantau latensi data atau mengubahnya menjadi tabel delta partisi.
Catatan
Jika Anda menonaktifkan ketersediaan OneLake, properti kebijakan IsEnabled
pencerminan diatur ke false (IsEnabled=false
).
Tabel delta partisi
Anda dapat mempartisi tabel delta Anda untuk meningkatkan kecepatan kueri. Untuk informasi tentang kapan harus mempartisi file OneLake Anda, lihat Kapan harus mempartisi tabel. Setiap partisi direpresentasikan sebagai kolom terpisah menggunakan PartitionName yang tercantum dalam daftar Partisi. Ini berarti salinan OneLake Anda memiliki lebih banyak kolom daripada tabel sumber Anda.
Untuk mempartisi tabel delta Anda, gunakan perintah pencerminan kebijakan tabel .alter-merge.
Konten terkait
- Untuk mengekspos data di OneLake, lihat Membuat pintasan di OneLake
- Untuk membuat pintasan OneLake di Lakehouse, lihat Apa itu pintasan di lakehouse?
- Untuk mengkueri data yang dirujuk dari OneLake di database atau tabel KQL Anda, lihat Membuat pintasan OneLake di KQL Database