Catatan
Akses ke halaman ini memerlukan otorisasi. Anda dapat mencoba masuk atau mengubah direktori.
Akses ke halaman ini memerlukan otorisasi. Anda dapat mencoba mengubah direktori.
Artikel ini menjelaskan konsep tabel sistem di Azure Databricks dan menyoroti sumber daya yang bisa Anda gunakan untuk mendapatkan hasil maksimal dari data tabel sistem Anda.
Apa itu tabel sistem?
Tabel sistem adalah penyimpanan analitik yang di-host oleh Azure Databricks untuk data operasional dari akun Anda yang ditemukan di system katalog. Tabel sistem dapat digunakan untuk pengamatan historis di seluruh akun Anda.
Catatan
Tabel skema informasi (system.information_schema) bekerja secara berbeda dari tabel sistem lainnya. Lihat skema Informasi.
Persyaratan
- Untuk mengakses tabel sistem, ruang kerja Anda harus diaktifkan untuk Katalog Unity. Untuk informasi selengkapnya, lihat Mengaktifkan tabel sistem.
- Tabel sistem tidak tersedia di wilayah berikut:
- Kawasan Azure China
- Kawasan Azure Government
- India Barat
- Swiss Barat
Tabel sistem mana yang tersedia?
Saat ini, Azure Databricks menghosting tabel sistem berikut:
| Tabel | Deskripsi | Mendukung streaming | Periode gratis retensi | Mencakup data global atau regional |
|---|---|---|---|---|
| Catatan audit (Pratinjau Publik) | Menyertakan rekaman untuk semua peristiwa audit dari ruang kerja di wilayah Anda. Untuk daftar peristiwa audit yang tersedia, lihat referensi log diagnostik . Jalur tabel: system.access.audit |
Ya | 365 hari | Regional untuk acara tingkat ruang kerja. Peristiwa tingkat akun bersifat global. |
| Penggunaan yang dapat ditagih | Mencakup catatan untuk semua penggunaan yang dapat ditagih untuk seluruh akun Anda. Jalur tabel: system.billing.usage |
Ya | 365 hari | Mendunia |
| Acara clean room (Pratinjau Umum) | Menangkap peristiwa terkait ruang bersih. Jalur tabel: system.access.clean_room_events |
Ya | 365 hari | Wilayah |
| Kluster |
Tabel dimensi yang berubah lambat yang berisi riwayat lengkap konfigurasi komputasi dari waktu ke waktu untuk kluster apa pun. | Ya | 365 hari | Wilayah |
| Silsilah kolom | Menyertakan rekaman untuk setiap peristiwa baca atau tulis pada kolom Katalog Unity (tetapi tidak menyertakan peristiwa yang tidak memiliki sumber). Jalur tabel: system.access.column_lineage |
Ya | 365 hari | Wilayah |
| Hasil klasifikasi data (Beta) | Menyimpan deteksi pada tingkat kolom untuk kelas data sensitif di seluruh katalog yang diaktifkan dalam metastore yang Anda miliki. Jalur tabel: system.data_classification.results |
Tidak | 365 hari | Wilayah |
| Hasil pemantauan kualitas data (Beta) | Menyimpan hasil pemeriksaan pemantauan kualitas data (kesegaran, kelengkapan) dan informasi insiden, termasuk dampak hilir dan analisis akar penyebab, di seluruh tabel yang diaktifkan di metastore Anda. Jalur tabel: system.data_quality_monitoring.table_results |
Tidak | Tak Terbatas | Wilayah |
| Peristiwa Asisten Databricks (Pratinjau Umum) | Melacak pesan pengguna yang dikirim ke Asisten Databricks. Jalur tabel: system.access.assistant_events |
Tidak | 365 hari | Wilayah |
| Peristiwa materialisasi data pada Delta Sharing | Menangkap peristiwa materialisasi data yang dibuat dari tampilan, tampilan terwujud, dan pembagian tabel streaming. Jalur tabel: system.sharing.materialization_history |
Ya | 365 hari | Regional untuk acara tingkat ruang kerja. |
| Linimasa Pemrosesan Pekerjaan (Pratinjau Umum) | Melacak waktu mulai dan berakhir dari proses pekerjaan. Jalur tabel: system.lakeflow.job_run_timeline |
Ya | 365 hari | Wilayah |
| Jadwal tugas (Pratinjau Umum) | Melacak waktu mulai dan berakhir serta sumber daya komputasi yang digunakan untuk menjalankan tugas pekerjaan. Jalur tabel: system.lakeflow.job_task_run_timeline |
Ya | 365 hari | Wilayah |
| Tugas pekerjaan (Pratinjau Umum) | Melacak semua tugas pekerjaan yang berjalan di akun. Jalur tabel: system.lakeflow.job_tasks |
Ya | 365 hari | Wilayah |
| Pekerjaan (Pratinjau Umum) | Melacak semua pekerjaan yang dibuat di akun. Jalur tabel: system.lakeflow.jobs |
Ya | 365 hari | Wilayah |
| Peristiwa corong di marketplace (Pratinjau Publik) | Termasuk kesan konsumen dan data saluran untuk daftar Anda. Jalur tabel: system.marketplace.listing_funnel_events |
Ya | 365 hari | Wilayah |
| Akses ke daftar di marketplace (Pratinjau Publik) | Menyertakan info konsumen untuk peristiwa permintaan data lengkap atau pengambilan data di daftar Anda. Jalur tabel: system.marketplace.listing_access_events |
Ya | 365 hari | Wilayah |
| Metadata eksperimen pelacakan MLflow (Pratinjau Umum) | Setiap baris mewakili eksperimen yang dibuat dalam sistem MLflow yang dikelola Databricks. Jalur tabel: system.mlflow.experiments_latest |
Ya | 180 hari | Wilayah |
| Metadata eksekusi pelacakan MLflow (Pratinjau Umum) | Setiap baris mewakili eksekusi yang dibuat dalam sistem MLflow yang dikelola Databricks. Jalur tabel: system.mlflow.runs_latest |
Ya | 180 hari | Wilayah |
| Metrik eksekusi pelacakan MLflow (Pratinjau Umum) | Menyimpan metrik timeseries yang dicatat ke MLflow yang terkait dengan pelatihan model, evaluasi, atau pengembangan agen tertentu. Jalur tabel: system.mlflow.run_metrics_history |
Ya | 180 hari | Wilayah |
| Data titik akhir penyajian model (Pratinjau Umum) | Tabel dimensi yang berubah lambat yang menyimpan metadata untuk setiap model fondasi yang dilayani dalam model yang melayani titik akhir. Jalur tabel: system.serving.served_entities |
Ya | 365 hari | Wilayah |
| Penggunaan titik akhir untuk penyajian model (Pratinjau Umum) | Merekam jumlah token untuk setiap permintaan ke model titik akhir pemrosesan dan responsnya. Untuk merekam penggunaan titik akhir dalam tabel ini, Anda harus mengaktifkan pelacakan penggunaan pada titik akhir layanan Anda. Jalur tabel: system.serving.endpoint_usage |
Ya | 90 hari | Wilayah |
| Peristiwa akses jaringan (Inbound) (Pratinjau Umum) | Tabel yang merekam peristiwa untuk setiap kali akses masuk ke ruang kerja ditolak oleh kebijakan masuk. Jalur tabel: system.access.inbound_network |
Ya | 30 hari | Wilayah |
| Peristiwa akses jaringan (Keluar) (Pratinjau Umum) | Tabel yang mencatat peristiwa setiap kali akses internet keluar ditolak dari akun Anda. Jalur tabel: system.access.outbound_network |
Ya | 365 hari | Wilayah |
| Garis waktu simpul | Menangkap metrik pemanfaatan sumber daya komputasi untuk keperluan umum dan tugas-tugas Anda. Jalur tabel: system.compute.node_timeline |
Ya | 90 hari | Wilayah |
| Jenis node | Menangkap jenis node yang saat ini tersedia dengan informasi perangkat keras dasarnya. Jalur tabel: system.compute.node_types |
Tidak | Tak Terbatas | Wilayah |
| Jadwal pembaruan jalur (Pratinjau Umum) | Melacak waktu mulai dan berakhir serta sumber daya komputasi yang digunakan untuk pembaruan alur. Jalur tabel: system.lakeflow.pipeline_update_timeline |
Ya | 365 hari | Wilayah |
| Pipeline (Pratinjau Publik) | Melacak semua pipeline yang sudah dibuat di akun. Jalur tabel: system.lakeflow.pipelines |
Ya | 365 hari | Wilayah |
| Pengoptimalan prediktif (Pratinjau Umum) | Melacak riwayat operasi fitur pengoptimalan prediktif. Jalur tabel: system.storage.predictive_optimization_operations_history |
Tidak | 180 hari | Wilayah |
| Penentuan Harga | Catatan sejarah harga SKU. Catatan ditambahkan setiap kali ada perubahan pada harga SKU. Jalur tabel: system.billing.list_prices |
Tidak | Tak Terbatas | Mendunia |
| Riwayat Kueri (Pratinjau Publik) | Mengambil rekaman untuk semua kueri yang dijalankan di gudang SQL dan komputasi tanpa server untuk buku catatan dan pekerjaan . Jalur tabel: system.query.history |
Tidak | 365 hari | Wilayah |
| Event gudang SQL (Pratinjau Umum) | Menangkap peristiwa yang terkait dengan gudang data SQL. Misalnya, memulai, menghentikan, menjalankan, memperbesar, dan memperkecil skala. Jalur tabel: system.compute.warehouse_events |
Ya | 365 hari | Wilayah |
| Gudang SQL (Pratinjau Umum) | Berisi riwayat lengkap konfigurasi dari waktu ke waktu untuk gudang SQL apa pun. Jalur tabel: system.compute.warehouses |
Ya | 365 hari | Wilayah |
| Keterkaitan tabel | Menyertakan catatan untuk setiap aktivitas baca atau tulis pada tabel atau jalur Katalog Unity. Jalur tabel: system.access.table_lineage |
Ya | 365 hari | Wilayah |
| Ruang Kerja (Pratinjau Umum) | Tabel workspaces_latest adalah tabel metadata dimensi yang berubah lambat untuk semua ruang kerja di akun. Jalur tabel: system.access.workspaces_latest |
Tidak | Tak Terbatas | Mendunia |
| Zerobus Ingest (Streams) (Beta) | Tabel yang menyimpan semua data terkait peristiwa streaming yang terjadi akibat penggunaan Zerobus Ingest. Jalur tabel: system.lakeflow.zerobus_stream |
Ya | 365 hari | Wilayah |
| Zerobus Ingest (Pengambilan Data) (Beta) | Tabel yang menyimpan semua data yang terkait dengan rekaman yang diserap menggunakan Zerobus Ingest. Jalur tabel: system.lakeflow.zerobus_ingest |
Ya | 365 hari | Wilayah |
Tabel penggunaan yang dapat ditagihkan dan harga dapat digunakan secara gratis. Tabel dalam Tahap Pratinjau Publik juga dapat digunakan secara gratis selama pratinjau, tetapi mungkin akan dikenakan biaya di masa depan.
Catatan
Anda mungkin melihat tabel sistem lain di akun Anda, selain tabel yang tercantum di atas. Tabel tersebut saat ini berada di Pratinjau Privat dan kosong secara default. Jika Anda tertarik menggunakan salah satu tabel ini, silakan hubungi tim akun Databricks Anda.
hubungan tabel-tabel sistem
Diagram hubungan entitas berikut menguraikan bagaimana tabel sistem yang saat ini tersedia berhubungan satu sama lain. Diagram ini menyoroti kunci primer dan asing dari setiap tabel.
diagram hubungan entitas
Mengaktifkan tabel sistem
Karena tabel sistem diatur oleh Unity Catalog, Anda harus memiliki setidaknya satu ruang kerja yang mendukung Katalog Unity di akun Anda untuk mengaktifkan tabel sistem akun Anda. Tabel sistem menyertakan data dari semua ruang kerja di akun Anda, tetapi hanya dapat diakses dari ruang kerja yang mendukung Katalog Unity.
Metastore harus berada di Unity Catalog Privilege Model Versi 1.0 untuk mengakses tabel sistem. Lihat Peningkatan ke pewarisan hak istimewa.
Memberikan akses ke tabel sistem
Akses ke tabel sistem diatur oleh Katalog Unity. Admin akun memiliki akses ke tabel sistem secara default. Untuk mengizinkan pengguna mengkueri tabel sistem, admin harus memberikan pengguna USE dan SELECT izin tersebut pada skema sistem. Lihat Kelola hak akses di Unity Catalog.
Tabel sistem bersifat baca-saja dan tidak dapat dimodifikasi.
Catatan
Jika akun Anda dibuat setelah 9 November 2023, Anda mungkin tidak memiliki admin metastore secara default. Untuk informasi selengkapnya, lihat Mulai menggunakan Katalog Unity.
Apakah tabel sistem berisi data untuk semua ruang kerja di akun Anda?
Tabel sistem berisi data operasional untuk semua ruang kerja di akun Anda yang disebarkan dalam wilayah cloud yang sama. Beberapa tabel menyertakan data global. Untuk detailnya, lihat daftar tabel yang tersedia.
Meskipun tabel sistem hanya dapat diakses melalui ruang kerja Unity Catalog, tabel tersebut menyertakan data operasional dari ruang kerja Katalog non-Unity di akun Anda.
Di mana data tabel sistem disimpan?
Data tabel sistem akun Anda disimpan di akun penyimpanan yang dihosting Azure Databricks yang terletak di wilayah yang sama dengan metastore Anda. Data dibagikan dengan aman kepada Anda menggunakan Berbagi Delta.
Setiap tabel memiliki periode retensi data gratis. Untuk detailnya, lihat kolom Periode retensi gratis di Tabel sistem mana yang tersedia?.
Di mana tabel sistem berada di Catalog Explorer?
Tabel-tabel sistem di akun Anda berada di katalog yang disebut system, yang disertakan dalam setiap metastore Katalog Unity.
system Dalam katalog, Anda akan melihat skema seperti access dan billing yang berisi tabel sistem.
Pertimbangan untuk tabel sistem streaming
Azure Databricks menggunakan Berbagi Delta untuk berbagi data tabel sistem dengan pelanggan. Ketahui pertimbangan berikut saat streaming dengan Berbagi Delta:
- Jika Anda menggunakan streaming dengan tabel sistem, atur opsi
skipChangeCommitsketrue. Ini memastikan pekerjaan streaming tidak terganggu oleh penghapusan dalam tabel sistem. Lihat Mengabaikan pembaruan dan penghapusan. -
Trigger.AvailableNowtidak didukung pada Delta Sharing streaming. Ini akan dikonversi keTrigger.Once. - Tabel sistem menggunakan retensi default selama 7 hari untuk
VACUUM(lihat Mengonfigurasi retensi data untuk kueri perjalanan waktu), yang berarti kueri streaming Anda mungkin gagal jika ketinggalan lebih dari 7 hari. Pantau aliran Anda untuk memastikan mereka tetap terkini dengan versi terbaru tabel sistem.
Jika Anda menggunakan pemicu dalam pekerjaan streaming dan menemukannya tidak mengejar versi tabel sistem terbaru, Databricks merekomendasikan untuk meningkatkan frekuensi pekerjaan terjadwal.
Membaca perubahan inkremental dari tabel sistem streaming
spark.readStream.option("skipChangeCommits", "true").table("system.billing.usage")
Masalah umum
- Kolom baru dapat ditambahkan ke tabel sistem yang ada kapan saja. Kueri yang mengandalkan skema tetap dapat rusak jika kolom baru diperkenalkan. Kolom yang ada tidak akan berubah atau dihapus. Jika Anda menulis data tabel sistem ke tabel target lain, pertimbangkan untuk mengaktifkan evolusi skema.
- Tidak ada dukungan untuk pemantauan real time. Data diperbarui sepanjang hari. Jika Anda tidak melihat log untuk peristiwa terbaru, periksa kembali nanti.
-
__internal_loggingSkema tabel sistem mendukung pengelogan payload menggunakan tabel inferensi dengan dukungan AI Gateway untuk model eksternal dan beban kerja throughput yang disediakan. Skema ini terlihat oleh admin akun, tetapi tidak dapat diaktifkan dan tidak boleh digunakan untuk alur kerja pelanggan.
- Untuk mengaktifkan tabel sistem, Anda mungkin perlu memberikan akses jaringan ke titik akhir penyimpanan Blob pada tabel sistem. Untuk melihat daftar titik akhir penyimpanan tabel sistem setiap wilayah, lihat Alamat IP titik akhir penyimpanan.
- Skema sistem
system.operational_datadansystem.lineagetidak digunakan lagi dan akan berisi tabel kosong.