Catatan
Akses ke halaman ini memerlukan otorisasi. Anda dapat mencoba masuk atau mengubah direktori.
Akses ke halaman ini memerlukan otorisasi. Anda dapat mencoba mengubah direktori.
Azure Databricks menyediakan beberapa jenis tabel dan format penyimpanan untuk memenuhi kebutuhan manajemen data yang berbeda. Bagian ini mencakup tabel terkelola, eksternal, dan asing, bersama dengan format penyimpanan Delta Lake dan Apache Iceberg yang mendukung fitur canggih seperti transaksi Atomitas, Konsistensi, Isolasi, dan Durabilitas (ACID) dan perjalanan waktu.
Konsep inti
Pelajari dasar-dasar jenis tabel, format penyimpanan, dan integrasi Unity Catalog.
| Topik | Description |
|---|---|
| Konsep tabel | Konsep inti dan informasi dasar tentang jenis tabel, format penyimpanan, dan integrasi Katalog Unity. |
Jenis tabel
Jelajahi berbagai jenis tabel dan kemampuannya untuk berbagai skenario manajemen data.
| Jenis tabel | Description |
|---|---|
| Tabel terkelola | Tabel tempat Azure Databricks mengelola metadata dan file data. Direkomendasikan untuk tabel baru dengan performa dan penyimpanan yang dioptimalkan. |
| Tabel eksternal | Tabel yang mereferensikan data yang disimpan dalam sistem penyimpanan eksternal saat mengelola metadata di Unity Catalog. |
| Tabel asing | Tabel baca-saja yang mewakili data dalam sistem eksternal yang terhubung melalui Federasi Lakehouse. |
Format penyimpanan
Bekerja dengan format tabel terbuka yang menyediakan kemampuan manajemen data tingkat lanjut.
| Rancangan | Description |
|---|---|
| Danau Delta | Format penyimpanan default yang menyediakan transaksi ACID, perjalanan waktu, dan penegakan skema untuk tabel terkelola dan eksternal. |
| Apache Iceberg | Format tabel terbuka untuk integrasi dengan ekosistem Iceberg, mendukung manajemen metadata tingkat lanjut. |
Manajemen tabel
Mengonfigurasi dan mengoptimalkan perilaku, struktur, dan performa tabel.
| Fitur | Description |
|---|---|
| Batasan tabel | Menentukan dan menerapkan aturan kualitas data dengan batasan pemeriksaan dan bukan batasan null. |
| Penegakan skema | Mengontrol bagaimana Azure Databricks menangani perubahan skema dan penegakan jenis data selama penulisan. |
| Pemartisian tabel | Atur data menurut kunci partisi untuk meningkatkan performa kueri dan manajemen data. |
| Pemantauan ukuran tabel | Pantau dan analisis penggunaan penyimpanan tabel dan pola pertumbuhan. |
| Mengonversi eksternal ke terkelola | Migrasikan tabel eksternal ke tabel terkelola untuk peningkatan performa dan manajemen. |
| Penemuan partisi eksternal | Temukan dan daftarkan partisi secara otomatis dalam tabel eksternal yang disimpan di penyimpanan cloud. |