Catatan
Akses ke halaman ini memerlukan otorisasi. Anda dapat mencoba masuk atau mengubah direktori.
Akses ke halaman ini memerlukan otorisasi. Anda dapat mencoba mengubah direktori.
Halaman ini menjelaskan pembatasan sekeliling jalur yang tumpang tindih di Unity Catalog, merinci pola akses berbasis jalur untuk file data di objek Katalog Unity, dan menjelaskan cara Katalog Unity mengelola jalur untuk tabel dan volume.
Pembatasan tumpang tindih jalur di Unity Catalog
Unity Catalog memberlakukan tata kelola data dengan mencegah direktori data terkelola tumpang tindih. Katalog Unity memberlakukan aturan berikut:
- Lokasi eksternal tidak dapat tumpang tindih dengan lokasi eksternal lainnya.
- Tabel dan volume menyimpan file data di lokasi eksternal atau lokasi akar metastore.
- Volume tidak dapat tumpang tindih dengan volume lain.
- Tabel tidak dapat tumpang tindih dengan tabel lain.
- Tabel dan volume tidak dapat saling tumpang tindih.
- Lokasi penyimpanan terkelola tidak dapat saling tumpang tindih. Lihat Menentukan lokasi penyimpanan terkelola di Unity Catalog.
- Volume eksternal tidak dapat tumpang tindih dengan lokasi penyimpanan terkelola.
- Tabel eksternal tidak dapat tumpang tindih dengan lokasi penyimpanan terkelola.
Aturan ini berarti bahwa pembatasan berikut ada di Katalog Unity:
- Anda tidak dapat menentukan lokasi eksternal dalam lokasi eksternal lain.
- Anda tidak dapat menentukan volume dalam volume lain.
- Anda tidak dapat menentukan tabel dalam tabel lain.
- Anda tidak dapat menentukan tabel pada file data atau direktori apa pun dalam volume.
- Anda tidak dapat menentukan volume pada direktori dalam tabel.
Nota
Anda selalu dapat menggunakan akses berbasis jalur untuk menulis atau membaca file data dari volume, termasuk Delta Lake. Anda tidak dapat mendaftarkan file data ini sebagai tabel di metastore Unity Catalog.
Jalur yang dikelola sepenuhnya untuk tabel dan volume
Saat Anda membuat tabel terkelola atau volume terkelola, Unity Catalog membuat direktori baru di lokasi penyimpanan yang dikonfigurasi Katalog Unity yang terkait dengan skema yang berisi. Nama direktori ini dihasilkan secara acak untuk menghindari potensi tabrakan dengan direktori lain yang sudah ada. Perilaku ini berbeda dari cara metastore Hive membuat tabel terkelola.
Akses berbasis jalur ke tabel terkelola Unity Catalog tidak didukung. Selalu berinteraksi dengan tabel terkelola Unity Catalog menggunakan nama tabel dan volume terkelola Unity Catalog menggunakan jalur volume.
Jalur lokasi eksternal untuk tabel dan volume
Saat Anda membuat tabel atau volume eksternal, Anda menentukan jalur dalam lokasi eksternal yang diatur oleh Katalog Unity.
Penting
Untuk menghindari konflik jalur, Databricks merekomendasikan pembuatan tabel dan volume eksternal di sub-direktori daripada di akar lokasi eksternal.
Untuk kemudahan penggunaan, berinteraksi dengan tabel eksternal Unity Catalog menggunakan nama tabel, dan volume eksternal menggunakan jalur volume. Pengguna dengan hak istimewa yang memadai juga dapat mengakses data secara langsung menggunakan jalur penyimpanan cloud lengkap.
Akses ke data melalui URI cloud untuk objek ini sepenuhnya diatur oleh hak istimewa Katalog Unity, yang mengambil alih hak istimewa apa pun di lokasi eksternal itu sendiri. Lihat Pembatasan tumpang tindih jalur di Katalog Unity dan hak istimewa Katalog Unity dan objek yang dapat diamankan.
Mengakses data di Katalog Unity
Objek Katalog Unity menyediakan akses ke data melalui pengidentifikasi objek, jalur volume, atau URI cloud. Anda dapat menggunakan nilai-nilai ini untuk mengakses data yang terkait dengan volume dan tabel.
Tabel Unity Catalog diakses menggunakan pengidentifikasi tiga tingkat dengan pola berikut:
<catalog_name>.<schema_name>.<table_name>
Jalur file volume di Katalog Unity
Volume menyediakan jalur file untuk mengakses file data dengan pola berikut:
/Volumes/<catalog_name>/<schema_name>/<volume_name>/<path_to_file>
URI cloud mengharuskan pengguna untuk menyediakan driver, pengidentifikasi kontainer penyimpanan, dan jalur lengkap ke file target, seperti dalam contoh berikut:
abfss://<container_name>@<storage_account>.dfs.core.windows.net/<path>
Tabel berikut ini memperlihatkan metode akses yang diizinkan untuk objek Katalog Unity:
| Objek | Pengidentifikasi objek | Lintasan file | Cloud URI |
|---|---|---|---|
| Lokasi eksternal | Tidak | Tidak | Ya |
| Tabel terkelola | Ya | Tidak | Tidak |
| Tabel eksternal | Ya | Tidak | Ya |
| Volume yang dikelola | Tidak | Ya | Tidak |
| Volume eksternal | Tidak | Ya | Ya |
Nota
Volume Katalog Unity menggunakan pengidentifikasi objek tiga tingkat dengan pola berikut untuk perintah manajemen (seperti CREATE VOLUME dan DROP VOLUME):
<catalog_name>.<schema_name>.<volume_name>
Untuk benar-benar bekerja dengan file dalam volume, Anda harus menggunakan akses berbasis jalur.