Catatan
Akses ke halaman ini memerlukan otorisasi. Anda dapat mencoba masuk atau mengubah direktori.
Akses ke halaman ini memerlukan otorisasi. Anda dapat mencoba mengubah direktori.
Halaman ini menjelaskan cara mengakses data yang telah dibagikan dengan Anda dengan menggunakan Delta Sharing. Delta Sharing mendukung dua model: Berbagi Databricks-ke-Databricks, untuk para pengguna ruang kerja Azure Databricks dengan Unity Catalog, dan berbagi terbuka, untuk penerima manapun yang menggunakan alat apapun.
Berbagi Delta dan penerima data
Delta Sharing adalah standar terbuka untuk berbagi data yang aman. Pengguna Databricks, yang disebut sebagai penyedia data dalam konteks ini, dapat menggunakan Berbagi Delta di Azure Databricks untuk berbagi data dengan seseorang atau grup di luar organisasi mereka, yang disebut penerima data.
Berbagi Databricks-ke-Databricks dan berbagi terbuka
Bagaimana Anda mengakses data tergantung pada apakah Anda sendiri adalah pengguna Databricks dan apakah penyedia data Anda mengonfigurasi data yang dibagikan dengan Anda untuk berbagi Databricks-ke-Databricks atau berbagi terbuka atau tidak.
Dalam model Databricks-to-Databricks, Anda harus menjadi pengguna di ruang kerja Databricks yang memiliki kemampuan untuk mendukung Unity Catalog. Anggota tim Anda menyediakan pengidentifikasi unik kepada penyedia data untuk metastore Katalog Unity Anda, dan penyedia data menggunakannya untuk menciptakan koneksi berbagi yang aman. Data bersama tersedia untuk akses di ruang kerja Anda. Jika perlu, anggota tim Anda mengonfigurasi kontrol akses terperinci pada data tersebut.
Dalam model berbagi terbuka, Anda dapat menggunakan alat apa pun yang Anda suka (termasuk Databricks) untuk mengakses data bersama. Penyedia data mengirimkan URL aktivasi atau tautan portal melalui saluran aman. Anda mengikutinya untuk mengunduh file kredensial atau URL yang memungkinkan Anda mengakses data yang dibagikan dengan Anda.
Data bersama tidak disediakan oleh Databricks secara langsung tetapi oleh penyedia data yang berjalan di Azure Databricks.
Catatan
Databricks dapat mengumpulkan informasi tentang penggunaan dan akses penerima data ke data bersama (termasuk mengidentifikasi individu atau perusahaan yang mengakses data menggunakan file kredensial sehubungan dengan informasi tersebut) dan dapat membagikannya dengan penyedia data yang berlaku.
Mendapatkan akses ke data yang dibagikan dengan Anda
Cara Anda mengakses data bergantung pada apakah penyedia data Anda berbagi data dengan Anda menggunakan protokol berbagi terbuka atau protokol berbagi Databricks-to-Databricks. Lihat Berbagi Databricks-ke-Databricks dan berbagi terbuka.
Dapatkan akses pada model Databricks-to-Databricks
Dalam model Databricks-to-Databricks:
Penyedia data mengirimkan instruksi untuk menemukan pengidentifikasi unik untuk Unity Catalog metastore yang terkait dengan ruang kerja Databricks Anda, dan Anda mengirimkannya kepada mereka.
Pengidentifikasi berbagi adalah string yang terdiri dari cloud, wilayah, dan UUID metastore (pengidentifikasi unik untuk metastore), dengan format
<cloud>:<region>:<uuid>. Contohnya,aws:eu-west-1:b0c978c8-3e68-4cdf-94af-d05c120ed1ef.Untuk mendapatkan pengidentifikasi pembagian menggunakan Catalog Explorer:
Di ruang kerja Azure Databricks Anda, klik
Katalog.
Di bagian atas panel Katalog , klik
ikon gerigi dan pilih Berbagi Delta.
Atau, di sudut kanan atas, klik
Bagikan Delta Sharing . Pada tab Dibagikan dengan saya, pilih nama organisasi berbagi Databricks Anda di pojok kanan atas, dan pilih Salin identifikasi berbagi.
Untuk mendapatkan identifikasi berbagi dengan menggunakan notebook atau kueri Databricks SQL, gunakan fungsi SQL default
CURRENT_METASTORE. Jika Anda menggunakan laptop, perangkat tersebut harus berjalan pada mode akses standar atau mode akses khusus di ruang kerja yang akan Anda gunakan untuk mengakses data bersama.SELECT CURRENT_METASTORE();Penyedia data membuat:
- Seorang penerima di dalam akun Databricks mereka untuk mewakili Anda dan pengguna di organisasi Anda yang akan mengakses data.
- berbagi, yang merupakan representasi tabel, volume, dan tampilan yang akan dibagikan dengan Anda.
Anda mengakses data yang dibagikan dengan Anda. Anda atau seseorang di tim Anda dapat, jika perlu, mengonfigurasi akses data terperinci pada data tersebut untuk pengguna Anda. Lihat Baca data yang dibagikan menggunakan Databricks-to-Databricks Delta Sharing (untuk penerima).
Mendapatkan akses dalam model berbagi terbuka
Dalam model berbagi terbuka:
Penyedia data membuat:
- Seorang penerima di dalam akun Databricks mereka untuk mewakili Anda dan pengguna di organisasi Anda yang akan mengakses data.
- Bagian , yang merupakan representasi dari tabel dan partisi yang akan dibagikan dengan Anda.
Penyedia data mengirimkan URL aktivasi (melalui saluran aman) atau URL portal. Anda mengikutinya untuk mengunduh file kredensial atau URL yang memungkinkan Anda mengakses data yang dibagikan dengan Anda.
Token pembawa dan Kredensial Klien OAuth didukung.
Penting
Jangan bagikan tautan aktivasi dengan siapa pun. Anda dapat mengunduh file kredensial hanya sekali. Jika Anda mengunjungi tautan aktivasi lagi setelah file kredensial diunduh, tombol Unduh File Kredensial dinonaktifkan.
Jika Anda kehilangan tautan aktivasi sebelum menggunakannya, hubungi penyedia data.
Simpan file kredensial di lokasi yang aman.
Jangan bagikan file kredensial dengan siapa pun di luar grup pengguna yang seharusnya memiliki akses ke data bersama. Jika Anda perlu membagikannya dengan seseorang di organisasi Anda, Databricks merekomendasikan untuk menggunakan pengelola kata sandi.
Membaca data yang dibagikan
Cara membaca data yang telah dibagikan dengan aman menggunakan Delta Sharing tergantung pada apakah Anda menerima file kredensial (model berbagi terbuka) atau Anda berada dalam ruang kerja Databricks dan memberikan pengidentifikasi berbagi Anda kepada penyedia data (model Databricks-ke-Databricks).
Catatan
Jika Anda mendapatkan kesalahan yang menyatakan aset data tidak ada saat mencoba membaca berbagi data Anda, lihat Kesalahan aset data "tidak ada".
Membaca data bersama menggunakan file kredensial (berbagi terbuka)
Jika data telah dibagikan kepada Anda menggunakan protokol berbagi terbuka Delta Sharing dengan bearer token, Anda menggunakan file kredensial yang telah diunduh untuk mengautentikasi akun penyedia data dan membaca data yang dibagikan. Akses bertahan selama token yang mendasar valid dan penyedia terus berbagi data. Penyedia mengelola kedaluwarsa dan rotasi token. Token berlaku selama maksimal satu tahun setelah pembuatan. Pembaruan data tersedia untuk Anda dalam waktu dekat. Anda dapat membaca dan membuat salinan data bersama, tetapi Anda tidak dapat mengubah data sumber.
Untuk mempelajari cara mengakses dan membaca data yang dibagikan menggunakan file kredensial di Azure Databricks, Apache Spark, pandas, dan Power BI, lihat Baca data yang dibagikan menggunakan Delta Sharing dengan token pembawa.
Membaca data bersama menggunakan federasi OIDC (berbagi terbuka)
Jika data telah dibagikan kepada Anda menggunakan protokol berbagi terbuka Delta Sharing dengan federasi OIDC, Anda menggunakan URL yang dikirim kepada Anda untuk mengautentikasi akun penyedia dan mengakses data yang dibagikan. Akses bertahan selama penyedia terus berbagi data. Pembaruan data tersedia untuk Anda dalam waktu dekat. Anda dapat membaca dan membuat salinan data bersama, tetapi Anda tidak dapat mengubah data sumber.
Untuk mempelajari cara mengakses dan membaca data bersama menggunakan alur federasi token OIDC di Tableau dan Power BI, lihat Menerima berbagi Delta Sharing menggunakan federasi Open ID Connect (OIDC) dalam alur pengguna-ke-mesin (pembagian terbuka). Untuk mempelajari cara mengakses dan membaca data bersama menggunakan alur federasi token OIDC di aplikasi klien Python, lihat Menerima penerimaan berbagi Delta menggunakan klien Python dan federasi Open ID Connect (OIDC) dalam alur berbagi terbuka antar mesin.
Membaca data yang dibagikan menggunakan pembagian antar-Databricks
Jika data telah dibagikan dengan Anda menggunakan model Databricks-to-Databricks, maka tidak ada file kredensial yang diperlukan untuk mengakses data bersama. Databricks mengurus koneksi yang aman, dan data bersama secara otomatis dapat ditemukan di ruang kerja Databricks Anda.
Untuk mempelajari cara menemukan, membaca, dan mengelola data yang dibagikan di ruang kerja Databricks Anda, rujuk pada Membaca data yang dibagikan melalui Berbagi Delta dari Databricks ke Databricks (untuk penerima).
Mengaudit penggunaan data bersama
Jika Anda memiliki akses ke ruang kerja Azure Databricks, Anda dapat menggunakan log audit Azure Databricks untuk memahami siapa di organisasi Anda yang mengakses data mana yang menggunakan Berbagi Delta. Lihat Mengaudit dan memantau berbagi data.