Bagikan melalui


Mengakses data yang dibagikan dengan Anda menggunakan Berbagi Delta (untuk penerima)

Artikel ini memperlihatkan cara mengakses data yang telah dibagikan dengan Anda menggunakan Berbagi Delta.

Delta Sharing dan penerima data

Delta Sharing adalah standar terbuka untuk berbagi data yang aman. Pengguna Databricks, yang disebut penyedia data, dapat menggunakan Berbagi Delta untuk berbagi data dengan seseorang atau grup di luar organisasi mereka, yang disebut penerima data.

Berbagi databricks-ke-Databricks dan berbagi terbuka

Bagaimana Anda mengakses data tergantung pada apakah Anda sendiri adalah pengguna Databricks dan apakah penyedia data Anda mengonfigurasi data yang dibagikan dengan Anda untuk berbagi Databricks-ke-Databricks atau berbagi terbuka atau tidak.

Dalam model Databricks-to-Databricks, Anda harus menjadi pengguna di ruang kerja Databricks yang diaktifkan untuk Unity Catalog. Anggota tim Anda menyediakan penyedia data dengan pengidentifikasi unik untuk metastore Katalog Unity Anda, dan penyedia data menggunakannya untuk membuat koneksi berbagi yang aman. Data bersama tersedia untuk akses di ruang kerja Anda. Jika perlu, anggota tim Anda mengonfigurasi kontrol akses terperinci pada data tersebut.

Dalam model berbagi terbuka, Anda dapat menggunakan alat apa pun yang Anda suka (termasuk Databricks) untuk mengakses data bersama. Penyedia data mengirimkan URL aktivasi melalui saluran aman. Anda mengikutinya untuk mengunduh file kredensial yang memungkinkan Anda mengakses data yang dibagikan dengan Anda.

Ketentuan penggunaan

Data bersama tidak disediakan oleh Databricks secara langsung tetapi oleh penyedia data yang berjalan di Azure Databricks.

Catatan

Dengan mengakses data bersama penyedia data sebagai penerima data, penerima data menyatakan bahwa telah diberi wewenang untuk mengakses berbagi data yang diberikan kepadanya oleh penyedia data dan mengakui bahwa (1) Databricks tidak bertanggung jawab atas penggunaan data atau perusahaan penerima data tersebut, dan (2) Databricks dapat mengumpulkan informasi tentang penggunaan dan akses penerima data ke data bersama (termasuk mengidentifikasi setiap individu atau perusahaan yang mengakses data yang menggunakan file info masuk sehubungan dengan informasi tersebut) dan dapat membagikannya dengan penyedia data yang berlaku.

Mendapatkan akses ke data yang dibagikan dengan Anda

Cara Anda mengakses data bergantung pada apakah penyedia data Anda berbagi data dengan Anda menggunakan protokol berbagi terbuka atau protokol berbagi Databricks-to-Databricks. Lihat Berbagi databricks-ke-Databricks dan berbagi terbuka.

Mendapatkan akses dalam model Databricks-to-Databricks

Dalam model Databricks-to-Databricks:

  1. Penyedia data mengirimkan instruksi untuk menemukan pengidentifikasi unik untuk metastore Unity Catalog yang terkait dengan ruang kerja Databricks Anda, dan Anda mengirimkannya kepada mereka.

    Pengidentifikasi berbagi adalah string yang terdiri dari cloud, wilayah, dan UUID metastore (pengidentifikasi unik untuk metastore), dalam format <cloud>:<region>:<uuid>. Contohnya,aws:eu-west-1:b0c978c8-3e68-4cdf-94af-d05c120ed1ef.

    Untuk mendapatkan pengidentifikasi berbagi menggunakan Catalog Explorer:

    1. Di ruang kerja Azure Databricks Anda, klik Ikon katalog Katalog.

    2. Di bagian atas panel Katalog , klik ikon gerigi Ikon gigi dan pilih Berbagi Delta.

      Atau, dari halaman Akses cepat, klik tombol Berbagi > Delta.

      1. Pada tab Dibagikan dengan saya , klik nama organisasi berbagi Databricks Anda di kanan atas, dan pilih Salin pengidentifikasi berbagi.

    Untuk mendapatkan pengidentifikasi berbagi menggunakan notebook atau kueri Databricks SQL, gunakan fungsi CURRENT_METASTORESQL default . Jika Anda menggunakan buku catatan, buku catatan harus berjalan pada kluster bersama atau pengguna tunggal di ruang kerja yang akan Anda gunakan untuk mengakses data bersama.

    SELECT CURRENT_METASTORE();
    
  2. Penyedia data membuat:

    • Penerima di akun Databricks mereka untuk mewakili Anda dan pengguna di organisasi Anda yang akan mengakses data.
    • Berbagi, yang merupakan representasi tabel, volume, dan tampilan yang akan dibagikan dengan Anda.
  3. Anda mengakses data yang dibagikan dengan Anda. Anda atau seseorang di tim Anda dapat, jika perlu, mengonfigurasi akses data terperinci pada data tersebut untuk pengguna Anda. Lihat Membaca data yang dibagikan menggunakan Berbagi Delta Databricks-ke-Databricks (untuk penerima).

Mendapatkan akses dalam model berbagi terbuka

Dalam model berbagi terbuka:

  1. Penyedia data membuat:

    • Penerima di akun Databricks mereka untuk mewakili Anda dan pengguna di organisasi Anda yang akan mengakses data. File token dan kredensial dihasilkan sebagai bagian dari konfigurasi ini.
    • Berbagi, yang merupakan representasi tabel dan partisi yang akan dibagikan dengan Anda.
  2. Penyedia data mengirimkan URL aktivasi melalui saluran aman. Anda mengikutinya untuk mengunduh file kredensial yang memungkinkan Anda mengakses data yang dibagikan dengan Anda.

    Penting

    Jangan bagikan tautan aktivasi dengan siapa pun. Anda dapat mengunduh file kredensial hanya sekali. Jika Anda mengunjungi tautan aktivasi lagi setelah file kredensial diunduh, tombol Unduh File Kredensial dinonaktifkan.

    Jika Anda kehilangan tautan aktivasi sebelum menggunakannya, hubungi penyedia data.

  3. Simpan file info masuk di lokasi yang aman.

    Jangan bagikan file kredensial dengan siapa pun di luar grup pengguna yang seharusnya memiliki akses ke data bersama. Jika Anda perlu membagikannya dengan seseorang di organisasi Anda, Databricks merekomendasikan untuk menggunakan pengelola kata sandi.

Membaca data yang dibagikan

Cara Anda membaca data yang telah dibagikan dengan aman dengan Anda menggunakan Berbagi Delta tergantung pada apakah Anda menerima file kredensial (model berbagi terbuka) atau Anda menggunakan ruang kerja Databricks dan Anda menyediakan penyedia data dengan pengidentifikasi berbagi Anda (model Databricks-ke-Databricks).

Membaca data bersama menggunakan file kredensial (berbagi terbuka)

Jika data telah dibagikan dengan Anda menggunakan protokol berbagi terbuka Berbagi Delta, Anda menggunakan file kredensial yang Anda unduh untuk mengautentikasi ke akun Databricks penyedia data dan membaca data bersama. Akses bertahan selama token yang mendasar valid dan penyedia terus berbagi data. Penyedia mengelola kedaluwarsa dan rotasi token. Pembaruan data tersedia untuk Anda dalam waktu dekat. Anda dapat membaca dan membuat salinan data bersama, tetapi Anda tidak dapat mengubah data sumber.

Untuk mempelajari cara mengakses dan membaca data bersama menggunakan file kredensial di Azure Databricks, Apache Spark, pandas, dan Power BI, lihat Membaca data yang dibagikan menggunakan berbagi terbuka Berbagi Delta (untuk penerima).

Membaca data bersama menggunakan berbagi Databricks-ke-Databricks

Jika data telah dibagikan dengan Anda menggunakan model Databricks-to-Databricks, maka tidak ada file kredensial yang diperlukan untuk mengakses data bersama. Databricks mengurus koneksi yang aman, dan data bersama secara otomatis dapat ditemukan di ruang kerja Databricks Anda.

Untuk mempelajari cara menemukan, membaca, dan mengelola data bersama tersebut di ruang kerja Databricks Anda, lihat Membaca data yang dibagikan menggunakan Berbagi Delta Databricks-ke-Databricks (untuk penerima).

Mengaudit penggunaan data bersama

Jika Anda memiliki akses ke ruang kerja Azure Databricks, Anda dapat menggunakan log audit Azure Databricks untuk memahami siapa di organisasi Anda yang mengakses data mana yang menggunakan Berbagi Delta. Lihat Mengaudit dan memantau berbagi data.

Langkah berikutnya