Penemuan dan kolaborasi data di lakehouse

Databricks memungkinkan kolaborasi yang aman dan diatur di seluruh beban kerja data, analitik, dan AI di Lakehouse. Menggunakan Katalog Unity dan protokol terbuka seperti Berbagi Delta, tim dapat menemukan, berbagi, dan menganalisis data dalam skala besar sambil mempertahankan tata kelola, auditbilitas, dan privasi di seluruh kasus penggunaan dan kolaborator.

Mengelola izin dalam skala besar

Katalog Unity menyediakan lokasi terpadu kepada administrator untuk menetapkan izin untuk katalog, database, tabel, dan tampilan ke grup pengguna. Hak akses dan metastores dibagikan di seluruh ruang kerja, memungkinkan administrator untuk mengatur izin yang aman sekali pada grup yang disinkronkan dari penyedia identitas dan memastikan bahwa pengguna akhir hanya memiliki akses ke data yang tepat di ruang kerja Azure Databricks mana pun yang mereka masuki.

Katalog Unity juga memungkinkan administrator untuk menentukan kredensial penyimpanan, metode yang aman untuk menyimpan dan berbagi izin pada infrastruktur penyimpanan cloud. Anda dapat memberikan hak istimewa pada entitas keamanan ini untuk memungkinkan pengguna di organisasi menentukan lokasi eksternal terhadap lokasi penyimpanan objek cloud, yang memungkinkan insinyur data untuk bekerja secara mandiri pada beban kerja baru tanpa perlu memberikan izin tambahan di konsol akun cloud.

Menemukan data di Azure Databricks

Pengguna dapat menelusuri objek data yang tersedia di Unity Catalog menggunakan Catalog Explorer. Catalog Explorer menggunakan hak istimewa yang dikonfigurasi oleh administrator Katalog Unity untuk memastikan bahwa pengguna hanya bisa melihat katalog, database, tabel, dan tampilan yang mereka punya izin untuk mengakses. Setelah pengguna menemukan himpunan data yang menarik, mereka dapat meninjau nama dan jenis bidang, membaca komentar pada tabel dan bidang individual, dan mempratinjau sampel data. Pengguna juga dapat meninjau riwayat lengkap tabel untuk memahami kapan dan bagaimana data telah berubah, dan fitur silsilah memungkinkan pengguna untuk melacak bagaimana himpunan data tertentu berasal dari pekerjaan hulu dan digunakan dalam pekerjaan hilir.

Kredensial penyimpanan dan lokasi eksternal juga ditampilkan di Catalog Explorer, memungkinkan setiap pengguna untuk melihat hak istimewa yang mereka butuhkan untuk membaca dan menulis data di seluruh lokasi dan sumber daya yang tersedia.

Mempercepat waktu untuk produksi dengan lakehouse

Azure Databricks mendukung beban kerja di SQL, Python, Scala, dan R, memungkinkan pengguna dengan beragam set keterampilan dan latar belakang teknis untuk menggunakan pengetahuan mereka untuk mendapatkan wawasan analitik. Anda dapat menggunakan semua bahasa yang didukung oleh Azure Databricks untuk menentukan pekerjaan produksi, dan notebook dapat menggunakan kombinasi bahasa. Ini berarti Anda dapat mempromosikan kueri yang ditulis oleh analis SQL untuk ETL tahap akhir ke dalam kode rekayasa data produksi dengan hampir tanpa usaha. Kueri dan beban kerja yang ditentukan oleh persona di seluruh organisasi menggunakan himpunan data yang sama, sehingga tidak perlu mendamaikan nama bidang atau memastikan dasbor sudah diperbarui sebelum berbagi kode dan hasil dengan tim lain. Anda dapat berbagi kode, buku catatan, kueri, dan dasbor dengan aman, semuanya didukung oleh infrastruktur cloud berskala yang sama dan didefinisikan terhadap sumber data yang dipilih yang sama.