Catatan
Akses ke halaman ini memerlukan otorisasi. Anda dapat mencoba masuk atau mengubah direktori.
Akses ke halaman ini memerlukan otorisasi. Anda dapat mencoba mengubah direktori.
Azure Databricks menyediakan serangkaian alat dan produk yang menyederhanakan penemuan aset data yang dapat diakses melalui Databricks Data Intelligence Platform. Artikel ini memberikan gambaran umum tentang cara Anda dapat menemukan dan mempratinjau data yang telah dikonfigurasi untuk diakses di ruang kerja Anda.
- Untuk menyambungkan ke sumber data, lihat Menyambungkan ke sumber data dan layanan eksternal.
- Untuk informasi tentang mendapatkan akses ke data di Databricks Marketplace, lihat Apa itu Databricks Marketplace?.
Topik di bagian ini berfokus pada eksplorasi objek data dan file data. Jika Anda mencari informasi tentang bekerja dengan aset seperti notebook, kueri SQL, pustaka, dan model, lihat UI Ruang Kerja.
Jika Anda mencari panduan tentang menghasilkan statistik ringkasan untuk himpunan data atau tugas lain yang terkait dengan analisis data eksploratif (EDA), lihat Analisis data eksploratif di Azure Databricks: Alat dan teknik.
Bagaimana Anda dapat menemukan aset data?
Alat penemuan data di Azure Databricks termasuk dalam kategori umum berikut:
- Wawasan, ringkasan, dan pencarian yang dibantu AI.
- Pencarian kata kunci.
- Eksplorasi katalog menggunakan UI.
- Pencatatan terprogram dan eksplorasi metadata.
Alat penemuan data dioptimalkan untuk data yang diatur oleh Unity Catalog. Aset data yang belum terdaftar sebagai objek Unity Catalog mungkin tidak dapat ditemukan menggunakan beberapa pendekatan ini.
Menemukan data menggunakan UI
Catalog Explorer menyediakan alat untuk menjelajahi dan mengatur aset data. Anda mengakses Catalog Explorer menggunakan Katalog di bilah sisi ruang kerja. Lihat Apa itu Catalog Explorer?.
Notebook dan editor kueri SQL juga menyediakan navigator katalog untuk menjelajahi objek database. Klik ikon Katalog di antarmuka ini untuk memperluas atau menciutkan navigator katalog tanpa meninggalkan editor kode Anda.
Setelah menemukan himpunan data yang menarik, Anda dapat menggunakan tab Insights untuk mempelajari bagaimana data digunakan di ruang kerja Anda. Lihat Lihat kueri dan pengguna tabel yang sering digunakan.
Menjelajahi data secara terprogram
Anda dapat menggunakan SHOW perintah pada semua objek database untuk menemukan aset yang terdaftar ke Katalog Unity. Gunakan perintah LIST, perintah ajaib %fs, atau Utilitas Databricks untuk mencantumkan file.
Lihat Menjelajahi penyimpanan dan menemukan file data dan Menjelajahi objek database.
Meninjau komentar data
Anda dapat meninjau komentar untuk mempelajari tentang konten himpunan data yang tersedia di lakehouse Anda. Komentar dapat diatur pada objek data termasuk katalog, skema, tabel, dan kolom. Anda dapat melihat komentar di Catalog Explorer atau menggunakan DESCRIBE perintah untuk objek.
Catalog Explorer dapat memberikan komentar yang dihasilkan AI untuk tabel, yang memudahkan pemilik aset data untuk memberikan gambaran umum himpunan data yang kaya. Lihat Menambahkan komentar yang dihasilkan AI ke objek Katalog Unity.
Pengguna juga dapat secara opsional memberikan komentar pada tabel dan objek database lainnya menggunakan markdown, yang dirender di Catalog Explorer. Lihat Menambahkan komentar ke data dan aset AI.
Cari tabel di lakehouse Anda
Anda dapat menggunakan bilah pencarian di Azure Databricks untuk menemukan tabel yang terdaftar di Unity Catalog. Anda dapat melakukan pencarian kata kunci atau menggunakan pencarian semantik untuk menemukan himpunan data atau kolom yang terkait dengan kueri pencarian Anda. Pencarian hanya mengembalikan hasil untuk tabel yang izinnya Anda lihat. Cari tinjauan nama tabel, nama kolom, komentar tabel, dan komentar kolom. Lihat Mencari objek ruang kerja.