Cara membuat profil data pada sumber data di Azure Data Catalog
Penting
Azure Data Catalog dihentikan pada 15 Mei 2024.
Untuk fitur katalog data, gunakan layanan Microsoft Purview , yang menawarkan tata kelola data terpadu untuk seluruh data estate Anda.
Pendahuluan
Microsoft Azure Data Catalog adalah layanan cloud yang dikelola penuh yang berfungsi sebagai sistem pendaftaran dan sistem penemuan untuk sumber data perusahaan. Dengan kata lain, Azure Data Catalog berkaitan dengan membantu orang menemukan, memahami, dan menggunakan sumber data, serta membantu organisasi lebih memaksimalkan manfaat dari data yang sudah ada. Saat sumber data didaftarkan dengan Azure Data Catalog, metadatanya akan disalin dan diindeks oleh layanan, tetapi bukan hanya itu saja.
Fitur Pembuatan Profil Data dari Azure Data Catalog memeriksa data dari sumber data yang didukung di katalog Anda dan mengumpulkan statistik serta informasi mengenai data tersebut. Anda dapat menyertakan profil aset data dengan mudah. Saat Anda mendaftarkan aset data, pilih Sertakan Profil Data di alat pendaftaran sumber data.
Apa itu pembuatan profil data?
Pembuatan profil data memeriksa data di sumber data yang didaftarkan, dan mengumpulkan statistik serta informasi mengenai data tersebut. Selama penemuan sumber data, statistik ini dapat membantu Anda menentukan kesesuaian data untuk menyelesaikan masalah bisnisnya.
Sumber data berikut mendukung pembuatan profil data:
- Tabel dan tampilan Server SQL (mencakup Azure SQL DB dan Azure Synapse Analytics)
- Tabel dan tampilan Oracle
- Tabel dan tampilan Teradata
- Tabel Apache Hive
Menyertakan profil data saat mendaftarkan aset data akan membantu pengguna menjawab pertanyaan mengenai sumber data, meliputi:
- Apakah data dapat digunakan untuk menyelesaikan masalah bisnis saya?
- Apakah data sesuai dengan standar atau pola tertentu?
- Apa saja anomali dari sumber data?
- Apa saja tantangan yang mungkin muncul saat mengintegrasikan data ini ke aplikasi saya?
Catatan
Anda juga dapat menambahkan dokumentasi ke aset untuk menjelaskan bagaimana data diintegrasikan ke aplikasi. Lihat Cara mendokumentasikan sumber data.
Cara menyertakan profil data saat mendaftarkan sumber data
Anda dapat menyertakan profil sumber data dengan mudah. Saat Anda mendaftarkan sumber data, di panel Objek yang akan didaftarkan pada alat pendaftaran sumber data, pilih Sertakan Profil Data.
Untuk mempelajari selengkapnya tentang cara mendaftarkan sumber data, lihat Cara mendaftarkan sumber data dan Memulai dengan Azure Data Catalog.
Pemfilteran aset data yang menyertakan profil data
Untuk menemukan aset data yang menyertakan profil data, Anda dapat menambahkan has:tableDataProfiles
atau has:columnsDataProfiles
sebagai istilah pencarian Anda.
Catatan
Memilih Sertakan Profil Data di alat pendaftaran sumber data akan menyertakan informasi profil tingkat kolom dan tabel. Namun, Data Catalog API mengizinkan aset data untuk didaftarkan hanya dengan menyertakan salah satu kumpulan informasi profil.
Melihat informasi profil data
Setelah menemukan data yang sesuai dengan profil, Anda dapat melihat detail profil data. Untuk melihat profil data, pilih aset data, lalu pilih Profil Data di jendela portal Data Catalog.
Profil data di Azure Data Catalog menampilkan informasi profil tingkat kolom dan tabel yang mencakup:
Profil data objek
- Jumlah baris
- Ukuran tabel
- Kapan objek terakhir diperbarui
Profil data kolom
- Jenis data kolom
- Jumlah nilai yang berbeda
- Jumlah baris dengan nilai NULL
- Nilai minimum, maksimum, rata-rata, dan simpangan baku untuk nilai kolom
Ringkasan
Pembuatan profil data memberikan statistik dan informasi mengenai aset data yang didaftarkan untuk membantu Anda menentukan kesesuaian data guna menyelesaikan masalah bisnis. Selain menganotasi dan mendokumentasikan sumber data, profil data juga memberi pengguna pemahaman lebih mendalam mengenai data Anda.
Lihat Juga
Saran dan Komentar
https://aka.ms/ContentUserFeedback.
Segera hadir: Sepanjang tahun 2024 kami akan menghentikan penggunaan GitHub Issues sebagai mekanisme umpan balik untuk konten dan menggantinya dengan sistem umpan balik baru. Untuk mengetahui informasi selengkapnya, lihat:Kirim dan lihat umpan balik untuk