Bagikan melalui


Cara membuat profil data pada sumber data di Azure Data Catalog

Penting

Azure Data Catalog dihentikan pada 15 Mei 2024.

Untuk fitur katalog data, gunakan layanan Microsoft Purview , yang menawarkan tata kelola data terpadu untuk seluruh data estate Anda.

Pendahuluan

Microsoft Azure Data Catalog adalah layanan cloud yang dikelola penuh yang berfungsi sebagai sistem pendaftaran dan sistem penemuan untuk sumber data perusahaan. Dengan kata lain, Azure Data Catalog berkaitan dengan membantu orang menemukan, memahami, dan menggunakan sumber data, serta membantu organisasi lebih memaksimalkan manfaat dari data yang sudah ada. Saat sumber data didaftarkan dengan Azure Data Catalog, metadatanya akan disalin dan diindeks oleh layanan, tetapi bukan hanya itu saja.

Fitur Pembuatan Profil Data dari Azure Data Catalog memeriksa data dari sumber data yang didukung di katalog Anda dan mengumpulkan statistik serta informasi mengenai data tersebut. Anda dapat menyertakan profil aset data dengan mudah. Saat Anda mendaftarkan aset data, pilih Sertakan Profil Data di alat pendaftaran sumber data.

Apa itu pembuatan profil data?

Pembuatan profil data memeriksa data di sumber data yang didaftarkan, dan mengumpulkan statistik serta informasi mengenai data tersebut. Selama penemuan sumber data, statistik ini dapat membantu Anda menentukan kesesuaian data untuk menyelesaikan masalah bisnisnya.

Sumber data berikut mendukung pembuatan profil data:

  • Tabel dan tampilan Server SQL (mencakup Azure SQL DB dan Azure Synapse Analytics)
  • Tabel dan tampilan Oracle
  • Tabel dan tampilan Teradata
  • Tabel Apache Hive

Menyertakan profil data saat mendaftarkan aset data akan membantu pengguna menjawab pertanyaan mengenai sumber data, meliputi:

  • Apakah data dapat digunakan untuk menyelesaikan masalah bisnis saya?
  • Apakah data sesuai dengan standar atau pola tertentu?
  • Apa saja anomali dari sumber data?
  • Apa saja tantangan yang mungkin muncul saat mengintegrasikan data ini ke aplikasi saya?

Catatan

Anda juga dapat menambahkan dokumentasi ke aset untuk menjelaskan bagaimana data diintegrasikan ke aplikasi. Lihat Cara mendokumentasikan sumber data.

Cara menyertakan profil data saat mendaftarkan sumber data

Anda dapat menyertakan profil sumber data dengan mudah. Saat Anda mendaftarkan sumber data, di panel Objek yang akan didaftarkan pada alat pendaftaran sumber data, pilih Sertakan Profil Data.

Kotak Sertakan Profil Data dicentang di bagian bawah jendela Objek yang akan didaftarkan.

Untuk mempelajari selengkapnya tentang cara mendaftarkan sumber data, lihat Cara mendaftarkan sumber data dan Memulai dengan Azure Data Catalog.

Pemfilteran aset data yang menyertakan profil data

Untuk menemukan aset data yang menyertakan profil data, Anda dapat menambahkan has:tableDataProfiles atau has:columnsDataProfiles sebagai istilah pencarian Anda.

Catatan

Memilih Sertakan Profil Data di alat pendaftaran sumber data akan menyertakan informasi profil tingkat kolom dan tabel. Namun, Data Catalog API mengizinkan aset data untuk didaftarkan hanya dengan menyertakan salah satu kumpulan informasi profil.

Melihat informasi profil data

Setelah menemukan data yang sesuai dengan profil, Anda dapat melihat detail profil data. Untuk melihat profil data, pilih aset data, lalu pilih Profil Data di jendela portal Data Catalog.

Tab profil data dipilih di bagian atas halaman, antara kolom dan dokumentasi.

Profil data di Azure Data Catalog menampilkan informasi profil tingkat kolom dan tabel yang mencakup:

Profil data objek

  • Jumlah baris
  • Ukuran tabel
  • Kapan objek terakhir diperbarui

Profil data kolom

  • Jenis data kolom
  • Jumlah nilai yang berbeda
  • Jumlah baris dengan nilai NULL
  • Nilai minimum, maksimum, rata-rata, dan simpangan baku untuk nilai kolom

Ringkasan

Pembuatan profil data memberikan statistik dan informasi mengenai aset data yang didaftarkan untuk membantu Anda menentukan kesesuaian data guna menyelesaikan masalah bisnis. Selain menganotasi dan mendokumentasikan sumber data, profil data juga memberi pengguna pemahaman lebih mendalam mengenai data Anda.

Lihat Juga