Bagikan melalui


Silsilah data

Silsilah data memainkan peran penting dalam analitik skala cloud. Silsilah data mentah dan produk jadi menunjukkan transformasi dan manipulasi yang mengubah data mentah tersebut menjadi produk data akhir. Ini membantu organisasi memahami kualitas data dan memvalidasi kepatuhan. Ini juga menambahkan konteks ke himpunan data dan produk yang memungkinkan produk data dapat ditemukan dan dapat dilayankan sendiri.

Primer katalog data apa pun adalah kemampuannya untuk menunjukkan silsilah data antar produk data. Azure Purview mendukung pengambilan silsilah data dari tiga aktivitas Azure Data Factory:

  • Salin data
  • Aliran Data
  • Jalankan paket SSIS

Selain pelaporan silsilah data asli ini, Azure Purview juga memungkinkan pelaporan silsilah kustom melalui kait Apache Atlas atau REST API.

Diagram silsilah data.

Penting

Alur Azure Data Factory dan Azure Synapse direkomendasikan untuk solusi penyerapan karena mengaktifkan silsilah data di Azure Purview. Pola penyerapan alternatif harus menggunakan Apache Atlas API untuk memperbarui silsilah data sebagai bagian dari pemrosesan data mereka.

Garis keturunan data Azure Purview

Salah satu fitur platform Azure Purview adalah kemampuannya untuk menunjukkan silsilah data antara himpunan data yang dibuat oleh proses data. Sistem seperti Data Factory, Data Share, dan Power BI mengambil silsilah data saat bergerak. Anda juga bisa mendapatkan pelaporan silsilah kustom melalui kait Atlas dan REST API.

Tip

Untuk informasi selengkapnya tentang sistem dan praktik terbaik yang didukung, lihat panduan pengguna silsilah Katalog Data Microsoft Purview.

Langkah berikutnya

Pelajari cara mengelola data master di Azure.