Cara membuat anotasi sumber data di Azure Data Catalog
Penting
Azure Data Catalog dihentikan pada 15 Mei 2024.
Untuk fitur katalog data, gunakan layanan Microsoft Purview , yang menawarkan tata kelola data terpadu untuk seluruh data estate Anda.
Pendahuluan
Microsoft Azure Data Catalog adalah layanan cloud yang dikelola penuh yang berfungsi sebagai sistem pendaftaran dan sistem penemuan untuk sumber data perusahaan. Dengan kata lain, Azure Data Catalog adalah tentang membantu orang menemukan, memahami, dan menggunakan sumber data, dan membantu organisasi mendapatkan nilai lebih dari data yang ada. Ketika sumber data terdaftar di Azure Data Catalog, metadatanya disalin dan diindeks oleh layanan, tetapi cerita tidak berakhir di sana. Azure Data Catalog memungkinkan pengguna untuk memberikan metadata deskriptif mereka sendiri - seperti deskripsi dan tag - untuk melengkapi metadata yang diekstrak dari sumber data, dan untuk membuat sumber data lebih dimengerti oleh lebih banyak orang.
Anotasi dan crowdsourcing
Semua orang punya pendapat. Ini adalah hal yang baik. Azure Data Catalog mengakui bahwa pengguna yang berbeda memiliki perspektif yang berbeda pada sumber data perusahaan, dan bahwa masing-masing perspektif ini dapat berharga. Pertimbangkan skenario berikut:
- Administrator sistem mengetahui perjanjian tingkat layanan untuk server atau layanan yang menghosting sumber data.
- Administrator database mengetahui jadwal pencadangan untuk setiap database, dan jendela pemrosesan ETL yang diizinkan.
- Pemilik sistem tahu proses bagi pengguna untuk meminta akses ke sumber data.
- Pengurus data tahu bagaimana aset dan atribut dalam peta sumber data ke model data perusahaan.
- Analis tahu bagaimana data digunakan dalam konteks proses bisnis yang mereka dukung.
Masing-masing perspektif ini berharga, dan Azure Data Catalog menggunakan pendekatan crowdsourcing untuk metadata yang memungkinkan masing-masing untuk diambil dan digunakan untuk memberikan gambaran lengkap sumber data terdaftar. Setiap pengguna dapat menambahkan dan mengedit anotasi mereka sendiri di portal Data Catalog, sambil dapat melihat anotasi yang disediakan oleh pengguna lain.
Berbagai jenis anotasi
Azure Data Catalog mendukung jenis anotasi berikut ini:
Anotasi | Catatan |
---|---|
Nama yang mudah diingat | Nama-nama yang mudah diingat dapat diberikan pada tingkat aset data, untuk membuat aset data lebih mudah dipahami. Nama yang mudah diingat paling berguna ketika nama objek yang mendasarinya samar, disingkat, atau tidak berarti bagi pengguna. |
Deskripsi | Deskripsi dapat diberikan di tingkat aset data dan atribut/kolom. Deskripsi adalah anotasi teks pendek bentuk bebas yang menjelaskan perspektif pengguna tentang aset data atau penggunaannya. |
Tag (tag pengguna) | Tag dapat diberikan di tingkat aset data dan atribut / kolom. Tag pengguna adalah label yang ditentukan pengguna yang dapat digunakan untuk mengkategorikan aset atau atribut data. |
Tag (tag glosarium) | Tag dapat diberikan di tingkat aset data dan atribut / kolom. Tag glosarium adalah istilah glosarium yang ditentukan secara terpusat yang dapat digunakan untuk mengategorikan aset atau atribut data menggunakan taksonomi bisnis umum. Untuk informasi selengkapnya, lihat Cara menyiapkan Glosarium Bisnis untuk Pembuatan Tag yang Diatur |
Ahli | Para ahli dapat dipasok di tingkat aset data. Para ahli mengidentifikasi pengguna atau grup dengan perspektif ahli pada data dan dapat berfungsi sebagai titik kontak bagi pengguna yang menemukan sumber data terdaftar dan memiliki pertanyaan yang tidak dijawab oleh anotasi yang ada. |
Meminta akses | Informasi akses permintaan dapat diberikan di tingkat aset data. Informasi ini untuk pengguna yang menemukan sumber data yang belum mereka akses. Pengguna dapat memasukkan alamat email pengguna atau grup yang memberikan akses, URL proses atau alat yang dibutuhkan pengguna untuk mendapatkan akses, atau dapat memasukkan proses itu sendiri sebagai teks. |
Dokumentasi | Para ahli dapat dipasok di tingkat aset data. Dokumentasi aset adalah informasi teks kaya yang dapat mencakup tautan dan gambar, dan yang dapat memberikan informasi apa pun yang tidak disampaikan melalui deskripsi dan tag. |
Menganotasi beberapa aset
Pengguna dapat memilih beberapa aset data di portal Data Catalog, dan membuat anotasi semua aset yang dipilih dalam satu operasi. Anotasi akan berlaku untuk semua aset yang dipilih, sehingga mudah untuk memilih dan memberikan deskripsi dan sekumpulan tag dan pakar yang konsisten untuk aset data terkait.
Catatan
Tag dan ahli juga dapat disediakan saat mendaftarkan aset data menggunakan alat pendaftaran sumber data Azure Data Catalog.
Saat beberapa tabel dan tampilan dipilih, hanya kolom yang memiliki semua aset data yang dipilih yang sama yang akan ditampilkan di portal Data Catalog. Ini memungkinkan pengguna untuk memberikan tag dan deskripsi untuk semua kolom dengan nama yang sama untuk semua aset yang dipilih.
Anotasi dan penemuan
Sama seperti metadata yang diekstrak dari sumber data selama pendaftaran ditambahkan ke indeks pencarian Azure Data Catalog, metadata yang disediakan pengguna juga diindeks. Ini berarti bahwa tidak hanya melakukan anotasi memudahkan pengguna untuk memahami data yang mereka temukan, anotasi juga memudahkan pengguna untuk menemukan aset data yang dianotasi dengan mencari menggunakan istilah yang masuk akal bagi mereka.
Ringkasan
Mendaftarkan sumber data dengan Azure Data Catalog membuat data tersebut dapat ditemukan dengan menyalin metadata struktural dan deskriptif dari sumber data ke dalam layanan Katalog. Setelah sumber data terdaftar, pengguna dapat memberikan anotasi untuk memudahkan menemukan dan memahami dari dalam portal Azure Data Catalog.