Pembuatan Profil dan Pemberitahuan Data di DQS

Berlaku untuk:SQL Server

Pembuatan profil data di Data Quality Services (DQS) adalah proses menganalisis data di sumber data yang ada, dan menampilkan statistik tentang data dalam aktivitas DQS. Ini memberi Anda pengukuran kualitas data otomatis. Pembuatan profil DQS diintegrasikan ke dalam manajemen pengetahuan DQS dan proyek berkualitas data. dinamis dan dapat disesuaikan. Pembuatan profil memiliki dua tujuan utama: pertama, untuk memandu Anda melalui proses kualitas data dan mendukung keputusan Anda, dan kedua, untuk menilai efektivitas proses. Proses pembuatan profil DQS memiliki manfaat berikut:

  • Pembuatan profil memberikan wawasan tentang kualitas data sumber Anda, dan membantu Anda mengidentifikasi masalah kualitas data.

  • Pembuatan profil menilai efektivitas proses kualitas data, memandu Anda dalam penemuan pengetahuan, pembersihan data, kebijakan pencocokan, dan pekerjaan pencocokan.

  • Pembuatan profil memberi Anda informasi yang paling relevan pada waktu yang paling relevan.

  • Proses pembuatan profil menghasilkan pemberitahuan yang menekankan statistik atau peristiwa penting yang mungkin layak mendapatkan tindakan. Dalam banyak kasus, pemberitahuan DQS akan menunjukkan kondisi dan merekomendasikan tindakan yang dapat Anda ambil untuk memperbaiki kondisi tersebut.

Pembuatan profil memungkinkan Anda menggunakan Data Quality Services tidak hanya untuk penemuan pengetahuan, pembersihan, dan pencocokan, tetapi juga sebagai alat analisis. Anda mungkin ingin membuat satu pangkalan pengetahuan untuk analisis, dan menjalankan penemuan pengetahuan menggunakan pangkalan pengetahuan tersebut untuk menentukan dari statistik pembuatan profil apakah pangkalan pengetahuan memenuhi kebutuhan penemuan, pembersihan, dan pencocokan Anda.

Cara Kerja Pembuatan Profil

Pembuatan profil tidak mengukur kualitas pangkalan pengetahuan. Ini mengukur kualitas data sumber. Pembuatan profil memberi Anda statistik yang menunjukkan efek operasi tertentu yang Anda lakukan dalam manajemen pengetahuan atau proyek kualitas data pada data sumber Anda. Pembuatan profil selalu dalam konteks aktivitas tertentu yang Anda lakukan. Anda dapat mengeklik tab pembuatan profil di layar untuk menampilkan data pembuatan profil tanpa meninggalkan tahap aktivitas yang Anda lakukan. Tabel pembuatan profil diisi secara real time saat proses dilakukan, memungkinkan Anda menilai tugas kualitas data saat Anda melakukannya. Anda dapat menentukan apakah data sumber lebih baik setelah pembersihan atau de-duplikasi, dan dengan berapa banyak.

Semua angka pembuatan profil mengacu pada jumlah kemunculan nilai, dan dalam banyak kasus mengacu pada persentase total, dengan pengecualian metrik keunikan. Metrik keunikan mengacu pada jumlah nilai absolut, terlepas dari jumlah kemunculan nilai-nilai tersebut.

Pembuatan profil adalah bagian dari solusi berbasis pengetahuan DQS. Ini memberikan informasi tentang pangkalan pengetahuan, pencocokan, atau proses pembersihan data berdasarkan pemetaan antara bidang sumber data dan domain pangkalan pengetahuan. Profil Anda hanya setelah pemetaan selesai; tidak ada pembuatan profil yang dilakukan selama tahap pemetaan aktivitas apa pun. Pembuatan profil selalu melekat pada aktivitas. Proses pembuatan profil dilakukan pada data yang dipetakan ke domain, bukan pada data di domain. Ini diintegrasikan ke dalam langkah-langkah aktivitas berikut:

  • Langkah-langkah Menemukan dan Mengelola nilai domain dari aktivitas Penemuan pengetahuan

  • Membersihkan dan Mengelola dan melihat langkah-langkah hasil aktivitas Pembersihan

  • Kebijakan pencocokan dan langkah-langkah hasil Pencocokan dari aktivitas kebijakan Pencocokan

  • Langkah-langkah Pencocokan dan Ekspor dari aktivitas Pencocokan

DQS tidak menyediakan statistik pembuatan profil untuk aktivitas Manajemen Domain.

Pembuatan Profil Data berdasarkan Aktivitas

Pembuatan profil DQS menggunakan dimensi kualitas data standar untuk mewakili kualitas data: kelengkapan (sejauh mana data ada), akurasi (sejauh mana data dapat digunakan untuk penggunaan yang dimaksudkan), dan keunikan (sejauh mana nilai yang berbeda mewakili entitas yang berbeda). Secara default, nilai NULL dan kosong dianggap hilang, atau menurunkan persentase kelengkapan; namun, Anda juga dapat menentukan nilai lain agar setara DENGAN NULL, dalam hal ini nilai tersebut juga akan dianggap hilang.

Pembuatan profil memberi Anda statistik yang Anda butuhkan untuk menilai proses Anda, tetapi Anda harus menginterpretasikan statistik. Memahami pembuatan profil apa yang memberi tahu Anda dengan melihat kolom statistik menurut kolom.

Aktivitas DQS memiliki serangkaian statistik pembuatan profil yang berbeda, sebagai berikut:

  • Hanya aktivitas Pembersihan yang memiliki statistik pembuatan profil untuk akurasi (dalam persentase menurut domain). Akurasi memengaruhi validitas, konsistensi, kesalahan sintaksis, dan aturan domain.

  • Hanya aktivitas Pembersihan yang memiliki statistik pembuatan profil untuk benar, diperbaiki, dan disarankan dalam sumber, dan nilai yang dikoreksi dan disarankan menurut domain (kedua jumlah persen).

  • Aktivitas Pembersihan dan Penemuan Pengetahuan memiliki statistik pembuatan profil untuk validitas (Pembersihan berdasarkan catatan, Penemuan Pengetahuan berdasarkan catatan dan domain). Aktivitas Kebijakan pencocokan dan Pencocokan tidak memiliki statistik untuk validitas.

  • Aktivitas Pembersihan tidak memiliki statistik pembuatan profil untuk keunikan. Aktivitas Penemuan Pengetahuan, Kebijakan Pencocokan, dan Pencocokan memiliki statistik pembuatan profil untuk keunikan jumlah dan persen untuk sumber dan menurut domain.

Untuk informasi selengkapnya tentang statistik pembuatan profil tertentu yang terkait dengan aktivitas, lihat bagian Pembuatan Profil di artikel berikut ini:

Data Pembuatan Profil dalam Pemantauan Aktivitas

Informasi pembuatan profil untuk aktivitas Penemuan Pengetahuan, Kebijakan Pencocokan, Pencocokan, dan Pembersihan tersedia tidak hanya di halaman aktivitas di klien Kualitas Data, tetapi juga tersedia dalam pemantauan aktivitas. Pemantauan aktivitas memberi Anda gambaran umum tentang aktivitas saat ini dan sebelumnya. Selain properti dan proses komputasi aktivitas terkait, Anda dapat melihat informasi pembuatan profil yang dihasilkan untuk setiap aktivitas di satu lokasi. Anda memilih aktivitas dalam tabel aktivitas untuk menampilkan hasil pembuatan profil dalam tabel di bawah ini. Anda juga dapat mengekspor hasil pembuatan profil. Untuk informasi selengkapnya, lihat Administrasi DQS.

Pemberitahuan

Selain mengumpulkan dan menampilkan statistik dan metrik penting melalui pembuatan profil, DQS akan menghasilkan pemberitahuan (jika diaktifkan) untuk menunjukkan kapan Anda mungkin ingin mengambil tindakan berdasarkan statistik pembuatan profil yang ditampilkan. DQS menggunakan pemberitahuan untuk menekankan fakta penting tentang sumber data, dan untuk menunjukkan efektivitas aktivitas saat ini dibandingkan dengan tujuan dieksekusi. Pemberitahuan memberikan tips dan rekomendasi yang menunjukkan kondisi dan merekomendasikan bagaimana Anda dapat meningkatkan penemuan pengetahuan, pembersihan data, atau aktivitas pencocokan data.

Pemberitahuan DQS digunakan untuk memunculkan masalah yang mungkin menarik bagi Anda, atau untuk mengatasi potensi masalah. Apakah Anda bertindak berdasarkan pemberitahuan tergantung pada apakah itu relevan dengan tujuan Anda. Misalnya, DQS memposting pemberitahuan saat pembersihan data tidak menghasilkan nilai yang dikoreksi atau nilai yang disarankan sementara kelengkapan dan akurasi keduanya 100%. Pemberitahuan ini akan menunjukkan bahwa aktivitas mungkin tidak perlu dijalankan. Apakah Anda memilih untuk menjalankan aktivitas, bagaimanapun, adalah keputusan Anda.

Pemberitahuan ditunjukkan oleh tip alat dengan tanda seru di tab Pembuatan Profil . Statistik yang terkait dengan pemberitahuan berwarna merah untuk menunjukkan pertimbangan statistik untuk pemberitahuan.

Anda dapat mengaktifkan (default) atau menonaktifkan pemberitahuan di tab Pengaturan Umum di bagian Administrasi di beranda Klien Kualitas Data. Saat pemberitahuan dinonaktifkan, tips alat tidak ditampilkan dan statistik tidak berwarna merah. Tidak ada peningkatan performa yang signifikan dengan menonaktifkan pemberitahuan. Pembuatan profil masih akan beroperasi jika Anda menonaktifkan pemberitahuan.

Untuk kondisi tertentu yang terkait dengan pemberitahuan untuk aktivitas, lihat artikel berikut ini:

Deskripsi Tugas Artikel
Menjelaskan cara mengaktifkan atau menonaktifkan pemberitahuan di DQS. Mengaktifkan atau Menonaktifkan Pemberitahuan Pembuatan Profil di DQS