Proyek Kualitas Data (DQS)
Berlaku untuk:SQL Server
Proyek kualitas data di Data Quality Services (DQS) adalah sarana menggunakan pangkalan pengetahuan untuk meningkatkan kualitas data sumber Anda dengan melakukan aktivitas pembersihan data dan pencocokan data, lalu mengekspor data yang dihasilkan ke database SQL Server atau file .csv. Anda dapat membuat proyek kualitas data sebagai proyek pembersihan atau proyek yang cocok untuk melakukan aktivitas masing-masing. Proyek pembersihan dan pencocokan dapat dijalankan menggunakan pangkalan pengetahuan yang sama, karena pengetahuan untuk pembersihan dan pencocokan data dapat dibangun ke dalam pangkalan pengetahuan yang sama.
Proyek kualitas data memiliki manfaat berikut:
Memungkinkan Anda melakukan pembersihan data pada data sumber Anda dengan menggunakan pengetahuan di pangkalan pengetahuan DQS.
Memungkinkan Anda melakukan pencocokan data pada data sumber Anda dengan menggunakan kebijakan yang cocok dalam pangkalan pengetahuan.
Menyediakan wizard untuk memandu Anda melalui aktivitas pembersihan dan pencocokan, dan mengekspor data sesuai pilihan Anda ke database SQL Server atau ke file .csv. Pengurus data dapat menggunakan proyek kualitas data untuk menjalankan dan mengontrol langkah-langkah pembersihan dan pencocokan data yang dibantu komputer/interaktif.
Proyek Kualitas Data: Aktivitas Pembersihan
Proyek kualitas data pembersihan memungkinkan Anda membersihkan data sumber berdasarkan pangkalan pengetahuan. Aktivitas pembersihan data di DQS adalah proses dua langkah:
Proses pembersihan data yang dibantu komputer yang menganalisis data sumber terhadap pengetahuan di pangkalan pengetahuan, dan mengusulkan perubahan. Data yang diproses dikategorikan (disarankan, baru, tidak valid, diperbaiki, dan benar) oleh DQS, dan ditampilkan kepada pengguna untuk pemrosesan lebih lanjut.
Proses pembersihan interaktif yang memungkinkan pengurus data menyetujui, menolak, atau memodifikasi data yang diusulkan oleh proses pembersihan data yang dibantu komputer.
Untuk informasi terperinci tentang aktivitas pembersihan dalam proyek kualitas data, lihat Pembersihan Data.
Proyek Kualitas Data: Aktivitas pencocokan
Proyek kualitas data yang cocok memungkinkan Anda melakukan aktivitas pencocokan berdasarkan kebijakan yang cocok dalam pangkalan pengetahuan untuk mencegah duplikasi data dengan mengidentifikasi kecocokan yang tepat dan perkiraan, dan dengan demikian memungkinkan Anda menghapus data duplikat. Disarankan agar Anda membersihkan data sebelum menjalankan pencocokan di atasnya. Untuk melakukannya:
Buat proyek kualitas data, pilih aktivitas Pembersihan , selesaikan aktivitas pembersihan data pada data sumber Anda, lalu ekspor ke tabel dalam database SQL Server.
Buat proyek kualitas data lain dengan menggunakan pangkalan pengetahuan yang berisi kebijakan yang cocok, pilih aktivitas Pencocokan , lalu di halaman Peta , pilih database dan tabel tempat Anda mengekspor data yang dibersihkan di langkah 1.
Selesaikan aktivitas pencocokan pada data yang dibersihkan.
Untuk informasi mendetail tentang aktivitas pencocokan dalam proyek kualitas data, lihat Pencocokan Data.
Pembuatan Profil dan Pemberitahuan Data
Saat menjalankan aktivitas pembersihan dan pencocokan dalam proyek kualitas data, Anda dapat melihat statistik real time dan informasi tentang data yang sedang diproses oleh DQS. Pembuatan profil data membantu Anda menilai efektivitas proses pembersihan dan pencocokan, dan Anda berpotensi menentukan sejauh mana pembersihan atau pencocokan data membantu meningkatkan kualitas data. Pembuatan profil DQS menyediakan dua dimensi kualitas data: kelengkapan (sejauh mana data ada) dan akurasi (sejauh mana data dapat digunakan untuk penggunaan yang dimaksudkan). Selanjutnya, berdasarkan informasi pembuatan profil data, pemberitahuan ditampilkan kepada pengguna pada tindakan yang dapat diambil untuk meningkatkan operasi pembersihan data dan pencocokan data. Untuk informasi terperinci tentang pembuatan profil dan pemberitahuan data, lihat Pembuatan Profil Data dan Pemberitahuan di DQS.
Tugas Terkait
Deskripsi Tugas | Topik |
---|---|
Menjelaskan cara membuat proyek kualitas data. | Membuat Proyek Kualitas Data |
Menjelaskan cara membuka, membuka kunci, mengganti nama, dan menghapus proyek kualitas data. | Buka, Buka Kunci, Ganti Nama, dan Hapus Proyek Kualitas Data |
Menjelaskan cara membuka proyek Integration Services di Klien Kualitas Data. | Buka Proyek Layanan Integrasi di Klien Kualitas Data |
Lihat Juga
Saran dan Komentar
https://aka.ms/ContentUserFeedback.
Segera hadir: Sepanjang tahun 2024 kami akan menghentikan penggunaan GitHub Issues sebagai mekanisme umpan balik untuk konten dan menggantinya dengan sistem umpan balik baru. Untuk mengetahui informasi selengkapnya, lihat:Kirim dan lihat umpan balik untuk