Proyek Kualitas Data (DQS)

Berlaku untuk:SQL Server

Proyek kualitas data di Data Quality Services (DQS) adalah sarana menggunakan pangkalan pengetahuan untuk meningkatkan kualitas data sumber Anda dengan melakukan aktivitas pembersihan data dan pencocokan data, lalu mengekspor data yang dihasilkan ke database SQL Server atau file .csv. Anda dapat membuat proyek kualitas data sebagai proyek pembersihan atau proyek yang cocok untuk melakukan aktivitas masing-masing. Proyek pembersihan dan pencocokan dapat dijalankan menggunakan pangkalan pengetahuan yang sama, karena pengetahuan untuk pembersihan dan pencocokan data dapat dibangun ke dalam pangkalan pengetahuan yang sama.

Proyek kualitas data memiliki manfaat berikut:

  • Memungkinkan Anda melakukan pembersihan data pada data sumber Anda dengan menggunakan pengetahuan di pangkalan pengetahuan DQS.

  • Memungkinkan Anda melakukan pencocokan data pada data sumber Anda dengan menggunakan kebijakan yang cocok dalam pangkalan pengetahuan.

  • Menyediakan wizard untuk memandu Anda melalui aktivitas pembersihan dan pencocokan, dan mengekspor data sesuai pilihan Anda ke database SQL Server atau ke file .csv. Pengurus data dapat menggunakan proyek kualitas data untuk menjalankan dan mengontrol langkah-langkah pembersihan dan pencocokan data yang dibantu komputer/interaktif.

Proyek Kualitas Data: Aktivitas Pembersihan

Proyek kualitas data pembersihan memungkinkan Anda membersihkan data sumber berdasarkan pangkalan pengetahuan. Aktivitas pembersihan data di DQS adalah proses dua langkah:

  1. Proses pembersihan data yang dibantu komputer yang menganalisis data sumber terhadap pengetahuan di pangkalan pengetahuan, dan mengusulkan perubahan. Data yang diproses dikategorikan (disarankan, baru, tidak valid, diperbaiki, dan benar) oleh DQS, dan ditampilkan kepada pengguna untuk pemrosesan lebih lanjut.

  2. Proses pembersihan interaktif yang memungkinkan pengurus data menyetujui, menolak, atau memodifikasi data yang diusulkan oleh proses pembersihan data yang dibantu komputer.

Untuk informasi terperinci tentang aktivitas pembersihan dalam proyek kualitas data, lihat Pembersihan Data.

Proyek Kualitas Data: Aktivitas pencocokan

Proyek kualitas data yang cocok memungkinkan Anda melakukan aktivitas pencocokan berdasarkan kebijakan yang cocok dalam pangkalan pengetahuan untuk mencegah duplikasi data dengan mengidentifikasi kecocokan yang tepat dan perkiraan, dan dengan demikian memungkinkan Anda menghapus data duplikat. Disarankan agar Anda membersihkan data sebelum menjalankan pencocokan di atasnya. Untuk melakukannya:

  1. Buat proyek kualitas data, pilih aktivitas Pembersihan , selesaikan aktivitas pembersihan data pada data sumber Anda, lalu ekspor ke tabel dalam database SQL Server.

  2. Buat proyek kualitas data lain dengan menggunakan pangkalan pengetahuan yang berisi kebijakan yang cocok, pilih aktivitas Pencocokan , lalu di halaman Peta , pilih database dan tabel tempat Anda mengekspor data yang dibersihkan di langkah 1.

  3. Selesaikan aktivitas pencocokan pada data yang dibersihkan.

Untuk informasi mendetail tentang aktivitas pencocokan dalam proyek kualitas data, lihat Pencocokan Data.

Pembuatan Profil dan Pemberitahuan Data

Saat menjalankan aktivitas pembersihan dan pencocokan dalam proyek kualitas data, Anda dapat melihat statistik real time dan informasi tentang data yang sedang diproses oleh DQS. Pembuatan profil data membantu Anda menilai efektivitas proses pembersihan dan pencocokan, dan Anda berpotensi menentukan sejauh mana pembersihan atau pencocokan data membantu meningkatkan kualitas data. Pembuatan profil DQS menyediakan dua dimensi kualitas data: kelengkapan (sejauh mana data ada) dan akurasi (sejauh mana data dapat digunakan untuk penggunaan yang dimaksudkan). Selanjutnya, berdasarkan informasi pembuatan profil data, pemberitahuan ditampilkan kepada pengguna pada tindakan yang dapat diambil untuk meningkatkan operasi pembersihan data dan pencocokan data. Untuk informasi terperinci tentang pembuatan profil dan pemberitahuan data, lihat Pembuatan Profil Data dan Pemberitahuan di DQS.

Deskripsi Tugas Topik
Menjelaskan cara membuat proyek kualitas data. Membuat Proyek Kualitas Data
Menjelaskan cara membuka, membuka kunci, mengganti nama, dan menghapus proyek kualitas data. Buka, Buka Kunci, Ganti Nama, dan Hapus Proyek Kualitas Data
Menjelaskan cara membuka proyek Integration Services di Klien Kualitas Data. Buka Proyek Layanan Integrasi di Klien Kualitas Data

Lihat Juga

Pangkalan pengetahuan dan Domain DQS