Transformasi Pembersihan DQS
Berlaku untuk: SQL Server SSIS Integration Runtime di Azure Data Factory
Transformasi Pembersihan DQS menggunakan Data Quality Services (DQS) untuk memperbaiki data dari sumber data yang terhubung, dengan menerapkan aturan yang disetujui yang dibuat untuk sumber data yang terhubung atau sumber data serupa. Untuk informasi selengkapnya tentang aturan koreksi data, lihat Pangkalan Pengetahuan dan Domain DQS. Untuk informasi selengkapnya tentang DQS, lihat Konsep Layanan Kualitas Data.
Untuk menentukan apakah data harus diperbaiki, transformasi Pembersihan DQS memproses data dari kolom input ketika kondisi berikut ini benar:
Kolom dipilih untuk koreksi data.
Jenis data kolom didukung untuk koreksi data.
Kolom dipetakan domain yang memiliki jenis data yang kompatibel.
Transformasi ini juga menyertakan output kesalahan yang Anda konfigurasi untuk menangani kesalahan tingkat baris. Untuk mengonfigurasi output kesalahan, gunakan Editor Transformasi Pembersihan DQS.
Anda dapat menyertakan Transformasi Pengelompokan Fuzzy dalam aliran data untuk mengidentifikasi baris data yang kemungkinan duplikat.
Proyek dan Nilai Kualitas Data
Saat Anda memproses data dengan transformasi Pembersihan DQS, proyek pembersihan dibuat di Server Kualitas Data. Anda menggunakan Klien Kualitas Data untuk mengelola proyek. Selain itu, Anda dapat menggunakan Klien Kualitas Data untuk mengimpor nilai proyek ke domain basis pengetahuan DQS. Anda hanya dapat mengimpor nilai ke domain (atau domain tertaut) yang dikonfigurasi oleh transformasi Pembersihan DQS untuk digunakan.
Tugas Terkait
Konten Terkait
Kotak Dialog Editor Transformasi Pembersihan DQS
Gunakan kotak dialog Editor Transformasi Pembersihan DQS untuk memperbaiki data menggunakan Data Quality Services (DQS). Untuk informasi selengkapnya, lihat Konsep Layanan Kualitas Data.
Apa yang ingin Anda lakukan?
Buka Editor Transformasi Pembersihan DQS
Tambahkan Transformasi Pembersihan DQS ke paket Layanan Integrasi, di SQL Server Data Tools (SSDT).
Klik kanan komponen lalu klik Edit.
Mengatur opsi pada tab Pengelola Sambungan
Manajer koneksi kualitas data
Pilih manajer koneksi DQS yang sudah ada dari daftar, atau buat koneksi baru dengan mengklik Baru.
Baru
Buat manajer koneksi baru dengan menggunakan kotak dialog Pembersihan Pengelola Sambungan DQS. Lihat Mengatur opsi dalam kotak dialog Pembersihan Pengelola Sambungan DQS
Pangkalan Pengetahuan Kualitas Data
Pilih basis pengetahuan DQS yang sudah ada untuk sumber data yang tersambung. Untuk informasi selengkapnya tentang basis pengetahuan DQS, lihat Pangkalan Pengetahuan dan Domain DQS.
Mengenkripsi koneksi
Tentukan apakah akan mengenkripsi koneksi, untuk mengenkripsi transfer data antara DQS Server dan Integration Services.
Domain yang tersedia
Mencantumkan domain yang tersedia untuk basis pengetahuan terpilih. Ada dua jenis domain: domain tunggal, dan domain komposit yang berisi dua domain tunggal atau lebih.
Untuk informasi tentang cara memetakan kolom ke domain komposit, lihat Memetakan Kolom ke Domain Komposit.
Untuk informasi selengkapnya tentang domain, lihat Pangkalan Pengetahuan dan Domain DQS.
Mengonfigurasi Output Kesalahan
Tentukan cara menangani kesalahan tingkat baris. Kesalahan dapat terjadi ketika transformasi mengoreksi data dari sumber data yang terhubung, karena nilai data yang tidak terduga atau batasan validasi.
Berikut ini adalah nilai yang valid:
Komponen Gagal, yang menunjukkan bahwa transformasi gagal dan data input tidak dimasukkan ke dalam database Layanan Kualitas Data. Ini adalah nilai default.
Alihkan Baris, yang menunjukkan bahwa data input tidak dimasukkan ke dalam database Layanan Kualitas Data dan dialihkan ke output kesalahan.
Mengatur opsi pada tab Pemetaan
Untuk informasi tentang cara memetakan kolom ke domain komposit, lihat Memetakan Kolom ke Domain Komposit.
Kolom Input yang Tersedia
Mencantumkan kolom dari sumber data yang tersambung. Pilih satu atau beberapa kolom yang berisi data yang ingin Anda koreksi.
Kolom Input
Mencantumkan kolom input yang Anda pilih di area Kolom Input yang Tersedia.
Domain
Pilih domain untuk dipetakan ke kolom input.
Alias Sumber
Mencantumkan kolom sumber yang berisi nilai kolom asli.
Klik di bidang untuk mengubah nama kolom.
Output Alias
Mencantumkan kolom yang dihasilkan oleh Transformasi Pembersihan DQS. Kolom berisi nilai kolom asli atau nilai yang dikoreksi.
Klik di bidang untuk mengubah nama kolom.
Status Alias
Mencantumkan kolom yang berisi informasi status untuk data yang dikoreksi. Klik di bidang untuk mengubah nama kolom.
Mengatur opsi pada tab Tingkat Lanjut
Menstandarkan output
Menunjukkan apakah akan menghasilkan data dalam format standar berdasarkan format output yang ditentukan untuk domain. Untuk informasi selengkapnya tentang format standar, lihat Pembersihan Data.
Keyakinan
Menunjukkan apakah akan menyertakan tingkat keyakinan untuk data yang dikoreksi. Tingkat keyakinan menunjukkan perluasan kepastian DQS untuk koreksi atau saran. Untuk informasi selengkapnya tentang tingkat keyakinan, lihat Pembersihan Data.
Alasan
Menunjukkan apakah akan menyertakan alasan koreksi data.
Data Yang Ditambahkan
Menunjukkan apakah akan menghasilkan data tambahan yang diterima dari penyedia data referensi yang ada. Untuk informasi selengkapnya, lihat Referensi Data Services di DQS.
Skema Data Tambahan
Menunjukkan apakah akan menghasilkan skema data. Untuk informasi selengkapnya, lihat Melampirkan Domain atau Domain Komposit ke Data Referensi.
Atur opsi dalam kotak dialog Pembersihan Pengelola Sambungan DQS
Nama Server
Pilih atau ketik nama server DQS yang ingin Anda sambungkan. Untuk informasi selengkapnya tentang server, lihat Administrasi DQS.
Uji Koneksi
Klik untuk mengonfirmasi bahwa koneksi yang Anda tentukan layak.
Anda juga dapat membuka kotak dialog DQS Cleansing Pengelola Sambungan dari area koneksi, dengan melakukan hal berikut:
Di SQL Server Data Tools (SSDT), buka proyek Integration Services yang ada atau buat yang baru.
Klik kanan di area koneksi, klik Koneksi Baru, lalu klik DQS.
Klik Tambahkan.