Melampirkan domain atau domain komposit ke data referensi - Data Quality Services (DQS)

Berlaku untuk:SQL Server

Topik ini menjelaskan cara melampirkan domain/domain komposit dalam pangkalan pengetahuan kualitas data ke layanan data referensi di Azure Marketplace untuk membangun pengetahuan terhadap data referensi berkualitas tinggi. Setiap layanan data referensi berisi skema (kolom data). Setelah melampirkan domain atau domain komposit ke layanan data referensi, Anda harus memetakan domain terlampir atau domain individual dalam domain komposit yang dilampirkan ke kolom yang sesuai dalam skema layanan data referensi. Melampirkan domain komposit ke layanan data referensi memungkinkan Anda melampirkan hanya satu domain ke layanan data referensi, lalu memetakan domain individual dalam domain komposit ke kolom yang sesuai dalam skema layanan data referensi.

Penting

Artikel ini menyebutkan layanan data referensi pihak ketiga yang sebelumnya tersedia dari Azure DataMarket. DataMarket dan Data Services - termasuk data alamat Melissa, misalnya - dihentikan setelah 31/12/2016. Akibatnya, Anda tidak dapat lagi menjalankan contoh dalam artikel ini dengan layanan yang ditentukan dari DataMarket. Anda masih dapat menggunakan layanan data referensi yang tersedia langsung secara online dari penyedia data referensi pihak ketiga.

Peringatan

Domain komposit yang dilampirkan ke layanan data referensi tersedia di daftar drop-down domain saat memetakan domain ke kolom dalam skema layanan data referensi. Jangan memetakan domain komposit ke kolom dalam skema layanan data referensi; Anda hanya boleh memetakan domain individual dalam domain komposit ke kolom yang sesuai dalam skema layanan data referensi. Jika tidak, itu akan mengakibatkan kesalahan.

Skema layanan data referensi dapat memiliki kolom wajib yang harus dipetakan dengan domain yang sesuai jika Anda memilih untuk menggunakan layanan data referensi. Kolom wajib dalam skema data referensi diidentifikasi dengan "(M)" terhadap nama kolom. Misalnya, AddressLine adalah kolom skema wajib di Melissa Data - Address Data dan CompanyName adalah kolom skema wajib di Digital Trowel Inc. - Perusahaan As dan data profesional untuk pengguna SQL.

Dalam topik ini, kami akan membuat empat domain: Baris Alamat, Kota, Negara Bagian, dan Zip, di bawah domain komposit, Verifikasi Alamat, lampirkan domain komposit ke layanan data referensi Melissa Data - Cek Alamat, lalu petakan domain individual dalam domain komposit ke kolom yang sesuai dalam skema layanan data referensi.

Sebelum Anda mulai

Prasyarat

Anda harus mengonfigurasi Data Quality Services (DQS) untuk menggunakan layanan data referensi. Lihat Mengonfigurasi DQS untuk Menggunakan Data Referensi.

Keamanan

Izin

Anda harus memiliki peran dqs_kb_editor pada database DQS_MAIN untuk memetakan domain ke data referensi.

Memetakan domain untuk mereferensikan data dari Melissa Data

  1. Mulai Klien Kualitas Data. Untuk informasi tentang melakukannya, lihat Menjalankan Aplikasi Klien Kualitas Data.

  2. Di layar beranda Klien Kualitas Data, di bawah Manajemen Pangkalan Pengetahuan, klik Pangkalan pengetahuan baru.

  3. Di layar Pangkalan Pengetahuan baru, ketik nama untuk pangkalan pengetahuan baru, klik aktivitas Manajemen Domain, dan klik Buat.

  4. Di layar Manajemen Domain, klik ikon Buat domain untuk membuat domain. Buat empat domain berikut: Baris Alamat, Kota, Status, dan Zip.

  5. Klik ikon Buat domain komposit untuk membuat domain komposit. Dalam kotak dialog Buat domain komposit, ketik Verifikasi Alamat di kotak Nama Domain Komposit, dan sertakan semua domain yang dibuat di langkah 3 di domain komposit. Klik OK.

  6. Di panel Domain di sisi kiri, pilih domain komposit dengan mengklik Verifikasi Alamat, lalu klik tab Data Referensi di sisi kanan.

  7. Klik ikon Telusuri.

  8. Dalam kotak dialog Katalog Penyedia Data Referensi Online:

    1. Di bawah DataMarket Data Quality Services, pilih kotak Centang Data - Alamat Melissa.

    2. Petakan kolom layanan data referensi Melissa Data - Cek Alamat dengan domain yang sesuai (Baris Alamat, Kota, Status, dan Zip). Anda memetakan kolom dengan memilih kolom layanan data referensi di kolom Skema RDS, lalu memilih domain yang sesuai di kolom Domain . Untuk menambahkan lebih banyak baris dalam tabel, klik ikon Tambahkan Entri Skema.

    3. Klik OK untuk menyimpan perubahan, dan tutup kotak dialog Katalog Penyedia Data Referensi Online.

      Online Reference Data Providers Catalog dialog box

      Catatan

      • Dalam kotak dialog Katalog Penyedia Data Referensi Online, simpul DataMarket Data Quality Services menampilkan semua penyedia layanan data referensi yang telah Anda berlangganan di Azure Marketplace. Jika Anda telah mengonfigurasi penyedia layanan data referensi pihak ketiga online langsung di DQS, mereka akan muncul di bawah simpul lain yang disebut Penyedia Online Langsung Pihak ke-3 (tidak tersedia sekarang karena tidak ada penyedia layanan data referensi pihak ketiga online langsung yang dikonfigurasi di DQS).
  9. Anda akan kembali ke tab Data Referensi. Di area Pengaturan Penyedia, ubah nilai dalam kotak berikut, jika diperlukan:

    • Ambang Koreksi Otomatis: Koreksi dari layanan data referensi dengan tingkat keyakinan di atas nilai ambang batas ini akan dilakukan secara otomatis. Masukkan nilai dalam notasi desimal dari nilai persentase yang sesuai. Misalnya, masukkan 0,9 untuk 90%.

    • Kandidat yang Disarankan: Jumlah kandidat yang disarankan untuk ditampilkan dari layanan data referensi.

    • Min Confidence: Saran dari layanan data referensi dengan tingkat keyakinan yang lebih rendah dari nilai ini akan diabaikan. Masukkan nilai dalam notasi desimal dari nilai persentase yang sesuai. Misalnya, masukkan 0,6 untuk 60%.

  10. Klik Selesai untuk menerbitkan pangkalan pengetahuan. Pesan konfirmasi muncul setelah pangkalan pengetahuan berhasil diterbitkan.

Anda sekarang dapat menggunakan pangkalan pengetahuan ini untuk membersihkan aktivitas dalam proyek kualitas data untuk menstandarkan dan membersihkan alamat AS dalam data sumber Anda berdasarkan pengetahuan yang disediakan oleh Melissa Data melalui Azure Marketplace.

Tindak Lanjut: Setelah Memetakan Domain ke Data Referensi

Buat proyek kualitas data, dan jalankan aktivitas pembersihan pada data sumber Anda yang berisi alamat AS dengan membandingkannya dengan pangkalan pengetahuan yang dibuat dalam topik ini. Lihat Membersihkan data menggunakan pengetahuan Data Referensi (Eksternal).

Lihat Juga

Referensi Data Services di DQS
Pembersihan Data