Bagikan melalui


Membuat Hubungan Berbasis Istilah

Berlaku untuk:SQL Server

Penting

Data Quality Services (DQS) dihapus dalam Pratinjau SQL Server 2025 (17.x). Kami terus mendukung DQS di SQL Server 2022 (16.x) dan versi yang lebih lama.

Topik ini menjelaskan cara membuat hubungan berbasis istilah untuk domain di Data Quality Services (DQS). Hubungan berbasis istilah (TBR) memungkinkan Anda membuat koreksi pada istilah yang merupakan bagian dari nilai dalam domain. Ini memungkinkan beberapa nilai yang identik, walaupun ejaan bagian umumnya berbeda, tetap dapat dianggap sebagai sinonim. Misalnya, Anda dapat menyiapkan hubungan berbasis istilah yang mengubah istilah "Inc." menjadi "Incorporated". Istilah "Inc." akan diubah setiap kali muncul di domain. Instans "Contoso, Inc." akan diubah menjadi "Contoso, Incorporated", dan kedua nilai dianggap sebagai sinonim yang tepat.

Untuk menggunakan hubungan berbasis istilah, Anda membuat daftar pasangan Nilai/Koreksi Ke, seperti "Inc." dan "Incorporated", atau "Senior" dan "Sr.". Menggunakan relasi berbasis istilah memungkinkan Anda mengubah istilah di seluruh domain tanpa mengatur nilai domain individual secara manual sebagai sinonim. Anda dapat menentukan bahwa nilai akan dikoreksi meskipun penemuan pengetahuan belum menemukan nilai tersebut sebelumnya. Jika transformasi hubungan berbasis istilah menyebabkan dua nilai identik, maka DQS akan membuat hubungan sinonim di antara mereka (dalam penemuan pengetahuan), hubungan koreksi di antara mereka (dalam koreksi data), atau kecocokan yang tepat (dalam pencocokan).

Transformasi relasi berbasis istilah dan transformasi simbol (di mana karakter khusus digantikan oleh spasi atau null) keduanya dilakukan dalam tahap pra-pemrosesan sebelum analisis. Jika penguraian domain komposit diminta, penguraian akan dilakukan sebelum dua transformasi, karena penguraian pemisah memerlukan simbol. Operasi lain, seperti aturan domain dan perubahan nilai domain, akan dilakukan setelah transformasi. Untuk pencocokan, hubungan berbasis istilah diterapkan pada data sumber sebelum aktivitas pencocokan tanpa memandang apakah Anda menjalankan pembersihan.

Hubungan Berbasis Istilah dan Manajemen Domain

Saat Anda menerapkan hubungan berbasis istilah dalam manajemen domain, DQS akan menerapkan perubahan dalam proses penemuan pengetahuan, pembersihan, atau pencocokan; namun, DQS tidak mengubah nilai domain itu sendiri agar sesuai dengan hubungan berbasis istilah. Dengan kata lain, jika Anda memasukkan dan menerima hubungan berbasis istilah di tab Hubungan Berbasis Istilah di halaman Manajemen Domain, perubahan tidak akan dilakukan di tab Nilai Domain di halaman yang sama. Ini memungkinkan Anda untuk mengubah TBR kemudian.

Hubungan Berbasis Istilah dan Pembersihan Data

Saat Anda menerapkan hubungan berbasis istilah di domain lalu menjalankan proses pembersihan data, DQS menerapkan perubahan selama pembersihan, tetapi tidak menerapkan perubahan pada istilah dalam basis pengetahuan.

  • Jika nilai diubah oleh relasi berbasis istilah ada di domain, tetapi bukan sinonim, nilai tersebut akan ditampilkan di kolom Benar ke di bawah tab Dikoreksi dari halaman Kelola dan Tampilkan hasil, dengan Alasan disetel ke Relasi berbasis istilah.

  • Jika nilai yang diubah oleh relasi berbasis istilah tidak berada dalam domain, dan DQS menemukan nilai yang cocok, nilai tersebut akan dikoreksi dan kemudian akan muncul di bawah tab Dikoreksi atau tab yang Disarankan, berdasarkan tingkat kepercayaan. Jika tidak ada kecocokan yang ditemukan, nilai akan muncul di bawah Baru dengan koreksi TBR. Ini dilakukan karena bahkan jika Anda memperbaiki TBR, itu tidak berarti bahwa nilainya benar.

  • Jika nilai yang diubah oleh relasi berbasis istilah ada di domain, tetapi nilainya adalah Kesalahan/Tidak Valid dengan koreksi yang ada, nilai akan muncul di bawah tab Diperbaiki dengan koreksinya dan dengan alasan Nilai Domain.

  • Jika nilai yang diubah oleh relasi berbasis istilah berada dalam domain, tetapi nilainya adalah Kesalahan/Tidak Valid tanpa perbaikan, nilai akan muncul di bawah tab Tidak Valid dengan alasan Nilai Domain.

Penemuan Hubungan dan Pengetahuan Berbasis Istilah

Ketika Anda menerapkan hubungan berbasis istilah dan kemudian menjalankan proses penemuan pengetahuan, nilai apa pun yang sesuai dengan TBR akan tetap apa adanya dan akan diidentifikasi sebagai nilai yang benar. Nilai apa pun yang diubah oleh TBR akan diimpor sebagai nilai yang benar, dan akan diidentifikasi sebagai sinonim dari nilai yang sesuai dengan TBR.

Hubungan Berbasis Istilah dan Impor Nilai Pemurnian ke dalam Suatu Domain

Jika Anda mengimpor pengetahuan kualitas data yang dikumpulkan selama proses pembersihan ke domain, nilai yang diubah oleh TBR akan diimpor sebagai nilai yang benar.

Sebelum Anda mulai

Prasyarat

Untuk membuat hubungan berbasis istilah, Anda harus membuka domain dalam aktivitas Manajemen Domain.

Keamanan

Perizinan

Anda harus memiliki peran dqs_kb_editor atau dqs_administrator pada database DQS_MAIN untuk membuat hubungan berbasis istilah.

Membuat Hubungan Berbasis Istilah

  1. Mulai Aplikasi Kualitas Data. Untuk informasi tentang melakukannya, lihat Jalankan Aplikasi Klien Kualitas Data.

  2. Di layar beranda Klien Kualitas Data, buka atau buat basis pengetahuan. Pilih Manajemen Domain sebagai aktivitas, lalu klik Buka atau Buat. Untuk informasi selengkapnya, lihat Membuat Pangkalan Pengetahuan atau Membuka Pangkalan Pengetahuan.

    Catatan

    Manajemen domain dilakukan di halaman klien Layanan Kualitas Data yang berisi lima tab untuk operasi manajemen domain terpisah. Ini bukan proses berbasis wizard; setiap operasi manajemen dapat dilakukan secara terpisah.

  3. Dari daftar Domain di halaman Manajemen Domain, pilih domain yang ingin Anda buat aturan domainnya, atau buat domain baru. Jika Anda harus membuat domain baru, lihat Membuat Domain.

  4. Klik tab Hubungan Berbasis Istilah.

  5. Buat hubungan berbasis istilah sebagai berikut:

    1. Klik Tambahkan Hubungan Baru untuk menambahkan baris ke tabel Hubungan.

    2. Ke kolom Nilai dari baris yang ditambahkan, masukkan istilah yang ingin Anda ubah setiap kali terjadi dalam nilai di domain yang dipilih.

      Catatan

      Anda akan mendapatkan pesan kesalahan jika istilah ada sebagai nilai utuh di domain, atau jika sudah ada sebagai nilai koreksi di domain.

    3. Masukkan istilah yang ingin Anda ubah di kolom Nilai ke kolom Benar Ke.

    4. Klik Tambahkan Hubungan Baru lagi untuk menambahkan hubungan berbasis istilah lain.

    5. Klik Hapus Hubungan yang Dipilih untuk menghapus satu atau beberapa baris yang dipilih dari tabel Hubungan. Anda dapat memilih beberapa baris dengan menekan tombol Ctrl dan mengklik baris yang tidak dipilih.

    6. Temukan nilai dalam tabel Hubungan dengan memasukkan satu atau beberapa digit dalam kotak teks Temukan . Kecocokan untuk string akan disorot. Gunakan panah atas dan bawah untuk berpindah ke instans string yang berbeda dalam tabel.

    7. Pemeriksa Ejaan: Jika nilai dalam kolom Nilai atau Koreksi ke memiliki garis bawah bergelombang merah, Pemeriksa Ejaan menyarankan untuk mengoreksi nilai tersebut. Klik kanan nilai yang memiliki garis bawah, dan pilih salah satu nilai yang diusulkan oleh periksa ejaan. Secara bergantian, Anda dapat mengklik Tambahkan di menu pintasan tp lanjutkan dengan nilai asli. Untuk informasi selengkapnya, lihat Menggunakan DQS Speller dan Mengatur Properti Domain.

      Catatan

      Untuk menggunakan Ejaan, Anda bisa mengaktifkannya di halaman Properti Domain, atau jika dinonaktifkan di halaman Properti Domain, Anda bisa mengklik ikon Aktifkan/Nonaktifkan Ejaan pada halaman Hubungan Berbasis Istilah untuk mengaktifkannya di halaman ini.

  6. Klik Terapkan Perubahan untuk menerapkan hubungan berbasis istilah ke domain.

  7. Klik Selesai untuk menyelesaikan aktivitas manajemen domain, seperti yang dijelaskan di Akhir Aktivitas Manajemen Domain.

Tindak Lanjut: Setelah Membuat Hubungan Berbasis Istilah

Setelah membuat hubungan berbasis istilah, Anda dapat melakukan tugas manajemen domain lain di domain, Anda dapat melakukan penemuan pengetahuan untuk menambahkan pengetahuan ke domain, atau Anda bisa menambahkan kebijakan yang cocok ke domain. Untuk informasi selengkapnya, lihat Melakukan Penemuan Pengetahuan, Mengelola Domain, atau Membuat Kebijakan yang Cocok.