Bagikan melalui


Atur Properti Domain

Berlaku untuk: SQL Server

Topik ini menjelaskan cara mengatur properti domain di Data Quality Services (DQS).

Sebelum Anda mulai

Prasyarat

Untuk mengatur properti untuk domain, Anda harus telah membuat basis pengetahuan dan domain.

Keamanan

Izin

Anda harus memiliki peran dqs_kb_editor atau dqs_administrator pada database DQS_MAIN untuk mengatur properti pada domain.

Atur Properti Domain

  1. Atur properti pada domain yang sudah ada dengan membuka basis pengetahuan di aktivitas Manajemen Domain (lihat Membuka Pangkalan Pengetahuan), lalu memilih domain yang sesuai di daftar Domain. Halaman Properti Domain akan ditampilkan secara default.

  2. Atur properti pada domain baru setelah membuatnya seperti yang dijelaskan di Membuat Domain.

  3. Klik Selesai untuk menyelesaikan aktivitas manajemen domain, seperti yang dijelaskan di Akhir Aktivitas Manajemen Domain.

Tindak Lanjut: Setelah Mengatur Properti Domain

Setelah mengatur properti domain, Anda bisa melakukan tugas manajemen domain lain di domain, Anda bisa melakukan penemuan pengetahuan untuk menambahkan pengetahuan ke domain, atau Anda bisa menambahkan kebijakan yang cocok ke domain. Untuk informasi selengkapnya, lihat Melakukan Penemuan Pengetahuan, Mengelola Domain, atau Membuat Kebijakan yang Cocok.

Properti Domain

Nama dan Deskripsi Domain

Setelah domain dibuat, nama atau deskripsi domain dapat diubah. Nama domain harus unik untuk basis pengetahuan. Deskripsinya bisa hingga 256 karakter.

Jenis Data

Saat Anda membuat domain, pilih salah satu jenis data berikut untuk nilai di domain: String (default), Tanggal, Bilangan Bulat, atau Desimal. Setelah membuat domain, Anda bisa menampilkan tipe data, tetapi Anda tidak dapat mengubahnya. Jenis data yang dipilih untuk domain menentukan jenis data sumber yang dapat dipetakan ke domain. Untuk informasi tentang jenis data yang didukung untuk masing-masing dari empat jenis data domain di DQS, lihat Jenis Data SQL Server dan SSIS yang didukung untuk Domain DQS.

Gunakan Nilai Terdepan

Pilih kotak centang ini untuk menentukan bahwa nilai di depan dalam sekelompok sinonim akan menjadi output alih-alih nilai yang merupakan sinonim padanya. Batal pilih Gunakan Nilai Utama untuk menentukan bahwa setiap nilai sinonim adalah output dalam bentuk yang benar atau diperbaik, dan tidak digantikan oleh nilai di depan untuk grupnya.

Menormalkan String

Jika jenis data adalah String, klik untuk mengabaikan karakter khusus dalam data sumber untuk pemrosesan kualitas data oleh DQS. DQS secara internal mengganti karakter khusus dengan null atau spasi saat data dimuat ke domain. Titik dua, tanda hubung, titik, tanda kutip ganda, atau titik koma digantikan oleh spasi. Kuotasi tunggal digantikan oleh null. Menggunakan null menyaingkan dua bagian string.

Mengabaikan karakter khusus dalam nilai string dapat meningkatkan akurasi pencocokan. Skor kesamaan antara dua string dapat ditingkatkan dengan mengganti karakter khusus dengan null atau spasi. Tanda baca atau simbol lainnya dapat dengan mudah berbeda dalam string yang berbeda. Mengganti karakter khusus secara internal dapat memungkinkan skor melampaui ambang pencocokan minimum di DQS, menyebabkan dua string dianggap cocok ketika mereka tidak akan begitu sebaliknya. Namun, apakah Anda memilih untuk mengabaikan karakter khusus mungkin bergantung pada jenis data tempat Anda melakukan pencocokan. Misalnya, ketika Anda bekerja dengan data dalam Sistem pengukuran Bahasa Inggris, mengabaikan tanda kutip ganda dan tanda kutip tunggal dalam data produk dapat mengakibatkan positif palsu jika tanda kutip ganda adalah singkatan dari satu inci dan tanda kutip tunggal berdiri untuk satu kaki.

Normalisasi dilakukan ketika data dimuat dan diindeks dalam tahap pemrosesan data penemuan, kebijakan pencocokan, pencocokan proyek, dan aktivitas proyek pembersihan. Jika diaktifkan, normalisasi dan transformasi hubungan berbasis istilah keduanya dilakukan dalam tahap pra-pemrosesan sebelum analisis. Mereka dijalankan pada setiap domain sebelum algoritma diterapkan yang menghitung kesamaan antar string. Jika penguraian domain komposit diminta, penguraian akan dilakukan sebelum normalisasi dan transformasi relasi berbasis istilah, karena penguraian pemisah memerlukan simbol. Operasi lain, seperti aturan domain dan perubahan nilai domain, akan dilakukan setelah transformasi. Data yang dihasilkan tidak diubah oleh penggantian internal karakter khusus di DQS.

Format Output ke

Pilih pemformatan yang akan diterapkan saat nilai data di domain adalah output. Pemformatan khusus untuk tipe data yang dipilih, seperti yang diperlihatkan dalam daftar berikut ini. Memilih Tidak Ada berarti tidak ada format dalam daftar yang akan diterapkan.

  • Untuk nilai string, Anda dapat menentukan bahwa string menjadi output sebagai huruf besar, huruf kecil, atau bermodal.

  • Untuk nilai tanggal, Anda dapat menentukan format hari, bulan, dan tahun.

  • Untuk nilai bilangan bulat, Anda dapat menentukan jenis format masker yang akan diterapkan.

  • Untuk nilai desimal, Anda dapat menentukan akurasi dan jenis format masker yang akan diterapkan.

Bahasa

Jika jenis data adalah String, pilih bahasa mana yang ingin Anda kaitkan dengan domain untuk operasi ejaan. Pilihan ini hanya berlaku untuk ejaan, karena hasil ejaan bergantung pada bahasa yang digunakan. Pilihan hanya berlaku untuk satu domain dengan jenis data adalah string. Properti bahasa tidak relevan untuk domain komposit. Bahasa untuk setiap bagian domain komposit ditentukan oleh domain tunggal yang relevan.

Bahasa Inggris adalah bahasa default. Mengatur properti Bahasa ke Lainnya menonaktifkan Ejaan untuk domain.

Tip

Jika bahasa Anda tidak tercantum dalam daftar drop-down Bahasa , Anda harus memilih Lainnya. Ini memastikan bahwa DQS membersihkan dan menghilangkan duplikat untuk data bahasa yang tidak tercantum berdasarkan pengetahuan yang tersedia (aturan domain, nilai domain, TBR, aturan yang cocok) di domain.

Aktifkan Ejaan

Jika jenis data adalah String, klik untuk mengaktifkan DQS Speller untuk domain. Speller hanya berfungsi pada domain dengan tipe data string. Kotak centang Aktifkan Ejaan hanya mengaktifkan ejaan untuk satu domain yang terkait dengan kotak centang. Kotak centang tidak berlaku untuk domain komposit.

Speller mengusulkan koreksi sintaksis dan validasi ke nilai dalam domain. Untuk informasi selengkapnya, lihat Menggunakan Ejaan DQS.

Nonaktifkan Algoritma Kesalahan Sintaks

Jika jenis data adalah String, pilih untuk menentukan bahwa kesalahan sintaks tidak akan diidentifikasi oleh DQS di domain selama pembersihan. Pilih kotak centang ini saat mengidentifikasi kesalahan sintaks untuk domain tersebut tidak relevan. Misalnya, mengidentifikasi kesalahan sintaks mungkin tidak penting untuk nomor seri. Kontrol ini hanya tersedia untuk jenis data string. DQS tidak akan memeriksa jenis data non-string untuk kesalahan sintaks.