Atur Properti Domain

Berlaku untuk: SQL Server (semua versi yang didukung)

Topik ini menjelaskan cara mengatur properti domain di Data Quality Services (DQS).

Sebelum Anda Mulai

Prasyarat

Untuk mengatur properti untuk domain, Anda harus telah membuat Pangkalan Pengetahuan dan domain.

Keamanan

Izin

Anda harus memiliki peran dqs_kb_editor atau dqs_administrator pada database DQS_MAIN untuk mengatur properti pada domain.

Atur Properti Domain

  1. Atur properti pada domain yang sudah ada dengan membuka Pangkalan Pengetahuan di aktivitas Manajemen Domain (lihat Membuka Pangkalan Pengetahuan), lalu memilih domain yang sesuai di daftar Domain. Halaman Properti Domain akan ditampilkan secara default.

  2. Atur properti pada domain baru setelah membuatnya seperti yang dijelaskan di Membuat Domain.

  3. Klik Selesai untuk menyelesaikan aktivitas manajemen domain, seperti yang dijelaskan di Akhir Aktivitas Manajemen Domain.

Tindak Lanjut: Setelah Mengatur Properti Domain

Setelah mengatur properti domain, Anda bisa melakukan tugas manajemen domain lain di domain, Anda bisa melakukan penemuan pengetahuan untuk menambahkan pengetahuan ke domain, atau Anda bisa menambahkan kebijakan yang cocok ke domain. Untuk informasi selengkapnya, lihat Melakukan Penemuan Pengetahuan, Mengelola Domain, atau Membuat Kebijakan yang Cocok.

Properti Domain

Nama dan Deskripsi Domain

Setelah domain dibuat, nama atau deskripsi domain dapat diubah. Nama domain harus unik untuk Pangkalan Pengetahuan. Deskripsinya bisa hingga 256 karakter.

Jenis Data

Saat Anda membuat domain, pilih salah satu jenis data berikut untuk nilai di domain: String (default), Tanggal, Bilangan Bulat, atau Desimal. Setelah membuat domain, Anda bisa menampilkan tipe data, tetapi Anda tidak dapat mengubahnya. Jenis data yang dipilih untuk domain menentukan jenis data sumber yang dapat dipetakan ke domain. Untuk informasi tentang jenis data yang didukung untuk masing-masing dari empat jenis data domain di DQS, lihat SQL Server yang didukung dan Jenis Data SSIS untuk Domain DQS.

Gunakan Nilai Terdepan

Pilih kotak centang ini untuk menentukan bahwa nilai di depannya dalam sekelompok sinonim akan menjadi output alih-alih nilai yang merupakan sinonim untuk itu. Batal pilih Gunakan Nilai Di depan untuk menentukan bahwa setiap nilai sinonim adalah output dalam bentuk yang benar atau diperbaika, dan tidak digantikan oleh nilai awal untuk grupnya.

Menormalkan String

Jika jenis data adalah String, klik untuk mengabaikan karakter khusus dalam data sumber untuk pemrosesan kualitas data oleh DQS. DQS secara internal mengganti karakter khusus dengan null atau spasi saat data dimuat ke dalam domain. Titik dua, tanda hubung, titik, kutipan ganda, atau titik koma digantikan oleh spasi. Kuotasi tunggal digantikan oleh null. Menggunakan null menyaingkan dua bagian string.

Mengabaikan karakter khusus dalam nilai string dapat meningkatkan akurasi yang cocok. Skor kesamaan antara dua string dapat ditingkatkan dengan mengganti karakter khusus dengan null atau spasi. Tanda baca atau simbol lainnya dapat dengan mudah berbeda dalam string yang berbeda. Mengganti karakter khusus secara internal dapat memungkinkan skor melampaui ambang pencocokan minimum di DQS, menyebabkan dua string dianggap cocok ketika mereka tidak akan begitu sebaliknya. Namun, apakah Anda memilih untuk mengabaikan karakter khusus mungkin bergantung pada jenis data tempat Anda melakukan pencocokan. Misalnya, ketika Anda bekerja dengan data dalam Sistem pengukuran Bahasa Inggris, mengabaikan tanda kutip ganda dan tanda kutip tunggal dalam data produk dapat mengakibatkan positif palsu jika tanda kutip ganda adalah singkatan dari satu inci dan tanda kutip tunggal adalah singkatan dari kaki.

Normalisasi dilakukan ketika data dimuat dan diindeks dalam tahapan pemrosesan data penemuan, kebijakan pencocokan, proyek pencocokan, dan aktivitas proyek pembersihan. Jika diaktifkan, normalisasi dan transformasi hubungan berbasis istilah keduanya dilakukan dalam tahap pra-pemrosesan sebelum analisis. Mereka dijalankan pada setiap domain sebelum algoritma diterapkan yang menghitung kesamaan antar string. Jika penguraian domain komposit diminta, penguraian akan dilakukan sebelum normalisasi dan transformasi relasi berbasis istilah, karena penguraian pemisah memerlukan simbol. Operasi lain, seperti aturan domain dan perubahan nilai domain, akan dilakukan setelah transformasi. Data yang dihasilkan tidak diubah oleh penggantian internal karakter khusus di DQS.

Format Output ke

Pilih pemformatan yang akan diterapkan saat nilai data di domain adalah output. Pemformatan khusus untuk tipe data yang dipilih, seperti yang diperlihatkan dalam daftar berikut ini. Memilih Tidak Ada berarti tidak ada format dalam daftar yang akan diterapkan.

  • Untuk nilai string, Anda dapat menentukan bahwa string menjadi output sebagai huruf besar, huruf kecil, atau dikapitalisasi.

  • Untuk nilai tanggal, Anda dapat menentukan format hari, bulan, dan tahun.

  • Untuk nilai bilangan bulat, Anda dapat menentukan jenis format masker yang akan diterapkan.

  • Untuk nilai desimal, Anda dapat menentukan akurasi dan jenis format masker yang akan diterapkan.

Bahasa

Jika jenis data adalah String, pilih bahasa mana yang ingin Anda kaitkan dengan domain untuk pengoperasian ejaan. Pilihan ini hanya berlaku untuk ejaan, karena hasil ejaan bergantung pada bahasa yang digunakan. Pilihan hanya berlaku untuk satu domain dengan jenis data adalah string. Properti bahasa tidak relevan untuk domain komposit. Bahasa untuk setiap bagian domain komposit ditentukan oleh domain tunggal yang relevan.

Bahasa Inggris adalah bahasa default. Mengatur properti Bahasa ke Lainnya menonaktifkan Speller untuk domain.

Tip

Jika bahasa Anda tidak tercantum dalam daftar drop-down Bahasa , Anda harus memilih Lainnya. Ini memastikan bahwa DQS membersihkan dan menghilangkan duplikat untuk data bahasa yang tidak terdaftar berdasarkan pengetahuan yang tersedia (aturan domain, nilai domain, TBR, aturan yang cocok) di domain.

Aktifkan Ejaan

Jika jenis data adalah String, klik untuk mengaktifkan DQS Speller untuk domain. Speller hanya berfungsi pada domain dengan tipe data string. Kotak centang Aktifkan Ejaan hanya mengaktifkan ejaan untuk satu domain yang terkait dengan kotak centang. Kotak centang tidak berlaku untuk domain komposit.

Speller mengusulkan koreksi sintaksis dan validasi ke nilai di domain. Untuk informasi selengkapnya, lihat Menggunakan Ejaan DQS.

Nonaktifkan Algoritma Kesalahan Sintaks

Jika jenis data adalah String, pilih untuk menentukan bahwa kesalahan sintaks tidak akan diidentifikasi oleh DQS di domain selama pembersihan. Pilih kotak centang ini saat mengidentifikasi kesalahan sintaks untuk domain tersebut tidak relevan. Misalnya, mengidentifikasi kesalahan sintaks mungkin tidak masalah untuk nomor seri. Kontrol ini hanya tersedia untuk jenis data string. DQS tidak akan memeriksa jenis data non-string untuk kesalahan sintaks.