Menentukan aturan pencocokan untuk penyatuan data
Langkah dalam penyatuan ini mendefinisikan urutan pencocokan dan aturan untuk pencocokan lintas tabel. Langkah ini membutuhkan setidaknya dua tabel. Saat rekaman dicocokkan, rekaman tersebut digabungkan menjadi satu rekaman dengan semua bidang dari setiap tabel. Baris alternatif (baris non-pemenang dari langkah Deduplikasi) dipertimbangkan saat mencocokkan. Namun, jika baris cocok dengan baris alternatif dalam tabel, rekaman akan dicocokkan dengan baris pemenang.
Catatan
Setelah membuat kondisi kecocokan dan memilih Berikutnya, Anda tidak dapat menghapus tabel atau kolom yang dipilih. Jika perlu, pilih Kembali untuk meninjau tabel dan kolom yang dipilih sebelum melanjutkan.
Langkah-langkah dan gambar berikut mencerminkan pertama kali Anda melalui proses penyatuan. Untuk mengedit pengaturan penyatuan yang ada, lihat Memperbarui pengaturan penyatuan.
Menyertakan tabel yang diperkaya (pratinjau)
Jika Anda memperkaya tabel pada tingkat sumber data untuk membantu meningkatkan hasil penyatuan, pilihlah. Untuk informasi selengkapnya, lihat Pengayaan untuk sumber data. Jika Anda memilih tabel yang diperkaya pada halaman Aturan duplikasi, Anda tidak perlu memilihnya lagi.
Pada halaman Aturan pencocokan, pilih Gunakan tabel yang diperkaya di bagian atas halaman.
Dari panel Gunakan tabel yang diperkaya, pilih satu atau beberapa tabel yang diperkaya.
Pilih Selesai.
Tentukan urutan kecocokan
Setiap kecocokan menyatukan dua atau lebih tabel menjadi satu tabel terkonsolidasi. Pada waktu bersamaan, ia menyimpan rekaman pelanggan unik. Urutan pencocokan menunjukkan urutan di mana sistem mencoba mencocokkan rekaman.
Penting
Tabel pertama disebut tabel utama, yang berfungsi sebagai dasar untuk profil terpadu Anda. Tabel tambahan yang dipilih akan ditambahkan ke tabel ini.
Pertimbangan penting:
- Pilih tabel dengan data profil terlengkap dan terpercaya tentang pelanggan Anda sebagai tabel utama.
- Pilih tabel yang memiliki beberapa kolom yang sama dengan tabel lain (misalnya, nama, nomor telepon, atau alamat email) sebagai tabel utama.
- Tabel hanya dapat mencocokkan dengan tabel lain yang memiliki prioritas lebih tinggi. Jadi Table2 hanya dapat mencocokkan dengan Table1, dan Table3 dapat mencocokkan dengan Table2 atau Table1.
Pada halaman Aturan pencocokan, gunakan panah pindah ke atas dan bawah untuk memindahkan tabel dalam urutan yang Anda inginkan, atau seret dan lepaskan. Misalnya, pilih eCommerceContacts sebagai tabel utama dan loyCustomer sebagai tabel kedua.
Untuk memiliki setiap rekaman dalam tabel sebagai pelanggan unik terlepas dari apakah kecocokan ditemukan, pilih Sertakan semua rekaman. Setiap rekaman dalam tabel ini yang tidak cocok dengan rekaman di tabel lain disertakan dalam profil terpadu. Rekaman yang tidak memiliki kecocokan disebut singleton.
Tabel utama eCommerceContacts dicocokkan dengan tabel berikutnya loyCustomer. Himpunan data yang dihasilkan dari langkah pencocokan pertama dicocokkan dengan tabel berikut jika Anda memiliki lebih dari dua tabel. Jika duplikat masih ada di eCommerceContacts, ketika loyCustomer dicocokkan dengan eCommerceContacts, baris duplikat eCommerceContacts tidak dikurangi menjadi satu rekaman pelanggan. Namun, jika baris duplikat di loyCustomer cocok dengan baris di eCommerceContacts, baris tersebut dikurangi menjadi satu catatan pelanggan.
Menentukan aturan untuk pasangan yang cocok
Aturan pencocokan menentukan logika yang digunakan untuk mencocokkan pasangan tabel tertentu. Aturan terdiri dari satu atau beberapa kondisi.
Peringatan di samping nama tabel berarti bahwa tidak ada aturan pencocokan yang ditentukan untuk pasangan pencocokan.
Pilih Tambahkan aturan untuk pasangan tabel untuk menentukan aturan pencocokan.
Di panel Tambahkan aturan , konfigurasikan kondisi untuk aturan.
Pilih Tabel/Bidang (baris pertama): Pilih tabel dan kolom yang kemungkinan unik untuk pelanggan. Contohnya, nomor telepon atau alamat email. Hindari pencocokan berdasarkan kolom jenis aktivitas. Misalnya, ID pembelian kemungkinan tidak akan menemukan kecocokan pada jenis rekaman lain.
Pilih Tabel/Bidang (baris kedua): Pilih kolom yang berhubungan dengan kolom tabel yang ditentukan di baris pertama.
Normalisasi: Pilih opsi normalisasi untuk kolom.
- Angka: Mengonversi simbol Unicode yang mewakili angka menjadi angka sederhana.
- Simbol: Menghapus simbol dan karakter khusus seperti !" #$%&'()*+,-./:;<=>?@[]^_'{|}~. Misalnya, Kepala & Bahu menjadi HeadShoulder.
- Teks ke huruf kecil: Mengonversi karakter huruf besar menjadi huruf kecil. "SEMUA huruf besar dan huruf besar judul" menjadi "semua huruf besar dan huruf besar judul."
- Jenis (Telepon, Nama, Alamat, Organisasi): Standarisasi nama, gelar, nomor telepon, dan alamat.
- Unicode ke ASCII: Mengonversi karakter Unicode menjadi huruf ASCII yang setara. Misalnya, aksen ề diubah menjadi karakter e.
- Spasi kosong: Menghapus semua spasi. Hello World menjadi HelloWorld.
- Pemetaan alias: Memungkinkan Anda mengunggah daftar pasangan string kustom untuk menunjukkan string yang harus selalu dianggap sama persis.
- Bypass kustom: Memungkinkan Anda mengunggah daftar string kustom untuk menunjukkan string yang tidak boleh dicocokkan.
Presisi: Tetapkan tingkat presisi untuk diterapkan pada kondisi ini. Presisi digunakan untuk pencocokan persis dan pencocokan fuzzy, dan menentukan seberapa dekat dua string yang harus dianggap cocok.
- Dasar: Pilih dari Rendah (30%), Sedang (60%), Tinggi (80%), dan Tepat (100%). Pilih Persis untuk hanya mencocokkan rekaman yang cocok 100 persen.
- Kustom: Tetapkan persentase yang harus dicocokkan oleh catatan. Sistem hanya akan mencocokkan rekaman yang melewati ambang batas ini.
Nama: Nama untuk aturan.
Untuk mencocokkan tabel hanya jika kolom memenuhi beberapa kondisi, pilih Tambahkan>Kondisi untuk menambahkan lebih banyak kondisi ke aturan pencocokan. Kondisi terhubung dengan operator AND logis dan dengan demikian hanya dijalankan jika semua kondisi terpenuhi.
Secara opsional, pertimbangkan opsi lanjutan seperti pengecualian atau kondisi kecocokan kustom.
Pilih Selesai untuk menyelesaikan aturan.
Secara opsional, tambahkan lebih banyak aturan.
Pilih Selanjutnya.
Menambahkan aturan ke pasangan yang cocok
Aturan kecocokan menunjukkan rangkaian kondisi. Untuk mencocokkan tabel berdasarkan kondisi berdasarkan beberapa kolom, tambahkan aturan lainnya.
Pilih Tambahkan aturan pada tabel yang ingin Anda tambahkan aturan.
Ikuti langkah-langkah dalam Menentukan aturan untuk pasangan pertandingan.
Catatan
Urutan aturan itu penting. Algoritme pencocokan mencoba mencocokkan rekaman pelanggan tertentu berdasarkan aturan pertama Anda dan melanjutkan ke aturan kedua hanya jika tidak ada kecocokan yang diidentifikasi dengan aturan pertama.
Pilihan tingkat lanjut
Menambahkan pengecualian ke aturan
Dalam kebanyakan kasus, pencocokan tabel mengarah ke profil pelanggan unik dengan data konsolidasi. Untuk mengatasi kasus positif palsu dan negatif palsu yang jarang terjadi, tentukan pengecualian untuk aturan pencocokan. Pengecualian diterapkan setelah memproses aturan kecocokan dan menghindari pencocokan semua rekaman, yang memenuhi kriteria pengecualian.
Misalnya, jika aturan pencocokan Anda menggabungkan nama belakang, kota, dan tanggal lahir, sistem akan mengidentifikasi anak kembar dengan nama belakang yang sama yang tinggal di kota yang sama dengan profil yang sama. Anda dapat menentukan pengecualian yang tidak cocok dengan profil jika nama depan dalam tabel yang Anda gabungkan tidak sama.
Di panel Edit aturan , pilih Tambahkan>pengecualian.
Tentukan kriteria pengecualian.
Pilih Selesai untuk menyimpan aturan.
Menentukan kondisi kecocokan kustom
Tentukan kondisi yang menimpa logika pencocokan default. Ada empat opsi yang tersedia:
Opsi | Description | Contoh |
---|---|---|
Selalu cocok | Menentukan nilai untuk kunci utama yang selalu cocok. | Selalu cocokkan baris dengan kunci utama 12345 dengan baris dengan kunci utama 54321. |
Tidak pernah cocok | Menentukan nilai untuk kunci utama yang tidak pernah cocok. | Jangan pernah mencocokkan baris dengan kunci utama 12345 dengan baris dengan kunci utama 54321. |
Bypass | Menentukan nilai yang harus selalu diabaikan sistem dalam fase pencocokan. | Abaikan nilai 11111 dan Tidak Diketahui selama pertandingan. |
Pemetaan alias | Menentukan nilai yang harus dipertimbangkan sistem sebagai nilai yang sama. | Anggaplah Joe setara dengan Joseph. |
Pilih Kustom.
Pilih jenis kustom dan pilih Unduh template . Ganti nama templat tanpa menggunakan spasi. Gunakan template terpisah untuk setiap opsi kecocokan.
Buka file template yang diunduh dan isi detailnya. Templat berisi bidang untuk menentukan tabel dan nilai kunci utama tabel yang akan digunakan dalam pencocokan kustom. Nama tabel peka huruf besar/kecil. Misalnya, jika Anda ingin kunci utama 12345 dari tabel Penjualan selalu cocok dengan kunci utama 34567 dari tabel Kontak , isi templat:
- Tabel1: Penjualan
- Tabel1Kunci: 12345
- Tabel2: Kontak
- Tabel2Kunci: 34567
File templat yang sama dapat menentukan rekaman pencocokan kustom dari beberapa tabel.
Jika Anda ingin menentukan pencocokan kustom untuk deduplikasi pada tabel, berikan tabel yang sama dengan Table1 dan Table2 dan atur nilai kunci utama yang berbeda. Anda harus menentukan setidaknya satu aturan deduplikasi ke tabel untuk menggunakan pencocokan kustom.
Setelah menambahkan semua penggantian, simpan file template.
Buka Sumber>data Data dan menyerap file templat sebagai tabel baru.
Setelah mengunggah file, pilih opsi Kustom lagi. Pilih tabel yang diperlukan dari menu tarik-turun dan pilih Selesai.
Menerapkan pencocokan kustom bergantung pada opsi pencocokan yang ingin Anda gunakan.
- Untuk Selalu cocok atau Jangan pernah cocok, lanjutkan ke langkah berikutnya.
- Untuk Pemetaan Bypass atauAlias, pilih Edit pada aturan kecocokan yang ada atau buat aturan baru. Di menu menurun Normalisasi, pilih opsi Bypass kustom atau Pemetaan alias dan pilih Selesai.
Pilih Selesai pada panel Kustom untuk menerapkan konfigurasi pencocokan kustom.
Setiap file templat yang diserap adalah sumber datanya sendiri. Jika rekaman ditemukan yang memerlukan perlakuan pencocokan khusus, perbarui sumber data yang sesuai. Pembaruan akan digunakan selama proses penyatuan berikutnya. Misalnya, Anda mengidentifikasi anak kembar dengan nama yang hampir sama yang tinggal di alamat yang sama yang telah digabungkan sebagai satu orang. Perbarui sumber data untuk mengidentifikasi kembar sebagai rekaman unik yang terpisah.