ลบรายการที่ซ้ำกันในแต่ละตารางเพื่อการรวมข้อมูล
ขั้นตอนกฎการขจัดข้อมูลซ้ำซ้อนของการรวมจะค้นหาและลบเรกคอร์ดที่ซ้ำกันของลูกค้าออกจากตารางต้นทาง เพื่อให้ลูกค้าแต่ละรายแสดงด้วยแถวเดียวในแต่ละตาราง แต่ละตารางจะถูกขจัดข้อมูลซ้ำซ้อนแยกกันโดยใช้กฎ เพื่อระบุเรกคอร์ดสำหรับลูกค้าที่กำหนด
กฎได้รับการประมวลผลตามลำดับ หลังจากที่กฎทั้งหมดทำงานกับเรคคอร์ดทั้งหมดในตารางแล้ว กลุ่มการจับคู่ที่ใช้แถวร่วมกันจะถูกรวมเป็นกลุ่มการจับคู่เดียว
กำหนดกฎการลบข้อมูลซ้ำซ้อน
กฎที่ดีจะระบุถึงลูกค้าที่ไม่ซ้ำกัน พิจารณาข้อมูลของคุณ การระบุลูกค้าตามฟิลด์ เช่น อีเมล อาจเพียงพอแล้ว อย่างไรก็ตาม หากคุณต้องการแยกความแตกต่างระหว่างลูกค้าที่แชร์อีเมล คุณอาจเลือกที่จะมีกฎที่มีสองเงื่อนไข ซึ่งตรงกับอีเมล + ชื่อ หากต้องการข้อมูลเพิ่มเติม โปรดดู แนวทางปฏิบัติที่ดีที่สุดในการขจัดข้อมูลซ้ำซ้อน
บนหน้า กฎการขจัดข้อมูลซ้ำซ้อน ให้เลือกตารางและเลือก เพิ่มกฎ เพื่อกำหนดกฎการลบข้อมูลซ้ำซ้อน
เคล็ดลับ
หากคุณเพิ่มตารางในระดับแหล่งข้อมูลเพื่อในการช่วยปรับปรุงผลลัพธ์การรวมของคุณ ให้เลือก ใช้ตารางที่เพิ่มข้อมูล ที่ด้านบนของหน้า สำหรับข้อมูลเพิ่มเติม โปรดดู การเพิ่มความสมบูรณ์จากแหล่งข้อมูล
ในบานหน้าต่าง เพิ่มกฎ ให้ป้อนข้อมูลดังต่อไปนี้:
เลือกฟิลด์: เลือกจากรายการฟิลด์ที่มีอยู่จากตารางที่คุณต้องการตรวจสอบรายการที่ซ้ำกัน เลือกฟิลด์ที่มีแนวโน้มไม่ซ้ำกันสำหรับลูกค้าหนึ่งราย ตัวอย่างเช่น ที่อยู่อีเมล หรือชื่อ เมือง และหมายเลขโทรศัพท์รวมกัน
ทำให้เป็นมาตรฐาน: เลือก ตัวเลือกการทำให้เป็นมาตรฐาน สำหรับคอลัมน์ การทำให้เป็นมาตรฐานจะส่งผลต่อขั้นตอนการจับคู่เท่านั้น และจะไม่เปลี่ยนแปลงข้อมูล
- ตัวเลข: แปลงสัญลักษณ์ Unicode ที่แสดงตัวเลขเป็นตัวเลขเชิงเดี่ยว
- สัญลักษณ์: ลบสัญลักษณ์และอักขระพิเศษ เช่น !"#$%&'()*+,-./:;<=>? @[]^_`{|}~. ตัวอย่างเช่น Head&Shoulder กลายเป็น HeadShoulder
- ข้อความเป็นตัวพิมพ์เล็ก: แปลงอักขระตัวพิมพ์ใหญ่ให้เป็นตัวพิมพ์เล็ก "ALL CAPS and Title Case" กลายเป็น "all caps and title case"
- ประเภท (โทรศัพท์ ชื่อ ที่อยู่ องค์กร): กำหนดมาตรฐานชื่อ ตำแหน่ง หมายเลขโทรศัพท์ และที่อยู่
- Unicode เป็น ASCII: แปลงอักขระ Unicode ให้เทียบเท่ากับตัวอักษร ASCII ตัวอย่างเช่น ề ที่เน้นเสียงจะแปลงเป็นอักขระ e
- ช่องว่าง: ลบช่องว่างทั้งหมด Hello World กลายเป็น HelloWorld
- นามแฝง การแมป: ช่วยให้คุณสามารถอัปโหลดรายการคู่สตริงที่กำหนดเองเพื่อระบุสตริงที่ควรพิจารณาว่าตรงกันทุกประการเสมอ
- บายพาสที่กำหนดเอง: ช่วยให้คุณสามารถอัปโหลดรายการสตริงที่กำหนดเองเพื่อระบุสตริงที่ไม่ควรตรงกัน
ความแม่นยำ: ตั้งค่าระดับของความแม่นยำ ความแม่นยำใช้สำหรับการจับคู่แบบตรงทั้งหมดและการจับคู่แบบคลุมเครือ และกำหนดว่าสตริง 2 รายการจะต้องอยู่ใกล้กันเพียงใดจึงจะถือว่าตรงกัน
- พื้นฐาน: เลือกจาก ต่ำ (30%), ปานกลาง (60%), สูง (80%) และ ตรงกันทุกประการ (100%) เลือก ตรงกันทุกประการ เพื่อจับคู่เรกคอร์ดที่ตรงกัน 100 เปอร์เซ็นต์เท่านั้น
- กำหนดเอง: กำหนดเปอร์เซ็นต์ที่เรกคอร์ดต้องตรงกัน ระบบจะจับคู่เรกคอร์ดที่ผ่านเกณฑ์นี้เท่านั้น
ชื่อ: ชื่อสำหรับกฎ
หรือ เลือก เพิ่ม>เพิ่มเงื่อนไข เพื่อเพิ่มเงื่อนไขเพิ่มเติมให้กับกฎ เงื่อนไขเชื่อมต่อกับตัวดำเนินการเชิงตรรกะ และจะมีการดำเนินการก็ต่อเมื่อตรงตามเงื่อนไขทั้งหมดเท่านั้น
อีกทางหนึ่งคือ เพิ่ม>เพิ่มข้อยกเว้น เพื่อ เพิ่มข้อยกเว้นให้กับกฎ ข้อยกเว้นถูกใช้เพื่อจัดการกับกรณีที่เกิดขึ้นได้ยากของผลลัพธ์ที่ผิดและผลลบเท็จ
เลือก เสร็จสิ้น เพื่อสร้างกฎ
หรือ เพิ่มกฎเพิ่มเติม
เลือกตาราง จากนั้น แก้ไขการกําหนดลักษณะการรวมเข้าด้วยกัน
ในบานหน้าต่าง การกําหนดลักษณะการรวมเข้าด้วยกัน:
เลือกหนึ่งในสามตัวเลือกเพื่อกำหนดว่าจะเก็บบันทึกใดหากพบรายการที่ซ้ำกัน:
- ที่กรอกข้อมูลมากที่สุด : ระบุเรกคอร์ดที่มีคอลัมน์ที่กรอกข้อมูลมากที่สุดเป็นเรกคอร์ดผู้ชนะ ซึ่งเป็นตัวเลือกการผสานเริ่มต้น
- ล่าสุด: ระบุเรกคอร์ดผู้ชนะโดยพิจารณาจากความใหม่ที่สุด ต้องมีวันที่หรือฟิลด์ตัวเลขเพื่อกำหนดความใหม่
- รายการที่เก่าที่สุด: ระบุเรกคอร์ดผู้ชนะโดยพิจารณาจากความใหม่น้อยที่สุด ต้องมีวันที่หรือฟิลด์ตัวเลขเพื่อกำหนดความใหม่
หากเสมอกัน เรกคอร์ดผู้ชนะคือรายการที่มี MAX (PK) หรือค่าคีย์หลักที่มากกว่า
หรือหากต้องการกำหนดการกําหนดลักษณะการรวมเข้าด้วยกันกับแต่ละคอลัมน์ของตาราง ให้เลือก ขั้นสูง ที่ด้านล่างของบานหน้าต่าง ตัวอย่างเช่น คุณสามารถเลือกเก็บอีเมลล่าสุดและที่อยู่ที่สมบูรณ์ที่สุดจากเรกคอร์ดต่างๆ ขยายตารางเพื่อดูคอลัมน์ทั้งหมดและกำหนดตัวเลือกที่จะใช้สำหรับแต่ละคอลัมน์ หากคุณเลือกตัวเลือกตามความใหม่ คุณต้องระบุฟิลด์วันที่/เวลาที่กำหนดความใหม่ด้วย
เลือก เสร็จสิ้น เพื่อนำการกําหนดลักษณะการรวมเข้าด้วยกันของคุณมาใช้
หลังจากกำหนดกฎการลบข้อมูลซ้ำซ้อนและการกําหนดลักษณะการรวมเข้าด้วยกัน ให้เลือก ถัดไป