แชร์ผ่าน


ลบรายการที่ซ้ำกันในแต่ละตารางเพื่อการรวมข้อมูล

ขั้นตอนกฎการขจัดข้อมูลซ้ำซ้อนของการรวมจะค้นหาและลบเรกคอร์ดที่ซ้ำกันของลูกค้าออกจากตารางต้นทาง เพื่อให้ลูกค้าแต่ละรายแสดงด้วยแถวเดียวในแต่ละตาราง แต่ละตารางจะถูกขจัดข้อมูลซ้ำซ้อนแยกกันโดยใช้กฎ เพื่อระบุเรกคอร์ดสำหรับลูกค้าที่กำหนด

กฎได้รับการประมวลผลตามลำดับ หลังจากที่กฎทั้งหมดทำงานกับเรคคอร์ดทั้งหมดในตารางแล้ว กลุ่มการจับคู่ที่ใช้แถวร่วมกันจะถูกรวมเป็นกลุ่มการจับคู่เดียว

กำหนดกฎการลบข้อมูลซ้ำซ้อน

กฎที่ดีจะระบุถึงลูกค้าที่ไม่ซ้ำกัน พิจารณาข้อมูลของคุณ การระบุลูกค้าตามฟิลด์ เช่น อีเมล อาจเพียงพอแล้ว อย่างไรก็ตาม หากคุณต้องการแยกความแตกต่างระหว่างลูกค้าที่แชร์อีเมล คุณอาจเลือกที่จะมีกฎที่มีสองเงื่อนไข ซึ่งตรงกับอีเมล + ชื่อ หากต้องการข้อมูลเพิ่มเติม โปรดดู แนวทางปฏิบัติที่ดีที่สุดในการขจัดข้อมูลซ้ำซ้อน

  1. บนหน้า กฎการขจัดข้อมูลซ้ำซ้อน ให้เลือกตารางและเลือก เพิ่มกฎ เพื่อกำหนดกฎการลบข้อมูลซ้ำซ้อน

    เคล็ดลับ

    หากคุณเพิ่มตารางในระดับแหล่งข้อมูลเพื่อในการช่วยปรับปรุงผลลัพธ์การรวมของคุณ ให้เลือก ใช้ตารางที่เพิ่มข้อมูล ที่ด้านบนของหน้า สำหรับข้อมูลเพิ่มเติม โปรดดู การเพิ่มความสมบูรณ์จากแหล่งข้อมูล

    ภาพหน้าจอของหน้ากฎการขจัดข้อมูลซ้ำซ้อนที่เน้นตารางและแสดงเพิ่มกฎ

    1. ในบานหน้าต่าง เพิ่มกฎ ให้ป้อนข้อมูลดังต่อไปนี้:

      • เลือกฟิลด์: เลือกจากรายการฟิลด์ที่มีอยู่จากตารางที่คุณต้องการตรวจสอบรายการที่ซ้ำกัน เลือกฟิลด์ที่มีแนวโน้มไม่ซ้ำกันสำหรับลูกค้าหนึ่งราย ตัวอย่างเช่น ที่อยู่อีเมล หรือชื่อ เมือง และหมายเลขโทรศัพท์รวมกัน

      • ทำให้เป็นมาตรฐาน: เลือก ตัวเลือกการทำให้เป็นมาตรฐาน สำหรับคอลัมน์ การทำให้เป็นมาตรฐานจะส่งผลต่อขั้นตอนการจับคู่เท่านั้น และจะไม่เปลี่ยนแปลงข้อมูล

        • ตัวเลข: แปลงสัญลักษณ์ Unicode ที่แสดงตัวเลขเป็นตัวเลขเชิงเดี่ยว
        • สัญลักษณ์: ลบสัญลักษณ์และอักขระพิเศษ เช่น !"#$%&'()*+,-./:;<=>? @[]^_`{|}~. ตัวอย่างเช่น Head&Shoulder กลายเป็น HeadShoulder
        • ข้อความเป็นตัวพิมพ์เล็ก: แปลงอักขระตัวพิมพ์ใหญ่ให้เป็นตัวพิมพ์เล็ก "ALL CAPS and Title Case" กลายเป็น "all caps and title case"
        • ประเภท (โทรศัพท์ ชื่อ ที่อยู่ องค์กร): กำหนดมาตรฐานชื่อ ตำแหน่ง หมายเลขโทรศัพท์ และที่อยู่
        • Unicode เป็น ASCII: แปลงอักขระ Unicode ให้เทียบเท่ากับตัวอักษร ASCII ตัวอย่างเช่น ề ที่เน้นเสียงจะแปลงเป็นอักขระ e
        • ช่องว่าง: ลบช่องว่างทั้งหมด Hello World กลายเป็น HelloWorld
        • นามแฝง การแมป: ช่วยให้คุณสามารถอัปโหลดรายการคู่สตริงที่กำหนดเองเพื่อระบุสตริงที่ควรพิจารณาว่าตรงกันทุกประการเสมอ
        • บายพาสที่กำหนดเอง: ช่วยให้คุณสามารถอัปโหลดรายการสตริงที่กำหนดเองเพื่อระบุสตริงที่ไม่ควรตรงกัน
      • ความแม่นยำ: ตั้งค่าระดับของความแม่นยำ ความแม่นยำใช้สำหรับการจับคู่แบบตรงทั้งหมดและการจับคู่แบบคลุมเครือ และกำหนดว่าสตริง 2 รายการจะต้องอยู่ใกล้กันเพียงใดจึงจะถือว่าตรงกัน

        • พื้นฐาน: เลือกจาก ต่ำ (30%), ปานกลาง (60%), สูง (80%) และ ตรงกันทุกประการ (100%) เลือก ตรงกันทุกประการ เพื่อจับคู่เรกคอร์ดที่ตรงกัน 100 เปอร์เซ็นต์เท่านั้น
        • กำหนดเอง: กำหนดเปอร์เซ็นต์ที่เรกคอร์ดต้องตรงกัน ระบบจะจับคู่เรกคอร์ดที่ผ่านเกณฑ์นี้เท่านั้น
      • ชื่อ: ชื่อสำหรับกฎ

      ภาพหน้าจอของบานหน้าต่างเพิ่มกฎสำหรับการลบรายการที่ซ้ำกัน

    2. หรือ เลือก เพิ่ม>เพิ่มเงื่อนไข เพื่อเพิ่มเงื่อนไขเพิ่มเติมให้กับกฎ เงื่อนไขเชื่อมต่อกับตัวดำเนินการเชิงตรรกะ และจะมีการดำเนินการก็ต่อเมื่อตรงตามเงื่อนไขทั้งหมดเท่านั้น

    3. อีกทางหนึ่งคือ เพิ่ม>เพิ่มข้อยกเว้น เพื่อ เพิ่มข้อยกเว้นให้กับกฎ ข้อยกเว้นถูกใช้เพื่อจัดการกับกรณีที่เกิดขึ้นได้ยากของผลลัพธ์ที่ผิดและผลลบเท็จ

    4. เลือก เสร็จสิ้น เพื่อสร้างกฎ

  2. หรือ เพิ่มกฎเพิ่มเติม

  3. เลือกตาราง จากนั้น แก้ไขการกําหนดลักษณะการรวมเข้าด้วยกัน

  4. ในบานหน้าต่าง การกําหนดลักษณะการรวมเข้าด้วยกัน:

    1. เลือกหนึ่งในสามตัวเลือกเพื่อกำหนดว่าจะเก็บบันทึกใดหากพบรายการที่ซ้ำกัน:

      • ที่กรอกข้อมูลมากที่สุด : ระบุเรกคอร์ดที่มีคอลัมน์ที่กรอกข้อมูลมากที่สุดเป็นเรกคอร์ดผู้ชนะ ซึ่งเป็นตัวเลือกการผสานเริ่มต้น
      • ล่าสุด: ระบุเรกคอร์ดผู้ชนะโดยพิจารณาจากความใหม่ที่สุด ต้องมีวันที่หรือฟิลด์ตัวเลขเพื่อกำหนดความใหม่
      • รายการที่เก่าที่สุด: ระบุเรกคอร์ดผู้ชนะโดยพิจารณาจากความใหม่น้อยที่สุด ต้องมีวันที่หรือฟิลด์ตัวเลขเพื่อกำหนดความใหม่

      หากเสมอกัน เรกคอร์ดผู้ชนะคือรายการที่มี MAX (PK) หรือค่าคีย์หลักที่มากกว่า

    2. หรือหากต้องการกำหนดการกําหนดลักษณะการรวมเข้าด้วยกันกับแต่ละคอลัมน์ของตาราง ให้เลือก ขั้นสูง ที่ด้านล่างของบานหน้าต่าง ตัวอย่างเช่น คุณสามารถเลือกเก็บอีเมลล่าสุดและที่อยู่ที่สมบูรณ์ที่สุดจากเรกคอร์ดต่างๆ ขยายตารางเพื่อดูคอลัมน์ทั้งหมดและกำหนดตัวเลือกที่จะใช้สำหรับแต่ละคอลัมน์ หากคุณเลือกตัวเลือกตามความใหม่ คุณต้องระบุฟิลด์วันที่/เวลาที่กำหนดความใหม่ด้วย

      บานหน้าต่างการกําหนดลักษณะการรวมเข้าด้วยกันขั้นสูงที่แสดงอีเมลล่าสุดและที่อยู่ที่สมบูรณ์

    3. เลือก เสร็จสิ้น เพื่อนำการกําหนดลักษณะการรวมเข้าด้วยกันของคุณมาใช้

  5. หลังจากกำหนดกฎการลบข้อมูลซ้ำซ้อนและการกําหนดลักษณะการรวมเข้าด้วยกัน ให้เลือก ถัดไป