Κοινή χρήση μέσω


Κατάργηση διπλοτύπων σε κάθε πίνακα για ενοποίηση δεδομένων

Το βήμα κανόνων κατάργησης διπλότυπων της ενοποίησης εντοπίζει και καταργεί τις διπλότυπες καρτέλες για ένα πελάτη από έναν πίνακα προέλευσης, ώστε κάθε πελάτης να αντιπροσωπεύεται από μία γραμμή σε κάθε πίνακα. Σε κάθε πίνακα καταργούνται ξεχωριστά τα διπλότυπα χρησιμοποιώντας κανόνες για τον προσδιορισμό των καρτελών για έναν δεδομένο πελάτη.

Η επεξεργασία των κανόνων γίνεται με τη σειρά. Αφού έχουν εκτελεστεί όλοι οι κανόνες σε όλες τις καρτέλες σε έναν πίνακα, οι ομάδες αντιστοίχισης που έχουν κοινή γραμμή συνδυάζονται σε μία ομάδα αντιστοίχισης.

Καθορισμός κανόνων κατάργησης διπλοτύπων

Ένας καλός κανόνας προσδιορίζει έναν μοναδικό πελάτη. Λάβετε υπόψη τα δεδομένα σας. Ίσως να αρκεί ο προσδιορισμός πελατών βάσει ενός πεδίου όπως το ηλεκτρονικό ταχυδρομείο. Ωστόσο, εάν θέλετε να διαφοροποιήσετε τους πελάτες που χρησιμοποιούν από κοινού ένα μήνυμα ηλεκτρονικού ταχυδρομείου, μπορείτε να επιλέξετε να έχετε έναν κανόνα με δύο συνθήκες, που να αντιστοιχούν σε Email + Όνομα. Για περισσότερες πληροφορίες, ανατρέξτε στο θέμα Έννοιες και σενάρια κατάργησης διπλοτύπων.

  1. Στη σελίδα Κανόνες κατάργησης διπλοτύπων, επιλέξτε έναν πίνακα και επιλέξτε Προσθήκη κανόνα για να καθορίσετε τους κανόνες κατάργησης διπλοτύπων.

    Φιλοδώρημα

    Εάν έχετε εμπλουτίσει πίνακες σε επίπεδο προέλευσης δεδομένων για να βελτιώσετε τα αποτελέσματα ενοποίησης, επιλέξτε Χρήση εμπλουτισμένων πινάκων στην κορυφή της σελίδας. Για περισσότερες πληροφορίες δείτε το εμπλουτισμός για προελεύσεις δεδομένων.

    Στιγμιότυπο οθόνης της σελίδας Κανόνων κατάργησης διπλοτύπων με τον πίνακα επισημασμένο και την εμφάνιση κανόνα Προσθήκης

    1. Στο παράθυρο Προσθήκη κανόνα εισαγάγετε τις ακόλουθες πληροφορίες:

      • Επιλογή πεδίου: Επιλέξτε από τη λίστα των διαθέσιμων πεδίων από τον πίνακα που θέλετε να ελέγξετε για διπλότυπα. Επιλέξτε πεδία που είναι πιθανό να είναι μοναδικά για κάθε πελάτη. Για παράδειγμα, μια διεύθυνση ηλεκτρονικού ταχυδρομείου ή ο συνδυασμός ονόματος, πόλης και αριθμού τηλεφώνου.
      • Ομαλοποίηση: Κάντε μία από τις ακόλουθες επιλογές ομαλοποίησης για τη στήλη. Η κανονικοποίηση επηρεάζει μόνο το βήμα αντιστοίχισης και δεν αλλάζει τα δεδομένα.
        • Αριθμοί: Μετατρέπει πολλά σύμβολα Unicode που αντιπροσωπεύουν αριθμούς σε απλούς αριθμούς.
        • Σύμβολα: Καταργεί πολλά κοινά σύμβολα, όπως !"#$%&'()*+,-./:;<=>?@[]^_`{|}~. Για παράδειγμα, το Head&Shoulder γίνεται HeadShoulder.
        • Κείμενο σε πεζά: Μετατρέπει όλους τους χαρακτήρες σε πεζά. "Το ΟΛΑ ΚΕΦΑΛΑΙΑ και Γράμματα τίτλου γίνεται όλα κεφαλαία και γράμματα τίτλου."
        • Τύπος (Τηλέφωνο, Όνομα, Διεύθυνση, Οργανισμός): Τυποποιεί τα ονόματα, τους τίτλους, τους αριθμούς τηλεφώνου, τις διευθύνσεις κλπ.
        • Unicode σε ASCII: Μετατρέπει χαρακτήρες Unicode στους ισοδύναμους χαρακτήρες ASCII. Για παράδειγμα, το τονισμένο ề μετατρέπεται στον χαρακτήρα e.
        • Κενό διάστημα: Καταργεί όλους τους χώρους. Το Γεια σου Κόσμε γίνεται Γειασουκόσμε.
      • Ακρίβεια: Ορίζει το επίπεδο ακρίβειας. Η ακρίβεια χρησιμοποιείται με ασαφή συμφωνία και καθορίζει πόσο κοντά πρέπει να βρίσκονται δύο συμβολοσειρές προκειμένου να θεωρηθεί ότι ταιριάζουν.
        • Βασικό: Επιλέξτε από Χαμηλή (30%), Μέση (60%), Υψηλή (80%) και Ακριβής (100%). Επιλέξτε Ακριβής για αντιστοίχιση μόνο με καρτέλες που συμφωνούν 100 τοις εκατό.
        • Προσαρμογή: Ορίστε ένα ποσοστό που θα πρέπει να ταιριάζει με τις καρτέλες. Το σύστημα θα ταιριάζει μόνο με καρτέλες που περνούν αυτό το όριο.
      • Όνομα: Όνομα για τον κανόνα.

      Στιγμιότυπο οθόνης του παραθύρου Προσθήκη κανόνα για κατάργηση διπλοτύπων.

    2. Προαιρετικά, επιλέξτε Προσθήκη>Προσθήκη συνθήκης για να προσθέσετε περισσότερες συνθήκες στον κανόνα. Οι συνθήκες συνδέονται με έναν λογικό τελεστή AND και επομένως εκτελούνται μόνο εάν πληρούνται όλες οι συνθήκες.

    3. Προαιρετικά, Προσθήκη>Προσθήκη εξαίρεσης για να προσθέσετε εξαιρέσεις στον κανόνα. Οι εξαιρέσεις χρησιμοποιούνται για την αντιμετώπιση σπάνιων περιπτώσεων ψευδών θετικών και ψευδών αρνητικών αποτελεσμάτων.

    4. Επιλέξτε Ολοκλήρωση για να δημιουργήσετε τον κανόνα.

  2. Προαιρετικά, προσθέστε περισσότερους κανόνες.

  3. Επιλέξτε έναν πίνακα και, στη συνέχεια, Επεξεργασία προτιμήσεων συγχώνευσης.

  4. Στο παράθυρο Προτιμήσεις συγχώνευσης:

    1. Επιλέξτε μία από τις τρεις επιλογές για να καθορίσετε την καρτέλα που θα διατηρηθεί σε περίπτωση που βρεθεί διπλότυπο:

      • Οι πιο γεμάτες: προσδιορίζει την καρτέλα με τις πιο ενημερωμένες στήλες ως την καρτέλα του νικητή. Είναι η προεπιλεγμένη επιλογή συγχώνευσης.
      • Πιο πρόσφατη: προσδιορίζει την καρτέλα του νικητή με βάση τις πλέον πρόσφατες. Απαιτεί μια ημερομηνία ή ένα αριθμητικό πεδίο για τον καθορισμό του πρόσφατου χαρακτήρα.
      • Λιγότερο πρόσφατη: προσδιορίζει την καρτέλα του νικητή με βάση τις λιγότερο πρόσφατες. Απαιτεί μια ημερομηνία ή ένα αριθμητικό πεδίο για τον καθορισμό του πρόσφατου χαρακτήρα.

      Σε περίπτωση ισοπαλίας, η καρτέλα του νικητή είναι αυτή με το ΜΕΓΙΣΤΟ(PK) ή με τη μεγαλύτερη τιμή του πρωτεύοντος κλειδιού.

    2. Προαιρετικά, για να καθορίσετε τις προτιμήσεις συγχώνευσης σε μεμονωμένες στήλες ενός πίνακα, επιλέξτε Για προχωρημένους στο κάτω μέρος του παραθύρου. Για παράδειγμα, μπορείτε να επιλέξετε να διατηρήσετε την πιο πρόσφατη διεύθυνση ηλεκτρονικού ταχυδρομείου ΚΑΙ την πιο ολοκληρωμένη διεύθυνση από διαφορετικές καρτέλες. Αναπτύξτε τον πίνακα για να δείτε όλες τις στήλες του και να καθορίσετε την επιλογή που θα χρησιμοποιήσετε για μεμονωμένες στήλες. Εάν κάνετε μια επιλογή που βασίζεται σε επάρκεια, θα χρειαστεί επίσης να καθορίσετε ένα πεδίο ημερομηνίας/ώρας που καθορίζει την επάρκεια.

      Παράθυρο προτιμήσεων συγχώνευσης για προχωρημένους που δείχνει πρόσφατο email και την πλήρη διεύθυνση

    3. Επιλέξτε Ολοκλήρωση για να εφαρμοστούν προτιμήσεις συγχώνευσης.

  5. Αφού καθορίσετε τους κανόνες κατάργησης διπλοτύπων και τις προτιμήσεις συγχώνευσης, επιλέξτε Επόμενο.