Megosztás a következőn keresztül:


Távolítsa el az ismétlődéseket az egyes táblázatokból az adategyesítéshez

Az egyesítés Deduplikációs szabályok lépése megkeresi és eltávolítja a vevő ismétlődő rekordjait a forrástáblából, így minden vevőt egyetlen sor képvisel minden táblában. Minden tábla deduplikálása külön-külön történik, szabályok használatával azonosítva az adott vevő rekordjait.

A szabályok feldolgozása sorrendben történik. Miután az összes szabályt lefuttatta egy tábla összes rekordján, a közös sorral rendelkező egyezési csoportok egyetlen egyeztetési csoportba kerülnek.

Deduplikációszabály meghatározása

Egy jó szabály azonosítja az egyedi ügyfelet. Vegye figyelembe az adatait. Elegendő lehet az ügyfeleket egy mező, például az e-mail alapján azonosítani. Ha azonban meg szeretné különböztetni az e-maileket megosztó ügyfeleket, dönthet úgy, hogy két feltételt tartalmazó szabályt használ: E-mail + utónév. További információ: A deduplikáció fogalmai és forgatókönyvei.

  1. A Deduplikációs szabályok lapon jelöljön ki egy táblát, majd válassza a Szabály hozzáadása lehetőséget a deduplikációs szabályok meghatározásához.

    Tipp.

    Ha az egyesítési eredmények javítása érdekében bővítette a táblázatokat a adatforrás szinten, válassza a Bővített táblázatok használata lehetőséget az oldal tetején. További információ: Adatforrások bővítése.

    Képernyőkép a Deduplikációs szabályok lapról, amelyen a táblázat ki van emelve, és a Szabály hozzáadása megjelenik

    1. A Szabály hozzáadása panelen adja meg a következő adatokat:

      • Mező kiválasztása: Válasszon a rendelkezésre álló mezők listájából a táblázatból, amelyek ismétlődéseit ellenőrizni szeretné. Válassza ki a mezőket, amelyek valószínűleg egyediek minden egyes ügyfélnél. Például egy e-mail-cím, vagy a név, a város és a telefonszám kombinációja.
      • Normalizálás: Válassza ki az oszlop normalizálási beállításait. A normalizálás csak az egyeztetési lépésre van hatással, és nem módosítja az adatokat.
        • Számok: A számokat jelölő Unicode-szimbólumokat egyszerű számokká alakítja.
        • Szimbólumok: Eltávolít számos gyakori szimbólumot, például a !" #$%&'()*+,-./:;<=>?@[]^_'{|}~. Például a Head& Shoulder HeadShoulder lesz a HeadShoulder.
        • Szöveg kisbetűssé: Az összes karaktert kisbetűssé alakítja. Az "ALL CAPS and Title Case" (CSUPA nagybetű és kis- és nagybetű) helyett "csupa nagybetű és kis- és nagybetű" lesz.
        • Típus (telefon, név, cím, szervezet): Szabványosítja a neveket, címeket, telefonszámokat, címeket stb.
        • Unicode ASCII-vé: A Unicode-karaktereket ASCII-megfelelőjükké alakítja. Például az ékezetes ề e karakterré alakul.
        • Szóköz: Eltávolítja az összes szóközt. A Hello Worldből HelloWorld lesz.
      • Pontosság: Beállíthatja a pontosság szintjét. A pontosság fuzzy egyeztetésnél használatos, és meghatározza, hogy két karakterláncnak milyen közel kell lennie ahhoz, hogy egyezésnek minősüljön.
        • Alapszintű: Válasszon az Alacsony (30%), Közepes (60%), Magas (80%) ésPontos (100%) lehetőségek közül. Válassza a Pontos lehetőséget , ha csak a 100 százaléknak megfelelő rekordokat szeretné egyeztetni.
        • Egyéni: Állítsa be azt a százalékot, amelynek a rekordoknak egyezniük kell. A rendszer csak az ezt a küszöbértéket meghaladó rekordokat egyezteti.
      • Név: A szabály neve.

      Képernyőkép a Szabály hozzáadása panelről az ismétlődések eltávolításához.

    2. Ha szükséges, válassza a Feltétel hozzáadása>lehetőséget , ha további feltételeket szeretne hozzáadni a szabályhoz. A feltételek logikai ÉS operátorral kapcsolódnak, és ezért csak akkor hajtódnak végre, ha minden feltétel teljesül.

    3. Opcionálisan hozzáadhat>Kivétel hozzáadása kivételeket a szabályhoz. A kivételek a hamis pozitív és hamis negatív esetek ritka eseteinek kezelésére szolgálnak.

    4. Válassza a Kész lehetőséget a szabály létrehozásához.

  2. Ha szükséges, adjon hozzá további szabályokat.

  3. Jelöljön ki egy táblázatot, majd válassza az Egyesítési beállítások szerkesztése lehetőséget.

  4. Az Egyesítési beállítások panelen :

    1. Válasszon egyet a három lehetőség közül annak meghatározásához, hogy melyik rekordot tartsa meg, ha duplikált példányt talál:

      • Legtöbbet kitöltött: A leggyakrabban feltöltött oszlopokkal rendelkező rekordot azonosítja győztes rekordként. Ez az alapértelmezett egyesítési beállítás.
      • Legutóbbi: Azonosítja a győztes rekordot a legfrissebbek alapján. Az időbeli frissesség definiálásához dátum vagy numerikus mező szükséges.
      • Legkevésbé friss: A győztes rekordot azonosítja a legkevesebb közelmúltbeli eset alapján. Az időbeli frissesség definiálásához dátum vagy numerikus mező szükséges.

      Döntetlen esetén a MAX(PK) vagy a nagyobb elsődleges kulcs értékkel rendelkező rekord nyer.

    2. Ha egy táblázat egyes oszlopaira vonatkozóan szeretné megadni az egyesítési beállításokat, válassza a Speciális lehetőséget a panel alján. Dönthet például úgy, hogy megtartja a legutóbbi e-mailt ÉS a legteljesebb címet a különböző rekordokból. Bontsa ki a táblázatot az összes oszlopának megtekintéséhez, és adja meg, hogy melyik beállítást használja az egyes oszlopokhoz. Ha újkeletű beállítást választ, meg kell adnia egy dátum/idő mezőt is, amely meghatározza a frissességet.

      Speciális egyesítési beállítások ablaktábla a legutóbbi e-mailekkel és a teljes címmel

    3. Válassza a Kész lehetőséget az egyesítési beállítások alkalmazásához.

  5. A deduplikációs szabályok és az egyesítési beállítások megadása után válassza a Tovább lehetőséget.