Zdieľať cez


Definovanie pravidiel zhody pre zjednotenie údajov

Tento krok zjednotenia definuje poradie zhody a pravidlá párovania medzi stolmi. Tento krok vyžaduje aspoň dve tabuľky. Keď sa záznamy zhodujú, zreťazia sa do jedného záznamu so všetkými poľami z každej tabuľky. Pri párovaní sa berú do úvahy alternatívne riadky (riadky bez víťaza z kroku Deduplikácia). Ak sa však riadok zhoduje s alternatívnym riadkom v tabuľke, záznam sa priradí k riadku víťaza.

Poznámka

Po vytvorení podmienok zhody a výbere položky Ďalej už nie je možné odstrániť vybratú tabuľku ani stĺpec. V prípade potreby vyberte položku Naspäť a pred pokračovaním skontrolujte vybraté tabuľky a stĺpce.

Nasledujúce kroky a obrázky odrážajú, kedy prvýkrát prechádzate procesom zjednotenia. Ak chcete upraviť existujúce nastavenia zjednotenia, pozrite si tému Aktualizácia nastavení zjednotenia.

Zahrnutie obohatených tabuliek (ukážka)

Ak ste obohatili tabuľky na úrovni zdroj údajov, aby ste zlepšili výsledky zjednotenia, vyberte ich. Ďalšie informácie nájdete v téme Obohatenie zdrojov údajov. Ak ste na stránke Pravidlá duplikácie vybrali obohatené tabuľky , nemusíte ich znova vyberať.

  1. Na stránke Pravidlá zhody vyberte položku Použiť obohatené tabuľky v hornej časti stránky.

  2. Na table Použiť obohatené tabuľky vyberte jednu alebo viacero obohatených tabuliek.

  3. Vyberte položku Hotovo.

Určenie objednávky zosúladenia

Každý zápas zjednocuje dve alebo viac tabuliek do jednej konsolidovanej tabuľky. Zároveň vedie jedinečné záznamy o zákazníkoch. Poradie zhody označuje poradie, v ktorom sa systém pokúša porovnať záznamy.

Dôležité

Prvá tabuľka sa nazýva primárna tabuľka, ktorá slúži ako základ pre vaše zjednotené profily. Do tejto tabuľky sa pridajú ďalšie vybraté tabuľky.

Dôležité úvahy:

  • Vyberte tabuľku s najúplnejšími a najspoľahlivejšími profilovými údajmi o vašich zákazníkoch ako primárnu tabuľku.
  • Ako primárnu tabuľku vyberte tabuľku, ktorá má niekoľko spoločných stĺpcov s inými tabuľkami (napríklad meno, telefónne číslo alebo e-mailovú adresu).
  • Tabuľky sa môžu zhodovať iba s inými tabuľkami s vyššou prioritou. Takže tabuľka 2 sa môže zhodovať iba s tabuľkou 1 a tabuľka 3 sa môže zhodovať iba s tabuľkou 2 alebo tabuľkou 1.
  1. Na stránke Zodpovedajúce pravidlá pomocou šípok nahor a nadol presúvajte tabuľky v požadovanom poradí alebo ich presuňte myšou. Vyberte napríklad eCommerceContacts ako primárnu tabuľku a loyCustomer ako druhú tabuľku.

  2. Ak chcete, aby bol každý záznam v tabuľke jedinečným zákazníkom bez ohľadu na to, či sa nájde zhoda, vyberte položku Zahrnúť všetky záznamy. Všetky záznamy v tejto tabuľke, ktoré sa nezhodujú so záznamami v žiadnej inej tabuľke, sú zahrnuté v zjednotenom profile. Záznamy, ktoré nemajú zhodu, sa nazývajú singletony.

Primárna tabuľka eCommerceContacts sa zhoduje s ďalšou tabuľkou loyCustomer. Množina údajov, ktorá je výsledkom prvého kroku zhody, sa zhoduje s nasledujúcou tabuľkou, ak máte viac ako dve tabuľky. Ak v kontaktoch elektronického obchodu stále existujúduplikáty, po spárovaní verného zákazníka s kontaktmi elektronického obchodu sa duplicitné riadky kontaktov elektronického obchodu nezredukujú na jeden záznam zákazníka. Ak sa však duplicitné riadky v loyCustomer zhodujú s riadkom veCommerceContacts, zredukujú sa na jeden záznam zákazníka.

Snímka obrazovky s vybratým poradím zhody tabuliek.

Definujte pravidlá pre dvojice párov

Pravidlá zhody určujú logiku, podľa ktorej sa bude zhodovať konkrétna dvojica tabuliek. Pravidlo pozostáva z jednej alebo viacerých podmienok.

Upozornenie vedľa názvu tabuľky znamená, že pre párovú zhodu nie je definované žiadne pravidlo zhody.

  1. Vyberte položku Pridať pravidlo pre pár tabuliek a definujte pravidlá zhody.

  2. Na table Pridať pravidlo nakonfigurujte podmienky pravidla.

    Snímka obrazovky tably Pridať pravidlo.

    • Vyberte tabuľku alebo pole (prvý riadok): Vyberte tabuľku a stĺpec, ktoré sú pravdepodobne jedinečné pre zákazníka. Napríklad telefónne číslo alebo e-mailová adresa. Vyhnite sa priraďovaniu podľa stĺpcov typu aktivity. Napríklad ID nákupu pravdepodobne nenájde zhodu v iných typoch záznamov.

    • Vyberte položku Tabuľka/pole (druhý riadok): Vyberte stĺpec, ktorý súvisí so stĺpcom tabuľky zadanej v prvom riadku.

    • Normalizovať: Vyberte niektorú z nasledujúcich možností normalizácie pre vybraté stĺpce.

      • Číslice: Skonvertuje iné číselné systémy, napríklad rímske číslice, na arabské číslice. VIII sa stáva 8.
      • Symboly: Odstránia sa všetky symboly a špeciálne znaky. Head&Shoulder sa mení na HeadShoulder .
      • Text na malé písmená: Konvertuje celý znak na malé. ALL CAPS a Title Case sa zmení na všetky veľké písmená a veľké písmená.
      • Typ (telefón, meno, adresa, organizácia): Štandardizuje mená, tituly, telefónne čísla, adresy a organizácie.
      • Unicode na ASCII: Konvertuje zápis Unicode na znaky ASCII. /u00B2 sa zmení na 2.
      • Medzery: Odstránia sa všetky medzery. Hello World sa stáva HelloWorld .
    • Presnosť: Nastavte úroveň presnosti, ktorá sa má použiť pre túto podmienku. Presnosť sa používa pri fuzzy párovaní a určuje, ako blízko musia byť dva reťazce, aby boli považované za zhodu.

      • Základné: Vyberte si z možností Nízka (30 %), Stredná (60 %), Vysoká (80 %) a Presná (100 %). Vyberte možnosť Presné , ak chcete priradiť iba záznamy, ktoré zodpovedajú 100 percentám.
      • Vlastné: Nastavte percentuálnu hodnotu, ktorú musia záznamy zhodovať. Systém bude porovnávať iba záznamy prekračujúce tento limit.
    • Názov: Názov pravidla.

  3. Ak chcete, aby sa tabuľky zhodovali iba v prípade, že stĺpce spĺňajú viacero podmienok, vyberte položku Pridať>podmienku a pridajte ďalšie podmienky do pravidla zhody. Podmienky sú spojené s logickým operátorom AND a tak sa vykonávajú iba vtedy, ak sú splnené všetky podmienky.

  4. Voliteľne môžete zvážiť rozšírené možnosti, ako sú výnimky alebo vlastné podmienky zhody.

  5. Výberom položky Hotovo dokončite pravidlo.

  6. Voliteľnemôžete pridať ďalšie pravidlá .

  7. Vyberte Ďalej.

Pridajte pravidlá k páru

Pravidlá spárovania predstavujú súbory podmienok. Ak chcete tabuľky priradiť k podmienkam založeným na viacerých stĺpcoch, pridajte ďalšie pravidlá.

  1. Vyberte položku Pridať pravidlo v tabuľke, do ktorej chcete pridať pravidlá.

  2. Postupujte podľa krokov v téme Definovanie pravidiel pre páry zápasov.

Poznámka

Na poradí pravidiel záleží. Algoritmus priraďovania sa pokúsi priradiť daný záznam zákazníka na základe vášho prvého pravidla a pokračuje druhým pravidlom iba v prípade, že s prvým pravidlom neboli identifikované žiadne zhody.

Rozšírené možnosti

Pridanie výnimiek z pravidla

Vo väčšine prípadov vedie priradenie tabuliek k jedinečným profilom zákazníkov s konsolidovanými údajmi. Ak chcete riešiť zriedkavé prípady falošne pozitívnych a falošne negatívnych výsledkov, definujte výnimky pre pravidlo zhody. Výnimky sa uplatňujú po spracovaní pravidiel zhody a vyhýbajú sa párovaniu všetkých záznamov, ktoré spĺňajú kritériá výnimky.

Ak napríklad vaše pravidlo zhody kombinuje priezvisko, mesto a dátum narodenia, systém identifikuje dvojčatá s rovnakým priezvisko, ktoré žijú v rovnakom meste ako rovnaký profil. Môžete zadať výnimku, ktorá sa nezhoduje s profilmi, ak krstné meno v kombinovaných tabuľkách nie sú rovnaké.

  1. Na table Upraviť pravidlo vyberte položku Pridať>výnimku.

  2. Zadajte kritériá výnimky.

  3. Výberom položky Hotovo pravidlo uložte.

Zadajte vlastné podmienky spárovania

Zadajte podmienky, ktoré prepíšu predvolenú logiku zhody. K dispozícii sú štyri možnosti:

Možnosť Description Príklad
Vždy sa zhodovať Definuje hodnoty pre hlavné kľúče, ktoré sa vždy zhodujú. Vždy priraďte riadok s hlavným kľúčom 12345 k riadku s hlavným kľúčom54321.
Nikdy sa nezhodovať Definuje hodnoty pre primárne kľúče, ktoré sa nikdy nezhodujú. Nikdy neporovnávajte riadok s hlavným kľúčom 12345 s riadkom s hlavným kľúčom54321.
Obísť Definuje hodnoty, ktoré by mal systém vo fáze zápasu vždy ignorovať. Počas zápasu ignorujte hodnoty 11111 a Neznáme .
Mapovanie aliasu Definuje hodnoty, ktoré by mal systém považovať za rovnakú hodnotu. Považujte Joea za rovného Jozefovi .
  1. Vyberte Vlastné.

    Vlastné tlačidlo

  2. Vyberte Vlastný typ a potom Stiahnuť šablónu. Premenujte šablónu bez použitia medzier. Použite samostatnú šablónu pre každú možnosť zhody.

  3. Otvorte stiahnutý súbor šablóny a vyplňte podrobnosti. Šablóna obsahuje polia na určenie tabuľky a hodnoty hlavného kľúča tabuľky, ktoré sa majú použiť vo vlastnej zhode. V názvoch tabuliek sa rozlišujú veľké a malé písmená. Ak napríklad chcete, aby sa hlavný kľúč 12345 z tabuľky Predaj vždy zhodoval s hlavným kľúčom 34567 ztabuľky kontaktov , vyplňte šablónu:

    • Tabuľka 1: Predaj
    • Table1Key: 12345
    • Tabuľka 2: Kontakt
    • Table2Key: 34567

    Rovnaký súbor šablóny môže špecifikovať vlastné záznamy zhody z viacerých tabuliek.

    Ak chcete zadať vlastnú zhodu na odstránenie deduplicít v tabuľke, zadajte rovnakú tabuľku ako Tabuľka1 aj Tabuľka 2 a nastavte rôzne hodnoty hlavného kľúča. Ak chcete použiť vlastné párovanie, musíte do tabuľky definovať aspoň jedno pravidlo odstránenia deduplicít.

  4. Po pridaní všetkých prepísaní uložte súbor šablóny.

  5. Prejdite na zdroje>údajov a súbory šablón prehrajte ako nové tabuľky.

  6. Po nahraní súborov znova vyberte možnosť Vlastné . V rozbaľovacej ponuke vyberte požadované tabuľky a vyberte položku Hotovo.

    Snímka obrazovky s dialógovým oknom na výber prepísania pre scenár vlastnej zhody.

  7. Použitie vlastnej zhody závisí od možnosti zhody, ktorú chcete použiť.

    • V prípade možností Vždy zhodovať alebo Nikdy sa nezhodovať prejdite na ďalší krok.
    • V prípade obídenia alebo priradenia aliasu vyberte položkuUpraviť v existujúcom pravidle zhody alebo vytvorte nové pravidlo. V rozbaľovacom zozname Normalizácie vyberte možnosť Vlastné obídenie alebo Priradenie aliasu a vyberte položku Hotovo .
  8. Výberom položky Hotovo na table Vlastné použite vlastnú konfiguráciu zhody.

    Každý prijatý súbor šablóny má svoj vlastný zdroj údajov. Ak sa nájdu záznamy, ktoré vyžadujú špeciálne ošetrenie zhody, aktualizujte príslušné zdroj údajov. Aktualizácia sa použije počas ďalšieho procesu zjednotenia. Napríklad identifikujete dvojčatá s takmer rovnakým menom žijúce na rovnakej adrese, ktoré boli zlúčené ako jedna osoba. Aktualizujte zdroj údajov, aby ste identifikovali dvojčatá ako samostatné, jedinečné záznamy.