Dijeli putem


Definiranje pravila podudaranja za objedinjavanje podataka

Ovaj korak u ujedinjenju definira redoslijed podudaranja i pravila za podudaranje između tablica. Ovaj korak zahtijeva najmanje dvije tablice. Kada se zapisi podudaraju, oni se spajaju u jedan zapis sa svim poljima iz svake tablice. Prilikom podudaranja uzimaju se u obzir zamjenski reci (reci koji nisu pobjednici iz koraka dedupliciranja). Ali, ako se redak podudara s alternativnim retkom u tablici, zapis se podudara s retkom pobjednika.

Napomena

Nakon što stvorite uvjete podudaranja i odaberete Dalje, ne možete ukloniti odabranu tablicu ili stupac. Ako je potrebno, odaberite Natrag da biste pregledali odabrane tablice i stupce prije nastavka.

Sljedeći koraci i slike odražavaju prvi put kada prođete kroz proces ujedinjenja. Upute za uređivanje postojećih postavki ujedinjenja potražite u članku Ažuriranje postavki ujedinjenja.

Uključi obogaćene tablice (pretpregled)

Ako ste obogatili tablice na razini izvor podataka da biste poboljšali rezultate objedinjavanja, odaberite ih. Dodatne informacije potražite u odjeljku Obogaćivanje izvora podataka. Ako ste na stranici Pravila za dupliciranje odabrali obogaćene tablice, ne morate ih ponovno odabrati.

  1. Na stranici Pravila podudaranja pri vrhu stranice odaberite Koristi obogaćene tablice .

  2. U oknu Koristi obogaćene tablice odaberite jednu ili više obogaćenih tablica.

  3. Odaberite Gotovo.

Zadavanje redoslijeda uparivanja

Svaka utakmica objedinjuje dvije ili više tablica u jednu, konsolidiranu tablicu. Istodobno vodi jedinstvenu evidenciju klijenata. Redoslijed podudaranja označava redoslijed kojim sustav pokušava uskladiti zapise.

Važno

Prva tablica naziva se primarna tablica, koja služi kao osnova za vaše objedinjene profile. Dodatne odabrane tablice bit će dodane ovoj tablici.

Važna razmatranja:

  • Odaberite tablicu s najcjelovitijim i najpouzdanijim podacima profila o klijentima kao primarnoj tablici.
  • Odaberite tablicu koja ima nekoliko zajedničkih stupaca s drugim tablicama (na primjer, ime, telefonski broj ili adresa e-pošte) kao primarnu tablicu.
  • Tablice se mogu podudarati samo s drugim tablicama koje su prioritetnije. Dakle, tablica2 može se podudarati samo s tablicom1, a tablica3 se može mjeriti s tablicom2 ili tablicom1.
  1. Na stranici Pravila podudaranja pomoću strelica za pomicanje gore i dolje pomičite tablice željenim redoslijedom ili ih povucite i ispustite. Na primjer, odaberite eCommerceContacts kao primarnu tablicu, a loyCustomer kao drugu tablicu.

  2. Da bi svaki zapis u tablici bio jedinstveni klijent, bez obzira na to je li pronađeno podudaranje, odaberite Uključi sve zapise. Svi zapisi u ovoj tablici koji se ne podudaraju sa zapisima u bilo kojoj drugoj tablici uključeni su u jedinstveni profil. Zapisi koji nemaju podudaranje nazivaju se singletoni.

Primarna tablica eCommerceContacts usklađena je sa sljedećom tablicom loyCustomer. Skup podataka koji proizlazi iz prvog koraka podudaranja podudara se sa sljedećom tablicom ako imate više od dvije tablice. Ako duplikati još uvijek postoje u eCommerceContacts, kada se loyCustomer podudara s eCommerceContacts, duplicirani reci eCommerceContacts ne svode se na jedan zapis kupca. Međutim, ako se duplicirani reci u loyCustomeru podudaraju s retkom u eCommerceContacts, oni se smanjuju u jedan zapis kupca.

Snimka zaslona odabranog redoslijeda podudaranja za tablice.

Definiranje pravila za parove uparivanja

Pravila podudaranja određuju logiku po kojoj će se podudarati određeni par tablica. Pravilo se sastoji od jednog ili više uvjeta.

Upozorenje pored naziva tablice znači da za par podudaranja nije definirano pravilo podudaranja.

  1. Odaberite Dodaj pravilo za par tablica da biste definirali pravila podudaranja.

  2. U oknu Dodavanje pravila konfigurirajte uvjete za pravilo.

    Snimka zaslona s oknom Dodavanje pravila.

    • Odaberite Tablica/polje (prvi redak): Odaberite tablicu i stupac koji je vjerojatno jedinstven za kupca. Na primjer, telefonski broj ili adresu e-pošte. Izbjegavajte podudaranje prema stupcima vrste aktivnosti. Na primjer, ID kupnje vjerojatno neće pronaći uparivanje u drugim vrstama zapisa.

    • Odaberite tablicu/polje (drugi redak): Odaberite stupac koji se odnosi na stupac tablice naveden u prvom retku.

    • Normalizacija: Odaberite jednu od sljedećih mogućnosti normalizacije za odabrane stupce.

      • Brojevi: pretvara druge numeričke sustave, kao što su rimski brojevi, u arapske brojeve. VIII postaje 8.
      • Simboli: uklanja sve simbole i posebne znakove. Head&Shoulder postaje HeadShoulder.
      • Tekst u mala slova: Pretvara sve znakove u mala slova. ALL CAPS i Title Case postaju sva velika slova i velika i mala slova.
      • Vrsta (telefon, ime, adresa, organizacija): standardizira imena, naslove, telefonske brojeve, adrese i organizacije.
      • Unicode u ASCII: pretvara Unicode notaciju u ASCII znakove. /u00B2 postaje 2.
      • Razmak: uklanja sve razmake. Hello World postaje HelloWorld.
    • Preciznost: Postavite razinu preciznosti koja će se primjenjivati za ovaj uvjet. Preciznost se koristi s nejasnim podudaranjem i određuje koliko blizu moraju biti dvije žice kako bi se smatrale podudaranjem.

      • Osnovno: odaberite između niske (30%), srednje (60%), visoke (80%) i točne (100%). Odaberite Točno da biste odgovarali samo zapisima koji odgovaraju 100 posto.
      • Prilagođeno: postavite postotak koji zapisi trebaju uskladiti. Sustav će upariti samo zapise koji prelaze ovaj prag.
    • Naziv: naziv pravila.

  3. Da biste tablice uskladili samo ako stupci zadovoljavaju više uvjeta, odaberite Dodaj>uvjet da biste pravilu podudaranja dodali dodatne uvjete. Uvjeti su povezani logičkim operatorom AND i stoga se izvršavaju samo ako su ispunjeni svi uvjeti.

  4. Po želji razmotrite napredne opcije kao što su iznimke ili prilagođeni uvjeti podudaranja.

  5. Odaberite Gotovo da biste dovršili pravilo.

  6. Po želji dodajte još pravila.

  7. Odaberite Dalje.

Dodavanje pravila paru uparivanja

Pravila uparivanja predstavljaju skupove uvjeta. Da biste tablice uskladili s uvjetima koji se temelje na više stupaca, dodajte još pravila.

  1. Odaberite Dodaj pravilo u tablici u koju želite dodati pravila.

  2. Slijedite korake u odjeljku Definiranje pravila za parove podudaranja.

Napomena

Bitan je redoslijed pravila. Algoritam podudaranja pokušava uskladiti određeni zapis kupca na temelju vašeg prvog pravila i nastavlja se na drugo pravilo samo ako nisu identificirana podudaranja s prvim pravilom.

Dodatne mogućnosti

Dodavanje iznimaka pravilu

U većini slučajeva podudaranje tablice dovodi do jedinstvenih profila kupaca s konsolidiranim podacima. Da biste riješili rijetke slučajeve lažno pozitivnih i lažno negativnih rezultata, definirajte iznimke za pravilo podudaranja. Iznimke se primjenjuju nakon obrade pravila podudaranja i izbjegavaju se podudaranje svih zapisa koji ispunjavaju kriterije iznimke.

Na primjer, ako vaše pravilo podudaranja kombinira prezime, grad i datum rođenja, sustav će identificirati blizance s istim prezime koji žive u istom gradu kao i isti profil. Možete odrediti iznimku koja se ne podudara s profilima ako ime u tablicama koje kombinirate nisu iste.

  1. U oknu Uređivanje pravila odaberite Dodaj>iznimku.

  2. Navedite kriterije iznimke.

  3. Odaberite Gotovo da biste spremili pravilo.

Određivanje prilagođenih uvjeta uparivanja

Navedite uvjete koji nadjačavaju zadanu logiku podudaranja. Dostupne su četiri mogućnosti:

Mogućnost Opis Primjer
Uvijek se podudara Definira vrijednosti za primarne ključeve koji se uvijek podudaraju. Uvijek uskladite redak s primarnim ključem 12345 s retkom s primarnim ključem 54321.
Nikad se ne podudara Definira vrijednosti za primarne ključeve koji se nikada ne podudaraju. Nikada ne podudarajte redak s primarnim ključem 12345 s retkom s primarnim ključem 54321.
Zaobilaženje Definira vrijednosti koje sustav uvijek treba zanemariti u fazi podudaranja. Zanemarite vrijednosti 11111 i Nepoznato tijekom podudaranja.
Mapiranje pseudonima Definira vrijednosti koje bi sustav trebao uzeti u obzir kao istu vrijednost. Smatraj Joea jednakim Josephu .
  1. Odaberite Prilagođeni.

    Gumb Prilagođeno

  2. Odaberite Prilagođenu vrstu , a zatim Preuzmi predložak. Preimenujte predložak bez korištenja razmaka. Za svaku mogućnost podudaranja koristite zaseban predložak.

  3. Otvorite preuzetu datoteku predloška i ispunite detalje. Predložak sadrži polja za određivanje tablice i vrijednosti primarnog ključa tablice koje će se koristiti u prilagođenom podudaranju. Nazivi tablica razlikuju velika i mala slova. Na primjer, ako želite da se primarni ključ 12345 iz tablice Prodaja uvijek podudara s primarnim ključem 34567 iz tablice Kontakt , ispunite predložak:

    • Tablica1: Prodaja
    • Tipka tablice1: 12345
    • Tablica2: Kontakt
    • Tablica2Tipka: 34567

    Ista datoteka predloška može odrediti prilagođene zapise podudaranja iz više tablica.

    Ako želite odrediti prilagođeno podudaranje za dedupliciranje u tablici, navedite istu tablicu kao i tablica1 i tablica2 i postavite različite vrijednosti primarnog ključa. Da biste koristili prilagođeno podudaranje, tablici morate definirati barem jedno pravilo dedupliciranja.

  4. Nakon dodavanja svih poništenja spremite datoteku predloška.

  5. Idite na izvore>podataka podataka i unesite datoteke predloška kao nove tablice.

  6. Nakon prijenosa datoteka ponovno odaberite mogućnost Prilagođeno . Na padajućem izborniku odaberite potrebne tablice i odaberite Gotovo.

    Snimka zaslona dijaloškog okvira za odabir poništenja prilagođenog scenarija podudaranja.

  7. Primjena prilagođenog podudaranja ovisi o mogućnosti podudaranja koju želite koristiti.

    • Za Uvijek podudaranje ili Nikad ne podudaranje prijeđite na sljedeći korak.
    • Za preslikavanje zaobilaženja ilipseudonima odaberite Uredi prema postojećem pravilu podudaranja ili stvorite novo pravilo. Na padajućem izborniku Normalizacije odaberite mogućnost Prilagođena premosnica ili Mapiranje pseudonima , a zatim Gotovo .
  8. U prilagođenom oknu odaberite Gotovo da biste primijenili konfiguraciju prilagođenog podudaranja.

    Svaka unesena datoteka predloška je vlastita izvor podataka. Ako se otkriju zapisi kojima je potreban poseban odgovarajući tretman, ažurirajte odgovarajuće izvor podataka. Ažuriranje će se koristiti tijekom sljedećeg postupka ujedinjenja. Na primjer, identificirate blizance s gotovo istim imenom koji žive na istoj adresi koja je spojena kao jedna osoba. Ažurirajte izvor podataka da biste identificirali blizance kao zasebne, jedinstvene zapise.