Definiranje pravila podudaranja za objedinjavanje podataka
Ovaj korak u objedinjavanju definira redoslijed podudaranja i pravila za podudaranje na različitim stolovima. Ovaj korak zahtijeva najmanje dvije tablice. Kada se zapisi podudaraju, oni se spajaju u jedan zapis sa svim poljima iz svake tablice. Alternativni redovi (nepobjednički redovi iz korak Uklanjanje duplikata) uzimaju se u obzir prilikom podudaranja. No, ako se redak podudara s alternativnim redom u tablici, zapis se podudara s pobjedničkim redom.
Napomena
Nakon što stvorite uvjete podudaranja i odaberete Dalje, ne možete ukloniti odabranu tablicu ili stupac. Ako je potrebno, odaberite Natrag da biste pregledali odabrane tablice i stupce prije nastavka.
Sljedeći koraci i slike odražavaju prvi put kada prolazite kroz proces ujedinjenja. Za uređivanje postojećih postavki objedinjavanja pogledajte Ažuriranje postavki objedinjavanja.
Uključivanje obogaćenih tablica (pretpregled)
Ako ste obogatili tablice na razini izvora podataka da biste poboljšali rezultate objedinjavanja, odaberite ih. Dodatne informacije potražite u članku Obogaćivanje izvora podataka. Ako ste odabrali obogaćene tablice na stranici Pravila uklanjanja dupliciranja, ne morate ih ponovno odabrati.
Na stranici Pravila podudaranja odaberite Koristi obogaćene tablice pri vrhu stranice.
U oknu Koristi obogaćene tablice odaberite jednu ili više obogaćenih tablica.
Odaberite Gotovo.
Zadavanje redoslijeda uparivanja
Svako podudaranje objedinjuje dvije ili više tablica u jednu, objedinjenu tablicu. Istodobno vodi jedinstvenu evidenciju klijenata. Redoslijed podudaranja označava redoslijed kojim sustav pokušava uskladiti zapise.
Važno
Prva tablica naziva se primarna tablica, koja služi kao osnova za vaše objedinjene profile. Dodatne tablice koje su odabrane bit će dodane u ovu tablicu.
Važna razmatranja:
- Odaberite tablicu s najpotpunijim i najpouzdanijim podacima profila o svojim klijentima kao primarnu tablicu.
- Kao primarnu tablicu odaberite tablicu koja ima nekoliko zajedničkih stupaca s drugim tablicama (na primjer, ime, telefonski broj ili adresu e-pošte).
- Stolovi se mogu podudarati samo s drugim tablicama s većim prioritetom. Dakle, Tablica2 se može podudarati samo sa Tablicom 1, a Tablica 3 može se podudarati sa Tablicom 2 ili Tablicom 1.
Na stranici Pravila podudaranja pomoću strelica za pomicanje prema gore i dolje premjestite tablice željenim redoslijedom ili ih povucite i ispustite. Na primjer, odaberite eCommerceContacts kao primarnu tablicu i loyCustomer kao drugu tablicu.
Da bi svaki zapis u tablici bio jedinstveni klijent bez obzira na to je li pronađeno podudaranje, odaberite Uključi sve zapise. Svi zapisi u ovoj tablici koji se ne podudaraju sa zapisima u bilo kojoj drugoj tablici uključeni su u objedinjeni profil. Ploče koje nemaju podudaranje nazivaju se singletons.
Primarna tablica eCommerceContacts podudara se sa sljedećom tablicom loyCustomer. Skup podataka koji je rezultat prvog korak podudaranja podudara se sa sljedećom tablicom ako imate više od dvije tablice. Ako duplikati i dalje postoje u eCommerceContacts, kada se loyCustomer podudara s eCommerceContacts, eCommerceContacts duplicirani reci ne svode se na jedan zapis klijenta. Međutim, ako se duplicirani reci u loyCustomer podudaraju s retom u eCommerceContacts, oni se svode u jedan zapis klijenta.
Definiranje pravila za parove uparivanja
Pravila podudaranja određuju logiku po kojoj će se određeni par tablica podudarati. Pravilo se sastoji od jednog ili više uvjeta.
Upozorenje pored naziva tablice znači da nije definirano pravilo podudaranja za par podudaranja.
Odaberite Dodaj pravilo za par tablica da biste definirali pravila podudaranja.
U oknu Dodavanje pravila konfigurirajte uvjete za pravilo.
Odaberite Tablica/polje (prvi redak): Odaberite tablicu i stupac koji su vjerojatno jedinstveni za klijenta. Na primjer, telefonski broj ili adresu e-pošte. Izbjegavajte podudaranje prema stupcima vrste aktivnosti. Na primjer, ID kupnje vjerojatno neće pronaći uparivanje u drugim vrstama zapisa.
Odaberite Tablica/polje (drugi redak): Odaberite stupac koji se odnosi na stupac tablice naveden u prvom retku.
Normalizacija: Odaberite mogućnosti normalizacije za stupac.
- Brojevi: pretvara Unicode simbole koji predstavljaju brojeve u jednostavne brojeve.
- Simboli: Uklanja simbole i posebne znakove kao što su !" #$%&'()*+,-./:;<=>?@[]^_'{|}~. Na primjer, Head&Shoulder postaje HeadShoulder.
- Tekst u mala slova: pretvara velika slova u mala. "SVA VELIKA SLOVA i Title Case" postaju "sva velika slova i naslov".
- Vrsta (Telefon, Ime, Adresa, Organizacija): Standardizira imena, titule, telefonske brojeve i adrese.
- Unicode u ASCII: pretvara Unicode znakove u njihov ASCII ekvivalent slova. Na primjer, naglašeni ề pretvara se u znak e.
- Razmak: Uklanja sve razmake. Hello World postaje HelloWorld.
- mapiranje aliasa: omogućuje vam prijenos prilagođenog popisa parova nizova kako biste označili nizove koji bi se uvijek trebali smatrati točnim podudaranjem.
- Prilagođeno zaobilaženje: omogućuje vam prijenos prilagođenog popisa nizova kako biste označili nizove koji se nikada ne bi trebali podudarati.
Preciznost: Postavite razinu preciznosti koja će se primijeniti za ovaj uvjet. Preciznost se koristi za točno podudaranje i neizrazito podudaranje i određuje koliko blizu moraju biti dva niza da bi se smatrala podudaranjem.
- Osnovno: Odaberite između niske (30%), srednje (60%), visoke (80%) i točne (100%). Odaberite Točno da biste podudarali samo zapise koji se podudaraju sa 100 posto.
- Prilagođeno: postavite postotak koji se zapisi moraju podudarati. Sustav će upariti samo zapise koji prelaze ovaj prag.
Naziv: Naziv pravila.
Da biste podudarali tablice samo ako stupci ispunjavaju više uvjeta, odaberite Dodaj>Dodaj uvjet da biste dodali više uvjeta u pravilo podudaranja. Uvjeti su povezani logičkim operatorom AND i stoga se izvršavaju samo ako su ispunjeni svi uvjeti.
Po želji razmotrite napredne mogućnosti kao što su iznimke ili prilagođeni uvjeti podudaranja.
Odaberite Gotovo da biste dovršili pravilo.
Po želji dodajte još pravila.
Odaberite Dalje.
Dodavanje pravila paru uparivanja
Pravila uparivanja predstavljaju skupove uvjeta. Da biste uskladili tablice prema uvjetima na temelju više stupaca, dodajte još pravila.
Odaberite Dodaj pravilo u tablici u koju želite dodati pravila.
Slijedite korake u odjeljku Definiranje pravila za parove podudaranja.
Napomena
Bitan je redoslijed pravila. Algoritam podudaranja pokušava podudarati određeni zapis klijenta na temelju vašeg prvog pravila i nastavlja se na drugo pravilo samo ako nije identificirano podudaranje s prvim pravilom.
Dodatne mogućnosti
Dodavanje iznimaka u pravilo
U većini slučajeva podudaranje tablice dovodi do jedinstvenih profila klijenata s konsolidiranim podacima. Da biste riješili rijetke slučajeve lažno pozitivnih i lažno negativnih rezultata, definirajte iznimke za pravilo podudaranja. Iznimke se primjenjuju nakon obrade pravila podudaranja i izbjegavaju podudaranje svih zapisa koji ispunjavaju kriterije iznimke.
Na primjer, ako pravilo podudaranja kombinira prezime, grad i datum rođenja, sustav će identificirati blizance s istim prezime koji žive u istom gradu kao i isti profil. Možete navesti iznimku koja se ne podudara s profilima ako ime u tablicama koje kombinirate nije isto.
U oknu Uređivanje pravila odaberite Dodaj>Dodaj iznimku.
Navedite kriterije iznimke.
Odaberite Gotovo da biste spremili pravilo.
Određivanje prilagođenih uvjeta uparivanja
Navedite uvjete koji nadjačavaju zadanu logiku podudaranja. Dostupne su četiri opcije:
Mogućnost | Opis | Primjer |
---|---|---|
Uvijek se podudara | Definira vrijednosti za primarne ključeve koji se uvijek podudaraju. | Uvijek usporedite redak s primarnim ključem 12345 s redom s primarnim ključem 54321. |
Nikad se ne podudara | Definira vrijednosti za primarne ključeve koji se nikada ne podudaraju. | Nikada nemojte uspoređivati redak s primarnim ključem 12345 s redom s primarnim ključem 54321. |
Zaobilaženje | Definira vrijednosti koje bi sustav uvijek trebao zanemariti u fazi podudaranja. | Zanemarite vrijednosti 11111 i Nepoznato tijekom utakmice. |
Mapiranje pseudonima | Definira vrijednosti koje bi sustav trebao smatrati istom vrijednošću. | Smatrajte da je Joe jednak Josephu . |
Odaberite Prilagođeni.
Odaberite Prilagođena vrsta i odaberite Preuzmi predložak. Preimenujte predložak bez korištenja razmaka. Upotrijebite zaseban predložak za svaku opciju podudaranja.
Otvorite preuzetu datoteku predloška i ispunite detalje. Predložak sadrži polja za određivanje tablice i vrijednosti primarnog ključa tablice koje će se koristiti u prilagođenom podudaranju. Nazivi tablica razlikuju velika i mala slova. Na primjer, ako želite da se primarni ključ 12345 iz tablice Prodaja uvijek podudara s primarnim ključem 34567 iz tablice Kontakt, ispunite predložak:
- Tablica 1: Prodaja
- Tablica1ključ: 12345
- Tablica 2: Kontakt
- Tablica2ključ: 34567
Ista datoteka predloška može specificirati prilagođene zapise podudaranja iz više tablica.
Ako želite navesti prilagođeno podudaranje za deduplikaciju u tablici, navedite istu tablicu kao i Tablica1 i Tablica2 i postavite različite vrijednosti primarnog ključa. Morate definirati barem jedno pravilo deduplikacije u tablici da biste koristili prilagođeno podudaranje.
Nakon dodavanja svih poništenja, spremite datoteku predloška.
Idite na Izvori >podataka i unesite datoteke predloška kao nove tablice.
Nakon prijenosa datoteka, ponovno odaberite opciju Prilagođeno . Odaberite potrebne tablice s padajućeg izbornika i odaberite Gotovo.
Primjena prilagođenog podudaranja ovisi o opciji podudaranja koju želite koristiti.
- Za Uvijek podudaranje ili Nikad ne podudaranje prijeđite na sljedeći korak.
- Za mapiranje zaobilaženja ilialiasa odaberite Uredi na postojećem pravilu podudaranja ili stvorite novo pravilo. Na padajućem izborniku Normalizacije odaberite Prilagođeno zaobilaženje ili mapiranje aliasa, a zatim odaberite Gotovo.
Odaberite Gotovo u oknu Prilagođeno da biste primijenili konfiguraciju prilagođenog podudaranja.
Svaka unesena datoteka predloška vlastiti je izvor podataka. Ako se otkriju zapisi kojima je potreban poseban tretman podudaranja, ažurirajte odgovarajući izvor podataka. Ažuriranje će se koristiti tijekom sljedećeg postupka objedinjavanja. Na primjer, identificirate blizance s gotovo istim imenom koji žive na istoj adresi i koji su spojeni kao jedna osoba. Ažurirajte izvor podataka da biste identificirali blizance kao zasebne, jedinstvene zapise.