Deli putem


Definisanje pravila podudaranja za ujedinjenje podataka

Ovaj korak u ujedinjenju definiše redosled podudaranja i pravila za podudaranje više tabela. Za ovaj korak potrebne su najmanje dve tabele. Kada se zapisi podudaraju, oni se sačinjima sa jednim zapisom sa svim poljima iz svake tabele. Prilikom podudaranja razmatraju se alternativni redovi (redovi koji nisuviner iz koraka Deduplication). Međutim, ako se red podudara sa alternativnim redom u tabeli, zapis se podudara sa redom pobednika.

Belešku

Kada kreirate uslove podudaranja i izaberete opciju " Dalje", ne možete da uklonite izabranu tabelu ili kolonu. Ako je potrebno, kliknite na dugme "Nazad " da biste pregledali izabrane tabele i kolone pre nego što nastavite.

Sledeći koraci i slike odražavaju prvi put kada prolazite kroz proces ujedinjenja. Da biste uredili postojeće postavke ujedinjenja, pogledajte ažuriranje postavki ujedinjenja.

Uključi obogaćene tabele (pregled)

Ako ste obogatili tabele na izvor podataka da biste poboljšali rezultate ujedinjenja, izaberite ih. Više informacija potražite u članku Obogaćivanje izvora podataka. Ako ste izabrali obogaćene tabele na stranici sa pravilima Deduplication , nije potrebno da ih ponovo izaberete.

  1. Na stranici "Pravila podudaranja" izaberite stavku Korišćenje obogaćenih tabela na vrhu stranice.

  2. U oknu "Korišćenje obogaćenih tabela " odaberite jednu ili više obogaćenih tabela.

  3. Izaberite Gotovo.

Navedite redosled podudaranja

Svako podudaranje objedinjava dve ili više tabela u jednu, konsolidovanu tabelu. Istovremeno, objedinjavanje čuva jedinstvene zapise o klijentima. Redosled podudaranja označava redosled kojim sistem pokušava da se podudara sa zapisima.

Važno

Prva tabela se naziva primarna tabela koja služi kao osnova za objedinjene profile. U ovu tabelu biće dodate dodatne tabele koje su izabrane.

Važna razmatranja:

  • Odaberite tabelu sa najposebnijim i najpouzdanijim podacima profila o kupcima kao primarnoj tabeli.
  • Odaberite tabelu koja ima nekoliko zajedničkih kolona sa drugim tabelama (na primer, ime, broj telefona ili e-adresu) kao primarnu tabelu.
  • Tabele se mogu podudarati samo sa drugim tabelama koje su više u prioritetu. Dakle, Table2 može da se podudara samo sa Tabelom1, a Table3 protiv Table2 ili Table1.
  1. Na stranici "Pravila podudaranja " koristite strelice za premeštanje nagore i nadole da biste premestili tabele po redosledu kojim želite ili ih prevucite i otpustite. Na primer, izaberite eCommerceContacts kao primarnu tabelu , a loyCustomer kao drugu tabelu.

  2. Da biste imali svaki zapis u tabeli kao jedinstvenog kupca, bez obzira na to da li je pronađeno podudaranje, izaberite uključi sve zapise. Svi zapisi u ovoj tabeli koji se ne podudaraju sa zapisima u bilo kojoj drugoj tabeli biće uključeni u objedinjeni profil. Zapisi koji nemaju podudaranje nazivaju se singltoni.

Primarna tabela eCommerceContacts se podudara sa sledećom tabelom loyCustomer. Skup podataka koji je rezultat prvog koraka podudaranja podudara se sa sledećom tabelom ako imate više tabela. Ako duplikati i dalje postoje u eCommerceContacts, kada se loyCustomerpodudara sa eCommerceContacts,eCommerceContacts duplirani redovi se ne svode na jedan zapis kupca. Međutim, ako se duplirani redovi u loyCustomer podudaraju sa redom u eCommerceContacts, oni se smanjuju u jedan zapis kupca.

Snimak ekrana izabranog redosleda podudaranja za tabele.

Definisanje pravila za podudarne parove

Pravila podudaranja određuju logiku po kojoj će se podudarati određeni par tabela. Pravilo se sastoji od jednog ili više uslova.

Upozorenje pored imena tabele znači da nije definisano pravilo podudaranja za par podudaranja.

  1. Izaberite opciju Dodaj pravilo za par tabele da biste definisali pravila podudaranja.

  2. U oknu "Dodavanje pravila" konfigurišite uslove za pravilo.

    Snimak ekrana okna za dodavanje pravila.

    • Izaberite tabelu/polje (prvi red): Odaberite tabelu i kolonu koja je verovatno jedinstvena za kupca. Na primer, broj telefona ili adresa e-pošte. Izbegavajte podudaranje po kolonama tipa aktivnosti. Na primer, ID kupovine verovatno neće naći podudaranje u drugim vrstama zapisa.

    • Izaberite tabelu/polje (drugi red): Odaberite kolonu koja se odnosi na kolonu tabele navedenu u prvom redu.

    • Normalizacija: Izaberite neku od sledećih opcija normalizacije za izabrane kolone.

      • Brojevi: Konvertuje druge numeričke sisteme, kao što su rimski brojevi, u arapske brojeve. VIII postaje 8.
      • Simboli: Uklanja sve simbole i specijalne znakove. Head&Shoulder postaje HeadShoulder.
      • Tekst u manju sloћenja: Konvertuje sve znakove u niћa sliиna sloћenja. SVA VELIKA SLOVA i velika slova postaju sva velika slova i velika slova.
      • Tip (telefon, ime, adresa, organizacija): Standardizuje imena, naslove, brojeve telefona, adrese i organizacije.
      • Unikod u ASCII: Konvertuje unikod notaciju u ASCII znakove. /u00B2 postaje 2.
      • Razmak: Uklanja sve razmake. Hello World postaje HelloWorld.
    • Preciznost: Podesite nivo preciznosti koji treba primeniti za ovaj uslov. Preciznost se koristi sa nejasnim podudaranjem i određuje koliko dve niske treba da budu blizu da bi se smatrale podudaranjem.

      • Osnovno: Odaberitesa niskih (30%) ,Srednje (60%) ,High (80%) , iExact (100%) . Izaberite opciju Tačno da bi se podudarali samo sa zapisima koji se podudaraju sa 100 procenata.
      • Prilagođeno: Postavite procenat koji zapisi treba da se podudaraju. Sistem će se podudarati samo sa zapisima koji prelaze ovu graničnu vrednost.
    • Ime: Ime za pravilo.

  3. Da biste uporedili tabele samo ako kolone ispunjavaju više uslova, kliknite na dugme>"Dodaj uslov " da biste dodali još uslova pravilu podudaranja. Uslovi su povezani sa logičkim operatorom I, pa se stoga izvršavaju samo ako su ispunjeni svi uslovi.

  4. Opcionalno, razmotrite napredne opcije kao što su izuzeci ili prilagođeni uslovi podudaranja.

  5. Kliknite na dugme "Gotovo" da biste završili pravilo.

  6. Opcionalno, dodajte još pravila.

  7. Izaberite Sledeće.

Dodavanje pravila paru za podudaranje

Pravila za podudaranje predstavljaju skupove uslova. Dodajte još pravila da biste tabele podudarali sa uslovima zasnovanim na više kolona.

  1. Izaberite opciju Dodaj pravilo u tabelu u koju želite da dodate pravila.

  2. Sledite korake u opciji Definiši pravila za parove podudaranja.

Belešku

Redosled pravila je važan. Algoritam podudaranja pokušava da se podudara sa datim zapisom kupca na osnovu prvog pravila i nastavlja ka drugom pravilu samo ako nijedno podudaranje nije identifikovano sa prvim pravilom.

Napredne opcije

Dodavanje izuzetaka pravilu

U većini slučajeva podudaranje tabele vodi do jedinstvenih profila klijenata sa konsolidovanim podacima. Da biste rešili retke slučajeve lažnih pozitivnih i lažnih negativnosti, definišite izuzetke za pravilo podudaranja. Izuzeci se primenjuju nakon obrade pravila podudaranja i izbegavaju podudaranje svih zapisa koji ispunjavaju kriterijume za izuzetak.

Na primer, ako pravilo podudaranja kombinuje prezime, grad i datum rođenja, sistem će identifikovati blizance sa istim prezime koji žive u istom gradu kao i isti profil. Možete da navedete izuzetak koji se ne podudara sa profilima ako ime tabele koje kombinujete nisu iste.

  1. U oknu za uređivanje izaberite dodaj >izuzetak.

  2. Navedite kriterijume izuzetka.

  3. Kliknite na dugme "Gotovo" da biste sačuvali pravilo.

Navedite uslove za prilagođeno podudaranje

Navedite uslove koji zamenjuju podrazumevanu logiku podudaranja. Dostupne su četiri opcije:

Opcija Opis Primer
Uvek se podudara Definiše vrednosti za primarne ključeve koji se uvek podudaraju. Uvek uparite red sa primarnim ključem 12345 sa redom sa primarnim ključem 54321.
Nikad se ne podudara Definiše vrednosti za primarne ključeve koji se nikada ne podudaraju. Nikada ne uparite red sa primarnim ključem 12345 sa redom sa primarnim ključem 54321.
Zaobilaženje Definiše vrednosti koje sistem uvek treba da ignoriše u fazi podudaranja. Zanemari vrednosti 11111 i Nepoznatotokom podudaranja.
Mapiranje pseudonima Definiše vrednosti koje sistem treba da uzme u obzir kao istu vrednost. Smatraj da je Džo jednak sa Džozefom.
  1. Izaberite Prilagođeno.

    Prilagođeno dugme

  2. Odaberite prilagođeni tip i izaberite stavku Preuzmi predložak. Preimenujte predložak bez korišćenja razmaka. Koristite poseban predložak za svaku opciju podudaranja.

  3. Otvorite preuzetu datoteku predloška i popunite detalje. Predložak sadrži polja koja određuju tabelu i vrednosti primarnog ključa tabele koje će se koristiti u prilagođenom podudaranju. Imena tabela oslate mala i velika slova. Na primer, ako želite da se primarni ključ 12345iz tabele " Prodaja" uvek podudara sa primarnim ključem 34567iz tabele "Kontakt ", popunite predložak:

    • Tabela1: prodaja
    • Table1Key: 12345
    • Tabela2: kontakt
    • Table2Key: 34567

    Ista datoteka predloška može da precizira prilagođene zapise podudaranja iz više tabela.

    Ako želite da navedete prilagođeno podudaranje za deduplikaciju u tabeli, navedite istu tabelu kao i Tabela1 i Tabela2 i postavite različite vrednosti primarnog ključa. U tabelu morate definisati najmanje jedno pravilo deduplikacije da biste koristili prilagođeno podudaranje.

  4. Nakon dodavanja svih premošćivanja, sačuvajte datoteku predloška.

  5. Idite na izvore>podataka podataka i unesite datoteke predložaka kao nove tabele.

  6. Nakon otpremanja datoteka, ponovo izaberite opciju "Prilagođeno". Izaberite potrebne tabele iz padajućeg menija i izaberite gotovo .

    Snimak ekrana dijaloga koji treba odabrati za premošćivanje prilagođenog scenarija podudaranja.

  7. Primena prilagođenog podudaranja zavisi od opcije podudaranja koju želite da koristite.

    • Za " Uvek podudaranje " ili "Nikad se ne podudaraj", pređite na sledeći korak.
    • Za bajpasili mapiranje pseudonima izaberite uredi postojeće pravilo podudaranja ili kreirajte novo pravilo. U padajućem meniju Normalizacije odaberite opciju mapiranja prilagođenog bajpasaili pseudonima i izaberite gotovo .
  8. U prilagođenom oknu izaberite stavku Gotovo da biste primenili prilagođenu konfiguraciju podudaranja.

    Svaka unete datoteke predloška je sopstvena izvor podataka. Ako su otkriveni zapisi kojima je potreban poseban tretman podudaranja, ažurirajte odgovarajuće izvor podataka. Ispravka će biti korišćena tokom sledećeg procesa ujedinjenja. Na primer, identifikujete blizance sa skoro istim imenom koji žive na istoj adresi koja je objedinjena kao jedna osoba. Ažurirajte izvor podataka biste identifikovali blizance kao odvojene, jedinstvene zapise.