Jaa


Tietojen yhdistäminen poistamalla kaksoiskappaleet kussakin taulukossa

Yhdistämisen Kaksoiskappaleiden poistosäännöt -vaihe etsii ja poistaa asiakkaan tietueiden kaksoiskappaleet lähdetaulukosta, joten kutakin asiakasta koskee yksi rivi kussakin taulukossa. Kaksoiskappaleet poistetaan kustakin taulukosta erikseen käyttämällä sääntöjä, jotka tunnistavat tietyn asiakkaan tietueet.

Säännöt käsitellään järjestyksessä. Kun kaikki säännöt on suoritettu taulukon kaikissa taulukoissa, yhteisen rivin jakavat vastaavuusryhmät yhdistetään yhdeksi vastaavuusryhmäksi.

Määritä kaksoiskappaleiden poistamissäännöt

Hyvä sääntö tunnistaa yksilöllisen asiakkaan. Tietoihin perehtyminen. On ehkä riittävää, että asiakkaat tunnistetaan esimerkiksi sähköpostikentän perusteella. Jos kuitenkin halutaan erottaa sähköpostin jakavat asiakkaat, voidaan valita kaksi ehtoa sisältävä sääntö, joka hakee vastineen sähköpostin ja etunimen perusteella. Lisätietoja on kohdassa Kaksoiskappaleiden poiston käsitteet ja skenaariot.

  1. Valitse Kaksoiskappaleiden poistosäännöt -sivulla taulukko ja määritä kaksoiskappaleiden poistamissäännöt valitsemalla Lisää sääntö.

    Vihje

    Jos yhdistämistuloksia on parannettu rikastamalla taulukoita tietolähdetasolla, valitse Käytä rikastettuja taulukoita sivun yläosassa. Lisätietoja: Rikastus tietolähteitä varten.

    Kuvakaappaus Kaksoiskappaleiden poistosäännöt -sivusta, jossa taulukko on korostettu ja Lisää sääntö näkyy

    1. Syötä Lisää sääntö -ruutuun seuraavat tiedot:

      • Valitse kenttä: Valitse sen taulukon käytettävissä olevien kenttien luettelosta, jonka kaksoiskappaleita haluat tarkistaa. Valitse kentät, jotka ovat todennäköisesti yksilöllisiä jokaiselle asiakkaalle. Esimerkiksi sähköpostiosoite tai nimen, postiosoitteen ja puhelinnumeron yhdistelmä.
      • Normalisoi: Sarakkeen normalisointivaihtoehtojen valinta. Normalisointi vaikuttaa vain vastaavuusvaiheeseen, eikä se muuta tietoja.
        • Numerot: muuntaa monet numeroita ilmaisevat Unicode-symbolit yksinkertaisiksi numeroiksi.
        • Symbolit: Poistaa monet yleiset symbolit !"#$%&'()*+,-./:;<=>?@[]^_`{|}~. Esimerkiksi Head&Shoulder muuttuu muotoon HeadShoulder.
        • Teksti pieniksi kirjaimiksi: Muuntaa kaikki merkit pieniksi. KAIKKI ISOLLA- ja Ensimmäiset Kirjaimet Isolla -muoto muuttuvat muotoon kaikki isolla ja ensimmäiset kirjaimet isolla.
        • Tyyppi (Puhelin, Nimi, Osoite, Organisaatio): standardoi nimet, otsikot, puhelinnumerot, osoitteet jne.
        • Unicode ASCII-muotoon: Muuntaa Unicode-merkit vastaaviksi ASCII-merkeiksi. Esimerkiksi aksentillinen ề muuntuu e-merkiksi.
        • Tyhjä tila: poistaa kaikki välilyönnit. Hello Worldista tulee HelloWorld.
      • Tarkkuus: Määrittää tarkkuuden tason. Tarkkuutta käytetään sumeassa vastaavuudessa, ja sillä määritetään, kuinka samanlaiset merkkijonojen on oltava, jotta niitä pidetään vastineina.
        • Perustiedot: Valitse arvoksi Matala (30 %), Keskitaso (60 %), Korkea (80 %) tai Tarkka (100 %). Valitse Tarkka, jos haluat yhdistää vain tietueet, jotka vastaavat 100 prosentin tarkkuudella.
        • Mukautettu: Määritä prosenttiluku, jota tietueiden on vastattava. Järjestelmä pitää vastineeva vain tämän raja-arvon ohittavia tietueita.
      • Nimi: Säännön nimi.

      Näyttökuva Lisää sääntö -ruudusta kaksoiskappaleiden poistamista varten.

    2. Voit valinnaisesti valita Lisää>Lisää ehto lisätäksesi sääntöön lisää ehtoja. Ehdot yhdistetään loogiseen JA-operaattoriin, joten ne suoritetaan vain, jos kaikki ehdot täyttyvät.

    3. Vaihtoehtoisesti voit valita Lisää>Lisää poikkeuslisätäksesi sääntöön poikkeuksia. Poikkeuksia käytetään harvoissa väärissä positiivisissa ja väärissä negatiivisissa tapauksissa.

    4. Luo sääntö valitsemalla Valmis.

  2. Voit myös lisätä muita sääntöjä.

  3. Valitse taulukko ja sitten Muokkaa yhdistämisasetuksia.

  4. Valitse Yhdistämisasetukset -ruudussa seuraavat tiedot:

    1. Valitse jokin kolmesta vaihtoehdosta sen määrittämiseksi, mikä tietue säilytetään, jos kaksoiskappale löytyy:

      • Useimmat täytetyt: Määrittää voittavaksi tietueeksi tietueen, jossa on eniten täytettyjä sarakkeita. Se on yhdistämisen oletusasetus.
      • Uusin: Määrittää voittajatietueeksi uusimman tietueen. Viimeaikaisuuden määrittämiseen tarvitaan päivämäärä- tai numerokenttä.
      • Vähiten viimeaikaiset: Määrittää voittajatietueeksi vähiten viimeaikaisimman tietueen. Viimeaikaisuuden määrittämiseen tarvitaan päivämäärä- tai numerokenttä.

      Tasatilanteessa voittajatietue on se, jolla on MAX(PK) tai suurempi perusavaimen arvo.

    2. Jos haluat määrittää yhdistämisen asetukset taulukon yksittäisille sarakkeille, valitse ruudun alaosasta Lisäasetukset. Voit esimerkiksi säilyttää uusimman sähköpostiviestin JA täydellisimmän osoitteen eri tietueista. Laajenna taulukkoa, kun haluat nähdä sen kaikki sarakkeet, ja määritä, mitä asetusta käytetään yksittäisissä sarakkeissa. Jos valitset viimeaikaisuuteen perustuvan vaihtoehdon, sinun täytyy myös määrittää päivämäärä-/aikakenttä, joka määrittää viimeaikaisuuden.

      Yhdistämisasetusten lisäasetukset, joissa näkyvät uusin sähköposti ja täydellinen osoite

    3. Ota yhdistämisasetukset käyttöön valitsemalla Valmis.

  5. Kun olet määrittänyt kaksoiskappaleiden poistosäännöt ja yhdistämisasetukset, valitse Seuraava.