Megosztás:


Tudásfelderítés végrehajtása

A következőkre vonatkozik:SQL Server

Fontos

Az adatminőségi szolgáltatások (DQS) törlődnek az SQL Server 2025-ben (17.x). Továbbra is támogatjuk a DQS-t az SQL Server 2022 (16.x) és korábbi verzióiban.

Ez a témakör azt ismerteti, hogyan hozhat létre tudásbázist tudásfelderítéssel. A felderítési folyamat során a Data Quality Services (DQS) egy számítógéppel támogatott folyamaton keresztül elemzi a mintaadatforrás adatait, és hozzáadja a tudásbázishoz megszerzett tudást. Ez a tudás módosítható és bővíthető a tudásfelderítési tevékenység Tartományértékek kezelése vagy a tartománykezelési tevékenység során.

A tudásfelderítés egy varázslóalapú folyamat, amely három lépést tartalmaz, amelyek mindegyiket végre kell hajtani.

Mielőtt hozzákezdene

Előfeltételek

A Microsoft Excelt telepíteni kell az adatminőségi ügyfélszámítógépre, ha a forrásadatok, amelyeken a felderítést futtatja, Egy Excel-fájlban találhatók. Ellenkező esetben nem tudja kiválasztani az Excel-fájlt a leképezési szakaszban. A Microsoft Excel által létrehozott fájlok .xlsx, .xlsvagy .csvkiterjesztéssel is rendelkezhetnek. Ha az Excel 64 bites verzióját használja, csak az Excel 2003-fájlok (.xls) támogatottak; Az Excel 2007- vagy 2010-fájlok (.xlsx) nem támogatottak. Ha az Excel 2007 vagy 2010 64 bites verzióját használja, mentse a fájlt .xls fájlként vagy .csv fájlként, vagy telepítse helyette az Excel 32 bites verzióját.

Biztonság

Engedélyek

Tudásbázis létrehozásához rendelkeznie kell a DQS_MAIN adatbázis dqs_kb_editor vagy dqs_administrator szerepkörével.

Első lépés: Tudásfelderítés indítása

  1. Indítsa el az adatminőségi ügyfelet. Erről a Az adatminőségi ügyfélalkalmazás futtatásacímű témakörben talál további információt.

  2. Ha egy új tudásbázison szeretné elvégezni a tudásfelderítést, kattintson az Új tudásbáziselemre, írja be a nevet és a leírást, és adja meg, hogy miből hozza létre a tudásbázist, ha van ilyen. Ha egy meglévő tudásbázison szeretné elvégezni a tudásfelderítést, kattintson a Tudásbázis megnyitásaelemre, majd válasszon ki egy tudásbázist.

  3. Tevékenységként válassza a Knowledge Discovery lehetőséget, majd kattintson a létrehozása elemre az új tudásbázis létrehozásához, vagy Meglévő tudásbázis megnyitásához nyissa meg a megnyitása lehetőséget.

Leképezési szakasz

  1. Az Adatforrás mezőben válassza SQL Server (alapértelmezett) vagy Excel-fájl.

    Jegyzet

    Ezen a lapon kapcsolatot létesít egy SQL Server- vagy Excel-adatforrással, majd megfelelteti az adatforrás oszlopai és a tudásbázis egy tartománya között. A Leképezések tábla megjeleníti a forrásadatbázis összes oszlopát, amelyet elemezni fog, hogy tudást adjon a megfelelő tartományokhoz. A leképezések az adatforrás oszlopai és a tudásbázis egy tartománya között jönnek létre.

  2. Ha az adatforrás SQL Server, folytassa a következő lépésekkel:

    1. Az Adatbázis mezőben válassza ki azt a forrásadatbázist, amelyet elemezni szeretne a tudásbázis létrehozásához. A szövegdoboz legördülő listájában megjelennek az elérhető adatbázisok. A forrásadatbázisnak ugyanabban az SQL Server-példányban kell lennie, mint az Adatminőség-kiszolgálónak. Ellenkező esetben nem jelenik meg a legördülő listában.

    2. A Tábla/Nézet mezőben válassza ki azt a táblát vagy nézetet, amelyet elemezni szeretne a tudásbázis létrehozásához. Ennek a táblának vagy nézetnek mintaadatoknak kell lennie, nem pedig egy teljes forrásadatbázisnak, amelyen adattisztítást vagy egyeztetést végez. A szövegdoboz legördülő listájában megjelennek a kijelölt adatbázishoz elérhető táblák és nézetek.

  3. Ha az adatforrás az Excel , folytassa a következő lépésekkel:

    1. Kattintson Tallózás elemre, és válassza ki az elemezni kívánt Excel-fájlt a tudásbázis létrehozásához. Az Excel-fájl kiválasztásához telepíteni kell az Excelt az Adatminőségi ügyfélszámítógépre. Ha az Excel nincs telepítve az adatminőségi ügyfélszámítógépen, a Tallózás gomb nem lesz elérhető, és a szövegmező alatt értesítést kap arról, hogy az Excel nincs telepítve.

    2. Jelölje be a Az első sor fejlécként használja jelölőnégyzetet, ha az Excel-fájl első sora fejlécadatokat tartalmaz.

  4. A Leképezések táblában képezheti le azokat a forrásoszlopokat, amelyeken a tudásfelderítést a tudásbázis egy tartományában szeretné elvégezni, az alábbiak szerint:

    1. Leképezés létrehozásához válasszon ki egy forrásoszlopot az üres sor Forrásoszlop oszlopának legördülő listájából, majd válasszon ki egy tartományt a Tartomány oszlop legördülő listájából ugyanabban a sorban, ha létezik tartomány. Ha nincs tartomány, kattintson a Tartomány létrehozása vagy Összetett tartomány létrehozása. További információ: Tartományszabály létrehozása vagy Összetett tartomány létrehozása.

    2. Ismételje meg az előző lépést minden leképezésnél. A táblázat sorainak számának módosításához kattintson a Oszlopleképezés hozzáadásaelemre, vagy jelöljön ki egy sort, majd kattintson a A kijelölt oszlopleképezés eltávolításaelemre. Ha a Kijelölt oszlopleképezés eltávolítása elemre kattint egy kitöltött sor kijelölésekor, akkor a kijelölt sor törlődik, még akkor is, ha van kitöltetlen sor.

      Jegyzet

      A forrásadatokat csak akkor képezheti le egy DQS-tartományra a tudásfelderítés végrehajtásához, ha a forrásadattípus támogatott a DQS-ben, és megfelel a DQS-tartomány adattípusának. További információ a támogatott adattípusokról: DQS-tartományok támogatott SQL Server- és SSIS-adattípusai.

    3. Kattintson Összetett tartományok megtekintése/kijelölése a definiált összetett tartományok megjelenítéséhez. Ha nincs meghatározva összetett tartomány, a vezérlő nem lesz elérhető.

    4. Kattintson az Adatforrás előnézete elemre az Táblázat/nézet vagy Excel-fájl szövegmezőben kijelölt adatforrás összes adatának megjelenítéséhez.

  5. A Tovább gombra kattintva lépjen a Tudásfelderítés varázsló Felfedezés lapjára. A következőket is kiválaszthatja:

    • Kattintson a Mégse gombra a Tudásfelderítési tevékenység leállításához, a munka elvesztéséhez és a DQS kezdőlapjára való visszatéréshez.

    • A Bezárás gombra kattintva visszatérhet a DQS kezdőlapjára a munka mentése közben. A tudásbázis elérhetetlen lesz az Ön számára, és a tudásbázis táblázatban a Tudásbázis megnyitása képernyőn a tudásbázis állapota Felderítés – Leképezéslesz. Miután a Bezárásgombra kattintott, a tartománykezelési tevékenység végrehajtásához a Tudásbázis megnyitása képernyőn a Tudásbázis-felderítés elemre kell kattintania, lépjen a Tudásbázis kezelése: Tartományfeltételek kezelése képernyőre, kattintson a Befejezéselemre, majd kattintson a tudásbázis közzétételéhez Igen vagy Nincs gombra a munka tudásbázisba mentéséhez és a kilépéshez.

Felfedezési szakasz

  1. Kattintson a Start elemre az adatforrás elemzéséhez.

    Jegyzet

    A felderítés az Leképezések táblában a Térkép lapon megadott oszlopokon történik. Az egyes oszlopokhoz hozzárendelt tartomány a felderítésből származó ismeretekkel lesz feltöltve. Ha a tartomány összetett tartomány, a rendszer hozzáadja a tudást az összetett tartományhoz tartozó egyes tartományokhoz.

  2. A felderítési folyamat futása közben ellenőrizze az egyes felderítési lépésekhez megjelenített befejezési állapotot: Rekordok előfeldolgozása, A tartományszabályok futtatásaés A felderítés futtatása. A készültségi szint és a befejezés állapota az egyes szakaszokban jelenik meg.

  3. Ha az elemzés befejeződött, győződjön meg arról, hogy a befejezési statisztikák alatti állapotsor azt jelzi, hogy sikeresen befejeződött.

    Jegyzet

    Ha a fájl feltöltése előtt elhagyja a képernyőt, azzal leállítja a fájlfeltöltési folyamatot.

  4. Az elemzés befejezése után ellenőrizze a statisztikákat a Profiler lapon az adatok állapotának megtekintéséhez. További információért lásd a(z) DQSAdatprofilozás és értesítések részben.

  5. Az elemzés befejezése után a Start gomb egy Újraindítás gombtá válik. Kattintson újraindítása gombra az elemzési folyamat ismételt futtatásához. Az előző elemzés eredményei azonban még nem lettek mentve, ezért a Újraindítás gombra kattintva elvesznek a korábbi adatok. A folytatáshoz kattintson Igen elemre az előugró ablakban. Mivel az elemzés fut, ne hagyja el az oldalt, vagy az elemzési folyamat leáll.

  6. A Tovább gombra kattintva lépjen a Tudásfelderítés varázsló Tartományértékek kezelése lapjára. Ezen a lapon módosíthatja a tudásbázis tartományaihoz hozzáadott tudást. A következőket is kiválaszthatja:

    • Kattintson a Mégse gombra a Tudásfelderítési tevékenység leállításához, a munka elvesztéséhez és a DQS kezdőlapjára való visszatéréshez.

    • A Bezárás gombra kattintva visszatérhet a DQS kezdőlapjára a munka mentése közben. A tudásbázis le lesz zárva az Ön számára, és a tudásbázis állapota a Nyitott Tudásbázis képernyőn Felderítéslesz. Miután a Bezárásgombra kattintott, a tartománykezelési tevékenység végrehajtásához a Tudásbázis megnyitása képernyőn a Tudásbázis-felderítés elemre kell kattintania, lépjen a Tudásbázis kezelése: Tartományfeltételek kezelése képernyőre, kattintson a Befejezéselemre, majd kattintson a tudásbázis közzétételéhez Igen vagy Nincs gombra a munka tudásbázisba mentéséhez és a kilépéshez.

    • Ide kattintva visszatérhet a Felfedezés lapra.

Adatfelderítési eredmények kezelése szakasz

A tudásfelderítési tevékenység elvégzése után az alábbi módon módosíthatja az értékeket:

  • Adjon hozzá egy tartományértéket az értéklistához, vagy jelöljön ki egy értéket, és törölje azt a listából

  • Tartományérték állapotának módosítása a DQS-felderítési folyamat által kijelölt értéktől, a javítás, a hiba vagy az érvénytelen érték módosítása

  • Adjon meg egy hibás vagy érvénytelen értéket helyettesítő értéket

  • Állítson be két vagy több értéket szinonimákként, és módosítsa a kezdőértéket a felderítési folyamat által beállított módon, azzal az eredménnyel, hogy a kezdő érték lecseréli a szinonimát, ha a tartomány létrehozásakor be lett állítva a Vezető érték használata tulajdonság

  • Tartományértékek importálása Excel-fájlból.

Az Érték tábla egyetlen tartomány tudásbázisához hozzáadott tudást jelenít meg. Ezt a tartományt a bal oldali panel tartománylistájában választhatja ki. A mező oszlopai a következők:

  • Az Érték oszlop megjeleníti azokat az értékeket, amelyeket a felderítési folyamat hozzáadott a kijelölt tartományhoz az adatminta egyik mezőjéből. A hibaként előre jelzett értékek szinonimájaként jelenik meg egy helyesnek vetített értéknek.

  • A Gyakoriság oszlop a tartomány által leképezett mintaadatbázis-mezőben lévő érték példányainak számát jeleníti meg. Összetett tartomány esetén csak azok az értékek jelennek meg, amelyek gyakorisága 20-nál nagyobb vagy egyenlő. A gyakorisági adatok azért érhetők el, mert a tudásfelderítési folyamat továbbra is kapcsolódik a mintaadatbázishoz. A gyakorisági adatok nem érhetők el a Tartománykezelés képernyő Tartományértékek lapján található tartománytáblában, mert a tartománykezelési folyamat nem kapcsolódik a mintaadatbázishoz.

  • A Típus oszlop megjeleníti az érték állapotát a felderítési folyamat által meghatározott módon. A zöld ellenőrzés azt jelzi, hogy az érték helyes vagy korrigált; a piros kereszt azt jelzi, hogy az érték hibás; és egy felkiáltójellel ellátott narancssárga háromszög azt jelzi, hogy az érték érvénytelen. Az érvénytelen értékek nem felelnek meg a tartomány adatkövetelményeinek. A hibás érték érvényes lehet, de adat okokból nem a megfelelő érték.

  • A Helyesen oszlop azt a helyes értéket mutatja, amelyre az eredeti hibásként vagy érvénytelenként megjelölt érték módosulni fog. A DQS a felderítési folyamat eredményeként javasolhatja a megfelelő értéket.

A felderítési eredmények kezelése az alábbiak szerint:

  1. A bal oldali Tartományok listája panelen válasszon ki egy tartományt a tartomány értékének beállításához. A megjelenített értékek módosításához az alábbiakat teheti meg.

    • A táblázatban az eredményeket az állapotuk szerint jelenítheti meg, ha kiválasztja az állapotot a Szűrő listában.

    • Keresse meg azokat az adatokat, amelyeket ellenőrizni vagy módosítani szeretne. Ehhez írjon be még egy betűt a Keresés szövegmezőbe. Ez kiemeli azokat a betűket, bárhol is forduljanak elő a megjelenített értékekben.

    • Kattintson a Csak új megjelenítése elemre, ha a táblában megjelenített értékeket csak az aktuális munkamenetben felderített értékekre szeretné korlátozni, az előző munkamenetekben nem.

    • Az Az összes kibontása gombra kattintva megjelenítheti a szinonimák bármely csoportjának összes értékét, ha az aktuális állapot összecsukva van, vagy a Az összes összecsukása gombbal elrejtheti az összes kezdőértéket a szinonimák bármelyik csoportjában az aktuális állapot kibontásakor.

    • Kattintson a Tartományértékek változási előzménypanel gombra egy előnézeti felugró ablak megjelenítéséhez az értéktábla alján, ami a tartományértékek gyűjteményének legutóbbi módosításait mutatja.

  2. Az Data Quality Services által javasolt javításokat a Szűrő beállításának Hibaopciójára történő módosításával találhatja meg. Ellenőrizze, hogy az érték valóban hibás-e, és hogy a Helyesen oszlop értéke megfelelő-e.

  3. Állítsa be a szűrőt a összes értékre, majd ellenőrizze, hogy az értékek állapota megfelelő-e. Egy érték állapotának módosításához jelölje ki az értéket, majd kattintson a Kijelölt tartományértékek javítottként beállítása (pipás) gombra, a kijelölt tartományértékek hibának beállítása (kereszt) gombra, vagy a kijelölt tartományértékek érvénytelenként beállítása (háromszög) gombra.

  4. Egy érték állapotának módosításához kövesse az alábbi lépéseket:

    1. Kijelölt tartományértékek beállítása javítottként: Ha egy érték állapotát Hiba vagy Érvénytelen értékről helyesre szeretné módosítani, jelölje ki az értéket, majd kattintson a A kijelölt tartományértékek beállítása javítottként (ellenőrzés) elemre az ikonsáv lefelé mutató nyílából vagy a Típus legördülő listából. Ha a hiba vagy az érvénytelen érték helyes értékkel van csoportosítva, törölje az értéket a művelet után.

    2. Kijelölt tartományértékek beállítása hibaként: Ha egy érték állapotát Helyes vagy Érvénytelen értékről Hiba értékre szeretné módosítani, jelölje ki az értéket, majd kattintson a A kijelölt tartományértékek beállítása hibaként (kereszt) ikonra az ikonsáv lefelé mutató nyilából vagy a Típus legördülő listából. Beírhat egy javítást a Helyes oszlopba, vagy üresen hagyhatja.

    3. A kijelölt tartományértékek beállítása érvénytelen: Ha egy érték állapotát helyes vagy hibás értékről érvénytelenre szeretné módosítani, jelölje ki az értéket, majd kattintson a A kijelölt tartományértékek beállítása érvénytelenként (háromszög) ikonra az ikonsáv lefelé mutató nyilából vagy a Típus legördülő listából. Beírhat egy javítást a Helyes oszlopba, vagy üresen hagyhatja.

    4. Javítás: Hibás vagy érvénytelen érték megadása után írjon be egy új értéket a Javítva oszlopba. A DQS hozzáad egy új sort a csereértékhez, helyesként jelöli meg, majd csoportosítja a két értéket. Az új érték bevezető értékként jelenik meg, a kezdőérték félkövér, a hiba vagy érvénytelen érték pedig behúzással.

  5. Ha szinonimák csoportjának szeretné kijelölni az értékeket, jelöljön ki több helyes értéket, majd folytassa a következő lépéseket:

    • Kijelölt tartományértékek beállítása szinonimákként: Ide kattintva szinonimákként állíthatja be a kijelölt értékeket. A DQS az egyik értéket jelöli meg vezető értékként, amellyel a többi érték lecserélődik.

      Jegyzet

      Ha kiválaszt két vagy több értéket egy csoportban, és egy másik értéket a csoporton kívül, majd szinonimákként állítja be őket, helytelen hibaüzenet jelenik meg. A hibaüzenet előugró ablakának bezárása után az értékek helyesen lesznek konfigurálva szinonimákként.

    • A kijelölt szinonimák közötti kapcsolat megszakadása: Kattintson ide a szinonimák megjelölésének visszavonásához.

    • A kijelölt tartomány értékét állítsa be a csoport első értékének: Módosítsa a csoport kezdőértékét úgy, hogy kijelöl egy olyan értéket a csoportban, amely nem az első érték, majd kattintson a A kijelölt tartomány értékének beállítása a csoport első értékének beállítása gombra.

  6. Speller: Ha engedélyezte a Helyesírás-ellenőrzőt a Tartomány tulajdonságai oldalon, keresse meg azokat az értékeket, amelyek hullámos piros aláhúzásjellel rendelkeznek, mivel ez jelzi, hogy a Helyesírás-ellenőrző javítást javasol. Kattintson a jobb gombbal az aláhúzással rendelkező értékre, és válasszon egy javítást, ha van ilyen. Az értéktípus hibává válik (vagy marad), és a javítás hozzáadódik a Helyes oszlophoz. Kattintson a lefelé mutató nyílra a további javasolt javítások megtekintéséhez. Adjon meg egy helyesbítést manuálisan, hogy hozzáadhassa a Speller szótárhoz, és kiválaszthassa azt javításként. További információért lásd: A DQS-helyesírás-ellenőrző használata és Tartománytulajdonságok beállítása.

    Jegyzet

    A Helyesírás-ellenőrző használatához engedélyezheti a Tartománytulajdonságok lapon, vagy ha a Tartomány tulajdonságai lapon le van tiltva, a Adatfelderítési eredmények kezelése lapon a Helyesírás-ellenőrző engedélyezése/letiltása ikonra kattintva engedélyezheti ezen a lapon.

  7. Új tartományérték hozzáadása: Új érték hozzáadása a tartományhoz az Új tartományérték hozzáadása gombra kattintva adhat hozzá egy sort a táblázat végén. Az érték megadása után a sor betűrendben lesz áthelyezve.

  8. Tartományértékek importálása az Excel: Új értékek hozzáadása egy Excel táblázatból az Értékek importálása ikon melletti lefelé mutató nyílra kattintva, majd a Tartományértékek importálása az Excelbőllehetőséget választva. Adja meg a fájl nevét, válassza Az első sor használata fejlécként, ha szükséges, majd kattintson OKgombra. További információ: Értékek importálása Excel-fájlból tartományba.

  9. Projektértékek importálása: Új értékek hozzáadása adatminőségi projektből az Értékek importálása ikon lefelé mutató nyílra kattintva, majd a Projektértékek importálásalehetőséget választva. Adja meg a fájl nevét, válassza Az első sor használata fejlécként, ha szükséges, majd kattintson OKgombra. Jelölje ki azt a projektet, amelyből értékeket szeretne importálni, majd kattintson OKgombra. Az importált értékek megjelennek. Kattintson a Befejezésgombra. További információ: Projektértékek importálása tartományba.

  10. Kijelölt tartományérték(ek) törlése: Távolítsa el egy vagy több meglévő értéket a tartományból az értékek kiválasztásával, majd kattintson a Kijelölt tartományérték(ek) törlése gombra. A DQS_NULL bejegyzése nem törölhető, ezért ha több törölni kívánt értéket választ, és a DQS_NULL egyik bejegyzése, a művelet sikertelen lesz.

  11. Kattintson a Befejezés gombra a tudásfelderítési tevékenység lezárásához. Egy előugró ablak jelenik meg, ha nem tekintette át az egyes tartományokat. Kattintson a Igen gombra a felülvizsgálat folytatásához, vagy a Nem gombra a továbblépéshez. Ha a Nem gombra kattint, egy másik előugró ablak jelenik meg, amely lehetővé teszi a következőket:

    1. Közzététel: A tudásbázis közzétéve lesz az aktuális felhasználó vagy mások számára. A tudásbázis nem lesz zárolva, a tudásbázis állapota (a tudásbázistáblában) üresre lesz állítva, és a tartománykezelési és a tudásfelderítési tevékenységek is elérhetők lesznek. Önt visszairányítják a kezdőlapra. A folyamat befejezéséhez kattintson az előugró ablak Igen gombra.

    2. Nincs: A munka mentésre kerül, a tudásbázis továbbra is zárolva marad, és a tudásbázis állapota Munka alatt lesz állítva. A tartománykezelési és a tudásfelderítési tevékenységek is elérhetők lesznek. Önt visszairányítják a kezdőlapra.

    3. Mégse: Az előugró ablak bezárul, és a Tartományérték kezelése lapon fog maradni.

  12. A következőkre is kattinthat:

    • megszakításával leállítja a Tudásfelderítési tevékenységet, elveszíti a munkáját, és visszatér a DQS kezdőlapjára.

    • Bezárás a DQS kezdőlapjára való visszatéréshez a munka mentése közben. A tudásbázis Ön számára zárolva lesz, és a tudásbázis állapota a Tudásbázis megnyitása képernyő tábláján Discovery – Value Managementlesz.

    • Kattintson a Vissza gombra a Felfedezés lapra való visszatéréshez. Miután a Bezárásgombra kattintott, a tartománykezelési tevékenység végrehajtásához a Tudásbázis megnyitása képernyőn a Tudásbázis-felderítés elemre kell kattintania, lépjen a Tudásbázis kezelése: Tartományfeltételek kezelése képernyőre, kattintson a Befejezéselemre, majd kattintson a tudásbázis közzétételéhez Igen vagy Nincs gombra a munka tudásbázisba mentéséhez és a kilépéshez.

Nyomon követés: A tudásfelderítés végrehajtása után

Miután a számítógéppel támogatott tudásfelderítési folyamat során tudást adott hozzá a tudásbázishoz, azonnal használhatja a tudásbázist egy tisztítási projekthez, vagy elvégezheti a tartománykezelést a tisztítás előtt. További információ az adattisztításról vagy a tartomány kezeléséről a következő részekben található: Adattisztítás vagy Tartomány kezelése.

A helyes, a hiba és az érvénytelen értékek jelentése

A Tartományértékek lap Érték táblázatának minden egyes értéke Helyes , Hibavagy érvénytelen típus beállításhoz van rendelve. Az érték típusát kezdetben a tudásfelderítési tevékenység határozza meg, és úgy változtathatja meg, ahogy jónak látja. A végleges típust a felderítés és az interaktív módosítások alapján a tisztítási tevékenység hozza létre. Ezek a beállítások a következő jelentéssel rendelkeznek:

  • Helyes: Ez egy olyan érték, amely a tartományhoz tartozik, és nem tartalmaz szintaxishibákat. Például a Város tartományban a "Chicago" helyes.

  • hiba: Ez egy olyan érték, amely a tartományhoz tartozik, de helytelen érték. Például a városok tartományában a "Shicago" helyett "Chicago" szerepel, ami hibának számít. A DQS kijelöl egy értéket hibásként, amikor szintaxishibát észlel, és ezzel kapcsolatos javításokat fedez fel a felderítési folyamat során. A szintaxishibák közé tartoznak a helyesírási hibák.

  • Érvénytelen: Ez az érték nem tartozik a tartományhoz, és nem rendelkezik javítással. Egy Város tartományban például az "12345" érték érvénytelen. A DQS érvénytelenként jelöl meg egy értéket, ha egy tartományszabály meghiúsul.

Az érték típusát manuálisan is módosíthatja a két másik érték egyikére. A DQS nem kényszeríti ki az érvényességet és a hibaszemantikát a manuális műveletekhez. Érvénytelen érték helyesbítését az állapot módosítása nélkül is megadhatja. Egy értéket akkor is érvénytelenként jelölhet meg, ha nem hiúsult meg egy tartományszabály. Akkor is megadhat egy értéket hibaként, ha a felderítési folyamat nem jelezte, hogy szintaxishiba történt. Az állapot módosítása nélkül is eltávolíthat egy hibaértéket, amely helyesként van megjelölve.

Ha interaktív adattisztítást végez a Eredmények kezelése és megtekintése oldalon a Tisztítás tevékenységen belül, az érvénytelen és a hibás értékek egyaránt szerepelnek a Érvénytelen lapon a Eredmények kezelése és megtekintése oldalon.

A megfelelő értékek megjelenítése

A megjelenítést az alábbiak szerint módosíthatja:

  • Szűrje a táblázatban található eredményeket az állapotuk alapján, úgy hogy kiválasztja a kívánt állapotot a Szűrő legördülő listából.

  • A ellenőrizni vagy módosítani kívánt adatok megkeresése az Keresés szövegmezőben további betűk beírásával. Ez kiemeli azokat a betűket, bárhol is forduljanak elő a megjelenített értékekben.

  • Kattintson a Csak új megjelenítése elemre, ha a táblában megjelenített értékeket csak az aktuális munkamenetben felderített értékekre szeretné korlátozni, az előző munkamenetekben nem.

  • Kattintson az Az összes kibontása gombra az összes szinonimacsoport összes értékének megjelenítéséhez, amikor az aktuális állapot összecsukva van.

  • Kattintson az Az összes összecsukása gombra, hogy elrejtse az összeset, kivéve a vezető értéket bármely szinonimacsoportban, amikor az aktuális állapot ki van bontva.

  • Kattintson a Tartományértékek változási előzménypanel gombra egy előnézeti felugró ablak megjelenítéséhez az értéktábla alján, ami a tartományértékek gyűjteményének legutóbbi módosításait mutatja.

Profiler-statisztikák

A Profiler lapon olyan statisztikák találhatók, amelyek a forrásadatok minőségét jelzik. Ezek a statisztikák nem mérik a tudásbázis minőségét. A tudásfelderítésben végzett profilkészítés betekintést nyújt a teljességbe és az egyediségbe. A tudásfelderítési profilkészítés nem méri a pontosságot. A tudáskezelés profilkészítése segít felmérni, hogy az adatforrás milyen mértékben hasznos a tudásbázisban lévő tudás kiépítéséhez és fejlesztéséhez.

A Profiler lap a felderítési folyamat alábbi statisztikáit tartalmazza mező és tartomány szerint:

  • Rekordok: Hány rekordot észleltek az adatmintában

  • Összes érték: Hány összes érték található az egyes mezőkhöz és összesen

  • Új értékek: Az egyes mezők és az összes megfeleltetett mező összesített értékeinek száma az utolsó felderítési folyamat óta új volt, és az összes érték százalékos aránya

  • Egyedi értékek: Az egyes mezők és az összes megfeleltetett mező összesített értékeinek száma egyedi volt, és a teljes értékek százalékos aránya

  • Új egyedi értékek: Az egyes mezők és az összes megfeleltetett mező egyedi értékeinek száma az utolsó felderítési folyamat óta új volt, és az összes érték százalékos aránya

  • Érvényes tartományértékek: Az egyes mezők és az összes megfeleltetett mező összesített értékeinek száma, valamint a teljes értékek százalékos aránya

A mezőstatisztikák a következőket tartalmazzák:

  • Mező: A forrásadatbázis mezőjének neve

  • tartomány: A mezőre leképelő tartomány neve

  • Új: Az új értékek száma és az új értékek százalékos aránya a mező meglévő értékeihez képest

  • Egyedi: A mező egyedi rekordjainak száma és százalékos aránya

  • Érvényes tartomány: Az érvényes tartományértékek száma és az összeg százalékos aránya

  • Teljesség: Az egyezési feladathoz hozzárendelt forrásmezők teljessége.

A tudásfelderítési profilkészítés betekintést nyújt a teljességbe. Ha a profilkészítés azt jelzi, hogy egy mező viszonylag hiányos, érdemes lehet eltávolítani egy adatminőségi projekt tudásbázisából. Előfordulhat, hogy a profilkészítés nem nyújt megbízható teljességi statisztikákat az összetett tartományokhoz. Ha teljességi statisztikákra van szüksége, összetett tartományok helyett használjon önálló tartományokat. Ha összetett tartományokat szeretne használni, érdemes lehet létrehozni egy tudásbázist egyetlen tartománnyal a profilkészítéshez, a teljesség megállapításához, és egy másik, összetett tartományt tartalmazó tartományt létrehozni a tisztítási folyamathoz. A profilkészítés például 95% teljességet mutathat az összetett tartományt használó címrekordok esetében, de az egyik oszlopnál, például egy irányítószámoszlopnál sokkal nagyobb a hiányosság szintje. Ebben a példában érdemes lehet az irányítószám oszlop teljességét egyetlen tartománnyal mérni. A profilkészítés valószínűleg megbízható pontossági statisztikákat biztosít az összetett tartományokhoz, mivel több oszlop pontosságát együtt mérheti. Az adatok értéke az összetett aggregációban található, ezért érdemes lehet a pontosságot egy összetett tartománnyal mérni.

A statisztikák a Profiler lapon a következő fázisokban jelennek meg:

  • A Rekordok előfeldolgozása fázisban a DQS betölti az adatokat, és indexeli azokat. Ez rekordról rekordra vagy kötegről kötegre történik, így a haladás rekordok alapján jeleníthető meg. A lépés végrehajtása során a profilkészítési adatok többsége létrehozható, kivéve Érvényes tartomány értékeket.

  • A Futó tartomány szabályok fázisában az Érvényes tartomány oszlop kitöltésre kerül, ahogy a tartományszabályok minden egyes tartományérték atomi egységeként végrehajtásra kerülnek.

  • A Felderítés futtatása fázisban a Profiler lapon nem frissülnek új adatok. A felmerülő szintaxishibák a varázsló következő lépésében, a Tartományértékek kezelése fázisban láthatók.

A tudásfelderítési tevékenységhez a következő feltételek eredményeznek értesítéseket:

  • Nincsenek új értékek a mezőben; javasoljuk, hogy távolítsa el azt a leképezésből.

  • Kevés új érték van egy mezőben; előfordulhat, hogy ki szeretné hagyni a leképezésből.

  • Egy mező üres; javasoljuk, hogy távolítsa el a leképezésből.

  • A mező teljességi pontszáma nagyon alacsony; előfordulhat, hogy ki szeretné zárni a leképezésből.

  • Egy mező összes értéke érvénytelen; ellenőriznie kell a megfeleltetést és a tartományszabályoknak a mező tartalmára való relevanciáját.

  • A mezőben alacsony az érvényes értékek szintje; ellenőriznie kell a megfeleltetést és a tartományszabályoknak a mező tartalmára való relevanciáját.

További információkért a profilkészítésről, lásd: Adatprofilozás és értesítések a DQS-ben.