Jegyzet
Az oldalhoz való hozzáférés engedélyezést igényel. Próbálhatod be jelentkezni vagy könyvtárat váltani.
Az oldalhoz való hozzáférés engedélyezést igényel. Megpróbálhatod a könyvtár váltását.
A következőkre vonatkozik:SQL Server
Fontos
Az adatminőségi szolgáltatások (DQS) törlődnek az SQL Server 2025-ben (17.x). Továbbra is támogatjuk a DQS-t az SQL Server 2022 (16.x) és korábbi verzióiban.
Ez a témakör azt ismerteti, hogyan tisztíthatja meg az adatokat egy adatminőségi projekt használatával a Data Quality Servicesben (DQS). Az adattisztítás a forrásadatokon egy olyan tudásbázis használatával történik, amely a DQS-ben egy kiváló minőségű adatkészleten alapul. További információ: Tudásbázis létrehozása.
Az adattisztítás négy fázisban történik: egy leképezési szakasz, amelyben azonosítja a megtisztítandó adatforrást, és megfelelteti azt egy tudásbázis szükséges tartományaihoz, egy számítógéppel támogatott tisztítási szakaszba, ahol a DQS a megtisztítandó adatokra alkalmazza a tudásbázist, és javaslatot tesz/módosít a forrásadatokon, egy interaktív tisztítási szakasz, ahol az adatgondnokok elemezhetik az adatváltozásokat, elfogadhatják/elutasíthatják az adatmódosításokat, végül pedig az exportálási szakaszt, amely lehetővé teszi a megtisztított adatok exportálását. Ezek a folyamatok a tisztítási tevékenység varázslójának egy külön lapján lesznek végrehajtva, lehetővé téve, hogy oda-vissza haladjon a különböző oldalakra, újrafuttassa a folyamatot, és bezárjon egy adott tisztítási folyamatot, majd térjen vissza a folyamat ugyanazon szakaszába. A DQS statisztikát nyújt a forrásadatokról és a tisztítási eredményekről, amelyek lehetővé teszik, hogy megalapozott döntéseket hozzon az adattisztításról.
Mielőtt hozzákezdene
Előfeltételek
A tisztítási tevékenységhez meg kell adnia a megfelelő küszöbértékeket. Erről további információt a Küszöbértékek beállítása a tisztításhoz és az összerendeléshezcímű témakörben talál.
A DQS-tudásbázisnak elérhetőnek kell lennie azon az adatminőségi kiszolgálón, amelyhez viszonyítani szeretné, és megtisztítani a forrásadatokat. Emellett a tudásbázisnak tartalmaznia kell a megtisztítani kívánt adatok típusával kapcsolatos ismereteket. Ha például az USA-címeket tartalmazó forrásadatokat szeretné megtisztítani, rendelkeznie kell egy tudásbázissal, amely egy "kiváló minőségű" mintaadatok alapján lett létrehozva az USA-címekhez.
A Microsoft Excelt telepíteni kell az adatminőségi ügyfélszámítógépre, ha a megtisztítandó forrásadatok Egy Excel-fájlban vannak. Ellenkező esetben nem tudja kiválasztani az Excel-fájlt a leképezési szakaszban. A Microsoft Excel által létrehozott fájlok .xlsx, .xlsvagy .csvkiterjesztéssel is rendelkezhetnek. Ha az Excel 64 bites verzióját használja, csak az Excel 2003-fájlok (.xls) támogatottak; Az Excel 2007- vagy 2010-fájlok (.xlsx) nem támogatottak. Ha az Excel 2007 vagy 2010 64 bites verzióját használja, mentse a fájlt .xls fájlként vagy .csv fájlként, vagy telepítse helyette az Excel 32 bites verzióját.
Biztonság
Engedélyek
A DQS_MAIN adatbázis dqs_kb_editor vagy dqs_kb_operator szerepkörével kell rendelkezni az adattisztítás elvégzéséhez.
Tisztítási adatminőségi projekt létrehozása
Adattisztítási művelet végrehajtásához adatminőségi projektet kell használnia. Tisztítási adatminőségi projekt létrehozása:
Kövesse az 1–3. lépést a Adatminőségi projekt létrehozásacímű témakörben.
A 3.d lépésben válassza ki a tisztítási tevékenységet.
Kattintson létrehozása gombra az adatminőség-tisztítási projekt létrehozásához.
Ezzel létrehoz egy adatminőség-tisztítási projektet, és megnyitja a Térkép lapját az adatminőség-tisztítási varázslóban.
Leképezési szakasz
A leképezési szakaszban meg kell adnia a megtisztítandó forrásadatokhoz való kapcsolatot, és leképezheti a forrásadatok oszlopait a kiválasztott tudásbázis megfelelő tartományaival.
A tisztítási adatminőségi varázsló Térkép lapján válassza ki a megtisztítandó forrásadatokat: SQL Server vagy Excel-fájl:
SQL Server: Válassza a forrásadatbázisként DQS_STAGING_DATA lehetőséget, ha a forrásadatokat ebbe az adatbázisba másolta, majd válassza ki a forrásadatokat tartalmazó megfelelő táblát/nézetet. Ellenkező esetben válassza ki a forrásadatbázist és a megfelelő táblát/nézetet. A forrásadatbázisnak ugyanabban az SQL Server-példányban kell lennie, mint az Adatminőség-kiszolgálónak, hogy elérhető legyen a Adatbázis legördülő listában.
Excel-fájl: Kattintson a Tallózáselemre, és válassza ki a megtisztítandó adatokat tartalmazó Excel-fájlt. Az Excel-fájl kiválasztásához a Microsoft Excelt telepíteni kell az adatminőségi ügyfélszámítógépre. Ellenkező esetben a Tallózás gomb nem érhető el, és a szövegmező alatt értesítést kap arról, hogy a Microsoft Excel nincs telepítve. Ha az Excel-fájl első sora fejlécadatokat tartalmaz, hagyja kijelölve a Az első sor használata fejlécként jelölőnégyzetet.
A Leképezésekterületen képezheti le a forrásadatok adatoszlopait a tudásbázis megfelelő tartományaival. Ehhez válasszon ki egy forrásoszlopot a Forrásoszlop oszlop legördülő listájából, majd válasszon ki egy tartományt a Tartomány oszlop legördülő listájából ugyanabban a sorban. Ismételje meg ezt a lépést a forrásadatok összes oszlopának megfeleltetéséhez a tudásbázis megfelelő tartományaival. Ha szükséges, a oszlop-leképezés hozzáadása ikonra kattintva sorokat adhat hozzá a leképezési táblához.
Jegyzet
A forrásadatokat csak akkor képezheti le egy DQS-tartományra adattisztítás céljából, ha a forrásadattípus támogatott a DQS-ben, és megfelel a DQS-tartomány adattípusának. A támogatott forrásadattípusokról további információért lásd: A DQS-tartományok támogatott SQL Server- és SSIS-adattípusai.
Kattintson az Adatforrás előnézete ikonra a kijelölt SQL Server-táblázatban vagy nézetben, illetve a kijelölt Excel-munkalapon lévő adatok megtekintéséhez.
Kattintson Az összetett tartományok megtekintése/kijelölése elemre a forrásoszlopra leképezett összetett tartományok listájának megtekintéséhez. Ez a gomb csak akkor érhető el, ha legalább egy összetett tartományt leképez egy forrásoszlopra.
Kattintson a Tovább gombra a számítógéppel támogatott tisztítási szakasz (Tisztítás oldal) lépéséhez.
Computer-Assisted tisztítási szakasz
A számítógéppel támogatott tisztítási szakaszban egy automatizált adattisztítási folyamatot futtat, amely elemzi a forrásadatokat a tudásbázis leképezett tartományaihoz, és adatmódosításokat hajt végre/javasol.
Az adatminőségi varázsló Tisztítás lapján kattintson a indítása gombra a számítógéppel támogatott tisztítási folyamat futtatásához. A DQS fejlett algoritmusokat és megbízhatósági szinteket használ a megadott küszöbértékek alapján, hogy elemezze az adatokat a kiválasztott tudásbázisban, majd megtisztítsa azokat. A számítógéppel segített tisztítás DQS-ben történő működéséről részletes információkat a Számítógéppel segített tisztítás témakörben talál a Adattisztításalatt.
Fontos
Az adatelemzés befejezése után a Start gomb egy Újraindítás gombtá válik. Ha az előző elemzés eredményei még nem lettek mentve, a Újraindítás gombra kattintva elvesznek a korábbi adatok. Mivel az elemzés fut, ne hagyja el az oldalt, vagy az elemzési folyamat leáll.
Ha a tisztítási projekthez használt tudásbázist a tisztítási projekt létrehozása után frissítették és közzétették, a Start gombra kattintva megkérdezi, hogy a legújabb tudásbázist használja-e a tisztításhoz. Ez általában akkor fordulhat elő, ha egy tudásbázis használatával létrehozott egy adatminőségi projektet, félúton bezárta a tisztítási projektet a bezárása gombra kattintva, majd egy későbbi időpontban újra megnyitotta az adatminőségi projektet a tisztítás elvégzéséhez. Addig is frissítettük és közzétettük a tisztítási projektben használt tudásbázist.
Hasonlóképpen, ha a tisztítási projekthez használt tudásbázist a számítógéppel támogatott tisztítás utolsó futtatása után frissítették és közzétették, a Újraindítás gombra kattintva megkérdezi, hogy a legújabb tudásbázist használja-e a tisztításhoz.
Mindkét esetben kattintson az Igen gombra a számítógéppel támogatott tisztítás frissített tudásbázisának használatához. Ezenkívül ha ütközések merülnek fel az aktuális leképezések és a frissített tudásbázis között (például a tartományokat törölték vagy a tartomány adattípusát módosították), az üzenet arra kéri, hogy javítsa ki az aktuális leképezéseket a frissített tudásbázis használatához. Az Igen gombra kattintva a Térkép oldalra lép, ahol kijavíthatja a leképezéseket, mielőtt folytatná a számítógéppel támogatott tisztítást.
A számítógéppel támogatott tisztítási fázisban a profilkészítő bekapcsolásához kattintson a Profiler fülre a valós idejű adatprofilozás és -értesítések megtekintéséhez. További információ: Profiler Statistics.
Ha nem elégedett az eredményekkel, kattintson a Vissza gombra a Térkép lapra való visszalépéshez, szükség szerint módosítsa egy vagy több leképezést, térjen vissza a Tisztítás lapra, majd kattintson a Újraindításgombra.
A számítógéppel támogatott tisztítási folyamat befejezése után kattintson a Következő gombra az interaktív tisztítási szakasz (Eredmények kezelése és megtekintése lap) folytatásához.
Interaktív tisztítási szakasz
Az interaktív tisztítási szakaszban láthatja a DQS által javasolt módosításokat, és a módosítások jóváhagyásával vagy elutasításával eldöntheti, hogy végrehajtja-e őket. A Eredmények kezelése és megtekintése lap bal oldali ablaktábláján a DQS megjeleníti a leképezési szakaszban korábban leképezett tartományok listáját, valamint a forrásadatokban az egyes tartományokhoz a számítógéppel támogatott tisztítási szakasz során elemzett értékek számát. A Az eredmények kezelése és megtekintése lap jobb oldali ablaktábláján a tartományi szabályok, a szintaxishibák szabályainak és a speciális algoritmusoknak megfelelően a DQS öt lapra kategorizálja az adatokat a megbízhatósági szinthasználatával. A megbízhatósági szint a DQS bizonyosságának mértékét jelzi a korrekcióhoz vagy javaslathoz, és a következő küszöbértékeken alapul:
automatikus javítás küszöbértéke: A DQS automatikusan kijavítja azokat az értékeket, amelyek megbízhatósági szintje meghaladja ezt a küszöbértéket. Az adatgondnok azonban felülírhatja a módosítást az interaktív tisztítás során. Az automatikus javítás küszöbértékét a Konfiguráció képernyő Általános beállítások lapján adhatja meg. További információért lásd: Küszöbértékek beállítása tisztításhoz és illesztéshez.
automatikus javaslat küszöbértéke: Minden olyan érték, amelynek megbízhatósági szintje meghaladja ezt a küszöbértéket, de az automatikus javítás küszöbértéke alatt van, helyettesítő értékként javasolt. A DQS csak akkor módosítja a módosítást, ha az adatgondnok jóváhagyja. Az automatikus javaslat küszöbértékét az Általános beállítások lapon adhatja meg a Konfiguráció képernyőn. További információért lásd: Küszöbértékek beállítása tisztításhoz és illesztéshez.
Egyéb: Az automatikus javaslat küszöbértéke alatti értékeket a DQS változatlanul hagyja.
A megbízhatósági szint alapján az értékek az alábbi öt lapon jelennek meg:
| Tabulátor | Leírás |
|---|---|
| javasolt | Megjeleníti azokat a tartományértékeket, amelyeknél a DQS azokat a javasolt értékeket találta, amelyek megbízhatósági szintje magasabb az automatikus javaslati küszöbértéknél értéknél, de alacsonyabb az automatikus javítási küszöbértéknél értéknél. A javasolt értékek a Javítás célja oszlopban jelennek meg az eredeti értékkel szemben. A Jóváhagyás vagy Elutasítás oszlopban található rádiógombra kattintva a felső táblázat egyik értékéhez tartozó összes példány javaslatát elfogadhatja vagy elutasíthatja. Ebben az esetben az elfogadott érték a Javított lapra kerül, az elutasított érték pedig a Érvénytelen lapra kerül. |
| Új | Megjeleníti azt az érvényes tartományt, amelyhez a DQS nem rendelkezik elegendő információval, ezért nem rendelhető más laphoz. Ezenkívül ez a lap olyan értékeket is tartalmaz, amelyek megbízhatósági szintje alacsonyabb, mint az automatikus javaslat küszöbértéke érték, de elég magas ahhoz, hogy érvényesként legyen megjelölve. Ha úgy gondolja, hogy az érték helyes, kattintson a választógombra a Jóváhagyás oszlopban. Ha nem, kattintson a Elvetés oszlopban lévő választógombra. Az elfogadott érték a Helyes lapra kerül, az elutasított érték pedig a Érvénytelen lapra kerül. Manuálisan is beírhatja a helyes értéket az eredeti érték helyettesítőjeként a Helyesen oszlopban az értékhez, majd a módosítás elfogadásához kattintson a Jóváhagyás oszlopban lévő választógombra. Ebben az esetben az érték a Javított lapra kerül. |
| Érvénytelen | Megjeleníti azokat a tartományértékeket, amelyek érvénytelenként lettek megjelölve a tudásbázis tartományában, vagy olyan értékeket, amelyek nem feleltek meg egy tartományszabálynak. Ez a lap olyan értékeket is tartalmaz, amelyeket a felhasználó elutasított a másik négy lap bármelyikében. Ha azonban úgy gondolja, hogy az érték helyes, kattintson a választógombra a Jóváhagyás oszlopban. Az elfogadott érték a Helyes lapra kerül. Manuálisan is beírhatja a helyes értéket az eredeti érték helyére a Helyesítés oszlopban az értékhez, majd a módosítás elfogadásához jelölje ki a választógombot a Jóváhagyás oszlopban. Ebben az esetben az érték a Javított lapra kerül. |
| javított | Megjeleníti az automatikus tisztítási folyamat során a DQS által kijavított tartományértékeket, mivel a DQS az automatikus javítás küszöbértéke feletti megbízhatósági szinttel javította az értéket. A javított értékek a Helyes érték oszlopban jelennek meg az eredeti értékhez képest. Az értékhez tartozó választógomb a Jóváhagyás oszlopban alapértelmezés szerint van kiválasztva. Ha szükséges, a javasolt javítás elvetéséhez kattintson a elvetése oszlopban lévő választógombra az Érvénytelen lapra való áthelyezéshez, vagy írja be manuálisan a helyes értéket a Helyes oszlopba, majd kattintson a Jóváhagyás oszlopban lévő választógombra a módosítás elfogadásához. és helyezze át a Javított lapra. |
| Helyes | A helyesen talált tartományértékeket jeleníti meg. Az érték például egy tartományértéknek felelt meg. Ez a lap olyan értékeket is tartalmaz, amelyeket a felhasználó a Jóváhagyás oszlopban lévő választógombra kattintással hagyott jóvá a Új és Érvénytelen füleken. Alapértelmezés szerint a Jóváhagyó oszlop választógombja van kiválasztva az egyes értékekhez. Ha azonban úgy véli, hogy a fül egyik értéke helytelen, akkor a Elvetés oszlopban lévő választógombra kattintva áthelyezheti az értéket a Érvénytelen fülre, vagy a megfelelő értéket kézzel beírva a Helyesítendő oszlopban az érték helyett, majd kattintson a Jóváhagyás oszlopban lévő választógombra a módosítás elfogadásához, és így az érték a Javított fülre kerül. |
Az adatok interaktív megtisztítása:
Az eredmények kezelése és megtekintése lapján a tisztítási adatminőség varázslóban kattintson a bal oldali panelen egy tartománynévre.
Tekintse át a tartomány értékeit az öt lap alatt, és a korábban ismertetett módon hajtsa végre a megfelelő műveletet.
A jobb felső panel a következő információkat jeleníti meg a kijelölt tartomány egyes értékeiről: eredeti érték, példányok száma (rekordok), egy másik (helyes) érték megadására szolgáló mező, a megbízhatósági szint (a Helyes lapon lévő értékekhez nem érhető el), az érték DQS-műveletének oka, valamint az értékre vonatkozó javítások és javaslatok jóváhagyásának és elutasításának lehetősége.
Borravaló
A jobb felső panelen a kijelölt tartomány összes értékének jóváhagyásához vagy elutasításához kattintson a Az összes kifejezés jóváhagyása vagy Az összes kifejezés elvetése ikonra kattintva. Másik lehetőségként kattintson a jobb gombbal a kijelölt tartomány egyik értékére, és kattintson a Az összes elfogadása vagy A helyi menü összes elvetése parancsára.
Az alsó panel a jobb felső panelen kijelölt tartományérték egyedi előfordulásait jeleníti meg. A következő információk jelennek meg: egy másik (helyes) érték megadására szolgáló mező, a megbízhatósági szint (a Helyes lapon szereplő értékekhez nem érhető el), az érték DQS-műveletének oka, az értékre vonatkozó javítások és javaslatok jóváhagyása és elutasítása, valamint az eredeti érték.
Ha a létrehozásakor engedélyezte a Speller funkciót egy tartományhoz, a rendszer hullámos piros aláhúzásjeleket jelenít meg a lehetséges hibaként azonosított tartományértékeken. Az aláhúzásjel az egész értékhez megjelenik. Ha például a "New York" helytelenül "Neu York"-ként van beírva, a helyesírás-ellenőrző piros aláhúzásjelet jelenít meg a "Neu York" alatt, és nem csak a "Neu" szöveget. Ha a jobb gombbal az értékre kattint, megjelennek a javasolt javítások. Ha 5-nél több javaslat van, a helyi menüben a További javaslatok elemre kattintva megtekintheti a többit. Hibamegjelenítéshez hasonlóan a javaslatok a teljes érték pótlására szolgálnak. A "New York" például javaslatként jelenik meg az előző példában, és nem csak az "Új". Kiválaszthatja az egyik javaslatot, vagy hozzáadhat egy értéket az adott értékhez megjelenítendő szótárhoz. Az értékek a szótárban, felhasználói fiók szintjén vannak tárolva. Amikor kiválaszt egy javaslatot a helyesírás-ellenőrző helyi menüjéből, a kiválasztott javaslat a Javítva oszlopba kerül. Ha azonban a Helyes oszlopban jelöl ki egy javaslatot, az oszlopban lévő érték helyébe a kijelölt javaslat lép.
A helyesírás-ellenőrző funkció alapértelmezés szerint engedélyezve van az interaktív tisztítási szakaszban. Az interaktív tisztítási szakaszban letilthatja a helyesírás-ellenőrzőt, ha a Helyesírás-ellenőrző engedélyezése/letiltása ikonra kattint, vagy ha a jobb gombbal kattint a tartományértékek területére, majd a helyi menüben a Helyesírás-ellenőrző parancsra kattint. Ha újra engedélyezni szeretné, tegye ugyanezt.
Jegyzet
A helyesírás-ellenőrző funkció csak a felső panelen érhető el (tartományértékek). Ezenkívül nem engedélyezheti vagy tilthatja le a helyesírás-ellenőrzőt összetett tartományokhoz. Az összetett tartomány gyermektartományai, amelyek sztring típusúak és engedélyezettek a helyesírás-ellenőrző funkcióra, az interaktív tisztítási szakaszban alapértelmezés szerint engedélyezett helyesírás-ellenőrzéssel fognak rendelkezni.
Az interaktív tisztítási szakaszban a profilkészítő bekapcsolásához kattintson a Profiler fülre a valós idejű adatprofilozás és -értesítések megtekintéséhez. További információ: Profiler Statistics.
Miután áttekintette az összes tartományértéket, kattintson a Tovább gombra az exportálási szakasz folytatásához.
Exportálási szakasz
Az exportálási szakaszban meg kell adnia a megtisztított adatok exportálásának paramétereit: mit és hol kell exportálni.
A tisztítási adatminőségi varázsló Exportálás lapján válassza ki a megtisztított adatok exportálásának céltípusát: SQL Server, CSV-fájlvagy Excel-fájl.
Fontos
Ha az Excel 64 bites verzióját használja, a megtisztított adatokat nem exportálhatja Excel-fájlba; csak SQL Server-adatbázisba vagy .csv fájlba exportálhat.
SQL Server: Jelölje ki a DQS_STAGING_DATA céladatbázisként, ha ide szeretné exportálni az adatokat, majd adja meg az exportált adatok tárolásához létrehozandó táblanevet. Ellenkező esetben válasszon egy másik adatbázist, ha adatokat szeretne exportálni egy másik adatbázisba, majd adjon meg egy táblanevet, amely az exportált adatok tárolásához jön létre. A céladatbázisnak ugyanabban az SQL Server-példányban kell lennie, mint a Data Quality Servernek, hogy elérhető legyen a Adatbázis legördülő listában.
CSV-fájl: Kattintson a Tallózáselemre, és adja meg annak a .csv fájlnak a nevét és helyét, ahová exportálni szeretné a megtisztított adatokat. Beírhatja a .csv fájl nevét is, valamint a megtisztított adatok exportálásának teljes elérési útját. Például: "c:\ExportedData.csv". A fájl azon a számítógépen lesz mentve, amelyen az adatminőségi kiszolgáló telepítve van.
Excel-fájl: Kattintson a Tallózáselemre, és adja meg annak az Excel-fájlnak a nevét és helyét, ahová exportálni szeretné a megtisztított adatokat. Az Excel-fájl nevét is beírhatja a megtisztított adatok exportálásának teljes elérési útjával együtt. Például: "c:\ExportedData.xlsx". A fájl azon a számítógépen lesz mentve, amelyen az adatminőségi kiszolgáló telepítve van.
Jelölje be a A kimenet szabványosítása jelölőnégyzetet, ha a tartományhoz kiválasztott kimeneti formátum alapján szeretné szabványosítani a kimenetet. Például módosítsa a sztring értékét teljesen nagybetűsre, vagy csak a szó első betűjét tegye nagybetűssé. A tartomány kimeneti formátumának megadásáról szóló információkért lásd a Kimenet formázása listát a Tartománytulajdonságok beállítása-ban.
Ezután válassza ki az adatkimenetet: exportálja csak a megtisztított adatokat, vagy exportálja a megtisztított adatokat a tisztítási adatokkal együtt.
Csak adatok: A választógombra kattintva exportálhatja csak a megtisztított adatokat.
Adatok és tisztítási adatok: A választógombra kattintva exportálhatja a következő adatokat az egyes tartományokhoz:
<Tartomány>_Source: A tartomány eredeti értéke.
<tartomány>_Output: A tartomány megtisztított értékei.
<Domain>_Reason: Az érték javításának oka.
<Domain>_Bizalom: A kijavított kifejezések megbízhatósági szintje. A függvény a megfelelő százalékértéknek megfelelő decimális értékként jelenik meg. Például a 95% megbízhatósági szintje .9500000 értékként jelenik meg.
<Tartomány>_Status: A tartomány értékének állapota az adattisztítás után. Például Javasolt, Új, Érvénytelen, Javítottvagy Helyes.
Rekord állapota: A (<Tartománynév>_Status) összes leképezett tartományhoz tartozó állapotmezőn kívül az Rekord állapota mező megjeleníti a rekord állapotát. Ha a rekord tartományának bármelyik állapota Új vagy Helyes, akkor a rekord állapotaHelyesértékre van állítva. Ha a rekordban a tartomány állapotának bármelyike Javasolt, Érvénytelen, vagy Javított, a rekord állapota a megfelelő értékre állítódik. Ha például a rekord tartományának bármelyik állapota Javasolt, akkor a Rekord állapotaJavasoltértékre van állítva.
Jegyzet
Ha referenciaadat-szolgáltatást használ a tisztítási művelethez, a tartomány értékével kapcsolatos további adatok is elérhetők az exportáláshoz. További információért lásd: Adatok megtisztítása referenciaadatok (külső) használatával.
Kattintson a Exportálás elemre az adatok kijelölt célhelyre való exportálásához. Ha a következőt választotta:
SQL Server adatcélként egy új tábla jön létre a megadott névvel a kijelölt adatbázisban.
CSV-fájl adatcélként egy .csv fájl jön létre az adatminőség-kiszolgáló számítógépének azon a helyén, ahol a CSV-fájl névmezőben korábban megadott fájlnév szerepel.
Excel-fájl adatcélként egy Excel-fájl létrejön azon a helyen az Adatminőség-kiszolgáló számítógépén, ahol a Excel-fájlnév mezőben korábban megadott fájlnév található.
Kattintson Befejezés gombra az adatminőségi projekt bezárásához.
Profiler-statisztikák
A Profiler lap a forrásadatok minőségét jelző statisztikákat tartalmaz. A profilkészítés segít felmérni az adattisztítási tevékenység hatékonyságát, és meghatározhatja, hogy az adattisztítás milyen mértékben tudta javítani az adatok minőségét.
A Profiler lap a forrásadatok következő statisztikáit tartalmazza mező és tartomány szerint:
Rekordok: Az adatminta rekordjainak elemzése az adattisztítási tevékenységhez
Helyes rekordok: Hány rekordot talált helyesnek
Javított rekordok: Hány rekord lett kijavítva
Javasolt rekordok: Hány rekord javasolt
Érvénytelen rekordok: Hány rekord érvénytelen volt
A mezőstatisztikák a következőket tartalmazzák:
mező: A mező neve a forrásadatokban
tartomány: A mezőre leképelő tartomány neve
Javított értékek: A kijavított tartományértékek száma
Javasolt értékek: A javasolt tartományértékek száma
Teljesség: A tisztítási tevékenységhez hozzárendelt összes forrásmező teljessége
Pontossági: A tisztítási tevékenységhez leképezett forrásmezők pontossága
A DQS-profilkészítés két adatminőségi dimenziót biztosít: teljesség (az adatok rendelkezésre állásának mértéke) és pontossági (az adatok rendeltetésszerű felhasználásának mértéke). Ha a profilkészítés azt jelzi, hogy egy mező viszonylag hiányos, érdemes lehet eltávolítani egy adatminőségi projekt tudásbázisából. Előfordulhat, hogy a profilkészítés nem nyújt megbízható teljességi statisztikákat az összetett tartományokhoz. Ha teljességi statisztikákra van szüksége, összetett tartományok helyett használjon önálló tartományokat. Ha összetett tartományokat szeretne használni, érdemes lehet létrehozni egy tudásbázist egyetlen tartománnyal a profilkészítéshez, a teljesség megállapításához, és egy másik, összetett tartományt tartalmazó tartományt létrehozni a tisztítási folyamathoz. Például a profilalkotás 95% teljességet mutathat a címrekordok esetében, amelyek összetett tartományokat használnak, de az egyik oszlopnál, például egy irányítószám oszlopnál, sokkal nagyobb lehet a hiányosság szintje. Ebben a példában érdemes lehet az irányítószám oszlop teljességét egyetlen tartománnyal mérni. A profilkészítés valószínűleg megbízható pontossági statisztikákat biztosít az összetett tartományokhoz, mivel több oszlop pontosságát együtt mérheti. Az adatok értéke az összetett aggregációban található, ezért érdemes lehet a pontosságot egy összetett tartománnyal mérni.
A pontossági statisztikák valószínűleg több értelmezést igényelnek, ha nem használ referenciaadat-szolgáltatást. Ha referenciaadat-szolgáltatást használ az adattisztításhoz, akkor megbízhatósági szintű pontossági statisztikákat fog kapni. További információ a referenciaadat-szolgáltatással végzett adattisztításról: Adatok megtisztítása referenciaadatokkal (külső) tudás.
Tisztítási értesítések
A következő feltételek értesítéseket eredményeznek:
Nincsenek javítások vagy javaslatok egy mezőhöz. Érdemes lehet eltávolítani a leképezésből, először a tudásfelderítést futtatni, vagy egy másik tudásbázist használni.
Egy mezőhöz viszonylag kevés javítás vagy javaslat van. Érdemes lehet eltávolítani a leképezésből, először a tudásfelderítést futtatni, vagy egy másik tudásbázist használni.
A mező pontossági szintje nagyon alacsony. Érdemes lehet ellenőrizni a leképezést, vagy érdemes lehet először futtatni a tudásfelderítést.
További információért a profilozásról lásd: Adatprofilozás és értesítések a DQS.