Poznámka:
Přístup k této stránce vyžaduje autorizaci. Můžete se zkusit přihlásit nebo změnit adresáře.
Přístup k této stránce vyžaduje autorizaci. Můžete zkusit změnit adresáře.
platí pro:SQL Server
Důležitý
Služba DQS (Data Quality Services) se odebere v SQL Serveru 2025 (17.x). Stále podporujeme DQS v SQL Serveru 2022 (16.x) a starších verzích.
Toto téma popisuje, jak vyčistit data pomocí znalostí od referenčních poskytovatelů dat. I když všechny kroky provedení aktivity čištění zůstávají stejné pro čištění dat pomocí znalostí od poskytovatelů referenčních dat, jak je vysvětleno v tématu Čištění dat pomocí interních znalostí, toto téma poskytuje informace specifické pro čištění dat pomocí referenční datové služby ve službách kvality dat (DQS).
Důležitý
Tento článek uvádí referenční datové služby třetích stran, které byly dříve k dispozici na webu Azure DataMarket. DataMarket a datové služby ( včetně údajů o adresách Melissa, například – byly ukončeny po 31. 12. 2016. V důsledku toho už nemůžete spouštět příklady v tomto článku se zadanými službami z DataMarketu. Stále můžete používat referenční datové služby, které jsou k dispozici přímo online od externích poskytovatelů referenčních dat.
Když použijete funkci referenční datové služby v DQS k vyčištění dat, proces čištění DQS odešle mapované hodnoty domény referenčnímu poskytovateli datových služeb jako dávkový požadavek. Referenční datová služba odpoví následujícími informacemi:
Navrhovaná oprava
Důvěrnost
Další informace o mapované doméně Referenční data mohou také standardizovat, analyzovat nebo rozšířit zdroj dalšími daty. Tyto informace jsou uvedeny v dalších polích v odpovědi.
Po získání odpovědi z referenční datové služby dochází v DQS během aktivity čištění k následujícímu:
Na základě hodnot prahové hodnoty automatické opravy a minimální spolehlivosti , které byly zadány při mapování domén s referenční datovou službou, se hodnoty domén automaticky opravují nebo navrhují na základě úrovně spolehlivosti.
Poznámka
Prahové hodnoty, které zadáte při mapování domény na referenční datovou službu, se použijí při čištění dat pomocí znalostí v referenční datové službě, nikoli těch, které jsou zadané na kartě Obecné nastavení v části Konfigurace. Informace o zadání prahových hodnot pro čištění referenčních dat naleznete v kroku 9 v Připojit doménu nebo složenou doménu k referenčním datům.
Hodnoty domény jsou rozdělené do následujících kategorií: Navrhované, Nové, Neplatné, Opravenoa Správné.
Ke zdroji se připojí další data a informace jsou k dispozici spolu s vyčištěnými daty pro export.
Než začnete
Požadavky
Musíte mít namapované požadované domény ve znalostní bázi DQS na příslušnou referenční datovou službu. Znalostní báze navíc musí obsahovat znalosti o typu dat, která chcete vyčistit. Pokud například chcete vyčistit zdrojová data obsahující adresy USA, musíte své domény namapovat na referenčního poskytovatele datových služeb, který poskytuje vysoce kvalitní data pro adresy USA. Další informace najdete v tématu Připojení domény nebo složené domény k referenčním datům.
Zabezpečení
Dovolení
K čištění dat musíte mít v databázi DQS_MAIN roli dqs_kb_editor nebo dqs_kb_operator.
Vyčištění dat pomocí znalostí referenčních dat
Budeme pokračovat ve stejném příkladu použití domén, které jsme namapovali v předchozím tématu, Připojit doménu nebo složenou doménu k referenčním datům, se službou Melissa Data service v Azure Marketplace. Teď použijeme stejné domény k vyčištění některých ukázkových adres v USA. Postup čištění dat je stejný jako je popsáno v Čištění dat pomocí interní znalosti DQS. Upozorníme vás však, kdykoli to bude během procesu potřeba.
Vytvořte projekt kvality dat a vyberte aktivitu Čištění. Viz Vytvoření projektu kvality dat.
Na stránce mapa mapujte následující 4 domény s odpovídajícími sloupci ve zdrojových datech: Adresní řádek, Město, Státa PSČ. Klikněte na Další.
Poznámka
Protože jste namapovali všechny 4 domény v rámci složené domény ověření adresy, čištění dat se teď provede na úrovni složené domény, a nikoli na úrovni jednotlivých domén.
Na stránce Čištění spusťte proces čištění s asistencí počítače kliknutím na Spustit. Po dokončení procesu čištění klikněte na Další.
Poznámka
Na stránce Čištění zobrazí DQS informace o doménách připojených k referenční datové službě následujícími dvěma způsoby:
- Pod tlačítkem Start se zobrazí zpráva: Domény <Domain1>, <Domain2>,... <DomainN> jsou vyčištěny pomocí poskytovatele referenčních datových služeb. V tomto příkladu se zobrazí následující zpráva: "Ověření adresy domény je vyčištěno pomocí poskytovatele referenčních datových služeb".
- Ikona,
, se zobrazí v oblasti Profiler vůči doménám připojeným k referenčnímu poskytovateli datových služeb. V tomto příkladu se ikona zobrazí v rámci složené domény pro Ověření adresy.
Na stránce Spravovat a zobrazit výsledky zkontrolujte hodnoty domény. Referenční datová služba může zobrazit více než jeden návrh, pokud je k dispozici, pro hodnotu v závislosti na maximálním počtu návrhů zadaných v poli Navrhované kandidáty během mapování domény na referenční datovou službu. Například pro následující adresu USA se zobrazí dva návrhy:
původní hodnota :
Řádek adresy Město Stát ZIP 1 msft cesta Redmond 98052 navrhované hodnoty:
Řádek adresy Město Stát ZIP 1 Microsoft Way Redmond WA 98052 P. O. Box 1 Redmond WA 98073
Poznámka
U složených domén DQS také zvýrazní jednotlivé domény v jiné barvě, které byly opraveny během procesu čištění s asistencí počítače. V tomto případě byly například opraveny domény adresní řádek a stát , a proto jsou zvýrazněny azurovou barvou.
Po dokončení kontroly všech hodnot domény klikněte na Další a exportujte data.
Na stránce Export si všimnete, že kromě běžných informací o čisticí aktivitě pro každou doménu (zdroj, důvod, spolehlivost a stav) poskytuje služba Melissa Data další informace o datech vaší adresy, jako je zeměpisná šířka a délka vaší adresy, název okresu, typ adresy (highrise, ulice atd.), a tak dále.
Exportujte data do požadovaného cíle (SQL Server, CSV nebo Excel) a kliknutím na Dokončit zavřete projekt.
Důležitý
Pokud používáte 64bitovou verzi aplikace Excel, nemůžete data vyčištěná do excelového souboru exportovat; můžete exportovat pouze do databáze SQL Serveru nebo do .csv souboru.