Anfügen einer Domäne oder zusammengesetzten Domäne an Referenzdaten – Data Quality Services (DQS)

Gilt für: SQL Server (alle unterstützten Versionen)

In diesem Thema wird beschrieben, wie Sie Domänen/zusammengesetzte Domänen in einer Datenqualität Wissensdatenbank einem Referenzdatendienst in Azure Marketplace anfügen, um Wissen gegen die qualitativ hochwertigen Referenzdaten zu erstellen. Jeder Verweisdatendienst enthält ein Schema (Datenspalten). Nachdem eine Domäne oder eine Verbunddomäne an einen Verweisdatendienst angefügt wurde, müssen Sie die angefügte Domäne bzw. die einzelnen Domänen innerhalb der Verbunddomäne den entsprechenden Spalten im Schema des Verweisdatendiensts zuordnen. Indem eine Verbunddomäne an einen Verweisdatendienst angefügt wird, haben Sie die Möglichkeit, nur eine Domäne an einen Verweisdatendienst anzufügen. Daraufhin können Sie den entsprechenden Spalten im Schema des Verweisdatendiensts die einzelnen Domänen innerhalb der Verbunddomäne zuordnen.

Wichtig

In diesem Artikel werden Referenzdatendienste von Drittanbietern erwähnt, die zuvor in Azure DataMarket verfügbar waren. DataMarket und Data Services – einschließlich z.B. Melissa-Adressdaten – wurden am 31.12.2016 eingestellt. Daher können Sie die Beispiele in diesem Artikel nicht mehr mit den angegebenen Diensten von DataMarket ausführen. Sie können weiterhin Referenzdatendienste nutzen, die von externen Referenzdatenanbietern direkt online angeboten werden.

Warnung

Die an einen Verweisdatendienst angefügte Verbunddomäne ist in der Domänen-Dropdownliste verfügbar, während Domänen den Spalten in Schema des Verweisdatendiensts zugeordnet werden. Ordnen Sie die Verbunddomäne keiner Spalte im Schema des Verweisdatendiensts zu; Sie dürfen den entsprechenden Spalten im Schema des Verweisdatendiensts nur einzelne Domänen innerhalb einer Verbunddomäne zuordnen. Andernfalls tritt ein Fehler auf.

Das Schema eines Verweisdatendiensts kann über eine erforderliche Spalte verfügen, die mit der entsprechenden Domäne zugeordnet werden muss, wenn Sie einen Verweisdatendienst verwenden möchten. Die erforderliche Spalte in einem Verweisdatenschema wird mit einem „(M)“ im Spaltennamen gekennzeichnet. So ist AddressLine beispielsweise die erforderliche Schemaspalte in Melissa Data (Adressdaten), und CompanyName ist die erforderliche Schemaspalte in Digital Trowel Inc. (US-Unternehmen und professionelle Daten für SQL-Benutzer).

In diesem Thema erstellen wir vier Domänen: Adresszeile, Ort, Bundesland und PLZ, unter einer Verbunddomäne, Adressüberprüfung, fügen die Verbunddomäne an den Verweisdatendienst Melissa Data (Adressüberprüfung) an und ordnen die einzelnen Domänen innerhalb der Verbunddomäne anschließend den entsprechenden Spalten im Schema des Verweisdatendiensts zu.

Vorbereitungen

Voraussetzungen

Sie müssen Data Quality Services (DQS) für die Verwendung von Referenzdatendiensten konfiguriert haben. Siehe Konfigurieren von DQS zum Verwenden von Verweisdaten.

Sicherheit

Berechtigungen

Sie müssen über die dqs_kb_editor-Rolle in der DQS_MAIN-Datenbank verfügen, um Domänen Verweisdaten zuzuordnen.

Zuordnen von Domänen zu Verweisdaten aus Melissa Data

  1. Starten Sie Data Quality Client. Informationen dazu finden Sie unter Ausführen der Data Quality-Client Anwendung.

  2. Klicken Sie im Data Quality-Client Startbildschirm unter Knowledge Base Management auf "Neue Wissensdatenbank".

  3. Geben Sie im Bildschirm Neue Wissensdatenbank einen Namen für die neue Wissensdatenbank ein, klicken Sie auf die Aktivität Domänenverwaltung , und klicken Sie auf Erstellen.

  4. Klicken Sie im Bildschirm Domänenverwaltung auf das Symbol Domäne erstellen , um eine Domäne zu erstellen. Erstellen Sie die folgenden vier Domänen: Adresszeile, Ort, Bundeslandund PLZ.

  5. Klicken Sie auf das Symbol Verbunddomäne erstellen , um eine Verbunddomäne zu erstellen. Geben Sie im Dialogfeld Verbunddomäne erstellen im Feld Name der Verbunddomäne den Text Adressenüberprüfung ein, und schließen Sie alle Domänen ein, die unter Schritt 3 in der Verbunddomäne erstellt wurden. Klicken Sie auf OK.

  6. Wählen Sie im Bereich Domäne auf der linken Seite die Verbunddomäne aus, indem Sie auf Adressenüberprüfungklicken, und klicken Sie dann auf der rechten Seite auf die Registerkarte Verweisdaten .

  7. Klicken Sie auf das Symbol Durchsuchen .

  8. Im Dialogfeld Onlinekatalog der Reference Data Service-Anbieter :

    1. Aktivieren Sie unter DataMarket Data Quality Services das Kontrollkästchen Melissa Data (Adressüberprüfung).

    2. Ordnen Sie die Spalten des Verweisdatendiensts Melissa Data (Adressüberprüfung) den entsprechenden Domänen (Adresszeile, Ort, Bundesland und PLZ) zu. Sie ordnen die Spalten zu, indem Sie in der Spalte RDS-Schema eine Verweisdatendienst-Spalte auswählen und dann die entsprechende Domäne in der Spalte Domäne auswählen. Um mehr Zeilen in der Tabelle hinzuzufügen, klicken Sie auf das Symbol Schemaeintrag hinzufügen .

    3. Klicken Sie auf OK , um die Änderungen zu speichern, und schließen Sie das Dialogfeld Onlinekatalog der Reference Data Service-Anbieter .

      Dialogfeld "

      Hinweis

      • Im Dialogfeld "Katalog für Onlinereferenzdatenanbieter" zeigt der Knoten "DataMarket Data Quality Services" alle Referenzdatendienstanbieter an, die Sie in Azure Marketplace abonniert haben. Wenn Sie in DQS direkte Drittanbieter von Online-Verweisdatendiensten konfiguriert haben, werden diese unter einem anderen Knoten mit der Bezeichnung Direkte Drittanbieter-Onlineanbieter angezeigt (zu diesem Zeitpunkt nicht verfügbar, da keine direkten Drittanbieter von Online-Verweisdatendiensten in DQS konfiguriert sind).
  9. Sie kehren zur Registerkarte "Referenzdaten" zurück. Ändern Sie im Bereich "Anbietereinstellungen " bei Bedarf Werte in den folgenden Feldern:

    • Schwellenwert für Autokorrektur: Korrekturen aus dem Verweisdatendienst mit einem Vertrauensgrad über den Schwellenwerten werden automatisch vorgenommen. Geben Sie einen Wert in der Dezimalnotation des entsprechenden Prozentwerts ein. Geben Sie beispielsweise 0,9 für 90 % ein.

    • Vorgeschlagene Kandidaten: Anzahl der vorgeschlagenen Kandidaten aus dem Verweisdatendienst, die angezeigt werden sollen.

    • Minimaler Vertrauensgrad: Vorschläge aus dem Verweisdatendienst mit einem Vertrauensgrad, der niedriger als dieser Wert ist, werden ignoriert. Geben Sie einen Wert in der Dezimalnotation des entsprechenden Prozentwerts ein. Geben Sie beispielsweise 0,6 für 60 % an.

  10. Klicken Sie auf Fertig stellen , um die Wissensdatenbank zu veröffentlichen. Eine Bestätigungsmeldung wird angezeigt, nachdem die Wissensdatenbank erfolgreich veröffentlicht wurde.

Sie können diese Wissensdatenbank jetzt für die Reinigungsaktivität in einem Datenqualitätsprojekt verwenden, um US-Adressen in Ihren Quelldaten basierend auf dem von Melissa Data über Azure Marketplace bereitgestellten Wissen zu standardisieren und zu bereinigen.

Nachverfolgung: Nach dem Zuordnen einer Domäne zu Verweisdaten

Erstellen Sie ein Data Quality-Projekt, und führen Sie die Bereinigungsaktivität für die Quelldaten aus, die US-Adressen enthalten, indem Sie diese mit der in diesem Thema erstellten Wissensdatenbank vergleichen. Siehe Bereinigen von Daten mithilfe von Referenzdaten (externes) Wissen.

Weitere Informationen

Reference Data Services in DQS
Data Cleansing