Freigeben über


Aufgabe 2: Testen und Veröffentlichen der Abgleichsrichtlinie

In dieser Aufgabe testen und veröffentlichen Sie die Abgleichsrichtlinie Remove Duplicate Suppliers.

  1. Klicken Sie auf der Seite Abgleichsergebnisse auf Starten, um die gesamte Richtlinie zu testen. In diesem Fall enthält die Richtlinie nur eine Regel, daher sollten die Testergebnisse für die Regel und die Richtlinie identisch sein.

  2. Prüfen Sie alle übereinstimmenden Datensätze und ihre Treffergenauigkeit im Listenfeld. Ein Datensatz mit einem grünen Symbol ist ein Duplikat des Pivotdatensatzes, der ihm vorausgeht. Hier einige Beispiele:

    1. Der Datensatz mit der Datensatz-ID: 1000005 ist eine Übereinstimmung des Datensatzes mit der Datensatz-ID: 1000004 mit einer Treffergenauigkeit von 100 %, weil beide Datensätze die gleichen Werte für die Spalten SupplierID (Voraussetzung), Supplier Name und ContactEmailAddress-Spalten enthalten. DQS wählt nach dem Zufallsprinzip einen Datensatz als Pivotdatensatz für einen Cluster aus.

    2. Der Datensatz 1000023 ist eine Übereinstimmung des Datensatzes 1000022 mit einer Treffergenauigkeit von 93 %, da die beiden Datensätze die gleichen Werte für die Spalten SupplierID (Voraussetzung) und Supplier Name enthalten, aber unterschiedliche Werte für die Spalte ContactEmailAddress.

    3. Führen Sie einen Bildlauf zum Ende der Liste durch, um zwei Datensätze mit folgenden Datensatz-IDs anzuzeigen: 1000051 und 1000052. Der Datensatz 1000052 gilt als Übereinstimmung mit einer Treffergenauigkeit von 91 %, da die beiden Datensätze den gleichen Wert für die Spalten SupplierID und ContactEmailAddress enthalten, aber unterschiedliche Werte für die Spalte Supplier Name.

    Richtliniendefinition – Richtlinienergebnisse

  3. Klicken Sie mit der rechten Maustaste auf einen übereinstimmenden Datensatz (mit grünem Symbol), und klicken Sie auf Details anzeigen, um weitere Einzelheiten zur Übereinstimmung, wie z. B. Anteil jedes Feldergebnisses an der Gesamttreffergenauigkeit, anzuzeigen.

    Details zur Treffergenauigkeit (Dialogfeld)

  4. Klicken Sie auf Schließen, um das Dialogfeld Details zur Treffergenauigkeit zu schließen.

  5. Klicken Sie am unteren Rand der Seite auf die Registerkarte Abgleichsergebnisse. Diese Registerkarte enthält Details wie die Anzahl der übereinstimmenden Datensätze, die Anzahl der nicht übereinstimmenden Datensätze, die Anzahl der Cluster mit übereinstimmenden Datensätzen, die durchschnittliche Clustergröße, die minimale Clustergröße und die maximale Clustergröße. Unter Erstellen einer Abgleichsrichtlinie finden Sie weitere Informationen. Sie können die Ergebnisse dieser Aktivität nicht exportieren. Sie definieren lediglich eine Abgleichsrichtlinie, indem Sie die Beispieldaten verwenden, um Regeln und die Richtlinie unter Verwendung der Beispieldaten zu testen.

    Registerkarte „Abgleichsergebnisse“

  6. Klicken Sie auf Fertig stellen, um die Erstellung der Abgleichsrichtlinie abzuschließen.

    HinweisHinweis

    Sie haben hier die Abgleichsrichtlinie definiert; deshalb können Sie die Ergebnisse nicht in eine Ausgabedatei exportieren. Sie haben im Wesentlichen eine Beispieleingabedatei verwendet, Regeln erstellt und die Regeln und die Richtlinie unter Verwendung der Beispieldaten getestet, mit dem Ziel, die Richtlinie zu definieren.

  7. Klicken Sie im Dialogfeld "SQL Server Data Quality Services" auf Veröffentlichen und dann im Meldungsfeld auf OK. Nun wird die von Ihnen definierte Abgleichsrichtlinie in der Wissensdatenbank Suppliers veröffentlicht. Sie können die Wissensdatenbank verwenden, um den Abgleichsprozess für eine Eingabedatei auszuführen, mit dem Ziel, Duplikate zu identifizieren und zu entfernen.

Nächster Schritt

Aufgabe 3: Erstellen und Ausführen eines Data Quality-Projekts für den Abgleich