Freigeben über


Lektion 5: Automatisieren der Bereinigung und des Abgleichs mithilfe von SSIS

In Lektion 1 haben Sie die Wissensbasis "Lieferanten" erstellt und zum Bereinigen von Daten in Lektion 2 und zum Abgleichen von Daten in Lektion 3 mithilfe des Tools DQS Client verwendet. In einem realen Szenario müssen Sie möglicherweise Daten aus einer Quelle abrufen, die DQS nicht unterstützt, oder Sie möchten den Bereinigungs- und Abgleichsprozess automatisieren, ohne das DQS-Clienttool verwenden zu müssen. SQL Server Integration Services (SSIS) verfügt über Komponenten, die Sie zum Integrieren von Daten aus verschiedenen heterogenen Quellen und einer DQS-Reinigungstransformationskomponente verwenden können, um die von DQS verfügbar gemachte Bereinigungsfunktionalität aufzurufen. Derzeit macht DQS für SSIS keine übereinstimmenden Funktionen verfügbar, Sie können jedoch die Fuzzy-Gruppierungstransformation verwenden, um Duplikate in den Daten zu identifizieren.

Sie können Daten mithilfe der Entitätsbasierten Stagingfunktion in MDS hochladen. Wenn Sie eine Entität in MDS erstellen, werden automatisch entsprechende Stagingtabellen und gespeicherte Prozeduren erstellt. Wenn Sie beispielsweise die Lieferantenentität erstellt haben, wurden die stg.supplier_Leaf Tabelle und die stg.udp_Supplier_Leaf gespeicherten Prozedur automatisch erstellt. Sie verwenden die Stagingtabellen und -verfahren zum Erstellen, Aktualisieren und Löschen von Entitätsmitgliedern. In dieser Lektion erstellen Sie neue Entitätsmitglieder für die Lieferantenentität. Zum Laden von Daten in den MDS-Server lädt das SSIS-Paket zuerst die Daten in die Stagingtabelle stg.supplier_Leaf und löst dann die zugeordnete gespeicherte Prozedur stg.udp_Supplier_Leaf aus. Weitere Details finden Sie unter "Daten importieren ".

In dieser Lektion führen Sie die folgenden Aufgaben aus:

  1. Entfernen Sie Lieferantendaten in MDS (wenn Sie die vorherigen vier Lektionen durchlaufen haben). Das in dieser Lektion erstellte SSIS-Paket lädt die Daten automatisch in MDS hoch. Zuvor haben Sie die bereinigten und übereinstimmenden Lieferantendaten manuell mithilfe des DQS-Clients auf DEN MDS-Server hochgeladen.

  2. Erstellen Sie eine Abonnementansicht für die Lieferantenentität, um Daten in der Entität für andere Anwendungen verfügbar zu machen. Diese Aktion erstellt eine SQL-Ansicht, die Sie mithilfe von SQL Server Management Studio überprüfen. Sie werden diese Ansicht in dieser Version des Tutorials nicht verwenden.

  3. Erstellen und Ausführen eines SSIS-Projekts mithilfe von SQL Server Data Tools. Das Projekt verwendet die Datenbereinigungstransformation , um eine Reinigungsanforderung an den DQS-Server zu senden. DQS macht die übereinstimmende Funktionalität noch nicht verfügbar, sodass Sie die Fuzzy Grouping-Transformation verwenden, um Duplikate zu identifizieren.

  4. Stellen Sie sicher, dass die Daten mithilfe von Master Data Manger in MDS erstellt werden.

  5. Überprüfen Sie die Ergebnisse des vom SSIS-Paket erstellten DQS-Reinigungsprojekts und führen Sie optional interaktive Reinigung durch, um die Wissensbasis weiter zu erstellen.

Nächster Schritt

Aufgabe 1 (Voraussetzung): Entfernen von Lieferantendaten in MDS