レッスン 1 では、仕入先ナレッジ ベースを構築し、それを使用してレッスン 2 のデータをクレンジングし、ツール DQS クライアントを使用してレッスン 3 のデータを照合しました。 実際のシナリオでは、DQS でサポートされていないソースからデータをプルする必要がある場合や、 DQS クライアント ツールを使用せずにクレンジングと照合プロセスを自動化する必要がある場合があります。 SQL Server Integration Services (SSIS) には、さまざまな異種ソースからのデータを統合するために使用できるコンポーネントと、DQS によって公開されるクレンジング機能を呼び出す DQS クレンジング変換 コンポーネントがあります。 現時点では、DQS は SSIS で使用する照合機能を公開していませんが、 あいまいグループ化変換 を使用してデータ内の重複を識別できます。
エンティティ ベースのステージング機能を使用して、MDS にデータをアップロードできます。 MDS でエンティティを作成すると、対応するステージング テーブルとストアド プロシージャが自動的に作成されます。 たとえば、Supplier エンティティを作成すると、 stg.supplier_Leaf テーブルと stg.udp_Supplier_Leaf ストアド プロシージャが自動的に作成されます。 ステージング テーブルとプロシージャを使用して、エンティティ メンバーを作成、更新、および削除します。 このレッスンでは、仕入先エンティティの新しいエンティティ メンバーを作成します。 MDS サーバーにデータを読み込むには、SSIS パッケージは、まずステージング テーブル stg.supplier_Leafにデータを読み込み、関連付けられているストアド プロシージャ stg.udp_Supplier_Leafをトリガーします。 詳細については、「 データのインポート 」を参照してください。
このレッスンでは、次のタスクを実行します。
MDS の仕入先データを削除します (前の 4 つのレッスンを終えた場合)。 このレッスンで作成した SSIS パッケージは、データを MDS に自動的にアップロードします。 前に、DQS クライアントを使用して、クレンジングされた一致したサプライヤー データを MDS サーバーに手動でアップロードしました。
Supplier エンティティにサブスクリプション ビューを作成して、エンティティ内のデータを他のアプリケーションに公開します。 このアクションにより、SQL Server Management Studio を使用して検証する SQL ビューが作成されます。 このバージョンのチュートリアルでは、このビューを使用しません。
SQL Server Data Tools を使用して SSIS プロジェクトを作成して実行します。 このプロジェクトでは 、データ クレンジング変換を 使用して、DQS サーバーにクレンジング要求を送信します。 DQS では一致する機能がまだ公開されていないため、 あいまいグループ化 変換を使用して重複を識別します。
マスター データ マネージャーを使用して、MDS にデータが作成されていることを確認します。
SSIS パッケージによって作成された DQS クレンジング プロジェクトの結果を確認し、必要に応じて対話型クレンジングを実行してナレッジ ベースをさらに構築します。