次の方法で共有


レッスン 5: SSIS を使用してクレンジングと照合を自動化する

DQS クライアント ツールを使用して、レッスン 1 では Suppliers ナレッジ ベースを構築し、レッスン 2 ではこれを使用してデータをクレンジングし、レッスン 3 ではデータを照合します。 実際のシナリオでは、DQS でサポートされていないソースからデータをプルする必要がある場合や、DQS クライアント ツールを使用しないでクレンジングおよび照合プロセスを自動化したい場合があります。 SQL Server Integration Services (SSIS) には、さまざまな異種データ ソースからのデータを統合するために使用できるコンポーネントと、DQS によって公開されるクレンジング機能を呼び出すための **DQS クレンジング変換コンポーネントがあります。 現在、DQS では、SSIS で使用できる照合機能が公開されていませんが、あいまいグループ化変換**を使用してデータの重複を特定できます。

MDS には、エンティティ ベースのステージング機能を使用してデータをアップロードできます。 MDS でエンティティを作成する場合、対応するステージング テーブルとストアド プロシージャが自動的に作成されます。 たとえば、Supplier エンティティを作成したときは、stg.supplier_Leaf テーブルおよび stg.udp_Supplier_Leaf ストアド プロシージャが自動的に作成されました。 ステージング テーブルとプロシージャを使用して、エンティティ メンバーを作成、更新、および削除できます。 このレッスンでは、Supplier エンティティの新しいエンティティ メンバーを作成します。 MDS サーバーにデータを読み込むには、最初に SSIS パッケージでデータをステージング テーブル stg.supplier_Leaf に読み込み、関連するストアド プロシージャ stg.udp_Supplier_Leaf をトリガーします。 詳細については、「データのインポート」を参照してください。

このレッスンでは、次のタスクを行います。

  1. MDS で仕入先データを削除します (前の 4 レッスンを終了している場合)。 このレッスンで作成する SSIS パッケージにより、MDS に自動的にデータがアップロードされます。 前の手順では、DQS クライアントを使用して MDS サーバーに手動でクレンジングした照合仕入先データをアップロードしました。

  2. 他のアプリケーションのエンティティでデータを公開するために、Supplier エンティティでサブスクリプション ビューを作成します。 この操作により、SQL ビューを作成します。このビューは SQL Server Management Studio を使用して検証します。 このバージョンのチュートリアルでは、このビューを使用しません。

  3. SQL Server データ ツールを使用して SSIS プロジェクトを作成および実行します。 プロジェクトでは、データ クレンジング変換を使用して、DQS サーバーにクレンジング要求を送信します。 DQS では照合機能を公開していないため、あいまいグループ化変換を使用して重複を特定します。

  4. マスター データ マネージャーを使用して、MDS にデータが作成されていることを確認します。

  5. SSIS パッケージによって作成された DQS クレンジング プロジェクトの結果を確認し、必要に応じてインタラクティブなクレンジングを実行して、ナレッジ ベースを拡充します。

次の手順

タスク 1 (前提条件): MDS の仕入先データを削除する