このタスクでは、 重複サプライヤーの削除 照合ポリシーをテストして発行します。
[ 照合結果 ] ページで、[ 開始 ] をクリックしてポリシー全体をテストします。 この場合、ポリシーにはルールしかないため、ルールとポリシーをテストした結果は同じである必要があります。
リスト ボックスで、一致したすべてのレコードとその一致するスコアを確認します。 緑アイコンが関連付けられているレコードは、その前にあるピボット レコードの複製です。 いくつかの例を次に示します。
レコード ID: 1000005 のレコードは、レコード ID: 1000004のレコードとスコア: 100%で一致しています。理由は、両方のレコードがSupplierID (前提条件)、仕入先名、およびContactEmailAddress 列に同じ値を持っているためです。 DQS は、クラスターのピボット レコードとしてレコードをランダムに選択します。
レコード 1000023 は、レコード 1000022 と一致するスコア (93%) の一致です。これは、2 つのレコードが SupplierID (前提条件) 列と 仕入先名 列に同じ値を持ち、 ContactEmailAddress 列の値が異なるためです。
一覧の一番下までスクロールすると、レコード ID を持つ 2 つのレコード ( 1000051 と 1000052) が表示されます。 レコード 1000052は、2 つのレコードが SupplierID 列と ContactEmailAddress 列で同じ値を持ち、仕入先名列の値が異なるため、スコア 91 %が一致する一致と見なされます。
一致したレコード (緑色のアイコン付き) を右クリックし、[ 詳細の表示 ] をクリックすると、各フィールド スコアの全体的な一致スコアへの貢献など、一致に関する詳細が表示されます。
[ 閉じる ] をクリックして、[ 照合スコアの詳細 ] ダイアログ ボックスを閉じます。
ページの下部にある [ 照合結果 ] タブをクリックします。 このタブには、一致するレコードの数、一致しないレコードの数、一致したレコードを持つクラスターの数、平均クラスター サイズ、最小クラスター サイズ、最大クラスター サイズなどの詳細が表示されます。 詳細については 、「照合ポリシーの作成 」を参照してください。 このアクティビティから結果をエクスポートすることはできません。 サンプル データを使用してルールとポリシーをサンプル データに対してテストすることで、照合ポリシーを定義するだけです。
[ 完了] をクリックして、照合ポリシーの作成を完了します。
注
ここで照合ポリシーを定義しました。そのため、結果を出力ファイルにエクスポートすることはできません。 基本的には、サンプル入力ファイルを使用し、ルールを作成し、ポリシーを定義することを目的として、サンプル データに対してルールとポリシーをテストしました。
[SQL Server Data Quality Services] ダイアログ ボックスで、[ 発行 ] をクリックし、メッセージ ボックスで [OK] を クリックします。 これで、定義した照合ポリシーが Suppliers ナレッジ ベースに発行されます。 ナレッジ ベースを使用して、入力ファイルに対して照合プロセスを実行し、重複を識別および削除できます。