次の方法で共有


タスク 2: 照合ポリシーのテストと発行

このタスクでは、 重複サプライヤーの削除 照合ポリシーをテストして発行します。

  1. [ 照合結果 ] ページで、[ 開始 ] をクリックしてポリシー全体をテストします。 この場合、ポリシーにはルールしかないため、ルールとポリシーをテストした結果は同じである必要があります。

  2. リスト ボックスで、一致したすべてのレコードとその一致するスコアを確認します。 アイコンが関連付けられているレコードは、その前にあるピボット レコードの複製です。 いくつかの例を次に示します。

    1. レコード ID: 1000005 のレコードは、レコード ID: 1000004のレコードとスコア: 100%で一致しています。理由は、両方のレコードがSupplierID (前提条件)仕入先名、およびContactEmailAddress 列に同じ値を持っているためです。 DQS は、クラスターのピボット レコードとしてレコードをランダムに選択します。

    2. レコード 1000023 は、レコード 1000022 と一致するスコア (93%) の一致です。これは、2 つのレコードが SupplierID (前提条件) 列と 仕入先名 列に同じ値を持ち、 ContactEmailAddress 列の値が異なるためです。

    3. 一覧の一番下までスクロールすると、レコード ID を持つ 2 つのレコード ( 10000511000052) が表示されます。 レコード 1000052は、2 つのレコードが SupplierID 列と ContactEmailAddress 列で同じ値を持ち、仕入先名列の値が異なるため、スコア 91 %が一致する一致と見なされます。

    ポリシー定義 - ポリシー結果

  3. 一致したレコード (緑色のアイコン付き) を右クリックし、[ 詳細の表示 ] をクリックすると、各フィールド スコアの全体的な一致スコアへの貢献など、一致に関する詳細が表示されます。

    照合スコアの詳細ダイアログ ボックス

  4. [ 閉じる ] をクリックして、[ 照合スコアの詳細 ] ダイアログ ボックスを閉じます。

  5. ページの下部にある [ 照合結果 ] タブをクリックします。 このタブには、一致するレコードの数、一致しないレコードの数、一致したレコードを持つクラスターの数、平均クラスター サイズ、最小クラスター サイズ、最大クラスター サイズなどの詳細が表示されます。 詳細については 、「照合ポリシーの作成 」を参照してください。 このアクティビティから結果をエクスポートすることはできません。 サンプル データを使用してルールとポリシーをサンプル データに対してテストすることで、照合ポリシーを定義するだけです。

    [照合結果] タブ

  6. [ 完了] をクリックして、照合ポリシーの作成を完了します。

    ここで照合ポリシーを定義しました。そのため、結果を出力ファイルにエクスポートすることはできません。 基本的には、サンプル入力ファイルを使用し、ルールを作成し、ポリシーを定義することを目的として、サンプル データに対してルールとポリシーをテストしました。

  7. [SQL Server Data Quality Services] ダイアログ ボックスで、[ 発行 ] をクリックし、メッセージ ボックスで [OK] を クリックします。 これで、定義した照合ポリシーが Suppliers ナレッジ ベースに発行されます。 ナレッジ ベースを使用して、入力ファイルに対して照合プロセスを実行し、重複を識別および削除できます。

次の手順

タスク 3: 照合用のデータ品質プロジェクトの作成と実行