次の方法で共有


タスク 1: 照合ポリシーの定義

このタスクでは、1 つのルールを含む照合ポリシーを作成します。 ルールには、 サプライヤー ID という 1 つの前提条件があります。つまり、ルール内の他のドメインを使用する前に、サプライヤー ID が一致している必要があります。 このルールでは、他の 2 つのドメインが使用されます。類似度の値が 70% に設定された仕入先名、類似性の値が 30%に設定された連絡先電子メール

  1. DQS クライアントのメイン ページで、[仕入先] ナレッジ ベースの横にある右矢印をクリックし、[照合ポリシー] を選択します。

    メイン ページの [照合ポリシーメニュー]

  2. [マップ] ページ、[データ ソースExcel ファイル] を選択します。

  3. [ 参照] をクリックし、フィルターが Excel ブックに設定されていることを確認し、クレンジング アクティビティの実行後 にエクスポートしたクレンジング済みサプライヤー List.xls ファイルを選択します。

    このアクティビティは主に照合ポリシーの定義に重点を置いているため、このアクティビティの最後に結果をエクスポートすることはできません。 照合アクティビティのデータ品質プロジェクトを作成し、それを実行して、次のレッスンでこの照合ポリシーを使用して、仕入先一覧から重複を削除します。

  4. SupplierID 列を仕入先 ID ドメインにマップし、仕入先名列を仕入先名ドメインに、ContactEmailAddress 列を連絡先メール ドメインにマップします。 ソース列を、照合ポリシーの定義に使用するドメインにのみマップする必要があります。 この場合、一致するポリシー アクティビティで、仕入先 ID、仕入先名、連絡先メール ドメインを使用できるようにします。

    照合ポリシー定義プロセスのマップ ページ

  5. [ 次へ ] をクリックして、[ 照合ポリシー] ページに移動します。このページでは、1 つのルールを含む照合ポリシーを定義します。

  6. ツール バー の [一致するルールの作成 ] ボタンをクリックして、ポリシーにルールを作成します。

    [照合ルールの作成] ツール バー ボタン [

  7. 右側の [ルールの詳細] ウィンドウで、[ルール名] に「重複する仕入先の削除」と入力します。

  8. 右側のウィンドウのツール バーの [ 新しいドメイン要素の追加 ] をクリックします。

    ルールの詳細 - [新しいドメイン要素の追加] ボタン

  9. ドメイン[仕入先 ID] を選択し、[前提条件] チェック ボックスをオンにします。 類似性が自動的に [正確] に設定されていることに注意してください。 仕入先 ID を前提条件として設定すると、2 つのレコードのこのフィールドの値が 100% 一致を返す必要があることを指定します。それ以外の場合、レコードは一致と見なされず、ルール内の他の句は無視されます。

    重複サプライヤールール定義の

  10. ツール バーの [ 新しいドメイン要素の追加] をもう一度クリックします。

  11. [サプライヤー名] ドメインを選択し、[類似性] で [類似] を選択し、[重み] に「70」と入力します。 ここでは、仕入先名は同一である必要はありませんが、レコードが一致と見なされるために似ている可能性があることを指定します。 重みは、このフィールドのスコアが、全体的な一致スコアにどのように寄与するかを示します。

  12. 前の2つの手順を繰り返し、重み30を設定した連絡用メールドメインを追加します。

  13. 最小一致スコア80%に設定されていることに注意してください。これは、DQS 管理[構成] ページの [全般] タブに表示される値です。 このスコアは、ここでこのしきい値を超える値のみを増やすことができます。

  14. [重複クラスター] オプションが選択されていることに注意してください。 このオプションを使用すると、1 つのレコードを複数のクラスターに表示できます。 設定を [重複しないクラスター] に変更すると、共通のレコードを持つクラスターが 1 つのクラスターに結合されます。

  15. このページの [スタート ] ボタンを使用すると、ポリシー内の各ルールを個別にテストできます。一方、次のページの [スタート] ボタンを使用すると、ポリシー全体 (ポリシー内のすべてのルール) をテストできます。

  16. [ 次へ ] をクリックして、[ 照合結果 ] ページに切り替えます。

次の手順

タスク 2: 照合ポリシーのテストと発行