次の方法で共有


用語ベースのリレーションの作成

適用対象: SQL Server

このトピックでは、Data Quality Services (DQS) でドメインの用語ベースのリレーションを作成する方法について説明します。 用語ベースのリレーション (TBR) を使用して、ドメインの値の一部になっている用語を修正できます。 用語ベースのリレーションでは、共通する部分のスペルを除いても同一である複数の値は同一のシノニムと見なすことができます。 たとえば、"Inc." という用語を "Incorporated" に変更する用語ベースのリレーションを設定できます。 "Inc." という用語は、ドメイン内で出現するたびに変更されます。 "Contoso, Inc." のインスタンスは "Contoso, Incorporated" に変更され、2 つの値はまったく同じシノニムと見なされます。

用語ベースのリレーションを使用するには、"Inc." と "Incorporated"、または"Senior" と"Sr." などの Value/Correct To ペアの一覧を作成します。 用語ベースのリレーションを使用すると、個々のドメイン値をシノニムとして手動で設定しなくても、ドメイン全体で用語を変更できます。 以前にナレッジ検出で値が検出されていない場合でも値を修正することを指定できます。 用語ベースのリレーション変換により 2 つの値が同じになる場合、DQS ではそれらの用語間のシノニム リレーションシップ (ナレッジ検索)、それらの用語間の修正リレーションシップ (データ修正)、または完全一致 (照合) が作成されます。

用語ベースのリレーション変換と記号変換 (特殊文字をスペースまたは null で置き換える) はどちらも分析前の事前処理段階で実行されます。 複合ドメインの解析が要求された場合は、区切り記号の解析に記号が必要なため、2 つの変換の前にその解析が実行されます。 ドメイン ルールやドメイン値の変更などの他の操作は変換後に実行されます。 照合の場合、用語ベースのリレーションはクレンジングを実行するかどうかに関係なく照合アクティビティの前にソース データに適用されます。

用語ベースのリレーションとドメイン管理

ドメイン管理に用語ベースのリレーションを適用すると、DQS はナレッジ検出、クレンジング、または照合処理での変更を適用します。ただし、DQS は、用語ベースのリレーションに準拠するためにドメイン自体の値を変更することはありません。 つまり、 [ドメイン管理] ページの [用語ベースのリレーション] タブに用語ベースのリレーションを入力し、そのまま使用しても、同じページの [ドメイン値] タブには変更が適用されません。 これによって TBR を後から変更できます。

用語ベースのリレーションとデータ クリーニング

ドメインに用語ベースのリレーションを適用してから、データ クレンジング プロセスを実行すると、DQS はクレンジング中に変更を適用しますが、ナレッジ ベース内の用語には変更は適用されません。

  • 用語ベースのリレーションによって変更された値がドメイン内にあるがシノニムではない場合、その値は [結果の管理と表示] ページの [修正済み] タブの [次に修正] 列に、用語ベースのリレーションに設定された理由と共に表示されます。

  • 用語ベースのリレーションによって変更された値がドメイン内になく、DQS が一致する値を検出した場合、その値は修正され、信頼レベルに基づいて [修正済み] タブまたは [提案] タブに表示されます。 一致するものがない場合、値は TBR 修正と共に [新規] タブに表示されます。 TBR を修正しても、必ずしも値が正しいわけではないため、このように処理されます。

  • 用語ベースのリレーションによって変更された値がドメイン内にあるが、既存の修正によって [エラー] または [無効] の場合、その値は修正値と理由のドメイン値と共に [修正済み] タブに表示されます。

  • 用語ベースのリレーションによって変更された値がドメイン内にあるが、修正を伴わずに [エラー] または [無効] の場合、その値は理由のドメイン値と共に [無効] タブに表示されます。

用語ベースのリレーションとナレッジの検出

用語ベースのリレーションを適用してナレッジ検出プロセスを実行すると、TBR に準拠するすべての値はそのまま残り、正しい値として識別されます。 TBR によって変更されたすべての値は正しい値としてインポートされ、TBR に準拠した値のシノニムとして識別されます。

ドメインの用語ベースのリレーションとクレンジングした値のドメインへのインポート

クレンジング プロセス中に収集されるデータ品質ナレッジをドメインにインポートする場合、TBR によって変更された値が正しい値としてインポートされます。

始める前に

前提条件

用語ベースのリレーションを作成するには、ドメイン管理アクティビティでドメインを開いておく必要があります。

セキュリティ

アクセス許可

用語ベースのリレーションを作成するには、DQS_MAIN データベースの dqs_kb_editor ロールまたは dqs_administrator ロールが必要です。

用語ベースのリレーションの作成

  1. Data Quality クライアントを開始します。 これを行う方法の詳細については、「Data Quality Client アプリケーションの実行」を参照してください。

  2. Data Quality Client のホーム画面で、ナレッジ ベースを開くか作成します。 アクティビティとして [ドメイン管理] を選択した後に、 [開く] または [作成]をクリックします。 詳細については、「 ナレッジ ベースの作成 」または「 ナレッジ ベースを開く」を参照してください。

    Note

    Data Quality Service クライアントのドメイン管理用のページには、それぞれ異なるドメイン管理操作に対応する 5 つのタブが含まれています。 ウィザード ベースのプロセスではないため、任意の管理操作を個別に実行することができます。

  3. [ドメイン管理] ページの [ドメイン リスト] から、ドメイン ルールを作成するドメインを選択するか、新しいドメインを作成します。 新しいドメインを作成する必要がある場合は、「 ドメインの作成」を参照してください。

  4. [用語ベースのリレーション] タブをクリックします。

  5. 用語ベースのリレーションは次のとおりに作成します。

    1. [新しいリレーションの追加] をクリックし、リレーション テーブルに行を追加します。

    2. 追加された行の [値] 列に、選択したドメインの値で出現するたびに変更する用語を入力します。

      Note

      用語がドメイン内の値全体として存在する場合、またはドメイン内の修正値として既に存在している場合は、エラーが表示されます。

    3. [次に修正] 列に、 [値] 列の用語の変更後の用語を入力します。

    4. 別の用語ベースのリレーションを追加する場合は、 [新しいリレーションの追加] をもう一度クリックします。

    5. リレーション テーブルから 1 つ以上の選択した行を削除するには、 [選択したリレーションの削除] をクリックします。 Ctrl キーを押しながら選択解除する行をクリックすると、複数の行を選択できます。

    6. [検索] ボックスに 1 つ以上の数字を入力し、リレーション テーブルで値を検索します。 一致する文字列が強調表示されます。 上矢印と下矢印を使用して、テーブル内の文字列の異なるインスタンスに移動します。

    7. スペル チェック: [値] 列または [次に修正] 列の値に赤い波線の下線が付いている場合は、スペル チェックで値の修正が提案されています。 下線が付いている値を右クリックし、スペル チェックで提案された値の 1 つを選択します。 または、ショートカット メニューの [追加] をクリックすると、元の値を反映できます。 詳細については、「 DQS のスペル チェックの使用 」および「 ドメインのプロパティを設定する」を参照してください。

      Note

      スペル チェックを使用するには、 [ドメインのプロパティ] ページで有効にする必要があります。 [ドメインのプロパティ] ページで無効になっている場合は、 [用語ベースのリレーション] ページで [スペル チェックを有効/無効にします] アイコンをクリックして有効にすることもできます。

  6. [変更を適用] をクリックして、ドメインに用語ベースのリレーションを適用します。

  7. [完了] をクリックし、「 ドメイン管理アクティビティの終了」の説明に従ってドメイン管理アクティビティを完了します。

補足情報: 用語ベースのリレーションを作成した後

用語ベースのリレーションを作成した後、ドメインで他のドメイン管理タスクを実行したり、ナレッジ検出を実行してナレッジをドメインに追加したり、照合ポリシーをドメインに追加したりすることができます。 詳しくは、「ナレッジ検出の実行」、「ドメインの管理」、または「照合ポリシーの作成」をご覧ください。