参照データへのドメインまたは複合ドメインのアタッチ - データ品質サービス (DQS)
適用対象: SQL Server
このトピックでは、データ品質ナレッジ ベースのドメインと複合ドメインを Azure Marketplace の参照データ サービスにアタッチして、高品質参照データに対するナレッジを構築する方法について説明します。 各参照データ サービスには、スキーマ (データ列) が含まれています。 ドメインまたは複合ドメインを参照データ サービスにアタッチしたら、アタッチしたドメインまたはアタッチした複合ドメイン内の個々のドメインを参照データ サービス スキーマの適切な列にマップする必要があります。 複合ドメインを参照データ サービスにアタッチすると、参照データ サービスに 1 つだけドメインをアタッチして、複合ドメイン内の個々のドメインを参照データ サービス スキーマの適切な列にマップできます。
重要
この記事では、以前は Azure DataMarket から利用できたサード パーティ参照データ サービスについて説明します。 DataMarket および Data Services (Melissa アドレス データなどを含む) は、2016 年 12 月 31 日以降廃止となりました。 その結果、DataMarket から指定されたサービスを使用して、この記事に示されている例を実行できなくなりました。 サード パーティ参照データ プロバイダーからオンラインで直接利用可能な参照データ サービスは引き続き使用できます。
警告
参照データ サービスにアタッチされた複合ドメインは、ドメインを参照データ サービス スキーマの列にマップするときに、ドメインのドロップダウン リストで使用できます。 複合ドメインを参照データ サービス スキーマの列にマップしないでください。複合ドメイン内の個々のドメインのみを参照データ サービス スキーマの適切な列にマップする必要があります。 それ以外の場合、エラーが発生します。
参照データ サービス スキーマには、参照データ サービスを使用する場合に適切なドメインにマップする必要がある必須列が含まれている場合があります。 参照データ スキーマの必須列には列名に "(M)" と表示されます。 たとえば、AddressLine は Melissa Data - Address Data の必須スキーマ列で、CompanyName は Digital Trowel Inc. - Us companies and professional data for SQL users の必須スキーマ列です。
このトピックでは、複合ドメイン Address Verification に 4 つのドメイン (Address Line、City、State、および Zip) を作成し、複合ドメインを Melissa Data - Address Check 参照データ サービスにアタッチした後、複合ドメイン内の個々のドメインを参照データ サービス スキーマの適切な列にマップします。
始める前に
前提条件
参照データ サービスを使用するようにデータ品質サービス (DQS) を構成しておく必要があります。 「参照データを使用する DQS の構成」をご覧ください。
セキュリティ
アクセス許可
参照データにドメインをマップするには、DQS_MAIN データベースの dqs_kb_editor ロールが必要です。
Melissa Data の参照データへのドメインのマップ
Data Quality クライアントを開始します。 これを行う方法の詳細については、「Data Quality Client アプリケーションの実行」を参照してください。
Data Quality Client のホーム画面で、[Knowledge Base Management]の [New knowledge base]をクリックします。
[新しいナレッジ ベース] 画面で、新しいナレッジ ベースの名前を入力し、 [ドメイン管理] アクティビティをクリックして [作成]をクリックします。
[ドメイン管理] 画面で、 [ドメインの作成] アイコンをクリックしてドメインを作成します。 作成するドメインは、 Address Line、 City、 State、および Zipの 4 つです。
[複合ドメインの作成] アイコンをクリックして複合ドメインを作成します。 [複合ドメインの作成] ダイアログ ボックスで、 [複合ドメイン名] ボックスに「 Address Verification 」と入力し、手順 3. で作成したすべてのドメインを複合ドメインに含めます。 OK をクリックします。
左側の [ドメイン] ペインで、 [Address Verification]をクリックして複合ドメインを選択し、右側の [参照データ] タブをクリックします。
[参照] アイコンをクリックします。
[オンライン参照データ プロバイダーのカタログ] ダイアログ ボックスで以下を行います。
[DataMarket Data Quality Services] で [メリッサ データ - アドレスをチェック] ボックスをオンにします。
Melissa Data - Address Check 参照データ サービスの列を適切なドメイン (Address Line、City、State、および Zip) にマップします。 列をマップするには、 [RDS スキーマ] 列で参照データ サービス列を選択し、 [ドメイン] 列で適切なドメインを選択します。 テーブルに行を追加するには、 [スキーマ エントリの追加] アイコンをクリックします。
[OK] をクリックして変更を保存し、 [オンライン参照データ プロバイダーのカタログ] ダイアログ ボックスを閉じます。
Note
- [オンライン参照データ プロバイダーのカタログ] ダイアログ ボックスでは、Azure Marketplace でサブスクライブしているすべての参照データ サービス プロバイダーが [DataMarket Data Quality Services] ノードに表示されます。 ダイレクト オンライン サード パーティ参照データ サービス プロバイダーを DQS で構成している場合は、 [サード パーティのダイレクト オンライン プロバイダー] という別のノードに表示されます (ここでは、ダイレクト オンライン サード パーティ参照データ サービス プロバイダーを DQS で構成していないため表示されません)。
[参照データ] タブに戻ります。[プロバイダーの設定] 領域で、必要に応じて以下のボックスの値を変更します。
[自動修正しきい値]: 参照データ サービスの修正のうち、信頼レベルがこのしきい値を超える修正は自動的に実行されます。 割合値に相当する値を 10 進数表記で入力します。 たとえば、90% であれば「0.9」と入力します。
[提案された候補]: 参照データ サービスから提案された候補を表示する数です。
[最小信頼度]: 参照データ サービスの提案のうち、信頼レベルがこの値に満たない提案は無視されます。 割合値に相当する値を 10 進数表記で入力します。 たとえば、60% であれば「0.6」と入力します。
[完了] をクリックしてナレッジ ベースを発行します。 ナレッジ ベースが正常に発行されると、確認のメッセージが表示されます。
このナレッジ ベースをデータ品質プロジェクトのクレンジング アクティビティに使用できるようになりました。Azure Marketplace を通じて Melissa Data から提供されるナレッジに基づいて、ソース データに含まれる米国の住所を標準化およびクレンジングできます。
補足情報: 参照データにドメインをマップした後
データ品質プロジェクトを作成し、このトピックで作成したナレッジ ベースと照らし合わせて、米国の住所を含むソース データに対するクレンジング アクティビティを実行します。 参照データ (外部) のナレッジを使用したデータのクレンジングをご覧ください。