Добавление домена или составного домена к ссылочным данным
В этом разделе описывается процесс добавления доменов или составных доменов базы знаний в службу ссылочных данных на Windows Azure Marketplace с целью создания набора знаний по высококачественным данным в ссылочных данных. Каждая служба ссылочных данных содержит схему (столбцы данных). После добавления домена или составного домена к службе ссылочных данных необходимо сопоставить добавленный домен или отдельные домены в составе составного домена с соответствующими столбцами в схеме службы ссылочных данных. Добавление составного домена в службу ссылочных данных позволяет добавить только один домен в службу ссылочных данных, а затем сопоставить отдельные домены в составе составного домена с соответствующими столбцами в схеме службы ссылочных данных.
Внимание! |
---|
Составной домен, добавленный в службу ссылочных данных, доступен в раскрывающемся списке доменов во время сопоставления доменов со столбцами в схеме службы ссылочных данных. Не сопоставляйте составной домен со столбцом в схеме службы ссылочных данных. Следует сопоставлять только отдельные домены в рамках составного домена с соответствующими столбцами в схеме службы ссылочных данных. В противном случае процесс завершится ошибкой. |
Схема ссылочных данных может включать обязательный столбец, который в случае использования данной схемы требуется сопоставить со службой ссылочных данных. Обязательный столбец в схеме ссылочных данных идентифицируется символом (M), который расположен рядом с именем столбца. Например, AddressLine — это обязательный столбец схемы в таблице Адреса данных Мелиссы, а CompanyName — обязательный столбец схемы в таблице Digital Trowel Inc. — американские компании и профессиональные данные для пользователей SQL.
В этом разделе создадим четыре домена: Адрес, Город, Штат и Zip-код, на вкладке составного домена Проверка адреса добавьте составной домен в службы ссылочных данных Данные Мелиссы — проверка данных. Затем сопоставьте отдельные домены составного домена с соответствующими столбцами в схеме службы ссылочных данных.
В этом разделе
Перед началом работы выполните следующие действия.
Предварительные требования
Безопасность
Сопоставление домена со ссылочными данными из Melissa Data
Дальнейшие действия: после сопоставления домена со ссылочными данными
Перед началом
Предварительные требования
Необходимо настроить Службы Data Quality Services (DQS) для использования служб ссылочных данных. См. раздел Настройка служб DQS для использования справочных данных.
Безопасность
Разрешения
Для сопоставления доменов со ссылочными данными необходимо иметь роль dqs_kb_editor в базе данных DQS_MAIN.
[В начало]
Сопоставление доменов со ссылочными данными из Melissa Data
Запустите клиент DQS. Дополнительные сведения об этой процедуре см. в разделе Запуск клиентского приложения DQS.
На главном экране клиента Клиент Data Quality в разделе Управление базами знаний щелкните Создать базу знаний.
На экране Новая база знаний введите имя новой базы знаний, щелкните действие Управление доменами, а затем нажмите кнопку Создать.
Чтобы создать домен, на странице Управление доменами щелкните значок Создать домен. Создайте следующие четыре домена: Строка адреса, Город, Штат и Почтовый индекс.
Чтобы создать составной домен, щелкните значок Создать составной домен. В диалоговом окне Создать составной домен введите текст Проверка адреса в поле Имя составного домена и включите в составной домен все домены, созданные при выполнении шага 3. Нажмите кнопку ОК.
На расположенной слева панели Домен выберите составной домен, щелкнув значение Проверка адреса, а затем перейдите на вкладку Ссылочные данные, расположенную справа.
Щелкните значок Обзор.
В диалоговом окне Каталог поставщиков ссылочных данных в сети выполните следующие действия.
В разделе Службы DataMarket Data Quality Services выберите поле Данные Мелиссы — проверка адреса.
Сопоставьте столбцы службы ссылочных данных «Данные Мелиссы — проверка адреса» с соответствующими доменами («Адрес», «Город», «Штат» и «Zip-код»). Для сопоставления столбцов выберите столбец службы ссылочных данных в столбце Схема RDS, а затем выберите соответствующий домен в столбце Домен. Для добавления в таблицу дополнительных строк щелкните значок Добавить элемент схемы.
Нажмите кнопку ОК, чтобы сохранить изменения и закрыть диалоговое окно Каталог поставщиков ссылочных данных в сети.
Примечание В диалоговом окне Каталог поставщиков ссылочных данных в сети в узле DataMarket Data Quality Services содержатся все поставщики служб ссылочных данных, на которые пользователь подписан в Windows Azure Marketplace. Если в DQS настроены непосредственные сетевые сторонние поставщики служб ссылочных данных, они включены в другой узел с именем Сторонние непосредственные сетевые поставщики (в данный момент этот узел недоступен, так как в DQS прямые сетевые сторонние поставщики служб ссылочных данных не настроены).
Перейдите снова на вкладку Ссылочные данные. При необходимости измените в области Параметры поставщика значения в следующих полях:
Пороговое значение автоматического исправления. Исправления из службы ссылочных данных со степенью достоверности, которая превышает это пороговое значение, выполняются автоматически. Введите значение в десятичной нотации для соответствующего значения в процентах. Например, введите 0,9 для 90 %.
Предлагаемые варианты. Количество предлагаемых вариантов для отображения из службы ссылочных данных.
Минимальная достоверность. Предложения из службы ссылочных данных со степенью достоверности, которая меньше данного значения, игнорируются. Введите значение в десятичной нотации для соответствующего значения в процентах. Например, введите 0,6 для 60 %.
Нажмите кнопку Готово, чтобы опубликовать базу знаний. После публикации базы знаний выдается сообщение с подтверждением.
Теперь эту базу знаний можно использовать для действия очистки в проекте служб DQS, чтобы стандартизировать и очищать адреса США, содержащиеся в исходных данных, на основе набора знаний, предоставляемого «Данными Мелиссы» с помощью Windows Azure Marketplace.
[В начало]
Дальнейшие действия. После сопоставления домена со ссылочными данными
Создайте проект служб DQS и выполните действие очистки исходных данных, которые содержат адреса США, с помощью сравнения этих данных с базой знаний, созданной в данном разделе. См. раздел Очистка данных с использованием знаний о справочных данных (внешних знаний).
[В начало]