Управление доменом
Область применения: SQL Server
В этом разделе описывается использование доменов в службах качества данных (DQS). Домен содержит семантическое представление данных из одного поля в анализируемом источнике данных. Домен является частью базы знаний, которая создается для источника данных, и набор знаний, которые создаются путем анализа образца источника данных или импорта данных, добавляются в домены, определенные в базе знаний. Набор знаний в этих доменах затем используется для выполнения очистки и сопоставления в проекте служб DQS. Домены являются основой всех операций служб Data Quality Services.
Домен сопоставляется с полем источника данных и наполняется в ходе операций обнаружения знаний, управления доменами и сопоставления. Способ загрузки данных из источника данных и вывода данных в отчете определяется в свойствах домена. При использовании поставщика ссылочных данных для очистки данных к отдельному или составному домену присоединяется служба ссылочных данных. Пользователь создает правила, которые будут применяться к данным в домене, и отношения на основе терминов для домена. Данные в домене вы можете просматривать и исправлять.
Также вы можете создавать составной домен, который состоит из нескольких отдельных доменов, каждый из которых содержит знания об общих данных. Дополнительные сведения см. в разделе Управление составным доменом.
Свойства домена
При создании домена имеются следующие варианты наполнения домена из источника данных и вывода значений домена. Дополнительные сведения см. в статье Настройка свойств домена.
Выберите тип данных, которыми будет наполняться домен. Дополнительные сведения о поддерживаемых типах данных для каждого типа данных домена см. в разделе Типы данных SQL Server и службы SSIS, поддерживаемые для доменов DQS.
Укажите, что выводиться из домена будут только ведущие значения, а не их синонимы.
Укажите, что значения домена будут выводиться в определенном формате в зависимости от типа данных.
Данные строкового типа вы можете нормализовать, удаляя специальные символы при загрузке строки из источника данных в домен.
Если данные имеют строковый тип, вы можете запустить средство DQS Speller, которое проверит синтаксис, орфографию и структуру предложения в строке и укажет возможные ошибки на странице Значения домена в окне Управление доменами. Это включает указание языка, который будет использоваться средством DQS Speller.
Если данные имеют строковый тип, в службах DQS вы можете отменить определение синтаксических ошибок, когда известно, что в строках таких ошибок не будет.
В этом разделе
Использование домена позволяет выполнять следующие действия.
Описание операции | Раздел |
---|---|
Создавать семантическое представление для поля данных с конкретным типом данных, указывать способ наполнения домена и задавать формат выходных данных для домена. | Создание домена |
Связывать домен с другим доменом, обеспечивая общий доступ к параметрам и значениям. | Создание связанного домена |
Присоединять службу ссылочных данных к отдельному или составному домену. | Добавление домена или составного домена к ссылочным данным |
Изменять или дополнять значения в базе знаний. | Изменение значений домена |
Использовать правила проверки и стандартизации. | Создание правила домена |
Использовать отношения для исправления терминов, которые являются частью значений в домене. | Создание связей на основе термина |
Завершать, закрывать или отменять операцию управления доменами. | Завершение операции по управлению доменами |
Связанные задачи
Описание задачи | Раздел |
---|---|
Построение базы знаний с помощью обнаружения знаний и интерактивного управления знаниями | Построение базы знаний |
Импорт знаний в базу знаний или экспорт из нее. | Импорт и экспорт набора знаний |
Создание составного домена и добавление набора знаний в этот домен. | Управление составным доменом |