Создание составного домена
В этом разделе описывается, как создать составной домен в базе знаний в Службы Data Quality Services (DQS). Составной домен состоит из нескольких отдельных доменов, применимых к одному полю данных. Дополнительные сведения о составных доменах см. в разделе Управление составным доменом.
Существуют два способа создания нового составного домена. Первый — на этапе сопоставления действий по обнаружению знаний, в процессе анализа образца данных для добавления набора знаний в новую или существующую базу знаний. Второй — в ходе действий по управлению доменами, когда вместо изменения существующего домена вы создаете новый. Чтобы создать составной домен, необходимо предварительно создать не менее двух отдельных доменов, которые будут добавляться в составной домен. При создании нового составного домена доступны только предварительно созданные отдельные домены, которые еще не добавлены к существующим составным доменам. Отдельный домен можно добавить только к одному составному домену. Составной домен невозможно добавить в другой составной домен.
После создания составного домена можно изменить его свойства, присоединить к домену службы ссылочных данных, создать междоменные правила или связи значений. Для этого выберите составной домен в списке Домен на странице Управление доменами и перейдите на соответствующую вкладку.
В этом разделе
Перед началом работы выполните следующие действия.
Предварительные требования
Безопасность
Создание составного домена в ходе действия обнаружения знаний
Создание составного домена в ходе действия по управлению доменами
Задание свойств составного домена
Дальнейшие действия: после создания составного домена
Синтаксический анализ на основе знаний
Перед началом работы
Предварительные требования
Чтобы создать составной домен, необходимо предварительно создать и открыть базу знаний, также необходимо предварительно создать не менее двух отдельных доменов, которые будут добавляться в составной домен.
Безопасность
Разрешения
Для создания составного домена необходимо иметь роль dqs_kb_editor или dqs_administrator в базе DQS_MAIN.
[В начало]
Создание составного домена в ходе действия обнаружения знаний
Запустите клиент DQS. Дополнительные сведения об этой процедуре см. в разделе Запуск клиентского приложения DQS.
На главной странице Клиент Data Quality нажмите кнопку Открыть базу знаний и выберите базу знаний или нажмите кнопку Создать базу знаний и введите свойства новой базы знаний.
Выберите действие Обнаружение знаний и нажмите кнопку Создать, чтобы создать новую базу знаний, или нажмите кнопку Открыть, чтобы открыть существующую базу знаний.
На странице Сопоставление укажите соединение с источником данных. Дополнительные сведения см. в разделе Обнаружение набора знаний.
В таблице Сопоставления выберите исходный столбец из раскрывающегося списка для столбца Исходный столбец пустой строки. Убедитесь, что исходный столбец содержит составной домен, состоящий из двух существующих отдельных доменов. Если соответствующих отдельных доменов не существует, щелкните значок Создать домен.
В таблице Сопоставления выберите исходный столбец из раскрывающегося списка для столбца Исходный столбец пустой строки. Убедитесь, что исходный столбец содержит составной домен, на части которого указывают два существующих отдельных домена. Если соответствующих отдельных доменов не существует, щелкните значок Создать домен, чтобы создать эти домены. Дополнительные сведения см. в разделе Создание домена.
Щелкните значок Создать составной домен.
[В начало]
Создание составного домена в ходе действия по управлению доменами
На главной странице клиента Data Quality Services щелкните Открыть базу знаний и выберите базу знаний или щелкните Новая база знаний и введите свойства новой базы знаний.
Выберите действие Управление доменами и нажмите кнопку Создать, чтобы создать новую базу знаний, или нажмите кнопку Открыть, чтобы открыть существующую базу знаний.
Убедитесь, что существуют несколько доменов, необходимых для составного домена. В противном случае щелкните значок Создать домен и создайте его. Дополнительные сведения см. в разделе Создание домена.
На странице Управление доменами щелкните значок Создать составной домен, расположенный над списком доменов.
Введите имя, которое является уникальным в базе знаний, и описание длиной до 256 символов.
В Списке доменов выберите домены, которые будут входить в состав составного домена, и щелкните стрелку вправо, чтобы переместить эти домены в таблицу Домены в составном домене.
Нажмите кнопку ОК.
[В начало]
Задание свойств составного домена
В диалоговом окне Создание составного домена введите имя, которое является уникальным в базе знаний, и описание длиной до 256 символов.
В Списке доменов выберите домены, которые будут входить в состав составного домена, и щелкните стрелку вправо, чтобы переместить эти домены в таблицу Домены в составном домене. Это список отдельных доменов, доступных для добавления в создаваемый составной домен. Доступны только предварительно созданные отдельные домены, которые еще не добавлены к существующим составным доменам. Отдельный домен можно добавить только к одному составному домену в базе знаний. Составной домен невозможно добавить в другой составной домен.
Щелкните Дополнительно.
Выберите одно из следующих значений для параметра Метод анализа:
Эталонные данные. Анализ значений поля в соответствии с форматом данных в службе ссылочных данных (RDS). Службы Data Quality Services передают значения в составной домен в RDS, а RDS возвращает исправленные и проанализированные данные в соответствии с доменом в составном домене.
В порядке. Анализ значений поля в соответствии с порядком доменов в составном домене. Первое значение включается в первый домен, второе значение во вторые домены и так далее.
Разделители. Анализ значений поля на основе разделителя, выбранного с помощью переключателей, которые отображаются после выбора параметра «Разделители». Возможные разделители: Символ табуляции, Точка с запятой, Запятая, Пробел или Другое. Если выбран разделитель Другое, введите значение, которое будет служить в качестве разделителя.
Если в качестве метода анализа выбрано Разделители, вы можете также установить флажок Использовать анализ на основе знаний. Дополнительные сведения см. в разделе Анализ на основе знаний.
Нажмите кнопку Готово, чтобы завершить операцию управления доменами, как описано в разделе Завершение операции по управлению доменами.
[В начало]
Дальнейшие действия. после создания составного домена
После создания составного домена можно выполнить другие задачи по управлению для этого домена, провести обнаружение знаний для добавления набора знаний в домен или добавить в домен политику сопоставления. Дополнительные сведения см. в разделе Обнаружение набора знаний, Управление доменом или Создание политики сопоставления.
[В начало]
Синтаксический анализ на основе знаний
Службы Data Quality Services позволяют анализировать данные на основе набора знаний, а не в зависимости от разделителя или порядка. Анализ на основе знаний используется при сопоставлении сложных исходных данных с составным доменом, если при этом не используются службы ссылочных данных. Анализ на основе знаний вы можете использовать для выполнения анализа данных из источника данных по соответствующим отдельным доменам. С помощью анализа на основе знаний DQS сначала пытается использовать набор знаний для выполнения анализа сложных данных на отдельные домены. Если возможно, DQS определяет части строки в виде одного или нескольких доменов и выполняет анализ строки на различные домены. Предположим, «John B. Doe» используется в качестве сложных значений в поле полного имени, представленного составным доменом «Полное имя». Если DQS определяет значение «John» как относящееся к домену «Имя», а значение «Doe» — к домену «Фамилия», то DQS добавляет «B.» к домену «Отчество» на основе набора знаний домена.
Анализ на основе знаний вы можете использовать только в том случае, если выбран анализ на основе разделителей. Анализ на основе знаний не заменяет анализ на основе разделителей, но дополняет его. DQS использует разделитель для анализа только при отсутствии набора знаний. В некоторых случаях DQS может определить анализ на основе знаний, а затем определить еще один анализ с помощью разделителя.
Анализ на основе знаний можно использовать в случаях, когда составной домен состоит из доменов строк или если составной домен состоит из различных типов доменов (int, date, time и др.). Если источник данных состоит из данных различного типа, то сначала следует выделить нестроковые типы данных, а затем выполнить анализ остальных данных на основе набора знаний домена, как описано выше.
При использовании анализа на основе знаний, если количество значений в исходных данных меньше количества доменов в составном домене, DQS размещает в отсутствующих доменах значения NULL. Если количество значений в исходных данных превышает количество доменов в составном домене, DQS добавляет в один из столбцов дополнительные данные. Если несколько доменов включают одинаковые значения, выполняется анализ источника данных в первый сопоставленный домен.
[В начало]