Изменение значений домена
Область применения: SQL Server
В этом разделе описывается изменение и расширение метаданных в база знаний в службах качества данных (DQS). После создания набора знаний путем обнаружения набора знаний, импорта знаний в базу знаний или домены или подготовки базы знаний на основе другой базы знаний можно интерактивно изменять значения данных. Создание базы знаний не является строго автоматическим процессом. Можно использовать собственные знания для проверки и изменения значений данных следующими способами.
Добавить значение домена в список значений или выбрать значение и удалить его из списка.
Изменить состояние значения домена, назначенное на этапе анализа службами DQS, на одно из следующих: «верно», «ошибочно» или «недопустимо».
Ввести значение для замены ошибочного или недопустимого значения. Значение недопустимо, если оно не принадлежит домену, например если оно не соответствует типу данных домена или нарушает правило домена. Значение ошибочно, если принадлежит домену, но содержит синтаксическую ошибку.
Задать два значения или несколько в качестве синонимов и изменить ведущее значение, назначенное в процессе обнаружения, в результате чего ведущее значение заменяет значение синонима, если при создании домена было установлено свойство Использование ведущего значения
Импортировать значения в домен из файла Excel
Перед началом
Необходимые компоненты
Чтобы изменить значение домена, необходима база знаний и домен, открытый в операции управления доменами.
Безопасность
Разрешения
Для изменения значений домена необходимо иметь роль dqs_kb_editor или dqs_administrator в базе данных DQS_MAIN.
Изменение значений домена
В таблице Значение отображаются знания, добавленные в базу знаний для отдельного домена. В любое время вы можете выбрать другой домен в списке доменов для отображения значений для данного домена. Поле содержит следующие столбцы.
Столбец Значение отображает все значения, добавленные процессом обнаружения к выбранному домену из поля в образце данных. Любое значение, рассматриваемое как ошибочное, будет показано в качестве синонима для значения, рассматриваемого как верное.
Столбец Тип отображает состояние значения, определенное процессом обнаружения. Зеленый флажок указывает, что значение верно или исправлено; красный крест — что значение ошибочно, а оранжевый треугольник с восклицательным знаком — что значение недопустимо. Недопустимое значение не соответствует требованиям к данным для домена. Ошибочное значение может быть допустимым, но неправильным по причинам, связанным с данными.
В столбце Исправить на показано правильное значение, на которое изменяется исходное значение, отмеченное как ошибочное или недопустимое. По результатам процесса обнаружения службы DQS могут предложить правильное значение.
Чтобы изменить значения, выполните следующие действия.
Запустите клиент DQS. Сведения об этом см. в разделе "Запуск клиентского приложения качества данных".
На домашнем экране клиента качества данных откройте или создайте база знаний. Выберите операцию Управление доменами , а затем нажмите кнопку Открыть или Создать. Дополнительные сведения см. в разделе Создание базы знаний или Открытие базы знаний.
Примечание.
Управление доменами осуществляется на странице клиента службы Data Quality Services, которая содержит пять вкладок для отдельных операций управления доменом. Это не процесс, управляемый мастером; любая операция управления может быть выполнена отдельно.
В области Список доменов страницы Управление доменами выберите домен, для которого необходимо изменить значения, или создайте новый домен. Если нужно создать новый домен, см. раздел Создать домен. Выберите вкладку Значения домена .
Отобразите значения, которые нужно изменить в таблице Значение . Дополнительную информацию вы можете получить по ссылке Как отобразить соответствующие значения ниже.
Чтобы изменить состояние значения, необходимо выполните следующие действия:
Обозначить выбранные значения домена как исправленные. Чтобы изменить состояние значения с ошибочного или недопустимого на исправленное, выберите значение и щелкните пункт Обозначить выбранные значения домена как исправленные (галочка) в меню направленной вниз стрелки на панели значков или в раскрывающемся списке "Тип". Если ошибочное или недопустимое значение сгруппировано с правильным значением, удалите это значение после операции.
Обозначить выбранные значения домена как ошибки. Чтобы изменить состояние значения с верного или недопустимого на ошибочное, выберите значение и щелкните пункт Обозначить выбранные значения домена как ошибки (крестик) в меню направленной вниз стрелки на панели значков или в раскрывающемся списке "Тип". Вы можете ввести исправление в столбце Исправить на или оставить его пустым.
Обозначить выбранные значения домена как недопустимые. Чтобы изменить состояние значения с верного или ошибочного на недопустимое, выберите значение и щелкните пункт Обозначить выбранные значения домена как недопустимые (треугольник) в меню направленной вниз стрелки на панели значков или в раскрывающемся списке "Тип". Вы можете ввести исправление в столбце Исправить на или оставить его пустым.
Исправить на. После задания значения как ошибочного или недопустимого введите новое значение в столбец Исправить на . При этом службы DQS добавляют новую строку для замещающего значения и назначают его верным, а затем группируют оба эти значения. Новое значение будет показано как ведущее значение, ведущее значение выделено полужирным шрифтом, а ошибочное или недопустимое значение показано с отступами.
Чтобы определить значения как группы синонимов, выберите несколько значений, которые являются правильными, а затем выполните следующие действия.
Установить выбранные значения домена в качестве синонимов. Чтобы задать синонимы, выберите несколько правильных значений и щелкните значок Установить выбранные значения домена в качестве синонимов . Службы DQS сгруппируют значения и назначат одно из значений в качестве ведущего, которым будут заменяться другие. Обратите внимание, что, если два значения сгруппированы, но одно из них ошибочно или недопустимо, эти значения не являются синонимами.
Примечание.
Если выбрано два или несколько значений или несколько в группе и другое значение вне этой группы, а затем они назначены синонимами, будет получено неверное сообщение об ошибке. После закрытия всплывающего сообщения об ошибке значения будут правильно назначены синонимами.
Разорвать отношение между выбранными синонимами. Чтобы отменить назначение синонимов для двух или нескольких значений, выберите значения и щелкните значок Разорвать отношение между выбранными синонимами . Для успешного разгруппирования синонимов значения должны быть сгруппированы и быть правильными.
Установить выбранное значение домена в качестве ведущего значения своей группы. Чтобы изменить ведущее значение группы, выберите в группе значение, не назначенное ведущим, и нажмите кнопку Установить выбранное значение домена в качестве ведущего значения своей группы . В результате ведущее значение будет назначено в качестве замены для другого значения. Эта операция выполняется, только если два значения или несколько объединены в группу и требуется изменить ведущее значение, назначенное службами DQS. Обратите внимание, что ведущее значение обозначается синей строкой со значением, выделенным полужирным шрифтом.
Программа проверки орфографии. Если значение подчеркнуто волнистой красной линией, это означает, что средство проверки орфографии предлагает исправление для значения. Щелкните правой кнопкой мыши подчеркнутое значение и выберите одно из исправлений, если оно применимо. Тип значения становится ошибочным (или остается таковым), а исправление добавляется в столбец Исправить на . Щелкните стрелку «вниз» для просмотра дополнительных предложенных исправлений. Введите исправление вручную, чтобы добавить его к словарю средства проверки орфографии, с учетом того, что это значение должно быть выбрано как исправление. Дополнительные сведения см. в разделах Use the DQS Speller и Set Domain Properties.
Примечание.
Для использования средства проверки орфографии вы можете либо включить его на странице Свойства домена , либо, если оно отключено на странице Свойства домена , щелкнуть значок Включить/отключить средство проверки орфографии на странице Значения домена , чтобы включить его на этой странице.
Добавить новое значение домена. Щелкните, чтобы добавить строку в конец таблицы. После ввода значения строка будет позиционирована в алфавитном порядке и определена в качестве нового элемента предшествующим символом звездочки.
Импорт значений домена из Excel. Чтобы добавить новые значения из электронной таблицы Excel, щелкните стрелку «вниз » для значка Импортировать значения и выберите Импорт значений домена из Excel. Введите имя файла, выберите Использовать первую строку в качестве заголовка , если это возможно, и нажмите кнопку ОК. Дополнительные сведения см. в статье Импорт значений из файла Excel в домен.
Импорт значений проекта. Для добавления новых значений из проекта служб DQS щелкните стрелку «вниз» для значка Импортировать значения и выберите Импорт значений проекта. Введите имя файла, выберите Использовать первую строку в качестве заголовка , если это возможно, и нажмите кнопку ОК. Выберите проект, из которого нужно импортировать значения, и нажмите кнопку ОК. Будут отображены импортированные значения. Нажмите кнопку Готово. Дополнительные сведения см. в разделе «Импорт значений проекта в домен».
Удалить выбранные значения домена. Чтобы удалить одно или несколько существующих значений из домена, выберите значения из таблицы «Значения» и щелкните значок Удалить выбранные значения домена . Удалить элемент DQS_NULL нельзя, поэтому, если удаляется несколько значений, одно из которых — элемент DQS_NULL, операция завершится ошибкой.
Нажмите кнопку Готово , чтобы завершить операцию управления доменами, как описано в разделе Завершение операции по управлению доменами.
Дальнейшие действия. После изменения значений домена
После изменения значений для домена можно выполнить для него другие задачи управления доменами, обнаружение знаний, а также добавление в домен знаний или политики сопоставления. Дополнительные сведения см. в разделах Обнаружение набора знаний, Управление доменом и Создание политики сопоставления.
Смысл правильного, ошибочного и недопустимого значений
Каждому значению в таблице Значение на странице Значения домена назначается параметр Тип — Правильно, Ошибкаили Недопустимо. Тип значения первоначально назначается операцией обнаружения знаний, и его вы можете изменить по своему усмотрению. Последний тип, основанный на обнаружении и интерактивных изменениях, формируется операцией очистки. Эти значения имеют следующий смысл.
Правильно. Это значение принадлежит к домену и не имеет каких-либо синтаксических ошибок. Например, значение "Чикаго" в домене "Город" — правильное.
Ошибка. Это значение принадлежит домену, но является неверным. Например, "Шикаго" вместо "Чикаго" в домене "Город" — ошибка. Службы DQS определяют значение как ошибочное, если выявлена синтаксическая ошибка, и назначают связанное исправление в процессе обнаружения. Орфографические ошибки относятся к числу синтаксических ошибок.
Недопустимый. Это значение не принадлежит к домену и не имеет исправления. Например, значение "12345" в домене "Город" является недопустимым. Службы DQS определяют значение как недопустимое, если оно не соответствует правилу домена.
Тип значения вы можете изменить вручную на любое из двух других значений. Службы DQS не обеспечивают правильность и семантику ошибок при ручных операциях. Исправление для недопустимого значения вы можете ввести без изменения его статуса. Вы можете объявить значение недопустимым, даже если оно не нарушает правила домена. Службы DQS могут определить значение как ошибочное, даже если в процессе обнаружения не выявлены синтаксические ошибки. Вы можете также удалить исправление ошибочного значения, которое отмечено как правильное, без изменения его статуса.
При интерактивной очистке данных на странице Управление результатами и их просмотр операции Очистка как недопустимые, так и ошибочные значения представлены на вкладке Недопустимые на странице Управление результатами и их просмотр .
How to Display the Appropriate Values
Вы можете изменять отображаемые сведения следующим образом.
Фильтровать результаты, которые нужно внести в таблицу, по их состоянию, выбирая состояние в раскрывающемся списке Фильтр .
Найти данные, которые нужно проверить или изменить, добавляя по одной букве для поиска в текстовое поле Найти . В результате эти буквы будут выделяться всегда, когда они встречаются в любом отображаемом значении.
Выберите Показывать только новые , чтобы отображать в таблице только значения, обнаруженные только в текущем сеансе.
Нажмите кнопку Развернуть все , чтобы показать все значения в любой группе синонимов, если текущее состояние свернутое.
Нажмите кнопку Свернуть все , чтобы скрыть все значения, кроме ведущего, в любой группе синонимов, если текущее состояние развернутое.
Нажмите кнопку Показать или скрыть панель журнала изменений значений домена , чтобы отобразить всплывающее окно предварительного вида в нижней части таблицы значений, которое показывает недавние изменения в наборе значений домена.
Как обрабатывать значения, эквивалентные NULL
Каждая таблица значений на вкладке Значения домена содержит значение DQS_NULL. Значение NULL в источнике данных будет отображаться как SQL_NULL в таблице значений. Вы можете задать одно или несколько значений, эквивалентных NULL, в качестве синонимов для DQS_NULL. После этого все значения NULL и значения, эквивалентные NULL, будут обрабатываться как DQS_NULL.