Поделиться через


Изменение значений домена

Область применения:SQL Server

Это важно

Службы качества данных (DQS) удаляются в предварительной версии SQL Server 2025 (17.x). Мы продолжаем поддерживать DQS в SQL Server 2022 (16.x) и более ранних версиях.

В этом разделе описывается, как изменить и расширить метаданные в базе знаний в службе качества данных (DQS). После создания набора знаний путем обнаружения набора знаний, импорта знаний в базу знаний или домены или подготовки базы знаний на основе другой базы знаний можно интерактивно изменять значения данных. Создание базы знаний не является строго автоматическим процессом. Можно использовать собственные знания для проверки и изменения значений данных следующими способами.

  • Добавить значение домена в список значений или выбрать значение и удалить его из списка.

  • Изменить статус значения домена, каким его определяет процесс обнаружения DQS, на один из следующих: «корректно», «ошибка» или «недопустимо».

  • Ввести значение для замены ошибочного или недопустимого значения. Значение недопустимо, если оно не принадлежит домену, например если оно не соответствует типу данных домена или нарушает правило домена. Значение ошибочно, если принадлежит домену, но содержит синтаксическую ошибку.

  • Задать два значения или несколько в качестве синонимов и изменить ведущее значение, назначенное в процессе обнаружения, в результате чего ведущее значение заменяет значение синонима, если при создании домена было установлено свойство Использование ведущего значения

  • Импортировать значения в домен из файла Excel

Перед началом

Предварительные условия

Чтобы изменить значение домена, необходима база знаний и домен, открытый в операции управления доменами.

Безопасность

Разрешения

Для изменения значений домена необходимо иметь роль dqs_kb_editor или dqs_administrator в базе данных DQS_MAIN.

Изменение значений домена

В таблице Значение отображаются знания, добавленные в базу знаний для отдельного домена. В любое время вы можете выбрать другой домен в списке доменов для отображения значений для данного домена. Поле содержит следующие столбцы.

  • Столбец Значение отображает все значения, добавленные процессом обнаружения к выбранному домену из поля в образце данных. Любое значение, рассматриваемое как ошибочное, будет показано в качестве синонима для значения, рассматриваемого как верное.

  • Столбец Тип отображает состояние значения, определенное процессом обнаружения. Зеленый флажок указывает, что значение верно или исправлено; красный крест — что значение ошибочно, а оранжевый треугольник с восклицательным знаком — что значение недопустимо. Недопустимое значение не соответствует требованиям к данным для домена. Ошибочное значение может быть допустимым, но неправильным по причинам, связанным с данными.

  • В столбце Исправить на показано правильное значение, на которое изменяется исходное значение, отмеченное как ошибочное или недопустимое. По результатам процесса обнаружения служба DQS может предложить правильное значение.

Чтобы изменить значения, выполните следующие действия.

  1. Запустите клиент Data Quality. Сведения об этом см. в разделе «Запуск клиентского приложения для управления качеством данных».

  2. На домашнем экране клиента качества данных откройте или создайте база знаний. Выберите операцию Управление доменами , а затем нажмите кнопку Открыть или Создать. Дополнительные сведения см. в разделе Создание базы знаний или Открытие базы знаний.

    Примечание.

    Управление доменами осуществляется на странице клиента службы Data Quality Services, которая содержит пять вкладок для отдельных операций управления доменом. Это не процесс, управляемый мастером; любая операция управления может быть выполнена отдельно.

  3. В области Список доменов страницы Управление доменами выберите домен, для которого необходимо изменить значения, или создайте новый домен. Если нужно создать новый домен, см. раздел Создать домен. Выберите вкладку Значения домена .

  4. Отобразите значения, которые нужно изменить в таблице Значение . Дополнительную информацию вы можете получить по ссылке Как отобразить соответствующие значения ниже.

  5. Чтобы изменить состояние значения, необходимо выполните следующие действия:

    • Обозначить выбранные значения домена как исправленные. Чтобы изменить состояние значения с ошибочного или недопустимого на исправленное, выберите значение и щелкните пункт Обозначить выбранные значения домена как исправленные (галочка) в меню направленной вниз стрелки на панели значков или в раскрывающемся списке "Тип". Если ошибочное или недопустимое значение сгруппировано с правильным значением, удалите это значение после операции.

    • Обозначить выбранные значения домена как ошибки. Чтобы изменить состояние значения с верного или недопустимого на ошибочное, выберите значение и щелкните пункт Обозначить выбранные значения домена как ошибки (крестик) в меню направленной вниз стрелки на панели значков или в раскрывающемся списке "Тип". Вы можете ввести исправление в столбце Исправить на или оставить его пустым.

    • Обозначить выбранные значения домена как недопустимые. Чтобы изменить состояние значения с верного или ошибочного на недопустимое, выберите значение и щелкните пункт Обозначить выбранные значения домена как недопустимые (треугольник) в меню направленной вниз стрелки на панели значков или в раскрывающемся списке "Тип". Вы можете ввести исправление в столбце Исправить на или оставить его пустым.

    • Исправить на. После задания значения как ошибочного или недопустимого введите новое значение в столбец Исправить на . DQS добавит новую строку для замещающего значения, назначит его верным, а затем сгруппирует оба значения. Новое значение будет показано как ведущее значение, ведущее значение выделено полужирным шрифтом, а ошибочное или недопустимое значение показано с отступами.

  6. Чтобы определить значения как группы синонимов, выберите несколько значений, которые являются правильными, а затем выполните следующие действия.

    • Установить выбранные значения домена в качестве синонимов. Чтобы задать синонимы, выберите несколько правильных значений и щелкните значок Установить выбранные значения домена в качестве синонимов . Службы DQS сгруппируют значения и назначат одно из значений в качестве ведущего, которым будут заменяться другие. Обратите внимание, что, если два значения сгруппированы, но одно из них ошибочно или недопустимо, эти значения не являются синонимами.

      Примечание.

      Если выбрать два или более значений в группе и другое значение вне этой группы, а затем назначить их синонимами, вы получите ошибочное сообщение об ошибке. После закрытия всплывающего сообщения об ошибке значения будут правильно назначены синонимами.

    • Разорвать отношение между выбранными синонимами. Чтобы отменить назначение синонимов для двух или нескольких значений, выберите значения и щелкните значок Разорвать отношение между выбранными синонимами . Для успешного разгруппирования синонимов значения должны быть сгруппированы и быть правильными.

    • Установить выбранное значение домена в качестве ведущего значения своей группы. Чтобы изменить ведущее значение группы, выберите в группе значение, не назначенное ведущим, и нажмите кнопку Установить выбранное значение домена в качестве ведущего значения своей группы . В результате ведущее значение будет назначено в качестве замены для другого значения. Операция выполняется только если вы задали два или более значений, которые образуют группу, и хотите изменить ведущее значение, которое было назначено с помощью DQS. Обратите внимание, что ведущее значение обозначается синей строкой со значением, выделенным полужирным шрифтом.

  7. Программа проверки орфографии. Если значение подчеркнуто волнистой красной линией, это означает, что средство проверки орфографии предлагает исправление для значения. Щелкните правой кнопкой мыши подчеркнутое значение и выберите одно из исправлений, если оно применимо. Тип значения становится ошибочным (или остается таковым), а исправление добавляется в столбец Исправить на . Щелкните стрелку «вниз» для просмотра дополнительных предложенных исправлений. Введите исправление вручную, чтобы добавить его в словарь средства проверки орфографии и иметь возможность выбрать его в качестве исправления. Дополнительные сведения см. в разделах Use the DQS Speller и Set Domain Properties.

    Примечание.

    Для использования средства проверки орфографии вы можете либо включить его на странице Свойства домена , либо, если оно отключено на странице Свойства домена , щелкнуть значок Включить/отключить средство проверки орфографии на странице Значения домена , чтобы включить его на этой странице.

  8. Добавить новое значение домена. Щелкните, чтобы добавить строку в конец таблицы. После ввода значения строка будет позиционирована в алфавитном порядке и определена в качестве нового элемента предшествующим символом звездочки.

  9. Импорт значений домена из Excel. Чтобы добавить новые значения из электронной таблицы Excel, щелкните стрелку «вниз » для значка Импортировать значения и выберите Импорт значений домена из Excel. Введите имя файла, выберите Использовать первую строку в качестве заголовка , если это возможно, и нажмите кнопку ОК. Дополнительные сведения см. в статье Импорт значений из файла Excel в домен.

  10. Импорт значений проекта: Чтобы добавить новые значения из Проекта обеспечения качества данных, нажмите стрелку вниз на значке Импортировать значения и выберите Импорт значений проекта. Введите имя файла, выберите Использовать первую строку в качестве заголовка , если это возможно, и нажмите кнопку ОК. Выберите проект, из которого нужно импортировать значения, и нажмите кнопку ОК. Будут отображены импортированные значения. Нажмите кнопку Готово. Дополнительные сведения см. в разделе «Импорт значений проекта в домен».

  11. Удалить выбранные значения домена. Чтобы удалить одно или несколько существующих значений из домена, выберите значения из таблицы «Значения» и щелкните значок Удалить выбранные значения домена . Удалить элемент DQS_NULL нельзя, поэтому, если удаляется несколько значений, одно из которых — элемент DQS_NULL, операция завершится ошибкой.

  12. Нажмите кнопку Готово , чтобы завершить операцию управления доменами, как описано в разделе Завершение операции по управлению доменами.

Дальнейшие действия. После изменения значений домена

После изменения значений для домена можно выполнить для него другие задачи управления доменами, обнаружение знаний, а также добавление в домен знаний или политики сопоставления. Дополнительные сведения см. в разделах Обнаружение набора знаний, Управление доменом и Создание политики сопоставления.

Смысл правильного, ошибочного и недопустимого значений

Каждому значению в таблице Значение на странице Значения домена назначается параметр ТипПравильно, Ошибкаили Недопустимо. Тип значения первоначально назначается операцией обнаружения знаний, и его вы можете изменить по своему усмотрению. Последний тип, основанный на обнаружении и интерактивных изменениях, формируется операцией очистки. Эти значения имеют следующий смысл.

  • Правильно. Это значение принадлежит к домену и не имеет каких-либо синтаксических ошибок. Например, значение "Чикаго" в домене "Город" — правильное.

  • Ошибка. Это значение принадлежит домену, но является неверным. Например, "Шикаго" вместо "Чикаго" в домене "Город" — ошибка. DQS определяет значение как ошибочное при обнаружении синтаксической ошибки и применяет связанное исправление в процессе проверки. Орфографические ошибки относятся к числу синтаксических ошибок.

  • Неверный: Это значение не относится к домену и не имеет коррекции. Например, значение "12345" в домене "Город" является недопустимым. Службы DQS определяют значение как недопустимое, если оно не соответствует правилу домена.

Тип значения вы можете изменить вручную на любое из двух других значений. DQS не обеспечивает действительность и семантику ошибок при ручных операциях. Исправление для недопустимого значения вы можете ввести без изменения его статуса. Вы можете объявить значение недопустимым, даже если оно не нарушает правила домена. Вы можете обозначить значение как ошибочное, даже если в процессе обнаружения не указано на его синтаксическую ошибку. Вы можете также удалить исправление ошибочного значения, которое отмечено как правильное, без изменения его статуса.

При интерактивной очистке данных на странице Управление результатами и их просмотр операции Очистка как недопустимые, так и ошибочные значения представлены на вкладке Недопустимые на странице Управление результатами и их просмотр .

Как отображать соответствующие значения

Вы можете изменять отображаемые сведения следующим образом.

  • Фильтровать результаты, которые нужно внести в таблицу, по их состоянию, выбирая состояние в раскрывающемся списке Фильтр .

  • Найти данные, которые нужно проверить или изменить, добавляя по одной букве для поиска в текстовое поле Найти . В результате эти буквы будут выделяться всегда, когда они встречаются в любом отображаемом значении.

  • Выберите Показывать только новые , чтобы отображать в таблице только значения, обнаруженные только в текущем сеансе.

  • Нажмите кнопку Развернуть все, чтобы показать все значения в любой группе синонимов, если текущее состояние свернуто.

  • Нажмите кнопку Свернуть все , чтобы скрыть все значения, кроме ведущего, в любой группе синонимов, если текущее состояние развернутое.

  • Нажмите кнопку Показать или скрыть панель журнала изменений значений домена , чтобы отобразить всплывающее окно предварительного вида в нижней части таблицы значений, которое показывает недавние изменения в наборе значений домена.

Как обрабатывать значения, эквивалентные NULL

Каждая таблица значений на вкладке Значения домена содержит значение DQS_NULL. Значение NULL в источнике данных будет отображаться как SQL_NULL в таблице значений. Вы можете задать одно или несколько значений, эквивалентных NULL, в качестве синонимов для DQS_NULL. После этого все значения NULL и значения, эквивалентные NULL, будут обрабатываться как DQS_NULL.