Поделиться через


Добавление знаний в базу знаний

В этом разделе описываются способы, которыми можно добавить знания в базу знаний служб Службы Data Quality Services (DQS). Прежде чем приступать к работе со службами DQS, необходимо получить набор знаний о данных. Для этого необходимо построить и поддерживать базу знаний служб DQS, а также пополнять ее наборами знаний, связанными с соответствующими типами источников данных. База знаний является репозиторием знаний о данных, который дает представление о данных и помогает поддерживать их целостность.

База знаний содержит домены данных, связанные с источником данных. Для каждого домена данных в базе знаний хранятся идентифицированные термины, орфографические ошибки, правила проверки и бизнес-правила, а также справочные данные, которые могут использоваться для выполнения действий со службами DQS на источнике данных. В службах DQS эти знания используются для выявления неправильных или недопустимых данных, либо для сопоставления.

Добавлять знания в базу знаний вы можете приведенными ниже автоматическими и ручными способами.

  • Обнаружение набора знаний

  • Управление значениями данных в домене

  • Импорт набора знаний из файла .dqs

  • Импорт набора знаний из файла Excel

  • Импорт знаний из проекта очистки обратно в базу знаний

  • Использование базы знаний DQS по умолчанию

Обнаружение набора знаний

В процессе обнаружения знаний образец данных анализируется на соответствие критериям DQS, затем полученные знания добавляются в базу знаний. Это изменяющий данные автоматизированный процесс, при котором обнаруживаются несоответствия и синтаксические ошибки в данных. Действие по обнаружению знаний выполняется мастером, который представляет собой страницу для интерактивного управления значениями домена. Дополнительные сведения см. в разделе Обнаружение набора знаний.

Управление значениями данных в домене

В службах DQS предусмотрено интерактивное изменение и пополнение метаданных, создаваемых в процессе автоматизированного обнаружения знаний. Это выполняется в действии «Управление доменами», когда изменение можно применить к конкретному значению данных.

  • Дополнительные сведения в документации см. в разделе Изменение значений домена.

  • Чтобы просмотреть видео, в котором показано управление доменами, щелкните здесь. Обратите внимание, что в этом видео значения домена изменяются на странице «Управление значениями домена» в мастере «Обнаружение знаний». Кроме того, эти шаги можно выполнить на странице «Значения домена» действия «Управление доменами».

Импорт набора знаний из файла .dqs

Вы можете как импортировать домен из файла .dqs в существующую базу знаний, так и импортировать базу знаний целиком из файла .dqs в новую базу знаний. Для этого нужно сначала экспортировать существующий домен или базу знаний в файл .dqs. Файл .dqs с доменом содержит все данные этого домена. Файл .dqs с базой знаний содержит все сведения из этой базы знаний, в том числе домены и политику сопоставления.

Импорт набора знаний из файла Excel

Вы можете импортировать значения домена из файла электронной таблицы Excel в существующий домен или базу знаний. Для этого необходимо сначала создать электронную таблицу Excel со значениями домена для импорта, затем убедиться в наличии установленной программы Excel на компьютере с Клиент Data Quality, куда планируется импортировать значения с помощью Клиент Data Quality. Нельзя экспортировать значения домена из домена или базы знаний в файл Excel.

Импорт знаний из проекта очистки обратно в базу знаний

После выполнения очистки данных в проекте DQS с использованием базы знаний можно импортировать знания, полученные во время проверки, обратно в базу. Это позволяет сохранять набор знаний, полученные в ходе осуществления проекта, а также постоянно накапливать наборы знаний в базе знаний.

Использование базы знаний DQS по умолчанию

Службы DQS поставляются с предварительно созданной базой знаний, известной как «Данные служб DQS», содержащей домены для данных о компаниях и адресах США. С помощью этой базы знаний можно быстро начать проект, не создавая новую базу знаний. База знаний «Данные служб DQS» доступна только для чтения, но на ее основе диспетчер данных может создать новую базу знаний.