Добавление знаний в базу знаний
В этом разделе описываются способы, которыми можно добавить знания в базу знаний служб Службы Data Quality Services (DQS). Прежде чем приступать к работе со службами DQS, необходимо получить набор знаний о данных. Для этого необходимо построить и поддерживать базу знаний служб DQS, а также пополнять ее наборами знаний, связанными с соответствующими типами источников данных. База знаний является репозиторием знаний о данных, который дает представление о данных и помогает поддерживать их целостность.
База знаний содержит домены данных, связанные с источником данных. Для каждого домена данных в базе знаний хранятся идентифицированные термины, орфографические ошибки, правила проверки и бизнес-правила, а также справочные данные, которые могут использоваться для выполнения действий со службами DQS на источнике данных. В службах DQS эти знания используются для выявления неправильных или недопустимых данных, либо для сопоставления.
Добавлять знания в базу знаний вы можете приведенными ниже автоматическими и ручными способами.
Обнаружение набора знаний
Управление значениями данных в домене
Импорт набора знаний из файла .dqs
Импорт набора знаний из файла Excel
Импорт знаний из проекта очистки обратно в базу знаний
Использование базы знаний DQS по умолчанию
Обнаружение набора знаний
В процессе обнаружения знаний образец данных анализируется на соответствие критериям DQS, затем полученные знания добавляются в базу знаний. Это изменяющий данные автоматизированный процесс, при котором обнаруживаются несоответствия и синтаксические ошибки в данных. Действие по обнаружению знаний выполняется мастером, который представляет собой страницу для интерактивного управления значениями домена. Дополнительные сведения см. в разделе Обнаружение набора знаний.
Управление значениями данных в домене
В службах DQS предусмотрено интерактивное изменение и пополнение метаданных, создаваемых в процессе автоматизированного обнаружения знаний. Это выполняется в действии «Управление доменами», когда изменение можно применить к конкретному значению данных.
Дополнительные сведения в документации см. в разделе Изменение значений домена.
Чтобы просмотреть видео, в котором показано управление доменами, щелкните здесь. Обратите внимание, что в этом видео значения домена изменяются на странице «Управление значениями домена» в мастере «Обнаружение знаний». Кроме того, эти шаги можно выполнить на странице «Значения домена» действия «Управление доменами».
Импорт набора знаний из файла .dqs
Вы можете как импортировать домен из файла .dqs в существующую базу знаний, так и импортировать базу знаний целиком из файла .dqs в новую базу знаний. Для этого нужно сначала экспортировать существующий домен или базу знаний в файл .dqs. Файл .dqs с доменом содержит все данные этого домена. Файл .dqs с базой знаний содержит все сведения из этой базы знаний, в том числе домены и политику сопоставления.
- Дополнительные сведения в документации см. в разделе Импорт домена из файла .dqs или Импорт базы знаний из файла .dqs.
Импорт набора знаний из файла Excel
Вы можете импортировать значения домена из файла электронной таблицы Excel в существующий домен или базу знаний. Для этого необходимо сначала создать электронную таблицу Excel со значениями домена для импорта, затем убедиться в наличии установленной программы Excel на компьютере с Клиент Data Quality, куда планируется импортировать значения с помощью Клиент Data Quality. Нельзя экспортировать значения домена из домена или базы знаний в файл Excel.
- Дополнительные сведения в документации см. в разделе Импорт значений из файла Excel в домен или Импорт доменов из файла Excel при обнаружении набора знаний.
Импорт знаний из проекта очистки обратно в базу знаний
После выполнения очистки данных в проекте DQS с использованием базы знаний можно импортировать знания, полученные во время проверки, обратно в базу. Это позволяет сохранять набор знаний, полученные в ходе осуществления проекта, а также постоянно накапливать наборы знаний в базе знаний.
- Дополнительные сведения в документации см. в разделе Импорт значений проекта очистки в домен.
Использование базы знаний DQS по умолчанию
Службы DQS поставляются с предварительно созданной базой знаний, известной как «Данные служб DQS», содержащей домены для данных о компаниях и адресах США. С помощью этой базы знаний можно быстро начать проект, не создавая новую базу знаний. База знаний «Данные служб DQS» доступна только для чтения, но на ее основе диспетчер данных может создать новую базу знаний.
- Дополнительные сведения в документации см. в разделе Использование базы знаний DQS по умолчанию.