Основные понятия служб Data Quality Services
В этом разделе содержится краткая сводка по основным понятиям служб Службы Data Quality Services (DQS) в управлении набором знаний, проектах служб DQS и их администрировании.
В этом разделе
Основные понятия управления знаниями
Основные понятия проекта служб DQS
Основные понятия администрирования служб DQS
Основные понятия управления знаниями
База знаний DQS — это репозиторий метаданных, создаваемый администратором данных или ИТ-специалистом для использования при улучшении качества данных посредством их очистки и сопоставления. К управлению знаниями DQS относятся процессы, используемые для создания базы знаний и управления ею как в автоматизированном, так и в интерактивном режиме.
Обнаружение знаний
Обнаружение знаний — это автоматизированный процесс, в котором анализируются образцы данных организации для построения знаний об этих данных. После получения результатов анализа можно проверить и улучшить знания, а затем применить их для выполнения очистки, сопоставления и профилирования данных. Дополнительные сведения см. в разделе Базы знаний и домены DQS.
Управление доменами
Процесс управления доменами позволяет изменить или дополнить знания, сформированные процессом обнаружения знаний. Можно интерактивно изменять, обновлять и просматривать знания в базе знаний. База знаний состоит из доменов данных, содержащих значения доменов и их состояние, правила доменов, связи на основе термина и эталонные данные. При управлении доменами можно изменить свойства домена, прикрепить к домену эталонные данные, управлять правилами доменов, управлять значениями доменов и вводить связи данных, а также создавать, удалять, импортировать и экспортировать домены. Также можно использовать составные домены, которые включают несколько отдельных доменов. Дополнительные сведения см. в разделе Базы знаний и домены DQS.
Политика сопоставления
Политика сопоставления содержит правила сопоставления, используемые для выполнения дедупликации данных. Процесс политики сопоставления позволяет создавать правила сопоставления, настраивать их на основе результатов сопоставления и профилирования данных, а также добавлять политику в базу знаний. Дополнительные сведения см. в разделе Сопоставление данных.
Службы эталонных данных
С помощью эталонных данных можно проверить, исправить и обогатить данные, воспользовавшись службами компаний, гарантирующих качество своих эталонных данных. Для подключения к поставщикам эталонных данных можно использовать службы Windows Azure Marketplace или установить прямое соединение с поставщиком. Дополнительные сведения см. в разделе Службы эталонных данных в DQS.
Дополнительные сведения об управлении знаниями в DQS см. в разделе Базы знаний и домены DQS.
[В начало]
Основные понятия проекта служб DQS
Диспетчер данных выполняет операции повышения качества данных (очистка и сопоставление) с использованием проекта качества данных в приложении Клиент Data Quality.
Очистка данных
Очистка данных в DQS выполняется на основе знаний, хранящихся в базе знаний DQS. Очистка данных в DQS представляет собой двухэтапный процесс.
Автоматическая очистка. DQS использует знания из выбранной базы знаний для проекта очистки, чтобы предложить исправления и рекомендации для значений в источнике данных.
Интерактивная очистка. Диспетчер данных может выполнить интерактивный процесс очистки для изменения или дополнения исправлений данных, предложенных автоматизированным процессом очистки данных. Диспетчер данных делает это с помощью уровней достоверности и статистики, определенной процессом очистки данных, или путем ввода вручную собственных изменений проекта.
После очистки данных диспетчер данных может экспортировать обработанные данные в базу данных SQL Server, CSV-файл или файл Excel. Дополнительные сведения см. в разделе Очистка данных.
Сопоставление данных
Процесс сопоставления позволяет диспетчеру данных сравнить данные таким образом, чтобы скорректировать похожие, но слегка отличающиеся данные в процессе дедупликации. Службы DQS выполняют дедупликацию на основе правил сопоставления, содержащихся в базе знаний; диспетчер данных указывает параметры процесса сопоставления из проекта служб DQS. Дополнительные сведения см. в разделе Сопоставление данных.
Профилирование и уведомления
Профилирование данных дает диспетчерам данных статистику реального времени и сведения о данных, которые обрабатываются в DQS, для операций очистки или сопоставления при выполнении проекта качества данных. Профилирование данных позволяет оценить эффективность операций очистки и сопоставления в проекте качества данных, а уведомления помогают пользователю выполнять действия для совершенствования операций очистки и сопоставления. Дополнительные сведения см. в разделе Профилирование данных и уведомления в DQS.
Дополнительные сведения о проектах качества данных в DQS см. в разделе Проекты служб Data Quality Services (DQS).
[В начало]
Основные понятия администрирования служб DQS
Администратор DQS может выполнять разнообразные административные задачи в приложении Клиент Data Quality.
Мониторинг активности
В ходе мониторинга активности отображаются статус и состояние каждого действия, выполненного в пределах диапазона данных, предоставляются данные по каждому действию. Администраторы DQS могут управлять этими действиями. Дополнительные сведения см. в разделе Мониторинг операций DQS.
Конфигурация
Параметр «Конфигурация» позволяет выполнять следующие действия.
Настраивать параметры службы эталонных данных. Дополнительные сведения см. в разделе Настройка служб DQS для использования справочных данных.
Задавать пороговые значения для операций очистки и сопоставления. Дополнительные сведения см. в разделе Настройка пороговых значений для очистки и сопоставления.
Включать и отключать уведомления о профилировании. Дополнительные сведения см. в разделе Включение/отключение уведомлений о профилировании в службах DQS.
Настраивать степени серьезности для файлов журнала DQS на уровне действий или на более точном уровне модулей. Дополнительные сведения см. в разделе Настройка степеней серьезности для файлов журнала DQS.
Безопасность DQS
Роли в рамках механизма обеспечения безопасности SQL Server используются для обеспечения безопасности DQS. Уровень доступа пользователя в приложении Клиент Data Quality определяется тремя ролями DQS: dqs_administrator, dqs_kb_editor и dqs_kb_operator. Роли нельзя предоставлять пользователям в приложении Клиент Data Quality. Для этого используется среда SQL Server Management Studio. Дополнительные сведения см. в разделе Безопасность DQS.
Дополнительные сведения об администрировании DQS см. в разделе Администрирование DQS.
[В начало]