Поделиться через


Требования к управлению данными

Аналитика в масштабе облака рекомендует учитывать следующие требования к управлению данными:

  • Определение сущности данных для создания общего бизнес-словаря в бизнес-глоссарии. Сущности данных в этом контексте означают такие понятия, как клиент, поставщик, материалы, сотрудники и другие.
  • Идентификация и обнаружение сущностей данных.
  • Классификация данных для управления безопасностью доступа к данным, конфиденциальностью данных и хранением данных.
  • Назначение владельцев данных, отвечающих за их управление, и администраторов данных, отвечающих за их защиту и качество.
  • Процессы управления данными.
  • Управление жизненным циклом данных для управления сроком хранения данных
  • Определение политик и правил управления конкретными данными в течение всего жизненного цикла.
  • Применение политик к разным хранилищам данных в альбомной ориентации данных.
  • Управление основными данными для обеспечения соответствия данных. В операционных и аналитических системах это может быть клиент, продукт и поставщик.
  • Происхождение метаданных для понимания преобразования и связи сущностей данных.
  • Технология для обеспечения возможности управлять структурированными, многоструктурированными и неструктурированными данными. Управление может охватывать центр обработки данных, несколько облаков и пограничные устройства.

Одна из проблем заключается в том, что данные собираются и хранятся в нескольких местах на предприятии. Кроме того, это могут быть данные, собираемые и хранящиеся в разных географических регионах и юрисдикциях. В результате для управления одними и теми же данными в разных юрисдикциях применяются разные законы. Обнаруживайте данные, распределенные по нескольким облакам и географическим расположениям, чтобы:

  • Понять, какие существуют атрибуты данных, сущности данных и связи данных в альбомной ориентации данных.
  • Классифицировать данные для управления ими.
  • Определите политики, чтобы указать, как следует управлять данными для каждого типа классификации данных и управления жизненным циклом.
  • Обеспечить качество данных, безопасность доступа к данным, конфиденциальность данных и политик управления жизненным циклом в альбомной ориентации данных.

Классификация данных

Классификация данных — это способ классификации ресурсов данных путем назначения им уникальных логических тегов или классов. В основе классификации лежит бизнес-контекст данных.

Для понимания уровня конфиденциальности и срока хранения данных необходимо определить способ их классификации. При классификации данных требуется разработать:

  • Схему классификации конфиденциальности данных
  • Схему классификации хранения данных

Ниже приведены примеры этих схем:

Схема классификации конфиденциальности данных

Классификация Описание
Общие Любой пользователь может получить доступ к данным и отправить их кому угодно. Например, откройте правительственные данные.
Только для внутреннего применения Только сотрудники могут получить доступ к данным, и они не могут быть отправлены за пределы компании.
Конфиденциальный К данным можно предоставлять общий доступ только в том случае, если они необходимы для определенной задачи. Данные не могут быть отправлены за пределы компании без соглашения о неразглашении.
Конфиденциальные (персональные) данные Данные содержат частную информацию, которая должна быть замаскирована и предоставлена только в течение ограниченного времени. Данные не могут быть отправлены неавторизованному персоналу или за пределами компании.
С ограниченным доступом Эти данные могут предоставляться только именованным лицам, которые отвечают за их защиту. Например, юридические документы или торговые секреты.

Схема классификации жизненного цикла данных

Сохранение Описание
Нет Данные можно удалить в любое время.
Временный диск Хранить данные в течение короткого периода времени. Например, храните данные Twitter в течение недели.
Фиксированный период Хранить данные в течение заданного количества лет, после чего их можно удалить. Например, хранить налоговые записи в течение семи лет в соответствии с правительственными законами.
Постоянно Никогда не удаляйте данные. Например, юридическая переписка.

Автоматизация процесса классификации конфиденциальности данных и срока хранения данных с помощью классов, определенных в каждой схеме, необходима для согласованной маркировки данных в распределенном ландшафте данных. Автоматизация обеспечивает согласованность данных и их корректное управление. Для управления данными в соответствии с классификацией определите правила и политики для каждого класса, указанного в схеме классификации.

Роли и обязанности по управлению данными

Еще одним требованием является обеспечение подотчетности. В противном случае возникает путаница относительно того, кто отвечает за управление данными. Как ответить на следующие вопросы в отсутствие подотчетности?

  • Кто задает метрики успешности и следит, насколько хорошо работает программа управления данными?
  • Кто является владельцем данных?
  • Кто составляет и обеспечивает ведение бизнес-глоссария?
  • Кто формирует и утверждает политику безопасности доступа к данным?
  • Кто несет ответственность за соблюдение требований при защите конфиденциальности персональных данных?
  • Кто отслеживает качество данных продукта, просматривая брошюры и партнерские веб-сайты?
  • Кто обеспечивает согласованность данных клиента во всех системах?
  • Кто контролирует соответствие данных внешней подписки лицензии?
  • Кто контролирует привилегированных пользователей, таких как администраторы баз данных и специалисты по обработке данных?

Это руководитель уровня C? Это руководитель отдела? Это руководитель отдела управления, рисков и соответствия требованиям? Что насчет юридического отдела? Или это обязанность ИТ-отдела? Определение ролей и обязанностей позволит избежать путаницы и задаст основу для материализации языка и региональных параметров данных.

Процессы управления данными

Наряду с ролями и обязанностями необходимые также следующие процессы управления данными:

  • Управление созданием и обслуживанием общего бизнес-словаря
  • Обнаружение и определение имеющихся данных, их значений и места их хранения
  • Классификация данных для управления ими.
  • Управление определением и обслуживанием политик безопасности доступа к данным.
  • Управление определением и обслуживанием политик конфиденциальности данных.
  • Обнаружение проблем, связанных с качеством данных, и их устранение.
  • Использование политик для обеспечения соответствия выполняемых действий требованиям.
  • Управление обслуживанием основных данных.

Политики и правила управления данными

Определите следующие политики и правила управления данными:

  • Правила целостности данных
  • Политики и правила приема данных
  • Политики и правила управления безопасностью доступа к данным
  • Политики и правила управления конфиденциальностью данных
  • Политики и правила качества данных
  • Политики и правила обслуживания данных
  • Политики и правила хранения данных

Полученные политики и правила необходимо сопоставить с каждым классом в схемах классификации управления данными.

Управление основными данными

Еще одним требованием к управлению данными является master управление данными. Основные данные — это наиболее распространенные общие данные, хранящиеся в организации и включающие основные сущности данных. К основным сущностям данных относятся клиент, поставщик, материалы, сотрудник и ресурс, а также данные плана финансовых счетов, которые находятся в разных финансовых приложениях. Так как master данные настолько широко распространены, они не зависят от приложений. Они необходимы для работы приложений по обработке транзакций и аналитических систем. Поддержание синхронизации основных данных может устранить многие ошибки данных и процессов. Таким образом, идеальным вариантом будет централизованное обслуживание основных данных с помощью общего процесса синхронизации всех необходимых систем. Кроме того, управление требуется для определения лиц, допускаемых к обслуживанию основных данных, и мест для выполнения обслуживания.

То же самое относится и к эталонным данным, таким как наборы кода и данные финансовых рынков. В этом случае стандартизацию и синхронизацию наборов кода называют «управлением эталонными данными», которое также является обязательным требованием.

Преобразование метаданных

Наконец, существует требование к преобразованию метаданных. Чтобы выяснить, откуда поступили данные и каким образом они были преобразованы для маршрутизации в отчет или хранилище данных, можно использовать журнал аудита. Метаданные используются для того, чтобы отследить, кто или что обслуживает данные, включая время и местоположение.

Краткие сведения о комплексном управлении данными

Для управления данными на протяжении всего жизненного цикла в хранилищах данных на пограничных устройствах, нескольких облаках и центре обработки данных необходимо комплексное решение.

Схема платформы управления данными.

Решение по управлению данными должно содержать несколько компонентов:

  • Концепция и стратегия управления данными.
  • Сами данные (данные клиента, данные поставщика, данные заказа и т. д.).
  • Жизненный цикл данных от их создания до уничтожения, в течение которого данными необходимо управлять.
  • Роли и обязанности по управлению данными.
  • Процессы и действия по управлению данными, а также их применение к жизненному циклу данных.
  • Политики и правила управления данными в разных точках жизненного цикла.
  • Технологии управления данными, помогающие сделать управление данными возможным.

Дальнейшие действия