Поделиться через


Требования к управлению данными

Аналитика в масштабе облака рекомендует учитывать следующие требования для управления данными:

  • Определение сущности данных для создания общего бизнес-словаря в бизнес-глоссарии. Сущности данных в этом контексте означают такие понятия, как клиент, поставщик, материалы, сотрудники и другие.
  • Идентификация и обнаружение сущностей данных.
  • Классификация данных для управления безопасностью доступа к данным, конфиденциальностью данных и хранением данных.
  • Назначение владельцев данных, отвечающих за их управление, и администраторов данных, отвечающих за их защиту и качество.
  • Процессы управления данными.
  • Управление жизненным циклом данных для управления сроком хранения данных
  • Определение политик и правил управления конкретными данными в течение всего жизненного цикла.
  • Применение политик к разным хранилищам данных в альбомной ориентации данных.
  • Управление главными данными для обеспечения согласованности данных в операционных и аналитических системах, таких как клиент, продукт и поставщик.
  • Происхождение метаданных для понимания преобразования и связи сущностей данных.
  • Технология для обеспечения возможности управлять структурированными, многоструктурированными и неструктурированными данными. Управление может охватывать центр обработки данных, несколько облаков и пограничные устройства.

Одна из проблем заключается в том, что данные собираются и хранятся в нескольких местах в разных местах предприятия. Кроме того, это могут быть данные, собираемые и хранящиеся в разных географических регионах и юрисдикциях. В результате для управления одними и теми же данными в разных юрисдикциях применяются разные законы. Обнаружение данных, распределенных между несколькими облаками и географическими расположениями, для:

  • Понять, какие существуют атрибуты данных, сущности данных и связи данных в альбомной ориентации данных.
  • Классифицировать данные для управления ими.
  • Определите политики, чтобы указать способ управления данными для каждого типа классификации данных и управления жизненным циклом.
  • Обеспечить качество данных, безопасность доступа к данным, конфиденциальность данных и политик управления жизненным циклом в альбомной ориентации данных.

Классификация данных

Классификация данных — это способ классификации ресурсов данных путем назначения уникальных логических тегов или классов ресурсам данных. В основе классификации лежит бизнес-контекст данных.

Для понимания уровня конфиденциальности и срока хранения данных необходимо определить способ их классификации. При классификации данных требуется разработать:

  • Схему классификации конфиденциальности данных
  • Схему классификации хранения данных

Схема классификации конфиденциальности данных

Классификация Description
Общедоступный Любой пользователь может получить доступ к данным, и его можно отправить любому пользователю. Например, откройте данные для государственных организаций.
Только для внутреннего применения Доступ к данным может получить только сотрудники, и его нельзя отправлять за пределы компании.
Конфиденциальная Данные можно совместно использовать только в том случае, если это необходимо для конкретной задачи. Данные не могут быть отправлены за пределы компании без соглашения о неразглашении.
Конфиденциальные (персональные) данные Данные содержат частную информацию, которая должна быть маскирована и предоставлена только на основе ограниченного времени. Данные не могут быть отправлены несанкционированным сотрудникам или за пределами компании.
С ограниченным доступом Эти данные могут предоставляться только именованным лицам, которые отвечают за защиту. Например, юридические документы или торговые секреты.

Схема классификации жизненного цикла данных

Хранение Description
Нет Данные можно удалять в любое время.
Временные процедуры Храните данные в течение короткого периода времени. Например, сохраняйте данные Twitter в течение недели.
Фиксированный период Храните данные в течение заданного количества лет, после чего его можно удалить. Например, сохраняйте налоговые записи в течение семи лет, чтобы соответствовать законам правительства.
Постоянный Никогда не удалять данные. Например, юридическая корреспонденция.

Автоматизация процесса классификации конфиденциальности данных и хранения жизненного цикла данных с помощью классов, определенных в каждой схеме, необходима для последовательной маркировки данных в распределенном ландшафте данных. Автоматизация обеспечивает согласованное и правильное управление. Для управления данными в соответствии с классификацией определите правила и политики для каждого класса, указанного в схеме классификации.

Роли и обязанности по системе управления данными

Еще одним требованием является обеспечение подотчетности. В противном случае путаница заключается в том, кто отвечает за управление данными. Как ответить на следующие вопросы в отсутствие подотчетности?

  • Кто задает метрики успешности и следит, насколько хорошо работает программа управления данными?
  • Кто является владельцем данных?
  • Кто составляет и обеспечивает ведение бизнес-глоссария?
  • Кто формирует и утверждает политику безопасности доступа к данным?
  • Кто несет ответственность за соблюдение требований при защите конфиденциальности персональных данных?
  • Кто отслеживает качество данных продукта, просматривая брошюры и партнерские веб-сайты?
  • Кто обеспечивает согласованность данных клиента во всех системах?
  • Кто контролирует соответствие данных внешней подписки лицензии?
  • Кто контролирует привилегированных пользователей, таких как администраторы баз данных и специалисты по обработке данных?
  • Это руководитель уровня C? Это руководитель отдела?
  • Это руководитель отдела управления, рисков и соответствия требованиям?
  • Что насчет юридического отдела?
  • Несет ли ИТ-ответственность?

Определение ролей и обязанностей позволит избежать путаницы и задаст основу для материализации языка и региональных параметров данных.

Процессы управления данными

Наряду с ролями и обязанностями необходимые также следующие процессы управления данными:

  • Управление созданием и обслуживанием общего бизнес-словаря
  • Узнайте и определите, какие данные у вас есть, что это означает, и где он хранится.
  • Классификация данных для управления ими.
  • Управление определением и обслуживанием политик безопасности доступа к данным.
  • Управление определением и обслуживанием политик конфиденциальности данных.
  • Обнаружение проблем, связанных с качеством данных, и их устранение.
  • Использование политик для обеспечения соответствия выполняемых действий требованиям.
  • Управление обслуживанием основных данных.

Политики и правила управления данными

Определите следующие политики и правила управления данными:

  • Правила целостности данных
  • Политики и правила приема данных
  • Политики и правила управления безопасностью доступа к данным
  • Политики и правила управления конфиденциальностью данных
  • Политики и правила качества данных
  • Политики и правила обслуживания данных
  • Политики и правила хранения данных

Полученные политики и правила необходимо сопоставить с каждым классом в схемах классификации управления данными.

Управление основными данными

Другим требованием для управления данными является управление главными данными. Основные данные — это наиболее распространенные общие данные, хранящиеся в организации и включающие основные сущности данных. К основным сущностям данных относятся клиент, поставщик, материалы, сотрудник и ресурс, а также данные плана финансовых счетов, которые находятся в разных финансовых приложениях. Так как основные данные настолько широко распространены, это не зависит от приложения. Они необходимы для работы приложений по обработке транзакций и аналитических систем. Поддержание синхронизации основных данных может устранить многие ошибки данных и процессов. Таким образом, идеальным вариантом будет централизованное обслуживание основных данных с помощью общего процесса синхронизации всех необходимых систем. Кроме того, управление требуется для определения лиц, допускаемых к обслуживанию основных данных, и мест для выполнения обслуживания.

То же самое относится и к эталонным данным, таким как наборы кода и данные финансовых рынков. В этом случае стандартизацию и синхронизацию наборов кода называют «управлением эталонными данными», которое также является обязательным требованием.

преобразования метаданных;

Наконец, существует требование к преобразованию метаданных. Вы можете использовать путь аудита, чтобы узнать, где произошли данные и как он преобразуется по маршруту в отчет или хранилище данных. Метаданные используются для того, чтобы отследить, кто или что обслуживает данные, включая время и местоположение.

Краткие сведения о комплексном управлении данными

Для управления данными на протяжении всего жизненного цикла в хранилищах данных на пограничных устройствах, нескольких облаках и центре обработки данных необходимо комплексное решение.

Схема платформы управления данными.

Решение по управлению данными должно содержать несколько компонентов:

  • Концепция и стратегия управления данными.
  • Сами данные (данные клиента, данные поставщика, данные заказа и т. д.).
  • Жизненный цикл данных от их создания до уничтожения, в течение которого данными необходимо управлять.
  • Роли и обязанности по управлению данными.
  • Процессы и действия по управлению данными, а также их применение к жизненному циклу данных.
  • Политики и правила управления данными в разных точках жизненного цикла.
  • Технологии управления данными, помогающие сделать управление данными возможным.

Следующие шаги