Требования к управлению данными
Аналитика в масштабе облака рекомендует учитывать следующие требования для управления данными:
- Определение сущности данных для создания общего бизнес-словаря в бизнес-глоссарии. Сущности данных в этом контексте означают такие понятия, как клиент, поставщик, материалы, сотрудники и другие.
- Идентификация и обнаружение сущностей данных.
- Классификация данных для управления безопасностью доступа к данным, конфиденциальностью данных и хранением данных.
- Назначение владельцев данных, отвечающих за их управление, и администраторов данных, отвечающих за их защиту и качество.
- Процессы управления данными.
- Управление жизненным циклом данных для управления сроком хранения данных
- Определение политик и правил управления конкретными данными в течение всего жизненного цикла.
- Применение политик к разным хранилищам данных в альбомной ориентации данных.
- Управление главными данными для обеспечения согласованности данных в операционных и аналитических системах, таких как клиент, продукт и поставщик.
- Происхождение метаданных для понимания преобразования и связи сущностей данных.
- Технология для обеспечения возможности управлять структурированными, многоструктурированными и неструктурированными данными. Управление может охватывать центр обработки данных, несколько облаков и пограничные устройства.
Одна из проблем заключается в том, что данные собираются и хранятся в нескольких местах в разных местах предприятия. Кроме того, это могут быть данные, собираемые и хранящиеся в разных географических регионах и юрисдикциях. В результате для управления одними и теми же данными в разных юрисдикциях применяются разные законы. Обнаружение данных, распределенных между несколькими облаками и географическими расположениями, для:
- Понять, какие существуют атрибуты данных, сущности данных и связи данных в альбомной ориентации данных.
- Классифицировать данные для управления ими.
- Определите политики, чтобы указать способ управления данными для каждого типа классификации данных и управления жизненным циклом.
- Обеспечить качество данных, безопасность доступа к данным, конфиденциальность данных и политик управления жизненным циклом в альбомной ориентации данных.
Классификация данных
Классификация данных — это способ классификации ресурсов данных путем назначения уникальных логических тегов или классов ресурсам данных. В основе классификации лежит бизнес-контекст данных.
Для понимания уровня конфиденциальности и срока хранения данных необходимо определить способ их классификации. При классификации данных требуется разработать:
- Схему классификации конфиденциальности данных
- Схему классификации хранения данных
Схема классификации конфиденциальности данных
Классификация | Description |
---|---|
Общедоступный | Любой пользователь может получить доступ к данным, и его можно отправить любому пользователю. Например, откройте данные для государственных организаций. |
Только для внутреннего применения | Доступ к данным может получить только сотрудники, и его нельзя отправлять за пределы компании. |
Конфиденциальная | Данные можно совместно использовать только в том случае, если это необходимо для конкретной задачи. Данные не могут быть отправлены за пределы компании без соглашения о неразглашении. |
Конфиденциальные (персональные) данные | Данные содержат частную информацию, которая должна быть маскирована и предоставлена только на основе ограниченного времени. Данные не могут быть отправлены несанкционированным сотрудникам или за пределами компании. |
С ограниченным доступом | Эти данные могут предоставляться только именованным лицам, которые отвечают за защиту. Например, юридические документы или торговые секреты. |
Схема классификации жизненного цикла данных
Хранение | Description |
---|---|
Нет | Данные можно удалять в любое время. |
Временные процедуры | Храните данные в течение короткого периода времени. Например, сохраняйте данные Twitter в течение недели. |
Фиксированный период | Храните данные в течение заданного количества лет, после чего его можно удалить. Например, сохраняйте налоговые записи в течение семи лет, чтобы соответствовать законам правительства. |
Постоянный | Никогда не удалять данные. Например, юридическая корреспонденция. |
Автоматизация процесса классификации конфиденциальности данных и хранения жизненного цикла данных с помощью классов, определенных в каждой схеме, необходима для последовательной маркировки данных в распределенном ландшафте данных. Автоматизация обеспечивает согласованное и правильное управление. Для управления данными в соответствии с классификацией определите правила и политики для каждого класса, указанного в схеме классификации.
Роли и обязанности по системе управления данными
Еще одним требованием является обеспечение подотчетности. В противном случае путаница заключается в том, кто отвечает за управление данными. Как ответить на следующие вопросы в отсутствие подотчетности?
- Кто задает метрики успешности и следит, насколько хорошо работает программа управления данными?
- Кто является владельцем данных?
- Кто составляет и обеспечивает ведение бизнес-глоссария?
- Кто формирует и утверждает политику безопасности доступа к данным?
- Кто несет ответственность за соблюдение требований при защите конфиденциальности персональных данных?
- Кто отслеживает качество данных продукта, просматривая брошюры и партнерские веб-сайты?
- Кто обеспечивает согласованность данных клиента во всех системах?
- Кто контролирует соответствие данных внешней подписки лицензии?
- Кто контролирует привилегированных пользователей, таких как администраторы баз данных и специалисты по обработке данных?
- Это руководитель уровня C? Это руководитель отдела?
- Это руководитель отдела управления, рисков и соответствия требованиям?
- Что насчет юридического отдела?
- Несет ли ИТ-ответственность?
Определение ролей и обязанностей позволит избежать путаницы и задаст основу для материализации языка и региональных параметров данных.
Процессы управления данными
Наряду с ролями и обязанностями необходимые также следующие процессы управления данными:
- Управление созданием и обслуживанием общего бизнес-словаря
- Узнайте и определите, какие данные у вас есть, что это означает, и где он хранится.
- Классификация данных для управления ими.
- Управление определением и обслуживанием политик безопасности доступа к данным.
- Управление определением и обслуживанием политик конфиденциальности данных.
- Обнаружение проблем, связанных с качеством данных, и их устранение.
- Использование политик для обеспечения соответствия выполняемых действий требованиям.
- Управление обслуживанием основных данных.
Политики и правила управления данными
Определите следующие политики и правила управления данными:
- Правила целостности данных
- Политики и правила приема данных
- Политики и правила управления безопасностью доступа к данным
- Политики и правила управления конфиденциальностью данных
- Политики и правила качества данных
- Политики и правила обслуживания данных
- Политики и правила хранения данных
Полученные политики и правила необходимо сопоставить с каждым классом в схемах классификации управления данными.
Управление основными данными
Другим требованием для управления данными является управление главными данными. Основные данные — это наиболее распространенные общие данные, хранящиеся в организации и включающие основные сущности данных. К основным сущностям данных относятся клиент, поставщик, материалы, сотрудник и ресурс, а также данные плана финансовых счетов, которые находятся в разных финансовых приложениях. Так как основные данные настолько широко распространены, это не зависит от приложения. Они необходимы для работы приложений по обработке транзакций и аналитических систем. Поддержание синхронизации основных данных может устранить многие ошибки данных и процессов. Таким образом, идеальным вариантом будет централизованное обслуживание основных данных с помощью общего процесса синхронизации всех необходимых систем. Кроме того, управление требуется для определения лиц, допускаемых к обслуживанию основных данных, и мест для выполнения обслуживания.
То же самое относится и к эталонным данным, таким как наборы кода и данные финансовых рынков. В этом случае стандартизацию и синхронизацию наборов кода называют «управлением эталонными данными», которое также является обязательным требованием.
преобразования метаданных;
Наконец, существует требование к преобразованию метаданных. Вы можете использовать путь аудита, чтобы узнать, где произошли данные и как он преобразуется по маршруту в отчет или хранилище данных. Метаданные используются для того, чтобы отследить, кто или что обслуживает данные, включая время и местоположение.
Краткие сведения о комплексном управлении данными
Для управления данными на протяжении всего жизненного цикла в хранилищах данных на пограничных устройствах, нескольких облаках и центре обработки данных необходимо комплексное решение.
Решение по управлению данными должно содержать несколько компонентов:
- Концепция и стратегия управления данными.
- Сами данные (данные клиента, данные поставщика, данные заказа и т. д.).
- Жизненный цикл данных от их создания до уничтожения, в течение которого данными необходимо управлять.
- Роли и обязанности по управлению данными.
- Процессы и действия по управлению данными, а также их применение к жизненному циклу данных.
- Политики и правила управления данными в разных точках жизненного цикла.
- Технологии управления данными, помогающие сделать управление данными возможным.