Requisitos para la gobernanza de datos

El análisis a escala de la nube recomienda tener en cuenta los siguientes requisitos para la gobernanza de datos:

  • Definición de entidad de datos para crear un vocabulario empresarial común recogido en un glosario empresarial. Las entidades de datos en este contexto significan conceptos como clientes, proveedores, materiales, empleados y otros.
  • Identificación y detección de entidades de datos.
  • Clasificación de datos para regular la seguridad del acceso a datos, la privacidad de los datos y la retención de estos.
  • Personas, como propietarios de datos con responsabilidad de gobernanza y administradores de datos responsables de la protección y la calidad de los datos.
  • Procesos de gobernanza de datos.
  • Administración del ciclo de vida de los datos para controlar cuánto tiempo se deben conservar los datos.
  • Directivas y reglas para definir cómo deben gobernarse datos específicos a lo largo de su ciclo de vida.
  • Aplicación de directivas en los almacenes de datos en un entorno de datos distribuidos.
  • Administración de los datos maestros para mantener la coherencia. Puede aplicarse tanto a sistemas operativos como analíticos, por ejemplo, del cliente, producto y proveedor.
  • Linaje de metadatos para comprender la transformación y la relación de las entidades de datos.
  • Tecnología para posibilitar el control de los datos estructurados, multiestructurados y no estructurados. La gobernanza puede abarcar el centro de datos, varias nubes y el perímetro.

Un desafío es que los datos se recopilan y almacenan en varios lugares de la empresa. Los datos pueden incluir datos recopilados y almacenados en distintas zonas geográficas y distintas jurisdicciones legales. Como resultado, puede que se apliquen legislaciones diferentes para gobernar los mismos datos en jurisdicciones distintas. Descubra los datos distribuidos entre varias nubes y ubicaciones geográficas para:

  • Comprender qué atributos de datos, entidades de datos y relaciones de datos existen en el entorno de datos distribuidos.
  • Clasificar los datos para saber cómo gobernarlos
  • Definir directivas para especificar cómo deben gobernarse los datos para cada tipo de clasificación y administración del ciclo de vida de los datos.
  • Aplicar directivas de calidad de datos, seguridad de acceso a datos, privacidad de datos y administración del ciclo de vida en todo el entorno de datos distribuidos.

Clasificación de los datos

La clasificación de datos, es una manera de categorizar los recursos de datos mediante la asignación de clases o etiquetas lógicas únicas a los recursos de datos. La clasificación se basa en el contexto empresarial de los datos.

Es necesario contar con una forma de clasificar los datos para comprender su nivel de confidencialidad y cuánto tiempo deben conservarse. La clasificación requiere:

  • Un esquema de clasificación de la confidencialidad de los datos
  • Un esquema de clasificación de la retención de datos

A continuación, se muestra un ejemplo de estos esquemas:

Esquema de clasificación de confidencialidad de los datos

clasificación Descripción
Público Cualquiera puede acceder a los datos y se pueden enviar a cualquiera. Por ejemplo, abra datos de gobierno.
Exclusivamente para uso interno Solo los empleados pueden acceder a los datos y no se pueden enviar fuera de la empresa.
Confidencial Los datos solo se pueden compartir si es necesario para una tarea específica. Los datos no se pueden enviar fuera de la empresa sin un acuerdo de no divulgación.
Altamente confidenciales (datos personales) Los datos contienen información privada que debe ocultarse y compartirse solo cuando sea necesario conocerla, durante un tiempo limitado. Los datos no se pueden enviar a personal no autorizado ni fuera de la empresa.
Restringidos Los datos solo se pueden compartir con personas con nombre responsables de su protección. Por ejemplo, documentos legales o secretos comerciales.

Esquema de clasificación de la retención del ciclo de vida de los datos

Retención Descripción
None Los datos se pueden eliminar en cualquier momento.
Temporales Los datos se mantienen durante un breve período de tiempo. Por ejemplo, los datos de Twitter se mantienen durante una semana.
Período fijo Los datos se mantienen durante un número determinado de años, después se pueden eliminar. Por ejemplo, los registros fiscales se mantienen durante siete años para cumplir con las leyes gubernamentales.
Permanente No se eliminan nunca los datos. Por ejemplo, la correspondencia legal.

Es necesario automatizar el proceso de clasificación de la confidencialidad y retención del ciclo de vida de los datos mediante las clases definidas en cada esquema a fin de etiquetar los datos de forma coherente en todo el entorno de datos distribuidos. La automatización permitirá que este se gobierne de forma coherente y correcta. A continuación, deben definirse reglas y directivas para cada clase del esquema de clasificación a fin de especificar cómo gobernar los datos según su clasificación.

Roles y responsabilidades de la gobernanza de datos

Otro de los requisitos es la necesidad de establecer responsabilidades. De lo contrario, no queda claro quién es responsable de la gobernanza de los datos. Si no se establecen responsabilidades, ¿cómo puede responderse a las preguntas siguientes?

  • ¿Quién establece las métricas correctas y supervisa si el programa de gobernanza de datos funciona adecuadamente?
  • ¿Quiénes son los propietarios de los datos?
  • ¿Quién define y mantiene un glosario empresarial?
  • ¿Quién crea y mantiene las directivas sobre la seguridad de acceso?
  • ¿Quién protege el cumplimiento de la privacidad de los datos personales?
  • ¿Quién comprueba la calidad de los datos de producto en todos los folletos y sitios web de asociados?
  • ¿Quién garantiza que los datos de los clientes sean coherentes en todos los sistemas?
  • ¿Quién controla el uso de los datos de suscripción externos con la licencia correspondiente?
  • ¿Quién controla a los usuarios con privilegios, como los administradores de bases de datos y los científicos de datos?

¿Se trata de un ejecutivo de nivel C? ¿Es un jefe de departamento? ¿Es el responsable de la gobernanza, riesgo y cumplimiento? ¿Qué ocurre con el departamento legal? ¿O es responsabilidad de TI? Se necesitan roles y responsabilidades para evitar confusiones y establecer la base sobre la que pueda materializarse una cultura de datos.

Procesos de gobernanza de datos

Junto con los roles y las responsabilidades, se necesitan procesos para lo siguiente:

  • Gobernar la definición y el mantenimiento de un vocabulario empresarial común
  • Descubrir e identificar qué datos tiene, qué significan y donde están almacenados.
  • Clasificar los datos para saber cómo gobernarlos
  • Gobernar la definición y el mantenimiento de las directivas de seguridad de acceso a datos
  • Gobernar la definición y el mantenimiento de las directivas de privacidad de datos
  • Detectar problemas de calidad de los datos y corregirlos
  • Aplicar directivas para asegurarse de que se tomen medidas para el cumplimiento
  • Gobernar el mantenimiento de los datos maestros

Reglas y directivas de gobernanza de datos

Defina las directivas y las reglas para gobernar:

  • Reglas de integridad de los datos
  • Reglas y directivas de ingesta de datos
  • Reglas y directivas de seguridad de acceso a datos
  • Reglas y directivas de privacidad de los datos
  • Reglas y directivas de calidad de los datos
  • Reglas y directivas de mantenimiento de datos
  • Reglas y directivas de retención de datos

Asocie estas directivas y reglas a cada una de las clases de los esquemas de clasificación de gobernanza de datos.

Administración de datos maestros

Otro requisito en la gobernanza de datos es la administración de datos maestros. Los datos maestros son los que más se comparten en cualquier organización e incluyen entidades de datos principales. Estas, a su vez, incluyen a los clientes, proveedores, materiales, empleados y recursos. También incluye un gráfico financiero con datos de cuentas que se encuentran en diferentes aplicaciones financieras. Dado que los datos maestros se comparten de forma tan amplia, son independientes de las aplicaciones. Los requieren tanto las aplicaciones de procesamiento de transacciones operativas como los sistemas analíticos. Mantener estos datos sincronizados puede resolver innumerables errores de datos y de proceso. Por lo tanto, la situación ideal es su mantenimiento centralizado a través de un proceso común y la sincronización de todos los sistemas que los requieran. Además, es necesario controlar a quienes tienen permiso para mantenerlos y dónde debe realizarse el mantenimiento.

Esto mismo se aplica a los datos de referencia, como los conjuntos de código y los datos de mercados financieros. En este caso, la normalización y la sincronización de los conjuntos de código se conoce como administración de datos de referencia, que también es un requisito.

Linaje de metadatos

Por último, está el requisito del linaje de los metadatos. Puede usar una pista de auditoría para saber dónde se originaron los datos y cómo se han transformado en el proceso hacia un informe o un almacén de datos. Puede usar metadatos para realizar un seguimiento de quién o qué realiza el mantenimiento de los datos, incluido cuándo y dónde se produce.

Resumen de los requisitos para la gobernanza de datos de un extremo a otro

Necesita una solución de un extremo a otro que pueda gobernar los datos a lo largo de su ciclo de vida en los almacenes de datos del perímetro, varias nubes y el centro de datos.

Diagrama del marco de gobernanza de datos.

La solución de gobernanza de datos debe tener varios componentes:

  • Una visión y una estrategia de gobernanza de datos
  • Los propios datos, como datos de los clientes, datos de proveedores, datos de pedidos, etc.
  • El ciclo de vida de los datos, desde su creación hasta su destrucción, durante el cual es necesario regularlos.
  • Roles y responsabilidades de la gobernanza de datos (usuarios).
  • Actividades y procesos de gobernanza de datos y cómo se aplican al ciclo de vida de los datos.
  • Directivas y reglas para controlar los datos en distintos puntos del ciclo de vida.
  • Tecnologías de gobernanza de datos para hacer posible este proceso.

Pasos siguientes