Compartir vía


Procesos de gobernanza de datos

Hay cuatro categorías de procesos de gobernanza de datos.

Categoría de proceso Procesos
Procesos de detección de datos para comprender el panorama de los datos Proceso de detección, asignación y catalogación de datos y entidades de datos.
Proceso de detección de generación de perfiles de datos para determinar la calidad de los datos.
Proceso de clasificación de gobernanza y detección de datos confidenciales.
Proceso de detección de mantenimiento de datos para el análisis CRUD, por ejemplo, de archivos de registro para comprender el uso y el mantenimiento de datos, como los datos maestros, en toda la empresa.
Procesos de definición de gobernanza de datos Creación y mantenimiento de un vocabulario empresarial común en un glosario empresarial. Definición de entidades de datos, incluidos datos maestros, nombres de atributos de datos, reglas de integridad de datos y formatos válidos.
Definición de datos de referencia para estandarizar conjuntos de código en toda la empresa.
Definición de esquemas de clasificaciones de gobernanza de datos para etiquetar los datos y determinar cómo controlarlos.
Definición de reglas y directivas de gobernanza de datos para controlar los ciclos de vida de los documentos y entidades de datos.
Definición del umbral y las métricas de éxito.
Procesos de aplicación de reglas y directivas de gobernanza de datos Proceso para automatizar la aplicación de directivas y reglas de gobernanza de datos.
Proceso para aplicar manualmente directivas y reglas.
Procesos de gobernanza de datos controlados por eventos, a petición y controlados por temporizador (por lotes) publicados como servicios que se pueden invocar para controlar lo siguiente:
Ingesta de datos: catalogación, clasificación, asignación de propietario y almacenamiento
Calidad de los datos
Seguridad de acceso a datos
Privacidad de datos
Uso de datos, como el uso compartido y la garantía de que los datos con licencia solo se usan con fines aprobados
Mantenimiento de datos, como datos maestros
Retención de datos
Sincronización de datos maestros y datos de referencia
Supervisión de procesos Supervisión y auditoría de la actividad de uso de datos y la calidad de los datos, de la seguridad de acceso a datos, y de la privacidad, el mantenimiento y la retención de datos
Supervisión de la detección y resolución de infracciones de reglas de directiva

El vocabulario empresarial común debe definirse en un glosario empresarial dentro de un catálogo de datos.

Los grupos de trabajo de gobernanza de datos planean y desarrollan la definición de datos y la mejora de dominios de datos específicos (por ejemplo, cliente o proveedor), actualizan la placa de control de gobernanza de datos en curso y administran la administración en toda la empresa para un dominio específico. Cada grupo de trabajo debe asumir la responsabilidad de definir una entidad de datos específica o un área de asunto de datos, como varias entidades relacionadas. A continuación, se puede trabajar en paralelo en varias entidades de datos del vocabulario, junto con las directivas y las reglas. Para más información, consulte Roles y responsabilidades de la gobernanza de datos

Diagrama de definición de entidades en un vocabulario empresarial común. Figura 1: Grupo de trabajo de gobernanza de datos de ejemplo

La integración del glosario empresarial del catálogo con otras tecnologías es necesaria para obtener nombres de datos comunes coherentes en todas las tecnologías. Entre los ejemplos de otras tecnologías con las que se integrará se incluyen:

  • Herramientas de extracción, transformación y carga de datos (ETL)
  • Herramientas de modelado de datos
  • Herramientas de BI, sistemas de administración de bases de datos
  • Administración de datos maestros
  • Herramientas de virtualización de datos
  • Herramientas de desarrollo de software

Un procedimiento recomendado para crear un vocabulario empresarial común es crear un modelo de concepto de datos. El modelo es un enfoque de arriba abajo que identifica los conceptos de datos que se pueden usar como entidades de datos en un vocabulario empresarial común. De este modo, se puede asignar un grupo de trabajo de gobernanza de datos diferente a cada concepto de datos (entidad) o grupo de conceptos de datos relacionados (área de asunto). Se asignan distintos grupos de trabajo para controlar las distintas entidades de datos en todo el panorama.

Al crear un vocabulario empresarial común, puede usar software de catálogo de datos para detectar automáticamente qué datos existen en varios almacenes de datos. Ayuda a identificar todos los atributos asociados a entidades de datos específicas. Se trata de un enfoque de abajo arriba. Si usa un enfoque de arriba abajo de un modelo de concepto de datos para empezar y un enfoque de detección de datos automatizada a abajo arriba para identificar los atributos de una entidad de datos, es posible que varios grupos de trabajo creen de forma incremental un vocabulario empresarial común rápidamente.

El uso de un catálogo de datos para la detección de datos automatizada permite la asignación de datos dispares a un vocabulario común. El catálogo de datos puede ayudarle a comprender dónde se encuentran los datos de cada entidad de datos concreta del glosario empresarial en la empresa.

Directivas y reglas para controlar los datos en distintos puntos del ciclo de vida

Las directivas de gobernanza de datos describen un conjunto de reglas para controlar la integridad, la calidad, la seguridad de acceso, la privacidad y la retención de datos. Hay diferentes tipos de directivas, que incluyen:

  • Directivas de integridad de datos, como valores válidos o integridad referencial.
  • Directivas de calidad de datos con reglas de normalización, limpieza y coincidencia de datos.
  • Directivas de protección de datos con reglas de seguridad de acceso y privacidad de datos.
  • Directivas de retención de datos para administrar el ciclo de vida con reglas de retención, archivo y copia de seguridad. Es posible que se necesiten varias versiones de una directiva para gobernar los mismos datos en distintas jurisdicciones legales.

El esquema de clasificación de confidencialidad de datos tiene cinco niveles de clasificación:

  • Público
  • Exclusivamente para uso interno
  • Confidencial
  • Datos personales confidenciales
  • Restringidos

Controle los datos mediante la combinación de este esquema de clasificación con directivas y reglas. Use cada uno de los cinco niveles para etiquetar los datos, como los datos personales confidenciales. Al crear reglas para datos personales confidenciales y adjuntar estas reglas a una directiva, se crea una directiva para los datos personales confidenciales. Puede adjuntar la directiva a la etiqueta de datos personales confidenciales y, a continuación, adjuntar la etiqueta de datos personales confidenciales a los datos. De esta manera, todos los datos etiquetados como datos personales confidenciales están sujetos a las mismas directivas y reglas. Este proceso se conoce como administración de directivas basada en etiquetas. Es flexible porque una regla o una directiva individual se pueden cambiar de forma independiente. Todos los datos etiquetados como datos personales confidenciales se rigen por las nuevas reglas. Del mismo modo, una etiqueta de datos personales confidenciales se puede desasociar de los datos y usar una etiqueta de datos confidenciales en su lugar. En este caso, los datos se rigen al instante por un nuevo conjunto de directivas y reglas asociadas a la etiqueta de datos confidenciales.

Una vez que defina directivas y reglas en un catálogo de datos para cada clase de un esquema de clasificación de gobernanza de datos, se pueden pasar a otras tecnologías desde un catálogo de datos, a través de las API, para su aplicación. En su lugar, una plataforma de administración de datos común que pueda conectarse a varios almacenes de datos podría aplicarlas.

De este modo, se debería poder supervisar la calidad, la privacidad, la seguridad de acceso, el uso, el mantenimiento y la retención de los datos de entidades de datos específicas durante su ciclo de vida.

Pasos siguientes