Clasificación y etiquetado de datos

Completado

Los términos del glosario, las clasificaciones y las etiquetas son anotaciones para un recurso de datos. Cada uno de estos elementos tiene un significado diferente en el contexto del catálogo de datos.

¿Qué es la clasificación de datos?

Las clasificaciones son anotaciones que se pueden asignar a entidades. La flexibilidad de las clasificaciones le permite utilizarlas en varios escenarios, como en los casos siguientes:

  • Descripción de la naturaleza de los datos almacenados en los recursos de datos
  • Definición de directivas de control de acceso

La clasificación se basa en el contexto empresarial de los datos. Por ejemplo, podría clasificar los recursos por Número de pasaporte, Número de carné de conducir, Número de tarjeta de crédito, Código SWIFT, Nombre del usuario y así sucesivamente. Actualmente, Microsoft Purview tiene más de 200 clasificadores del sistema. Los usuarios también pueden definir sus clasificadores propios en el catálogo de datos. Como parte del proceso de examen, las clasificaciones se detectan y aplican automáticamente como metadatos dentro del catálogo de datos de Purview.

Reglas de clasificación

En Microsoft Purview, puede aplicar clasificaciones personalizadas o de sistema en un recurso de archivo, tabla o columna. Para clasificar los datos, Microsoft Purview usa filtros Bloom y patrones de Regex. Luego, estas clasificaciones se asocian a los metadatos detectados en el catálogo de datos de Azure Purview.

Los metadatos se usan para facilitar la descripción de los datos que se van a examinar y van a estar disponibles en el catálogo. Durante la configuración de un conjunto de reglas de examen, puede especificar reglas de clasificación para aplicarlas durante el examen que también servirán como metadatos. Las reglas de clasificación existentes se dividen en cinco categorías principales:

  • Administración pública: cubre atributos como los documentos de identidad oficiales, los números de los permisos de conducir, los números de pasaporte, etc.
  • Datos financieros: cubre atributos como los números de cuenta bancaria o los números de tarjeta de crédito.
  • Personal: información personal, como la edad de una persona, su fecha de nacimiento, dirección de correo electrónico, número de teléfono, etc.
  • Seguridad: atributos que se pueden almacenar, como las contraseñas.
  • Varios: atributos no cubiertos en las otras categorías.

¿Por qué se deben clasificar los datos?

Una buena estrategia de gobernanza de datos incluye un proceso para clasificar los datos a fin de comprender su nivel de confidencialidad, determinar si el origen de datos cumple con diversas reglamentaciones o durante cuánto tiempo se conservan. La clasificación en Microsoft Purview facilita la comprensión, búsqueda y gobernanza de los recursos de datos. La clasificación también puede ayudarlo a implementar medidas para proteger los datos confidenciales.

Una vez que una clasificación se etiqueta en un origen de datos después de un examen, puede generar informes y conclusiones para comprender mejor el patrimonio de datos. Dado que la clasificación se basa en el contexto empresarial de los datos, puede ayudar a eliminar la brecha entre la empresa y el equipo de datos.

Clasificación de datos: comparación entre la clasificación del sistema y la clasificación personalizada

Microsoft Purview admite clasificaciones tanto del sistema como personalizadas. Actualmente, hay más de 200 clasificaciones del sistema disponibles en Microsoft Purview. Los equipos de datos deben saber que, si las clasificaciones necesarias no están disponibles de manera inmediata, pueden trabajar con los administradores de datos a fin de crear clasificaciones personalizadas, para cumplir con los requisitos de gobernanza de datos de su propia organización.

Importante

Para obtener una lista completa de las clasificaciones del sistema disponibles, vea Clasificaciones admitidas en Microsoft Purview.

¿Quién crea clasificaciones personalizadas?

Los conservadores de datos de Purview pueden crear, actualizar y eliminar reglas de clasificación y clasificadores personalizados. Los lectores de datos de Purview solo pueden ver reglas de clasificación y clasificadores.

En términos prácticos, es posible que los conservadores de datos no sean miembros del equipo de datos. Sin embargo, resulta fundamental que los miembros del equipo de datos comprendan la clasificación para poder trabajar correctamente y controlar los datos de toda una organización.

¿Qué son las etiquetas de datos?

El mapa de datos de Microsoft Purview admite el etiquetado de datos estructurados y no estructurados almacenados en varios orígenes de datos. Esto puede resultarle familiar de otras tecnologías de Microsoft y puede que las conozca como etiquetas de confidencialidad. El mapa de datos amplía el uso de etiquetas de confidencialidad de Microsoft Purview Information Protection a los recursos almacenados en ubicaciones de nube de infraestructura y orígenes de datos estructurados.

Las etiquetas se definen en Microsoft Purview Information Protection y puede extender la aplicación al catálogo de datos de Microsoft Purview.

En la captura de pantalla siguiente, se muestran tanto la clasificación de los datos como la etiqueta en el catálogo de datos de Microsoft Purview. Puede ver que esta tabla de Azure SQL tiene una columna denominada "CreditCard":

  • Clasificada como "Número de tarjeta de crédito", porque el examen ha detectado números correspondientes a las reglas de patrones de tarjetas de crédito.
  • Etiquetada como "Confidencial: Finanzas" porque el número de la tarjeta de crédito se definió en su organización como información confidencial (y esta etiqueta aporta cifrado).

Screenshot of ReportTable asset in Purview showing both data classification and label in the Microsoft Purview Data Catalog.