Share via


Catálogo de datos

El catálogo de datos registra y mantiene la información de datos en un lugar centralizado y hace que esté disponible para la organización. Garantiza que las empresas eviten conjuntos de productos de datos duplicados causados por la ingesta redundante de datos por parte de distintos equipos de proyecto.

Le recomendamos que aprovisione un servicio de catálogo de datos para definir los metadatos de los productos de datos almacenados en las zonas de aterrizaje de datos.

El análisis a escala de la nube se basa enAzure Purview para servir como:

  • Un sistema de registro
  • Un descubrimiento para orígenes de datos empresariales
  • Un motor de clasificación de datos
  • Un almacén de directivas
  • Una API para registrar y leer información de datos
  • Un centro del panel de cumplimiento

Dado que el catálogo de datos forma parte de la zona de aterrizaje de gestión de datos, puede comunicarse con cada zona de aterrizaje de datos a través de su red virtual (VNet) y los tiempos de ejecución de integración autohospedados. La detección de productos de datos en almacenes locales y otras nubes públicas se logra mediante más implementaciones de entornos de ejecución de integración autohospedados.

Nota

Aunque esta documentación se centra principalmente en el uso de Microsoft Purview para las funcionalidades de catálogo de datos y la clasificación de datos, las empresas pueden haber invertido en otros productos, como Alation, Okera o Collibra. Si este es el caso, póngase en contacto con su proveedor para aplicar los principios descritos para una zona de aterrizaje de la administración de datos tan cerca como sea posible. Tenga en cuenta que puede ser necesaria alguna integración personalizada.

Detección de datos

La detección de datos refleja el estado de todos los datos que posee la empresa. Estos datos se conocen como patrimonio de datos. Durante la detección de datos, el patrimonio de datos se examina y clasifica. El proceso de examen de datos se conecta directamente al origen de datos según una programación establecida.

A medida que agrega una nueva zona de aterrizaje de datos al entorno, los lagos de datos asociados y los orígenes de persistencia políglota se registran como orígenes para que los rastreadores del catálogo de datos lleven a cabo sus análisis.

Con la detección automatizada del patrimonio de datos para rellenar el catálogo, puede hacer lo siguiente:

  • Rastreo de metadatos de orígenes de datos locales y de Azure.
  • Examen de los lagos de datos, los blobs y otros destinos admitidos.
  • Extracción del esquema de los destinos de datos para los tipos de archivo XML, TSV, CSV, PSV, SSV, JSON, Parquet, Avro y ORC.
  • Permitir actualizaciones automatizadas del catálogo mediante la programación configurable de exámenes y conjuntos de reglas de examen.

Importante

Cuando agregue una nueva zona de aterrizaje de datos al entorno, registre los lagos de datos asociados y el almacenamiento políglota a través de Azure DevOps como origen para que los rastreadores del catálogo de datos lleven a cabo sus análisis.

Clasificación de los datos

Microsoft Purview permite aplicar clasificaciones de datos personalizadas o de sistema en recursos de archivo, tabla o columna.

Las clasificaciones de datos son como etiquetas de asunto. Microsoft Purview marca e identifica el contenido de tipos de datos específicos que se encuentran en el patrimonio de datos durante el examen. Use etiquetas de confidencialidad para identificar las categorías de tipos de clasificación en los datos de la organización. También puede usar etiquetas de confidencialidad para agrupar las directivas que quiere aplicar a cada categoría. Microsoft Purview usa los mismos tipos de información confidencial que Microsoft 365, lo que le permite ampliar las directivas de seguridad y las protecciones existentes en todo el contenido y el patrimonio de datos.

Microsoft Purview puede examinar y clasificar automáticamente los documentos. Por ejemplo, si tiene un archivo denominado multiple.docx y tiene un número de id. nacional en su contenido, Microsoft Purview agrega una clasificación como EU National Identification Number en la página de detalles del recurso.

Microsoft Defender para SQL es una característica disponible para Azure SQL Database, Azure SQL Managed Instance y Azure Synapse Analytics. Incluye una funcionalidad para detectar y clasificar datos confidenciales, buscar y mitigar los potenciales puntos vulnerables de una base de datos y detectar actividades anómalas que puedan indicar una amenaza para dicha base de datos. Microsoft Defender para SQL proporciona una ubicación única para habilitar y administrar estas funcionalidades.

Pasos siguientes