Catálogo de datos
El catálogo de datos registra y mantiene la información de datos en un lugar centralizado y hace que esté disponible para la organización. Garantiza que las empresas eviten conjuntos de productos de datos duplicados causados por la ingesta redundante de datos por parte de distintos equipos de proyecto.
Se recomienda crear un servicio de catálogo de datos para definir los metadatos de los productos de datos almacenados en las zonas de aterrizaje de datos.
El análisis a escala en la nube depende de Microsoft Purview para registrar orígenes de datos empresariales, clasificarlos, garantizar la calidad de los datos y ofrecer acceso de autoservicio seguro.
Microsoft Purview es un servicio basado en inquilinos y puede comunicarse con cada zona de aterrizaje de datos mediante la creación de una red virtual administrada implementada en la región de las zonas de aterrizaje de datos. Puede implementar Azure Managed Virtual Network Integration Runtimes (IR) en redes virtuales administradas de Microsoft Purview en cualquier región de Microsoft Purview disponible. A partir de ahí, el IR de red virtual administrada puede usar puntos de conexión privados para conectarse de forma segura a los orígenes de datos compatibles y examinarlos. Para obtener más información, consulte Uso de una red virtual administrada con su cuenta de Microsoft Purview. La creación de un IR de red virtual administrada en Red virtual administrada garantiza que el proceso de integración de datos esté aislado y protegido.
Nota:
Aunque esta documentación se centra principalmente en el uso de Microsoft Purview para la gobernanza, es posible que las empresas hayan invertido en otros productos, como Alation, Okera o Collibra. Estas soluciones se basan en suscripciones y se recomienda implementarlas en la zona de aterrizaje de administración de datos. Tenga en cuenta que puede ser necesaria alguna integración personalizada.
Detección de datos
La detección de datos refleja el estado de todos los datos que posee la empresa. Estos datos se conocen como patrimonio de datos. Durante la detección de datos, el patrimonio de datos se examina y clasifica. El proceso de examen de datos se conecta directamente al origen de datos según una programación establecida.
A medida que agrega una nueva zona de aterrizaje de datos al entorno, los lagos de datos asociados y los orígenes de persistencia políglota deben registrarse como orígenes para que los rastreadores del catálogo de datos lleven a cabo sus análisis.
Con la detección automatizada del patrimonio de datos para rellenar el catálogo, puede hacer lo siguiente:
- Rastreo de metadatos de orígenes de datos locales y de Azure.
- Examen de los lagos de datos, los blobs y otros destinos admitidos.
- Extracción del esquema de los destinos de datos para los tipos de archivo XML, TSV, CSV, PSV, SSV, JSON, Parquet, Avro y ORC.
- Permitir actualizaciones automatizadas del catálogo mediante la programación configurable de exámenes y conjuntos de reglas de examen.
Importante
Al agregar una nueva zona de aterrizaje de datos al entorno, registre los lagos de datos asociados y el almacenamiento políglota a través de Azure DevOps como origen para que los rastreadores del catálogo de datos puedan analizar, gobernar y administrar la integridad de los datos.
Clasificación de los datos
Microsoft Purview permite aplicar clasificaciones de datos personalizadas o de sistema en recursos de archivo, tabla o columna.
Las clasificaciones de datos son como etiquetas de asunto. Microsoft Purview marca e identifica el contenido de tipos de datos específicos que se encuentran en el patrimonio de datos durante el examen. Use etiquetas de confidencialidad para identificar las categorías de tipos de clasificación en los datos de la organización. También puede usar etiquetas de confidencialidad para agrupar las directivas que quiere aplicar a cada categoría. Microsoft Purview usa los mismos tipos de información confidencial que Microsoft 365, lo que le permite ampliar las directivas de seguridad y las protecciones existentes en todo el contenido y el patrimonio de datos.
Microsoft Purview puede examinar y clasificar automáticamente los documentos. Por ejemplo, si tiene un archivo denominado multiple.docx
y tiene un número de id. nacional en su contenido, Microsoft Purview agrega una clasificación como EU National Identification Number
en la página de detalles del recurso.
Microsoft Defender para SQL es una característica disponible para Azure SQL Database, Azure SQL Managed Instance y Azure Synapse Analytics. Incluye una funcionalidad para detectar y clasificar datos confidenciales, buscar y mitigar los potenciales puntos vulnerables de una base de datos y detectar actividades anómalas que puedan indicar una amenaza para dicha base de datos. Microsoft Defender para SQL proporciona una ubicación única para habilitar y administrar estas funcionalidades.