Compartir a través de


Creación de perfiles de datos de orígenes de datos en Azure Data Catalog

Importante

Azure Data Catalog se retiró el 15 de mayo de 2024.

En el caso de las características de catálogo de datos, use el servicio Microsoft Purview, que ofrece una gobernanza de datos unificada para todo el patrimonio de datos.

Introducción

Microsoft Azure Data Catalog es un servicio en la nube totalmente administrado que actúa como sistema de registro y de detección de orígenes de datos empresariales. En otras palabras, Azure Data Catalog consiste en ayudar a las personas a detectar, comprender y usar orígenes de datos, y en ayudar a las organizaciones a obtener más valor de sus datos. Cuando un origen de datos se registra en Azure Data Catalog, el servicio copia e indexa sus metadatos, pero eso no es todo.

La característica de perfiles de datos de Azure Data Catalog examina los datos de orígenes de datos admitidos en el catálogo y recopila estadísticas e información sobre esos datos. Es fácil incluir un perfil de sus recursos de datos. Al registrar un recurso de datos, elija Incluir perfil de datos en la herramienta de registro de orígenes de datos.

¿Qué es la generación de perfiles de datos?

La generación de perfiles de datos examina los datos del origen de datos que se registra y recopila estadísticas e información sobre esos datos. Durante la detección del origen de datos, estas estadísticas pueden ayudar a los usuarios a determinar la idoneidad de los datos para resolver sus problemas empresariales.

Los siguientes orígenes de datos admiten la generación de perfiles de datos:

  • Vistas y tablas de SQL Server (incluidos Azure Synapse Analytics y Azure SQL Database)
  • Vistas y tablas de Oracle
  • Vistas y tablas de Teradata
  • Tablas de Hive

Incluir los perfiles de datos al registrar lo recursos de datos ayuda a los usuarios a responder preguntas acerca de los orígenes de datos, incluidas:

  • ¿Puede utilizarse para solucionar mi problema empresarial?
  • ¿Los datos se ajustan a estándares o patrones específicos?
  • ¿Cuáles son algunas de las anomalías del origen de datos?
  • ¿Cuáles son los posibles retos de integración de estos datos en mi aplicación?

Nota:

También puede agregar documentación a un recurso para describir cómo se pueden integrar los datos en una aplicación. Consulte Documentación de los orígenes de datos.

Cómo incluir un perfil de datos al registrar un origen de datos

Es fácil incluir un perfil de sus origen de datos. Al registrar un origen de datos, en el panel Objetos que se registrarán de la herramienta de registro de orígenes de datos, elija Incluir perfil de datos.

El cuadro Incluir perfil de datos está activado en la parte inferior de la ventana Objetos que se registrarán.

Para más información sobre cómo registrar orígenes de datos, vea Registro de orígenes de datos e Introducción a Azure Data Catalog.

Filtrado de recursos de datos que incluyen perfiles de datos

Para detectar los recursos de datos que incluyen un perfil de datos, puede incluir has:tableDataProfiles o has:columnsDataProfiles como uno de los términos de búsqueda.

Nota:

Al seleccionar Incluir perfil de datos en la herramienta de registro de orígenes de datos, se incluye la información de perfil de nivel de columna y tabla. Sin embargo, la API de Data Catalog permite que los recursos de datos se registren con un único conjunto de información de perfil.

Visualización de la información del perfil de datos

Una vez que encuentre un origen de datos adecuado con un perfil, puede ver los detalles del perfil de datos. Para ver el perfil de datos, seleccione un recurso de datos y elija Perfil de datos en la ventana del portal de Catálogo de datos.

La pestaña del perfil de datos está seleccionada en la parte superior de la página, entre columnas y documentación.

Un perfil de datos del Azure Data Catalog muestra la información del perfil de tabla y columna, incluido lo siguiente:

Perfil de datos de objeto

  • Número de filas
  • Tamaño de la tabla
  • Cuándo se actualizó por última vez el objeto

Perfil de datos de columna

  • Tipo de datos de la columna
  • Número de valores distintivos
  • Número de filas con valores NULL
  • Mínimo, máximo, promedio y desviación estándar para los valores de las columnas

Resumen

La generación de perfiles de datos proporciona estadísticas e información sobre los recursos de datos registrados para ayudar a los usuarios a determinar la idoneidad de los datos para resolver problemas empresariales. Junto con la anotación y documentación de los orígenes de datos, los perfiles de datos pueden dar a los usuarios una comprensión más profunda de los datos.

Consulte también