Compartir a través de


Tutorial: Registro de recursos de datos en Azure Data Catalog

Importante

Azure Data Catalog se retiró el 15 de mayo de 2024.

En el caso de las características de catálogo de datos, use el servicio Microsoft Purview, que ofrece una gobernanza de datos unificada para todo el patrimonio de datos.

En este tutorial, se usa la herramienta de registro para registrar recursos de datos de la base de datos de ejemplo con el catálogo. El registro es el proceso de extraer metadatos estructurales clave (como nombres, tipos y ubicaciones) del origen de datos y los recursos que contiene, y copiar dichos metadatos en el catálogo. El origen de datos y los recursos de datos permanecen donde están, pero el catálogo usa los metadatos para que se puedan detectar y comprender más fácilmente.

En este tutorial, aprenderá a:

  • Registro de los recursos de datos
  • Buscar recursos de datos
  • Anotación de los recursos de datos
  • Conexión con los recursos de datos
  • Administración de recursos de datos
  • Eliminar recursos de datos

Requisitos previos

Para configurar Data Catalog, debe ser propietario o copropietario de una suscripción de Azure.

Registro de los recursos de datos

Registro de un origen de datos

En este ejemplo, registraremos recursos de datos (tablas) de una base de datos de ejemplo de Azure SQL Database, pero puede usar cualquier origen de datos compatible si prefiere trabajar con datos que conozca y que sean relevantes para su rol. Para ver una lista de los orígenes de datos compatibles, vea Orígenes de datos compatibles con Azure Data Catalog.

El nombre de la base de datos que se usa en este tutorial es RLSTest.

Ahora puede registrar recursos de datos de la base de datos ejemplo mediante Azure Data Catalog.

  1. Vaya a la página principal de Azure Data Catalog y seleccione Publicar datos.

    Catálogo de datos abierto con el botón Publicar datos seleccionado.

  2. Seleccione Iniciar la aplicación para descargar, instalar y ejecutar la herramienta de registro en el equipo.

    En la página Publicar datos, el botón Iniciar la aplicación aparece seleccionado.

  3. En la página principal, seleccione Iniciar sesión y escriba sus credenciales.

    En la página principal, el botón Iniciar sesión aparece seleccionado.

  4. En la página Microsoft Azure Data Catalog, seleccione SQL Server y Siguiente.

    En la página Microsoft Azure Data Catalog, aparece seleccionado el botón SQL Server y, luego, el botón Siguiente.

  5. Especifique las propiedades de la conexión de SQL Server de la base de datos de ejemplo de Azure SQL Database y seleccione CONNECT.

    En la página de propiedades de la conexión de SQL Server, aparecen resaltados los cuadros de texto de los atributos de nombre del servidor, nombre de usuario, contraseña y base de datos. Luego, aparece seleccionado el botón Conectar.

  6. Registre los metadatos del recurso de datos. En este ejemplo, se registran los objetos Product del espacio de nombres de ejemplo:

    1. En el árbol Jerarquía de servidor, expanda la base de datos de ejemplo y seleccione SalesLT.

    2. Seleccione Product, ProductCategory, ProductDescription y ProductModel mediante Ctrl + seleccionar.

    3. Seleccione la flecha Mover seleccionados (>). Esta acción mueve todos los objetos seleccionados a la lista Objetos que se registrarán .

      En Jerarquía de servidor, aparece seleccionado SalesLT. Luego, en la lista de objetos disponibles, aparecen resaltados los objetos de producto, categoría del producto, descripción del producto, modelo del producto y descripción del producto del modelo del producto. Luego, aparece seleccionado el símbolo de mover la selección >.

    4. Seleccione Include a Preview (Incluir vista previa) para incluir una vista previa de instantánea de los datos. La instantánea incluye un máximo de 20 registros de cada tabla y se copia en el catálogo.

    5. Seleccione Incluir perfil de datos para incluir una instantánea de las estadísticas del objeto del perfil de datos (por ejemplo: los valores mínimo, máximo y medio de una columna, o el número de filas).

    6. En el campo Agregar etiquetas, escriba ventas, producto, azure sql. Esta acción agrega etiquetas de búsqueda a estos recursos de datos. Las etiquetas son una excelente manera de ayudar a los usuarios a buscar un origen de datos registrados.

    7. Especifique el nombre de un experto en estos datos (opcional).

      En la lista de los objetos que se van a registrar, se muestran estos nombres: producto, categoría del producto, descripción del producto, modelo del producto y descripción del producto del modelo del producto. Luego, aparecen seleccionadas las opciones para incluir vista previa e incluir perfil de datos. Después, se agregan tres etiquetas al campo de etiqueta, correspondientes a ventas, producto y Azure SQL.

    8. Seleccione REGISTRAR. Azure Data Catalog registra los objetos seleccionados. En este ejercicio, se registran los objetos seleccionados de la base de datos de ejemplo. La herramienta de registro extrae metadatos del recurso de datos y los copia en el servicio Azure Data Catalog. Los datos permanecen donde están actualmente. Los datos permanecen bajo el control de los administradores y directivas del sistema de origen.

      En la ventana Microsoft Azure Data Catalog, se muestran todos los objetos recién registrados en la lista de objetos que se van a registrar. En la parte superior de la ventana, se muestra una notificación que indica que finalizó el proceso para registrar los objetos seleccionados. Luego, el botón Ver portal aparece seleccionado.

    9. Para ver los objetos de origen de datos registrados, seleccione Ver portal. En el portal de Azure Data Catalog, confirme que ve las cuatro tablas y la base de datos en la vista de cuadrícula (compruebe que la barra de búsqueda ha desaparecido).

      En la ventana Microsoft Azure Data Catalog, aparecen iconos nuevos en la vista de cuadrícula para cada uno de los objetos registrados.

En este ejercicio, ha registrado objetos de la base de datos de ejemplo para Azure SQL Database de forma que los usuarios de la organización puedan detectarlos fácilmente.

En el siguiente ejercicio aprenderá a detectar recursos de datos registrados.

Detección de los recursos de datos

La detección en Azure Data Catalog usa dos mecanismos principales: la búsqueda y el filtrado.

La búsqueda está diseñada para ser intuitiva y eficaz. De forma predeterminada, los términos de la búsqueda se comparan todas las propiedades del catálogo, incluidas las anotaciones proporcionadas por el usuario.

El filtrado está diseñado para complementar la búsqueda. Puede seleccionar características específicas como expertos, tipos de origen de datos, tipos de objeto y etiquetas, para ver los recursos de datos que coincidan y para restringir los resultados de la búsqueda a los recursos correspondientes.

Mediante una combinación de búsqueda y filtrado puede desplazarse rápidamente por los orígenes de datos registrados en Azure Data Catalog.

En este ejercicio se usa el portal de Azure Data Catalog para detectar los recursos de datos que registró en el ejercicio anterior. Para más información acerca de la sintaxis de búsqueda, consulte Referencia de sintaxis de búsqueda en Data Catalog .

A continuación hay varios ejemplos de detección de recursos de datos en el catálogo.

La búsqueda básica permite buscar en un catálogo con uno o varios términos de búsqueda. Los resultados son los recursos que tienen alguna propiedad que coincide con uno o varios de los términos especificados.

  1. Seleccione Inicio en el portal de Azure Data Catalog. Si ha cerrado el explorador web, vaya a la página principal de Azure Data Catalog.

  2. En el cuadro de búsqueda, escriba product y presione ENTRAR.

    En el portal de Azure Data Catalog, el botón de inicio aparece seleccionado. Luego, en el cuadro de búsqueda, se ve escrito

  3. Confirme que ve las cuatro tablas y la base de datos en los resultados. Para alternar entre la vista de cuadrícula y la vista de lista, seleccione los botones de la barra de herramientas, como se muestra en la siguiente imagen. Observe que la palabra clave de la búsqueda aparece resaltada en los resultados de la búsqueda, ya que la opción Resaltar está activada. También puede especificar el número de resultados por página .

    En la barra de búsqueda, todavía se ve

    El panel Búsquedas está a la izquierda y el panel Propiedades, a la derecha. En panel Búsquedas se pueden cambiar los criterios de búsqueda y filtrar los resultados. El panel Propiedades muestra las propiedades de un objeto seleccionado en la cuadrícula o en la lista.

  4. Seleccione Producto en los resultados de la búsqueda. Seleccione las pestañas Vista previa, Columnas, Perfil de datos y Documentación, o bien la flecha para expandir el panel inferior.

    En la parte superior de los resultados de la búsqueda, el botón de vista previa aparece seleccionado.

    En la pestaña Vista previa, se muestra una vista previa de los datos de la tabla Product.

  5. Seleccione la pestaña Columnas para buscar detalles de las columnas (como el nombre y el tipo de datos) en el recurso de datos.

  6. Seleccione la pestaña Perfil de datos para ver la generación de perfiles de los datos (por ejemplo: el número de filas, el tamaño de los datos o el valor mínimo de una columna) del recurso de datos.

Detección de recursos de datos con ámbito de propiedad

El ámbito de una propiedad le ayuda a detectar recursos de datos en los que el término de búsqueda coincide con la propiedad especificada.

  1. Desactive el filtro Tabla en Tipo de objeto en Filtros.

  2. En el cuadro de búsqueda, escriba tags:product y presione ENTRAR. En Referencia de sintaxis de búsqueda en Data Catalog encontrará todas las propiedades que se pueden usar en las búsquedas en el catálogo de datos.

  3. Confirme que ve las tablas y la base de datos en los resultados.

    En la barra de búsqueda se ve escrito

  1. En el panel Búsquedas de la sección Búsqueda actual, escriba el nombre de la búsqueda y seleccione Guardar.

    En el panel de búsquedas, se escribió

  2. Confirme que la búsqueda guardada se muestra en Búsquedas guardadas.

  3. Seleccione una de las acciones que puede realizar en la búsqueda guardada (Cambiar nombre, Eliminar, Guardar como predeterminado).

Agrupación con paréntesis

Mediante los paréntesis se pueden agrupar partes de la consulta para conseguir el aislamiento lógico, especialmente junto con los operadores booleanos.

  1. En el cuadro de búsqueda, escriba name:product AND (tags:product AND objectType:table) y presione ENTRAR.

  2. Confirme que en los resultados de la búsqueda solo ve la tabla Product .

    En la barra de búsqueda, se escribió

Operadores de comparación

Con los operadores de comparación puede usar comparaciones diferentes de la igualdad de propiedades que tengan tipos de datos numéricos y de fechas.

  1. En el cuadro de búsqueda, escriba lastRegisteredTime:>"06/09/2016".

  2. Desactive el filtro Tabla en Tipo de objeto.

  3. Presione ENTRAR.

  4. Confirme que ve las tablas Product, ProductCategory y ProductDescription y la base de datos de SQL que registró en los resultados de la búsqueda.

    En la barra de búsqueda lastRegisteredTime: >, se escribió 06/09/2016. Se devolvieron las tablas de producto, categoría del producto y descripción del producto. También se devolvió la base de datos SQL.

Consulte Detección de orígenes de datos en Azure Data Catalog para ver información detallada acerca de la detección de recursos de datos. Para más información acerca de la sintaxis de búsqueda, consulte la referencia de la sintaxis de búsqueda en Data Catalog.

Anotación de los recursos de datos

En este ejercicio, usará el portal de Azure Data Catalog para anotar (agregar información como descripciones, etiquetas o expertos) los recursos de datos existentes en el catálogo. Las anotaciones complementan los metadatos estructurales extraídos del origen de datos durante el registro. También facilitan la detección y comprensión de los recursos de datos.

En este ejercicio, se anota un único recurso de datos (ProductPhoto). y se agrega un nombre descriptivo y una descripción al recurso de datos ProductPhoto.

  1. Vaya a la página principal de Azure Data Catalog y busque con tags:product para encontrar los recursos de datos que ha registrado.

  2. Seleccione ProductModel en los resultados de la búsqueda.

  3. Escriba Imágenes de productos en Nombre descriptivo y Fotos de productos para materiales de marketing en Descripción.

    En el panel de propiedades, se muestran el nombre, el nombre descriptivo y la descripción del recurso seleccionado. Es posible editar la información.

    El contenido del campo Descripción ayuda a otros usuarios a detectar el recurso de datos seleccionado y entender por qué y cómo se usa. También se pueden agregar otras etiquetas y ver columnas. Para filtrar y realizar búsquedas en los orígenes de datos, utilice los metadatos descriptivos que ha agregado al catálogo.

También puede dar los siguientes pasos en esta página:

  • Agregar a expertos para el recurso de datos. Seleccione Agregar en el área Expertos.

  • Agregar etiquetas en el nivel de conjunto de datos. Seleccione Agregar en el área Etiquetas. Una etiqueta puede ser una etiqueta de usuario o una etiqueta de glosario. La edición estándar del Catálogo de datos incluye un glosario empresarial que ayuda a los administradores del catálogo a definir una taxonomía empresarial central. Después, los usuarios del catálogo pueden anotar los recursos de datos con los términos del glosario. Para más información, consulte Configuración del glosario empresarial para el etiquetado regulado

  • Agregar etiquetas a nivel de columna. Seleccione Agregar en Etiquetas en la columna en la que desee realizar anotaciones.

  • Agregar descripción en el nivel de columna. En Descripción , escriba la descripción de la columna. También puede ver los metadatos de descripción extraídos del origen de datos.

  • Agregue la información de Solicitar acceso que muestra a los usuarios cómo solicitar acceso al recurso de datos.

  • Elija la pestaña Documentación y proporcione la documentación del recurso de datos. Con la documentación de Azure Data Catalog se puede usar un catálogo de datos como repositorio de contenido para crear una descripción completa de los recursos de datos.

También puede agregar una anotación a varios recursos de datos. Por ejemplo, puede seleccionar todos los recursos de datos que ha registrado y especificar un experto para ellos.

La casilla de la fila de título de la tabla de resultados aparece activada. Se seleccionaron todos los recursos devueltos al activar la casilla de la fila de título. Cualquier cambio en la ventana de propiedades afectará a todos los recursos seleccionados.

Azure Data Catalog admite un enfoque de colaboración abierta distribuida con respecto a las anotaciones. Todos los usuarios de Data Catalog pueden agregar etiquetas (usuario o glosario), descripciones y otros metadatos. Al hacerlo, los usuarios agregan perspectiva a un recurso de datos y su uso, y compartan dicha perspectiva con otros usuarios.

Consulte Anotación de recursos de datos para ver información detallada acerca de cómo anotar recursos de datos.

Conexión con los recursos de datos

En este ejercicio, se abren recursos de datos en una herramienta cliente integrada (Excel) y en una herramienta no integrada (SQL Server Management Studio) mediante la información de conexión.

Nota

Es importante recordar que Azure Data Catalog no brinda acceso al origen de datos en sí, simplemente facilita su detección y comprensión. Al conectarse a un origen de datos, la aplicación cliente que elija usa sus credenciales de Windows o le solicita las credenciales cuando sea necesario. Si no se le ha otorgado previamente acceso al origen de datos, será preciso que se le otorgue para que se pueda conectar.

Conexión a un recurso de datos desde Excel

  1. Seleccione Product en los resultados de la búsqueda. Seleccione Abrir en en la barra de herramientas y, después, seleccione Excel.

    El producto aparece seleccionado en la tabla de los resultados devueltos. El botón Abrir en aparece seleccionado y se seleccionó Excel en el menú desplegable.

  2. Seleccione Abrir en la ventana emergente de descarga. Esta experiencia puede variar en función del explorador.

  3. En la ventana Aviso de seguridad de Microsoft Excel, seleccione Habilitar.

    En el menú emergente Aviso de seguridad de Microsoft Excel, el botón Habilitar aparece seleccionado.

  4. Mantenga los valores predeterminados del cuadro de diálogo Importar datos y seleccione Aceptar.

    En el cuadro de diálogo Importar datos, Aceptar aparece seleccionado.

  5. Vea el origen de datos en Excel.

    Se muestran todos los datos en la tabla de Excel.

SQL Server Management Studio

En este ejercicio se ha conectado a los recursos de datos detectados mediante Azure Data Catalog. Con el portal de Azure Data Catalog, puede conectarse directamente mediante las aplicaciones cliente integradas en el menú Abrir en . También puede conectarse con cualquier aplicación que elija mediante la información de la ubicación de la conexión incluida en los metadatos del recurso. Por ejemplo, puede usar SQL Server Management Studio para conectarse a Azure SQL Database para acceder a los datos de los recursos de datos registrados en este tutorial.

  1. Abra SQL Server Management Studio.

  2. En el cuadro de diálogo Conectar con el servidor, escriba el nombre del servidor del panel Propiedades del portal de Azure Data Catalog.

  3. Use la autenticación y las credenciales apropiadas para acceder al recurso de datos. Si no tiene acceso, utilice la información del campo Solicitar acceso para obtenerla.

    En el cuadro de diálogo Información de la conexión, el campo Solicitar acceso aparece resaltado.

Seleccione Ver cadenas de conexión para ver y copiar las cadenas de conexión ADO.NET, ODBC y OLEDB en el Portapapeles para utilizarlas en la aplicación.

Administración de recursos de datos

En este paso, verá cómo se configura la seguridad de los recursos de datos. Data Catalog no ofrece a los usuarios acceso a los propios datos. El propietario del origen de datos controla el acceso a los datos.

Catálogo de datos se puede usar para detectar los orígenes de datos y ver los metadatos relacionados con los orígenes registrados en el catálogo. Sin embargo, puede haber situaciones en las que los orígenes de datos solo deben ser visibles a usuarios específicos o a los miembros de grupos específicos. En estos escenarios se puede usar Data Catalog para tomar propiedad de los recursos de datos registrados y controlar la visibilidad de los recursos que se poseen.

Nota

Las funcionalidades de administración descritas en este ejercicio solo están disponibles en la edición estándar de Azure Data Catalog, no en la edición gratuita. En Azure Data Catalog, puede tomar propiedad de los recursos de datos, agregar copropietarios a los recursos de datos y establecer la visibilidad de los recursos de datos.

Toma de propiedad de los recursos de datos y restricción de la visibilidad

  1. Vaya a la página principal de Azure Data Catalog. En el cuadro de texto Buscar, escriba tags:cycles y presione ENTRAR.

  2. Seleccione un elemento de la lista de resultados y, después, seleccione Asumir propiedad en la barra de herramientas.

  3. En la sección Administración del panel Propiedades, seleccione Tomar posesión.

    El elemento Producto aparece seleccionado en la lista de resultados y, en la pestaña Propiedades, en la sección Administración, el botón Tomar posesión aparece seleccionado.

  4. Para restringir la visibilidad, elija Propietarios y estos usuarios en la sección Visibilidad y seleccione Agregar. Escriba las direcciones de correo electrónico de los usuarios en el cuadro de texto y presione ENTRAR.

    En la pestaña Propiedades, en la sección Administración, el botón Agregar debajo de Propietarios está seleccionado. A continuación, en Visibilidad, se selecciona el botón Propietarios y estos usuarios. A continuación, se selecciona el botón Agregar en Visibilidad.

Eliminación de los recursos de datos

En este ejercicio se usa el portal de Azure Data Catalog para quitar los datos de vista previa de los recursos de datos registrados y eliminar los recursos de datos del catálogo.

En Azure Data Catalog se pueden eliminar uno o varios recursos.

  1. Vaya a la página principal de Azure Data Catalog.

  2. En el cuadro de texto Buscar, escriba tags:cycles y seleccione ENTRAR.

  3. Seleccione un elemento de la lista de resultados y, después, seleccione Eliminar en la barra de herramientas, como se muestra en la siguiente imagen:

    El icono Producto aparece seleccionado en una lista de resultados de la búsqueda y el botón Eliminar se ve seleccionado en la barra de herramientas superior.

    Si utiliza la vista de lista, la casilla está a la izquierda del elemento, como se muestra en la siguiente imagen:

    En la vista de lista, el cuadro de selección está a la izquierda del elemento del resultado de la búsqueda. El recurso Producto aparece seleccionado, al igual que el botón Eliminar en la barra de herramientas superior.

    También puede seleccionar varios recursos de datos y eliminarlos, según se muestra en la siguiente imagen:

    Azure Data Catalog: eliminar varios recursos de datosEn la vista de lista, se seleccionaron varios recursos y el botón Eliminar aparece seleccionado en la barra de herramientas superior.

Nota

El comportamiento predeterminado del catálogo es permitir que cualquier usuario registre cualquier origen de datos y permitir que cualquier usuario elimine cualquier recurso de datos que se haya registrado. Las funcionalidades de administración que se incluyen en la edición estándar de Azure Data Catalog proporcionan más opciones para la toma de propiedad de los recursos, ya que restringen quiénes puede detectar y eliminar los recursos.

Limpieza de recursos

Siga los pasos de Eliminación de los recursos de datos para limpiar los recursos utilizados al seguir este tutorial.

Resumen

En este tutorial ha explorado las funcionalidades esenciales de Azure Data Catalog, entre las que se incluyen el registro, la anotación, la detección y la administración de recursos de datos empresariales. Ahora que ha completado el tutorial, ha llegado el momento de comenzar. Puede empezar hoy mismo por registrar los orígenes de datos en los que confían usted y su equipo, e invitando a compañeros a usar el catálogo.

Pasos siguientes