Conexión a Looker

Este artículo describe cómo utilizar Looker con un clúster Azure Databricks o un almacén Databricks SQL (anteriormente llamado punto de conexión de Databricks SQL).

Importante

Cuando las tablas derivadas persistentes (PDT) están habilitadas, de manera predeterminada Looker vuelve a generar las PDT cada 5 minutos conectándose a la base de datos asociada. Databricks recomienda cambiar la frecuencia predeterminada para evitar incurrir en costos de proceso excesivos. Para obtener más información, vea Habilitación y administración de tablas derivadas persistentes (PDT).

Requisitos

Para conectarse a Looker manualmente, deberá cumplir los siguientes requisitos:

  • Un clúster o almacén SQL en el área de trabajo de Azure Databricks.

  • Los detalles de la conexión del clúster o almacén SQL, concretamente los valores Nombre de host del servidor, Puerto y Ruta de acceso HTTP.

  • Un token de acceso personal de Azure Databricks o un token de Microsoft Entra ID (anteriormente, Azure Active Directory). Para crear un token de acceso personal, haga lo siguiente:

    1. En el área de trabajo de Azure Databricks, haga clic en el nombre de usuario en la barra superior y seleccione Configuración de usuario en la lista desplegable.
    2. Haga clic en Desarrollador.
    3. Junto a Tokens de acceso, haga clic en Administrar.
    4. Haga clic en Generate new token (Generar nuevo token).
    5. (Opcional) Escriba un comentario que le ayude a identificar este token en el futuro y cambie la duración predeterminada del token de 90 días. Para crear un token sin duración (no recomendado), deje el cuadro Duración (días) vacío (en blanco).
    6. Haga clic en Generar.
    7. Copie el token mostrado en una ubicación segura y, a continuación, haga clic en Listo.

    Nota:

    Asegúrese de guardar el token copiado en una ubicación segura. No comparta el token copiado con otros usuarios. Si pierde el token copiado, no podrá volver a generar ese mismo token. Debe repetir el procedimiento para crear un nuevo token. Si pierde el token copiado o cree que el token se ha visto comprometido, Databricks recomienda eliminar inmediatamente ese token del área de trabajo haciendo clic en el icono de papelera (Revocar) situado junto al token en la página Tokens de acceso.

    Si no puede crear o usar tokens en el área de trabajo, puede deberse a que el administrador del área de trabajo tiene tokens deshabilitados o no le ha concedido permiso para crear o usar tokens. Consulte el administrador del área de trabajo o lo siguiente:

    Nota:

    Como procedimiento recomendado de seguridad, cuando se autentique con herramientas, sistemas, scripts y aplicaciones automatizados, Databricks recomienda usar los tokens de acceso personal pertenecientes a las entidades de servicio en lugar de a los usuarios del área de trabajo. Para crear tokens para entidades de servicio, consulte Administración de tokens para una entidad de servicio.

Conectarse a Looker manualmente

Para conectarse a Looker manualmente, siga los pasos que se muestran a continuación:

  1. En Looker, haga clic en Admin > Conexiones > Agregar conexión .

    Connection parameters

  2. Escriba un nombre único para la conexión.

    Sugerencia

    Los nombres de las conexiones deben contener sólo letras minúsculas, números y guiones bajos. Es posible que se acepten otros caracteres, pero podrían provocar resultados inesperados más adelante.

  3. En Dialecto, seleccione Databricks.

  4. Para Host remoto, introduzca el Nombre de host del servidor de los requisitos.

  5. En el campo Puerto, escriba Puerto que obtuvo al cumplir los requisitos.

  6. En Base de datos, escriba el nombre de la base de datos en el área de trabajo a la que desea acceder a través de la conexión (por ejemplo, default).

  7. En Nombre de usuario, escriba la palabra token.

  8. En Contraseña, introduzca el token de acceso personal de los requisitos.

  9. En Parámetros adicionales, escriba transportMode=http;ssl=1;httpPath=<http-path> y reemplace <http-path> por el valor de Ruta de acceso HTTP de los requisitos.

    Si Unity Catalog está habilitado para el área de trabajo, establezca además el catálogo predeterminado. Escriba ConnCatalog=<catalog-name> y reemplace <catalog-name> por el nombre de un catálogo.

  10. En PDT And Datagroup Maintenance Schedule (PDT y Programación de mantenimiento de grupos de datos), escriba una expresión válida cron para cambiar la frecuencia predeterminada a fin de volver a generar PDT. La frecuencia predeterminada es cada cinco minutos.

  11. Si desea traducir consultas a otras zonas horarias, ajuste zona horaria de consulta.

  12. En el caso de los campos restantes, mantenga los valores predeterminados, en particular:

    • Mantenga los valores predeterminados Máximo de conexiones y Tiempo de espera del grupo de conexiones.
    • Deje la zona horaria de la base de datos en blanco (suponiendo que está almacenando todo en UTC).
  13. Haga clic en Probar esta configuración.

  14. Si la prueba se realiza correctamente, haga clic en Agregar conexión.

Modelado de la base de datos en Looker

En esta sección se crea un proyecto y se ejecuta el generador. Los pasos siguientes suponen que hay tablas permanentes almacenadas en la base de datos para la conexión.

  1. En el menú Desarrollar, active Modo de desarrollo.

  2. Haga clic en Desarrollar >Administrar proyectos LookML.

  3. Haga clic en Nuevo proyecto LookML.

  4. Escriba un solo Nombre de proyecto.

    Sugerencia

    Los nombres de los proyectos deben contener sólo letras minúsculas, números y guiones bajos. Es posible que se acepten otros caracteres, pero podrían provocar resultados inesperados más adelante.

  5. En Conexión, seleccione el nombre de la conexión en el paso 2.

  6. En Esquemas, escriba default, a menos que tenga otras bases de datos para modelar a través de la conexión.

  7. En el caso de los campos restantes, mantenga los valores predeterminados, en particular:

    • Deje Punto de partida establecido en Generar modelo a partir del esquema de base de datos.
    • Deje Vistas de compilación de establecidas en Todas las tablas.
  8. Haga clic en Crear proyecto.

Después de crear el proyecto y de que se ejecute el generador, Looker muestra una interfaz de usuario con un archivo .model y varios archivos .view. El archivo .model muestra las tablas del esquema y las relaciones de combinación detectadas entre ellas, y los .view archivos muestran cada dimensión (columna) disponible para cada tabla del esquema.

Pasos siguientes

Para empezar a trabajar con el proyecto, consulte los siguientes recursos en el sitio web de Looker:

Habilitación y administración de tablas derivadas persistentes (PDT)

Looker puede reducir los tiempos de consulta y las cargas de base de datos mediante la creación de tablas derivadas persistentes (PDT). Un PDT es una tabla derivada que Looker escribe en un esquema de cero en la base de datos. A continuación, Looker vuelve a generar el PDT según la programación que especifique. Para obtener más información, vea Tablas derivadas persistentes (PDT) en la documentación de Looker.

Para habilitar los PDT para una conexión de base de datos, seleccione Tablas derivadas persistentes para esa conexión y complete las instrucciones en pantalla. Para obtener más información, vea Tablas derivadas persistentes y Configuración de credenciales de inicio de sesión independientes para procesos PDT en la documentación de Looker.

Cuando los PDT están habilitados, de forma predeterminada, Looker vuelve a generar los PDT cada 5 minutos mediante la conexión a la base de datos asociada. Looker reinicia el recurso Azure Databricks asociado si se detiene. Databricks recomienda cambiar la frecuencia predeterminada; para ello, establezca el campo PDT And Datagroup Maintenance Schedule (PDT y Programación de mantenimiento de grupos de datos) para la conexión de base de datos en una expresión cron válida. Para obtener más información, vea PDT y Programación de mantenimiento de grupos de datos en la documentación de Looker.

Para habilitar los PDT o cambiar la frecuencia de regeneración de PDT para una conexión de base de datos existente, haga clic en Administrar > Conexiones de base de datos, haga clic en Editar junto a la conexión de base de datos y siga las instrucciones anteriores.

Recursos adicionales

Compatibilidad con Looker