Tutorial: Configuración de la creación de reflejo para Google BigQuery (versión preliminar)

En este tutorial, configurará una base de datos Fabric replicada desde Google BigQuery.

Nota:

Aunque este ejemplo es específico de BigQuery, puede encontrar pasos detallados para configurar la creación de reflejo para otros orígenes de datos, como Azure SQL Database o Azure Cosmos DB. Para obtener más información, consulte ¿Qué es el mirroring en Fabric?

Prerrequisitos

Cree o use un almacenamiento de BigQuery existente. Puede conectarse a cualquier versión de la instancia de BigQuery en cualquier nube, incluida la Microsoft Azure.
Necesita una capacidad de Fabric existente. Si no, inicia una prueba de Fabric.

Requisitos de permisos

Necesita permisos de usuario para la base de datos de BigQuery que contenga los permisos siguientes:

bigquery.datasets.create
bigquery.tables.list
bigquery.tables.create
bigquery.tables.export
bigquery.tables.get
bigquery.tables.getData
bigquery.tables.updateData
bigquery.routines.get
bigquery.routines.list
bigquery.jobs.create
storage.buckets.create
storage.buckets.list
storage.objects.create
storage.objects.delete
storage.objects.list
iam.serviceAccounts.signBlob

Recuperar metadatos de tabla y configuración del historial de cambios (obligatorio)

Los roles BigQueryAdmin y StorageAdmin deben incluir estos permisos. Los permisos siguientes son necesarios para determinar si el historial de cambios está habilitado y para recuperar la clave principal o la información de clave compuesta.

El usuario debe tener al menos un rol asignado que permita el acceso a la instancia de BigQuery. Compruebe los requisitos de red para acceder al origen de datos de BigQuery. Si usa la creación de reflejos para Google BigQuery para la puerta de enlace de datos local (OPDG), debe tener opDG versión 3000.286.6 o superior para habilitar la creación de reflejo correcta.

Permisos necesarios

Para establecer manualmente cubos (y evitar la necesidad de conceder el permiso storage.buckets.create), puede usar:

bigquery.tables.get
bigquery.tables.list
bigquery.routines.get
bigquery.routines.list

Vaya a Almacenamiento en la nube en la consola de Google y seleccione Cubos.
Seleccione Crear y asigne un nombre al cubo en este formato (distingue mayúsculas de minúsculas): <projectid>_fabric_staging_bucket
Asegúrese de que la ubicación o región del bucket sea la misma que la del proyecto de GCP que planea reflejar.
Selecciona Crear. El sistema de réplica detectará automáticamente el bucket.

Se podrían requerir más permisos en función del caso de uso. Los permisos mínimos necesarios son para trabajar con el historial de cambios y controlar varias tablas de tamaño (tablas de más de 10 GB). Incluso si no trabaja con tablas superiores a 10 GB, habilite todos estos permisos mínimos para garantizar el éxito del uso del Espejo.

Recuperar el historial de cambios y los datos de tabla (obligatorios)

Para obtener más información sobre los permisos, consulte la documentación de Google BigQuery sobre los privilegios necesarios para los datos de streaming, los permisos necesarios para el acceso al historial de cambios y los permisos necesarios para escribir los resultados de la consulta.

Los permisos siguientes son necesarios para leer el historial de cambios y los datos de la tabla.

Importante

Cualquier seguridad granular establecida en el almacenamiento de BigQuery de origen debe volver a configurarse en la base de datos reflejada en Microsoft Fabric. Para obtener más información, consulte SQL granular permissions in Microsoft Fabric.

Permisos necesarios

bigquery.tables.getData
bigquery.jobs.create
bigquery.jobs.get
bigquery.jobs.list
bigquery.readsessions.create
bigquery.readsessions.getData

Habilitación de las funcionalidades del historial de cambios (obligatorio)

El historial de cambios debe estar habilitado en las tablas bigQuery de origen mediante una de las siguientes opciones.

Opción 1: Habilitar permiso

bigquery.tables.update

Permite habilitar el historial de cambios en las tablas.

Opción 2: Habilitar la opción de tabla en GCP

Asegúrese de que la siguiente opción de tabla esté establecida en TRUE:

enable_change_history

Exportación de datos a Google Cloud Storage para almacenamiento provisional y copia en OneLake (obligatorio)

Los permisos siguientes son necesarios para exportar datos de BigQuery a Google Cloud Storage para el almacenamiento provisional y copiarlos en OneLake.

Permisos necesarios

bigquery.tables.export
storage.objects.create
storage.objects.list
storage.buckets.get
iam.serviceAccounts.signBlob

Cubo de almacenamiento en la nube de Google para almacenamiento provisional (obligatorio)

Se requiere un cubo de Google Cloud Storage para exportar datos de tabla bigQuery para el almacenamiento provisional.

Opciones de creación de cubos

Siga uno de estos procedimientos:

Opción 1: Permitir la creación automática de cubos

Conceda el permiso siguiente:

storage.buckets.create

Opción 2: Crear manualmente el cubo de almacenamiento provisional

Cree un cubo con la siguiente convención de nomenclatura: <your_project_id_in_lowercase>_fabric_staging_bucket

Requisitos del bucket

El cubo debe estar en la misma ubicación o región que el conjunto de datos de BigQuery.
El sistema de creación de reflejo detectará automáticamente el cubo una vez que exista.

Enumerar conjuntos de datos (obligatorios)

Permisos necesarios

bigquery.datasets.get

Enumerar proyectos (obligatorios)

Permisos necesarios

resourcemanager.projects.get

Requisitos de rol y acceso

Los roles Administrador de BigQuery y Administrador de almacenamiento suelen incluir los permisos enumerados anteriormente.

Al usuario se le debe asignar al menos un rol que conceda acceso al proyecto y los conjuntos de datos de BigQuery de destino.

Requisitos de red y puerta de enlace

Compruebe los requisitos de red para acceder al origen de datos de BigQuery.

Si está utilizando Reflejo para Google BigQuery con la puerta de enlace de datos (OPDG) en las instalaciones, debe usar:

OPDG versión 3000.286.6 o posterior

Notas adicionales

Es posible que se necesiten más permisos en función del caso de uso. Los permisos enumerados anteriormente representan el mínimo necesario para:

Trabajar con el historial de cambios
Control de tablas de varios tamaños, incluidas las tablas de más de 10 GB

Incluso si actualmente no está trabajando con tablas de más de 10 GB, se recomienda habilitar todos los permisos mínimos para garantizar la creación de reflejo correcta.

Para obtener más información, consulte:

Importante

Cualquier seguridad granular definida en el almacenamiento de BigQuery de origen debe volver a configurarse en la base de datos reflejada en Microsoft Fabric. Para obtener más información, consulte SQL granular permissions in Microsoft Fabric.

Creación de una base de datos reflejada

En esta sección, creará una nueva base de datos duplicada a partir del origen de datos duplicado de BigQuery.

Puede usar un área de trabajo existente (no Mi área de trabajo) o crear una nueva área de trabajo.

Desde su área de trabajo, navega a la sección Crear.
Después de seleccionar el área de trabajo que desea usar, seleccione Crear.
Seleccione la tarjeta Google BigQuery replicada.
Escriba el nombre de la nueva base de datos.
Selecciona Crear.

Conexión a la instancia de BigQuery en cualquier nube

Nota:

Es posible que necesite modificar el firewall de nube para permitir que Mirroring se conecte a la instancia de BigQuery. Apoyamos el reflejo para Google BigQuery para la versión 3000.286.6 de OPDG o posterior. También admitimos VNET.

Seleccione BigQuery en Nueva conexión o seleccione una conexión existente.

Si seleccionó Nueva conexión, escriba los detalles de conexión en la base de datos bigQuery.

Configuración de conexión	Description
Correo electrónico de la cuenta de servicio	Si tiene una cuenta de servicio preexistente: puede encontrar el correo electrónico de la cuenta de servicio y la clave existente; para ello, vaya a Cuentas de servicio en la consola de Google BigQuery. Si no tiene una cuenta de servicio preexistente: vaya a "Cuentas de servicio" en la consola de Google BigQuery y seleccione Crear cuenta de servicio. Escriba un nombre de cuenta de servicio (un identificador de cuenta de servicio se genera automáticamente en función del nombre de la cuenta de servicio de entrada) y una descripción de la cuenta de servicio. Seleccione Listo. Copie y pegue el correo electrónico de la cuenta de servicio en su sección credenciales de conexiones designadas en Fabric.
Contenido del archivo de clave JSON de la cuenta de servicio	En el panel Cuentas de servicio, seleccione Acciones para la cuenta de servicio recién creada. Seleccione Administrar claves. Si ya tiene una clave por cuenta de servicio, descargue su contenido del archivo de clave JSON. Si aún no tiene una clave por cuenta de servicio, seleccione Agregar clave y Crear nueva clave. A continuación, seleccione JSON. El archivo de clave JSON debe descargarse automáticamente. Copie y pegue la clave JSON en la sección credenciales de conexiones designadas del portal de Fabric.
Conexión	Cree una nueva conexión.
Nombre de la conexión	Debe rellenarse automáticamente. Cámbielo por un nombre que le gustaría usar.

Seleccione la base de datos en la lista desplegable.

Inicio del proceso de creación de reflejo

La pantalla Configurar creación de reflejo permite reflejar todos los datos de la base de datos de forma predeterminada.
- Reflejar todos los datos significa que cualquier nueva tabla creada después de iniciar el reflejo se reflejará.
- Opcionalmente, elija solo determinados objetos que se van a reflejar. Deshabilite la opción Reflejar todos los datos y, a continuación, seleccione tablas individuales de la base de datos.
En este ejemplo, usamos la opción Reflejar todos los datos .
Seleccione Base de datos reflejada. Comienza la duplicación.
Espere entre 2 y 5 minutos. A continuación, seleccione Supervisar replicación para ver el estado.
Después de unos minutos, el estado debe cambiar a En ejecución, lo que significa que las tablas se están sincronizando.

Si no ve las tablas y el estado de replicación correspondiente, espere unos segundos y luego actualice el panel.
Cuando hayan terminado la copia inicial de las tablas, aparecerá una fecha en la columna Última actualización .
Ahora que sus datos están operativos, hay varios escenarios analíticos disponibles en todo el sistema Fabric.

Importante

Cualquier seguridad granular establecida en la base de datos de origen debe volver a configurarse en la base de datos reflejada en Microsoft Fabric.

Supervisión de la creación de reflejo de Fabric

Una vez configurado el reflejo, se le dirigirá a la página Estado de reflejo. Aquí puede supervisar el estado actual de la replicación.

Para obtener más información y detalles sobre los estados de replicación, consulte Monitorear la replicación de bases de datos reflejadas en Fabric.

Importante

Si no hay actualizaciones en las tablas de origen de la base de datos de BigQuery, el motor de replicador (el motor que impulsa los datos modificados para la creación de reflejo de BigQuery) se ralentizará y solo replicará las tablas cada hora. No se sorprenda si los datos después de la carga inicial tardan más de lo esperado, especialmente si no tiene actualizaciones nuevas en las tablas de origen. Después de la instantánea, el motor de espejo esperará aproximadamente 15 minutos antes de obtener los cambios; esto se debe a una limitación de Google BigQuery en la que se impone un retraso de 10 minutos para reflejar los cambios nuevos. Más información sobre el retraso de reflexión de cambios de BigQuery

Comentaris

Us ha resultat útil aquesta pàgina?

Last updated on 2026-03-26

Tutorial: Configuración de la creación de reflejo para Google BigQuery (versión preliminar)

Prerrequisitos

Requisitos de permisos

Recuperar metadatos de tabla y configuración del historial de cambios (obligatorio)

Permisos necesarios

Recuperar el historial de cambios y los datos de tabla (obligatorios)

Permisos necesarios

Habilitación de las funcionalidades del historial de cambios (obligatorio)

Opción 1: Habilitar permiso

Opción 2: Habilitar la opción de tabla en GCP

Exportación de datos a Google Cloud Storage para almacenamiento provisional y copia en OneLake (obligatorio)

Permisos necesarios

Cubo de almacenamiento en la nube de Google para almacenamiento provisional (obligatorio)

Opciones de creación de cubos

Requisitos del bucket

Enumerar conjuntos de datos (obligatorios)

Permisos necesarios

Enumerar proyectos (obligatorios)

Permisos necesarios

Requisitos de rol y acceso

Requisitos de red y puerta de enlace

Notas adicionales

Creación de una base de datos reflejada

Conexión a la instancia de BigQuery en cualquier nube

Inicio del proceso de creación de reflejo

Supervisión de la creación de reflejo de Fabric

Contenido relacionado

Comentaris

Recursos addicionals