Compartir vía


Introducción a Azure Synapse Link para SQL Server 2022

En este artículo es una guía paso a paso para empezar a trabajar con Azure Synapse Link para SQL Server 2022. Para obtener información general, consulte Azure Synapse Link para SQL Server 2022.

Requisitos previos

  • Antes de empezar, consulte Cree una nueva área de trabajo de Synapse para obtener Azure Synapse Link para SQL. El tutorial actual consiste en crear un vínculo de Azure Synapse para SQL en la red pública. En este artículo se supone que seleccionó Deshabilitar red virtual administrada y Permitir conexiones desde todas las direcciones IP al crear un área de trabajo de Azure Synapse. Si quiere configurar Azure Synapse Link para SQL Server 2022 con seguridad de red, vea también Configuración de Azure Synapse Link para SQL Server 2022 con seguridad de red.

  • Cree una cuenta de Azure Data Lake Storage Gen2, que es diferente de la cuenta que se crea con el área de trabajo de Azure Synapse Analytics. Usará esta cuenta como zona de aterrizaje para almacenar provisionalmente los datos enviados por SQL Server 2022. Para más información, consulte Creación de una cuenta de Azure Data Lake Storage Gen2.

  • Asegúrese de que su base de datos de SQL Server 2022 tiene una clave maestra creada.

    CREATE MASTER KEY ENCRYPTION BY PASSWORD = '<a new password>'
    

Creación de su grupo destino específico de SQL de Azure Synapse

  1. Abra Synapse Studio.

  2. Abra el centro Administrar, vaya a Grupos de SQL y entonces seleccione Nuevo.

    Captura de pantalla que muestra cómo crear un nuevo grupo dedicado de SQL Azure Synapse a partir de Synapse Studio.

  3. Escriba un nombre de grupo único, use la configuración predeterminada y cree el grupo dedicado.

  4. En el centro Datos, en Área de trabajo, debería ver la nueva base de datos de Synapse SQL en Bases de datos. En la nueva base de datos de Azure Synapse SQL, seleccione Nuevo script de SQL y, a continuación, seleccione Script vacío.

    Captura de pantalla que muestra cómo crear un nuevo script SQL vacío a partir de Synapse Studio.

  5. Para crear la clave maestra para la base de datos de Synapse SQL de destino, pegue el siguiente script y seleccione Ejecutar.

    CREATE MASTER KEY
    

Creación de un servicio vinculado para una base de datos de SQL Server 2022 de origen

  1. Seleccione el botón Administrar concentrador y, a continuación, seleccione Servicios vinculados.

    Vaya a los servicios vinculados desde Synapse Studio.

  2. Presione Nuevo, seleccione SQL Server y elija Continuar.

    Captura de pantalla que muestra cómo crear un servicio vinculado de SQL Server.

  3. En el cuadro Nombre, escriba el nombre del servicio vinculado de SQL Server 2022.

    Captura de pantalla que muestra dónde escribir los nombres de servidor y base de datos que se van a conectar.

    Nota:

    Solo se admite el servicio vinculado en la versión heredada.

  4. Cuando escoge el tiempo de ejecución de integración, seleccione el entorno de ejecución de integración configurado. Si el área de trabajo de Azure Synapse no tiene disponible el entorno de ejecución de integración autohospedado, cree uno.

  5. (Opcional) Para crear un entorno de ejecución de integración autohospedado para conectarse a SQL Server 2022 de origen, haga lo siguiente:

    a. Seleccione Nuevo.

    Captura de pantalla que muestra cómo crear un nuevo entorno de ejecución de integración autohospedado.

    b. Seleccione Autohospedado y entonces haga clic en Continuar.

    c. En el cuadro Nombre, escriba el nombre del entorno de ejecución de integración autohospedado y, a continuación, seleccione Crear.

    Captura de pantalla que muestra dónde escribir un nombre para el entorno de ejecución de integración autohospedado.

    Un entorno de ejecución de integración autohospedado está ahora disponible en el área de trabajo de Azure Synapse.

    d. Siga las indicaciones descargar, instalar y usar la clave para registrar el agente del entorno de ejecución de integración en la máquina Windows, que tiene acceso directo a la instancia de SQL Server 2022. Para más información, consulte Creación de un entorno de ejecución de integración autohospedado: Azure Data Factory y Azure Synapse.

    Captura de pantalla que muestra dónde descargar, instalar y registrar el entorno de ejecución de integración.

    e. Seleccione Cerrar.

    Obtenga el estado del entorno de ejecución de integración.

    f. Vaya a la página de supervisión y asegúrese de que el entorno de ejecución de integración autohospedado se está ejecutando; para ello, seleccione Actualizar para obtener el estado más reciente del entorno de ejecución de integración.

  6. Continúe introduciendo la información restante del servicio vinculado, lo que incluye los campos Nombre de SQL Server, Nombre de la base de datos, Tipo de autenticación, Nombre de usuario y Contraseña para conectarse a la instancia de SQL Server 2022.

    Nota:

    Se recomienda habilitar el cifrado en esta conexión. Para ello, agregue la propiedad Encrypt con un valor de como una propiedad true de conexión adicional. Establezca también la propiedad Trust Server Certificate en true o false, en función de la configuración del servidor. Para más información, vea Habilitación de conexiones cifradas en el motor de base de datos.

  7. Seleccione Probar conexión para asegurarse de que el entorno de ejecución de integración autohospedado pueda acceder a la instancia de SQL Server.

  8. Seleccione Crear.

    El nuevo servicio vinculado se conectará a la instancia de SQL Server 2022 que está disponible en el área de trabajo.

    Captura de pantalla que muestra dónde ver la conexión del servicio vinculado.

    Nota:

    El servicio vinculado que cree aquí no está dedicado a Azure Synapse Link para SQL. Se puede usar en cualquier usuario del área de trabajo que tenga los permisos adecuados. Dedique tiempo a comprender el ámbito de los usuarios que pueden tener acceso a este servicio vinculado y sus credenciales. Para más información sobre los permisos de áreas de trabajo de Azure Synapse, consulte Información general sobre el control de acceso al área de trabajo de Azure Synapse: Azure Synapse Analytics.

Creación de un servicio vinculado para conectarse a la zona de aterrizaje en Azure Data Lake Storage Gen2

  1. Vaya a la nueva cuenta de Azure Data Lake Storage Gen2 creada, seleccione Control de acceso (IAM), seleccione +Agregar y después elija Agregar asignación de roles.

    Captura de pantalla del panel

  2. Seleccione Colaborador de datos de Storage Blob para el rol elegido, seleccione Identidad administrada y, en Miembros, seleccione el área de trabajo de Azure Synapse. Agregar esta asignación de roles puede tardar unos minutos.

    Captura de pantalla que muestra cómo agregar una asignación de roles.

    Nota

    Asegúrese de que ha concedido los permisos de identidad administrada del área de trabajo de Azure Synapse a la cuenta de almacenamiento Azure Data Lake Storage Gen2 que se usa como zona de aterrizaje. Para más información, consulte Concesión de permisos a una identidad administrada en el área de trabajo de Azure Synapse: Azure Synapse Analytics.

  3. Abra el centro Administrar en el área de trabajo de Azure Synapse y vaya a Servicios vinculados.

    Captura de pantalla que muestra cómo ir al servicio vinculado.

  4. Seleccione Nuevo y después seleccione Azure Data Lake Storage Gen2.

  5. Haga lo siguiente:

    a. En el cuadro Nombre, escriba el nombre del servicio vinculado para la zona de aterrizaje.

    b. Por el método de autenticación introduzca Identidad administrada.

    c. Seleccione un nombre en Nombre de la cuenta de almacenamiento que ya haya creado.

  6. Seleccione Probar conexión para asegurarse de que puede acceder a su cuenta de Azure Data Lake Storage Gen2.

  7. Seleccione Crear.

    El nuevo servicio vinculado se conectará a la cuenta de Azure Data Lake Storage Gen2.

    Captura de pantalla que muestra el nuevo servicio vinculado a Azure Data Lake Storage Gen2.

    Nota

    El servicio vinculado que cree aquí no está dedicado a Azure Synapse Link para SQL. Se puede usar en cualquier usuario del área de trabajo que tenga los permisos adecuados. Dedique tiempo a comprender el ámbito de los usuarios que pueden tener acceso a este servicio vinculado y sus credenciales. Para más información sobre los permisos de áreas de trabajo de Azure Synapse, consulte Información general sobre el control de acceso al área de trabajo de Azure Synapse: Azure Synapse Analytics.

  1. En Synapse Studio, abra el centro Integrar.

  2. En el panel Integrar, seleccione el signo más (+) y, después, Link connection (Conexión de vínculo).

    Captura de pantalla en la que se muestra el botón

  3. Introduzca la base de datos de origen:

    a. En Tipo de origen, seleccione SQL Server.

    b, En el Servicio vinculado de origen, seleccione el servicio que se conecta a la instancia de SQL Server 2022.

    c. En Nombres de tabla, seleccione los nombres de la instancia de SQL Server que se va a replicar en el grupo de Azure Synapse SQL.

    d. Seleccione Continuar.

    Captura de pantalla que muestra dónde especificar los detalles de la base de datos de origen.

  4. En Grupos dedicados de Synapse SQL, seleccione un nombre de base de datos de destino.

  5. Seleccione Continuar.

  6. Introduzca la configuración de conexión del vínculo:

    a. En Nombre de conexión de vínculo, escriba el nombre.

    b. En Recuento de núcleos para el proceso de conexión de vínculo, escriba el número de núcleos. Estos núcleos se usarán para el movimiento de datos del origen al destino. Se recomienda empezar con un número pequeño y aumentar el recuento según sea necesario.

    c. En Servicio vinculado, seleccione el servicio que se conectará a la zona de aterrizaje.

    d. Introduzca el nombre del contenedor o el nombre de contenedor o carpeta de Azure Data Lake Storage Gen2 como ruta de acceso de la carpeta de la zona de aterrizaje para almacenar provisionalmente los datos. El contenedor debe crearse primero.

    e. Introduzca el token de firma de acceso compartido Azure Data Lake Storage Gen2. El token es necesario para que la fuente de cambios de SQL acceder a la zona de aterrizaje. Si la cuenta de Azure Data Lake Storage Gen2 no tiene un token de firma de acceso compartido, puede crear uno seleccionando Generar token.

    f. Seleccione Aceptar.

    Captura de pantalla que muestra dónde especificar la configuración de conexión del vínculo.

    Nota

    El número de núcleos que seleccione aquí se asigna al servicio de ingesta para procesar la carga de datos y los cambios. No afectan a la configuración del grupo de SQL dedicado de destino. Si no puede conectarse a la zona de aterrizaje mediante el token de SAS generado debido a la limitación del almacenamiento, también puede intentar usar el token de SAS de delegación para conectarse a la zona de aterrizaje.

  7. Con la nueva conexión de Azure Synapse Link abierta, puede actualizar el nombre de la tabla de destino, el tipo de distribución y el tipo de estructura.

    Nota

    • Considere la posibilidad de usar la tabla del montón para el tipo de estructura cuando los datos contengan varchar(max), nvarchar(max) y varbinary(max).
    • Asegúrese de que el esquema del grupo dedicado de Azure Synapse SQL ya se ha creado antes de iniciar la conexión de vínculo. Azure Synapse Link para SQL creará tablas automáticamente en el esquema en el grupo de Azure Synapse SQL.
  8. En la lista desplegable Acción sobre tabla de destino existente, elija la opción más apropiada para su escenario si la tabla ya existe en el destino.

    • Anular y volver a crear la tabla: la tabla de destino existente se anulará y se volverá a crear.
    • Error en tabla no vacía: si la tabla de destino contiene datos, fallará la conexión de vínculo para la tabla dada.
    • Combinar con datos existentes: los datos se combinarán en la tabla existente.

    Nota:

    Si quiere combinar varios orígenes en el mismo destino seleccionando "Combinar con datos existentes", asegúrese de que los orígenes contienen datos diferentes para evitar conflictos y un resultado inesperado.

  9. Especifique si se va a habilitar la coherencia de transacciones entre tablas.

    • Cuando esta opción está habilitada, una transacción que abarca varias tablas de la base de datos de origen siempre se replica en la base de datos de destino en una sola transacción. Sin embargo, creará una sobrecarga en el rendimiento general de la replicación.
    • Cuando la opción está deshabilitada, cada tabla replicará los cambios en su propio límite de transacción en el destino en conexiones paralelas, lo que mejora el rendimiento general de la replicación.

    Nota:

    Cuando quiera habilitar la consistencia de las transacciones a través de las tablas, asegúrese también de que los niveles de aislamiento de las transacciones en su pool SQL dedicado a Synapse sea READ COMMITTED SNAPSHOT ISOLATION.

  10. Seleccione Publicar todo para guardar la nueva conexión de vínculo al servicio.

Seleccione Iniciar y espere unos minutos para que se repliquen los datos.

Nota

Una conexión de vínculo partirá de una carga inicial completa de su base de datos de origen, seguida de alimentaciones de cambios incrementales a través de la función de alimentación de cambios en SQL Server 2022. Para más información, consulte Azure Synapse Link para fuente de cambios de SQL.

Puede supervisar el estado de la conexión de Azure Synapse Link, ver qué tablas se copian inicialmente (creación de instantáneas) y ver qué tablas están en modo de replicación continua (replicación).

  1. Vaya al centro de supervisión del área de trabajo de Azure Synapse y seleccione Vincular conexiones.

  2. Abra la conexión de vínculo que inició y vea el estado de cada tabla.

  3. Seleccione Actualizar en la vista de supervisión de la conexión para observar las actualizaciones del estado.

    Supervise la conexión vinculada.

Consulta de los datos replicados

Espere unos minutos y compruebe para asegurarse de que la base de datos de destino tiene la tabla y los datos esperados. Consulte los datos disponibles en el almacén de destino del grupo dedicado de Azure Synapse SQL. Ahora también puede explorar las tablas replicadas en el grupo dedicado de Azure Synapse SQL de destino.

  1. En el centro de datos, en Área de trabajo, abra la base de datos de destino.

  2. En Tablas, haga clic con el botón derecho en una de las tablas de destino.

  3. Seleccione Nuevo SQL script y después Seleccionar las 100 primeras filas.

  4. Ejecute esta consulta para ver los datos replicados en el grupo de dedicado de Azure Synapse SQL de destino.

  5. También puede consultar la base de datos de destino mediante Microsoft SQL Server Management Studio (SSMS) u otras herramientas. Use el punto de conexión de SQL dedicado para el área de trabajo como nombre del servidor. El nombre suele ser <workspacename>.sql.azuresynapse.net. Agregue Database=databasename@poolname como parámetro de cadena de conexión adicional al conectarse a través de SSMS u otras herramientas.

Para agregar o quitar tablas en Synapse Studio, haga lo siguiente:

  1. En el área de trabajo de Azure Synapse, abra el centro de integración.

  2. En Conexión de vínculo, seleccione la conexión que desee editar y ábrala.

  3. Realice cualquiera de las siguientes acciones:

    • Para agregar una tabla, seleccione Nueva tabla.
    • Para quitar una tabla, seleccione el icono de papelera junto a ella.

    Captura de pantalla del panel de conexión de vínculo para agregar o quitar tablas.

    Nota:

    Puede agregar o quitar tablas directamente cuando se ejecute una conexión de vínculo.

Para detener la conexión de Azure Synapse Link en Synapse Studio, haga lo siguiente:

  1. En el área de trabajo de Azure Synapse, abra el centro de integración.

  2. En Conexión de vínculo, seleccione la conexión que desee editar y ábrala.

  3. Seleccione Detener para detener la conexión de vínculo y dejará de replicar los datos.

    Captura de pantalla del panel para detener una conexión de vínculo.

    Nota:

    • Si reinicia una conexión de vínculo después de detenerla, comenzará a partir de una carga inicial completa desde la base de datos de origen y las fuentes de cambios incrementales ocurrirán a continuación.
    • Si elige "Combinar con datos existentes" como acción en la tabla de destino existente, cuando detenga la conexión de vínculo y la reinicie, los registros eliminados en el origen durante ese periodo no se eliminarán en el destino. En tal caso, para asegurar la coherencia de los datos, considere usar pausar/reanudar en lugar de parar/iniciar, o limpie las tablas de destino antes de reiniciar la conexión del vínculo.

Rotación del token de firma de acceso compartido para la zona de aterrizaje

Se requiere un token de firma de acceso compartido para que la fuente de cambios de SQL obtenga acceso a la zona de aterrizaje e inserte datos allí. Tiene una fecha de expiración, por lo que debe rotar el token antes en dicha fecha. De lo contrario, Azure Synapse Link no podrá replicar los datos de la instancia de SQL Server al grupo de dedicado de Synapse SQL.

  1. En el área de trabajo de Azure Synapse, abra el centro de integración.

  2. En Conexión de vínculo, seleccione la conexión que desee editar y ábrala.

  3. Seleccione Rotar token.

    Captura de pantalla que muestra dónde rotar un token de firma de acceso compartido.

  4. Para obtener el nuevo token de firma de acceso compartido, seleccione Generar automáticamente o Entrada manualmente y, a continuación, seleccione Aceptar.

    Captura de pantalla que muestra cómo obtener un nuevo token de firma de acceso compartido.

    Nota:

    Si no puede conectarse a la zona de aterrizaje mediante el token de SAS generado debido a la limitación del almacenamiento, también puede intentar usar el token de SAS de delegación para conectarse a la zona de aterrizaje.

Pasos siguientes

Si usa una base de datos distinta de SQL Server 2022, consulte: