Compartir vía


Creación de reflejo de Copo de nieve en Microsoft Fabric

La creación de reflejos en Fabric proporciona una experiencia sencilla para evitar ETL complejo (extraer carga de transformación) e integrar los datos de almacenamiento de Snowflake existentes con el resto de los datos en Microsoft Fabric. Puede replicar continuamente los datos existentes de Snowflake directamente en OneLake de Fabric. Dentro de Fabric, puede desbloquear potente inteligencia empresarial, inteligencia artificial, ingeniería de datos, ciencia de datos y escenarios de uso compartido de datos.

Para ver un tutorial sobre cómo configurar la base de datos de Snowflake para la creación de reflejo en Fabric, consulte Tutorial: Configuración de bases de datos reflejadas de Microsoft Fabric desde Snowflake.

¿Por qué usar la creación de reflejos en Fabric?

Con la creación de reflejos en Fabric, no es necesario unir diferentes servicios de varios proveedores. En su lugar, puede disfrutar de un producto muy integrado, de un extremo a otro y fácil de usar diseñado para simplificar sus necesidades de análisis, y creado para abrir y colaborar entre Microsoft, Snowflake y las 1000 soluciones tecnológicas que pueden leer el formato de tabla delta Lake de código abierto.

¿Qué experiencias de análisis se crean?

Las bases de datos reflejadas son un elemento de Fabric Data Warehouseing distinto del punto de conexión de Sql Analytics y Warehouse.

Diagrama de creación de reflejo de la base de datos de Fabric para Snowflake.

La creación de reflejo crea estos elementos en el área de trabajo de Fabric:

  • Elemento de base de datos reflejado. Esto permite escenarios de bajada, como la ingeniería de datos, la ciencia de datos, etc. La gestión de reflejos gestiona
    • La replicación de los metadatos de las tablas de Iceberg en OneLake mediante accesos rápidos al almacenamiento que contiene tus tablas de Iceberg. OneLake convierte automáticamente estas tablas Iceberg en tablas con formato Delta Lake para utilizarlas en cargas de trabajo de Fabric.
    • La replicación de datos de tabla administrada en OneLake y la conversión a Parquet, en un formato listo para el análisis.
  • Un punto de conexión de SQL Analytics

Cada base de datos reflejada tiene un punto de conexión de SQL Analytics generado automáticamente que proporciona una experiencia analítica enriquecida sobre las tablas delta creadas por el proceso de creación de reflejo. Los usuarios tienen acceso a comandos de T-SQL conocidos que pueden definir y consultar objetos de datos, pero no manipular los datos desde el punto de conexión de SQL Analytics, ya que es una copia de solo lectura. Puede realizar las siguientes acciones en el punto de conexión de SQL Analytics:

  • Explore las tablas que hacen referencia a datos de las tablas de Delta Lake desde Snowflake.
  • No cree consultas ni vistas de código y explore los datos visualmente sin escribir una línea de código.
  • Desarrolle vistas SQL, TVF insertadas (Funciones con valores de tabla) y procedimientos almacenados para encapsular la semántica y la lógica de negocios en T-SQL.
  • Administrar permisos en los objetos.
  • Consulte los datos de otros almacenes y lakehouses en la misma área de trabajo.

Además del editor de consultas SQL, hay un amplio ecosistema de herramientas que puede consultar el punto de conexión de análisis de SQL, incluido SQL Server Management Studio (SSMS),la extensión mssql con Visual Studio Code e incluso GitHub Copilot.

Consideraciones de seguridad

Para habilitar la creación de reflejo de Fabric, necesitará permisos de usuario para la base de datos de Snowflake que contenga los permisos siguientes:

  • CREATE STREAM
  • SELECT table
  • SHOW tables
  • DESCRIBE tables

Para obtener más información, consulte la documentación de Snowflake sobre privilegios de control de acceso para tablas de streaming y permisos necesarios para secuencias.

Importante

Cualquier seguridad pormenorizado establecida en el almacén de Snowflake de origen debe volver a configurarse en la base de datos reflejada en Microsoft Fabric. Para más información, consulte Permisos pormenorizados de SQL en Microsoft Fabric.

Reflejo de Snowflake detrás del firewall

Compruebe los requisitos de red para acceder al origen de datos de Snowflake. Si el origen de datos de Snowflake no es accesible públicamente y está dentro de una red privada, cree una puerta de enlace de datos de red virtual o instale una puerta de enlace de datos local para reflejar los datos. La red virtual de Azure o la red de la máquina de puerta de enlace deben conectarse a la instancia de Snowflake a través de un punto de conexión privado o permitirse mediante la regla de firewall. Para empezar, consulte Tutorial: Configuración de bases de datos reflejadas de Microsoft Fabric desde Snowflake.

Consideraciones sobre los costos de Snowflake reflejados

El proceso de Fabric que se usa para replicar los datos en Fabric OneLake es gratuito. El costo de almacenamiento de creación de reflejo es gratis hasta un límite basado en la capacidad. Para obtener más información, consulte Costo de creación de reflejo y precios de Microsoft Fabric. El proceso para consultar datos mediante SQL, Power BI o Spark se cobra a tarifas regulares.

Fabric no cobra por las tarifas de entrada de datos de red en OneLake for Mirroring.

Hay costos de proceso y consulta en la nube de Snowflake cuando se reflejan los datos: proceso de almacenamiento virtual y proceso de servicios en la nube.

  • Cargos de proceso de almacenamiento virtual de Snowflake:
    • Los cargos de proceso se cobrarán en el lado de Snowflake si hay cambios de datos que se leen en Snowflake y, a su vez, se reflejan en Fabric.
    • Las consultas de metadatos se ejecutan en segundo plano para comprobar si hay cambios en los datos no se cobran por ningún proceso de Snowflake; sin embargo, se cobrarán las consultas que producen datos como , SELECT * por ejemplo, el almacenamiento de Snowflake y el proceso.
  • Cargos de proceso de los servicios de Snowflake:
    • Aunque no hay cargos de proceso por tareas en segundo plano, como la creación, las consultas de metadatos, el control de acceso, la visualización de los cambios de datos e incluso las consultas DDL, hay costos en la nube asociados a estas consultas.
    • Dependiendo del tipo de edición de Snowflake que tenga, se le cobrarán los créditos correspondientes por los costos de los servicios en la nube.

En la captura de pantalla siguiente, puede ver los costos de proceso de almacenamiento virtual y servicios en la nube para la base de datos de Snowflake asociada que se está reflejando en Fabric. En este escenario, la mayoría de los costos de proceso de los servicios en la nube (en amarillo) proceden de consultas de cambios de datos basadas en los puntos mencionados anteriormente. Los cargos de proceso de almacenamiento virtual (en azul) proceden estrictamente de los cambios de datos que se leen de Snowflake y se reflejan en Fabric.

Captura de pantalla del gráfico de costos de Snowflake.

Para obtener más información sobre los costos específicos de las consultas en la nube de Snowflake, consulte la documentación de Snowflake: Descripción del costo general.

Paso siguiente