Compartir a través de


¿Qué es el almacenamiento de datos en Microsoft Fabric?

Se aplica a:✅ punto de conexión de análisis SQL y Almacenamiento de datos en Microsoft Fabric

Fabric Data Warehouse es un almacenamiento relacional de escala empresarial en una base de lago de datos.

  • Los casos de uso ideales para Fabric Data Warehouse son esquemas estrella o copo de nieve, data marts corporativos mantenidos, modelos semánticos regulados para inteligencia empresarial.
  • Los datos de Fabric Data Warehouse, como todos los datos de Fabric, se almacenan en tablas Delta, que son archivos de datos Parquet con un registro de transacciones basado en archivos. Basado en el formato de datos abierto Fabric, un almacenamiento permite compartir y colaborar entre ingenieros de datos y usuarios empresariales sin comprometer la seguridad ni la gobernanza.
  • Fabric Data Warehouse se desarrolla principalmente con T-SQL y comparte un área expuesta grande basada en el motor de base de datos SQL, con compatibilidad completa con transacciones ACID de varias tablas, vistas materializadas, funciones y procedimientos almacenados.
  • La carga masiva de Fabric Data Warehouse se puede realizar a través de conexiones T-SQL y TDS, o a través de Spark, con datos escritos de forma masiva directamente en las tablas Delta.
  • La experiencia de SaaS fácil de usar también está estrechamente integrada con Power BI para facilitar el análisis y los informes.

Los clientes del almacenamiento de datos se benefician de:

  • Las consultas entre bases de datos pueden usar varios orígenes de datos para obtener conclusiones rápidas con una duplicación de datos cero.
  • Ingiera, cargue y transforme datos a gran escala a través de canalizaciones, flujos de datos, consulta entre bases de datos o el comando COPY INTO.
  • La administración autónoma de la carga de trabajo con un motor de procesamiento de consultas distribuido líder en el sector significa que no hay que hacer ningún ajuste para conseguir el mejor rendimiento de su clase.
  • Escale casi de forma instantánea para satisfacer las demandas empresariales. El almacenamiento y el cómputo están separados.
  • Los datos se replican automáticamente en OneLake Files para el acceso externo.
  • Creado para cualquier nivel de aptitud, desde el desarrollador ciudadano hasta el ingeniero de datos o DBA.

Elementos de Almacenamiento de datos

Fabric Data Warehouse no es un almacenamiento de datos empresarial tradicional, es un almacenamiento de lago que admite dos elementos de almacenamiento distintos: el elemento de almacenamiento de Tejido y el elemento de punto de conexión de análisis de SQL. Ambos están diseñados específicamente para satisfacer las necesidades empresariales de los clientes, al tiempo que proporcionan el mejor rendimiento de su clase, minimizando los costos y reduciendo la sobrecarga administrativa.

Almacenamiento de datos de tejido

En un área de trabajo de Microsoft Fabric, un almacén de Fabric se etiqueta como Warehouse en la columna Tipo . Cuando necesite todas las funcionalidades de potencia y transaccionales (compatibilidad con consultas DDL y DML) de un almacenamiento de datos, esta es la solución más rápida y sencilla.

Captura de pantalla que muestra el tipo de almacenamiento en el área de trabajo.

El almacén puede rellenarse mediante cualquiera de los métodos de ingesta de datos admitidos, como COPY INTO, canalizaciones, flujos de datos, u opciones de ingesta de bases de datos cruzadas como CREATE TABLE AS SELECT (CTAS), INSERT..SELECT o SELECT INTO.

Para empezar a trabajar con el almacén, consulte:

Punto de conexión de análisis SQL del almacén de lago de datos

En un área de trabajo de Microsoft Fabric, cada Lakehouse tiene un "endpoint de análisis SQL" generado automáticamente que se puede usar para realizar la transición desde la vista "Lago" del Lakehouse (que admite la ingeniería de datos y Apache Spark) a la vista "SQL" del mismo Lakehouse para crear vistas, funciones, procedimientos almacenados y aplicar seguridad SQL.

Captura de pantalla que muestra el tipo de punto de conexión de SQL Analytics en el área de trabajo.

Mediante una tecnología similar, un almacén, una base de datos SQL y Fabric OneLake aprovisionan automáticamente un punto de conexión de análisis SQL cuando se crea.

Con el punto de conexión de SQL Analytics, los comandos de T-SQL pueden definir y consultar objetos de datos, pero no manipular ni modificar los datos. Puede realizar las siguientes acciones en el endpoint de análisis SQL:

  • Consulte las tablas que hacen referencia a datos en las carpetas de Delta Lake del lago.
  • Cree vistas, TVF insertadas y procedimientos para encapsular la semántica y la lógica de negocios en T-SQL.
  • Administre los permisos en los objetos. Para obtener más información sobre la seguridad en el punto de conexión analytics de SQL, consulte Seguridad de OneLake para puntos de conexión de análisis de SQL.

Para empezar a trabajar con el punto de conexión de análisis SQL, consulte:

Almacén o almacén de lago de datos

Al decidir si quiere usar un almacén o un almacén de lago, es importante tener en cuenta las necesidades y el contexto específicos de los requisitos de análisis y administración de datos.

  • Elija un almacenamiento de datos cuando necesite una solución de escala empresarial con formato estándar abierto, sin rendimiento de botones ni configuración mínima.  Además de ser adecuado para formatos de datos semiestructurados y estructurados, el almacenamiento de datos es adecuado para profesionales de datos principiantes y experimentados, ya que ofrece experiencias sencillas e intuitivas.

  • Elija una instancia de Lakehouse cuando necesite un repositorio grande de datos altamente no estructurados de orígenes heterogéneos y quiera usar Spark como herramienta de desarrollo principal. Actuar como un almacenamiento de datos "ligero", siempre tiene la opción de usar el punto de conexión de análisis de SQL y las herramientas de T-SQL para ofrecer escenarios de informes e inteligencia de datos en su instancia de LakeHouse.

Siempre tiene la oportunidad de agregar uno u otro en un momento posterior si cambian sus necesidades empresariales e, independientemente de por dónde empiece, tanto el almacén como el almacén de lago de datos utilizan el mismo potente motor SQL para todas las consultas T-SQL.

Para obtener instrucciones de decisión más detalladas, consulte Guía de decisión de Microsoft Fabric: Elegir entre Warehouse y Lakehouse.

Migration

Use Fabric Migration Assistant para Data Warehouse para migrar desde Azure Synapse Analytics, SQL Server y otras plataformas del motor de base de datos de SQL. Revise Planeamiento de la migración y Métodos de migración para grupos de SQL dedicados de Azure Synapse Analytics en Fabric Data Warehouse.

Para obtener instrucciones de migración en Microsoft Fabric, revise las herramientas y los vínculos de información general sobre la migración de Microsoft Fabric.