¿Qué es el almacenamiento de datos en Microsoft Fabric?
Se aplica a:✅ punto de conexión de análisis SQL y Warehouse en Microsoft Fabric
Microsoft Fabric es una solución de almacenamiento de datos de última generación en Microsoft Fabric.
El almacenamiento de datos centrado en lago se basa en un motor de procesamiento distribuido de nivel empresarial que permite obtener un rendimiento líder del sector a gran escala, al tiempo que elimina la necesidad de configuración y administración. El almacén de datos de Fabric, que se encuentra en el lago de datos y está diseñado para admitir de forma nativa formatos de datos abiertos, permite una colaboración fluida entre ingenieros de datos y usuarios empresariales sin comprometer la seguridad ni la gobernanza.
La experiencia SaaS fácil de usar también está estrechamente integrada con Power BI, para facilitar el análisis y la creación de informes, lo que hace converger el mundo de los lagos de datos y los almacenes y simplifica enormemente la inversión de una organización en su patrimonio de análisis.
Los clientes del almacenamiento de datos se benefician de:
- Los datos almacenados en formato Delta-Parquet permiten realizar transacciones ACID y la interoperabilidad con otras cargas de trabajo de Fabric, lo que significa que no necesita varias copias de datos.
- La consulta entre bases de datos permite a los clientes usar varios orígenes de datos para obtener conclusiones rápidas y con cero duplicaciones de datos.
- Ingiera, cargue y transforme datos a gran escala a través de canalizaciones, flujos de datos, consultas entre bases de datos o el comando COPY INTO.
- La administración autónoma de cargas de trabajo con el motor de procesamiento de consultas distribuidas líder en el sector significa que no hay obstáculos para lograr el mejor rendimiento en su clase.
- Escale casi de forma instantánea para satisfacer las demandas de su empresa. Compute y Storage se ofrecen por separado.
- Se ha reducido el tiempo de información con un modelo semántico fácil de consumir y siempre conectado, que se integra con Power BI en el modo Direct Lake. Los informes siempre tienen los datos más recientes para el análisis y la creación de informes.
- Compilado para cualquier nivel de aptitud, desde el desarrollador civil hasta el ingeniero de datos o DBA.
Elementos de Almacenamiento de datos
Fabric Warehouse no es un almacenamiento de datos empresarial tradicional, es un almacén de lago que admite dos elementos de almacenamiento distintos: el almacenamiento de datos de Fabric y el punto de conexión de análisis SQL. Ambos están diseñados específicamente para satisfacer las necesidades empresariales de los clientes, al tiempo que proporcionan el mejor rendimiento de su clase, minimizando los costos y reduciendo la sobrecarga administrativa.
Synapse: almacenamiento de datos
En un área de trabajo de Microsoft Fabric, una instancia de Synapse Data Warehouse o Warehouse se etiqueta como "Almacén" en la columna Tipo. Cuando necesite todas las funcionalidades de potencia y transaccionales (compatibilidad con consultas DDL y DML) de un almacenamiento de datos, esta es la solución más rápida y sencilla.
Un almacén se llena mediante uno de los métodos de ingesta de datos admitidos, como COPY INTO, Canalizaciones, Flujos de datos u opciones de ingesta entre bases de datos, como CREATE TABLE AS SELECT (CTAS), INSERT..SELECT o SELECT INTO.
Para empezar a trabajar con el almacén, consulte:
Punto de conexión de análisis SQL del almacén de lago
En un área de trabajo de Microsoft Fabric, cada almacén de lago tiene un "punto de conexión de análisis SQL" generado automáticamente que se puede usar para realizar la transición desde la vista "Lago" del almacén de lago (que admite la ingeniería de datos y Apache Spark) a la vista "SQL" de la misma instancia de Lakehouse para crear vistas, funciones, procedimientos almacenados y aplicar la seguridad de SQL.
Con el punto de conexión de análisis SQL del almacén de lago, los comandos de T-SQL pueden definir y consultar objetos de datos, pero no manipular o modificar los datos. Puede realizar las siguientes acciones en el punto de conexión de análisis SQL:
- Consulte las tablas que hacen referencia a datos en las carpetas de Delta Lake del lago.
- Cree vistas, TVF insertadas y procedimientos para encapsular la semántica y la lógica de negocios en T-SQL.
- Administre los permisos en los objetos.
Para ver una introducción a los puntos de conexión de análisis SQL, consulte:
- Juntos es mejor: el almacén de lago y el almacenamiento en Microsoft Fabric
- Consideraciones sobre el rendimiento del punto de conexión de SQL Analytics
- Consultar el punto de conexión de análisis SQL o Warehouse en Microsoft Fabric
Almacén o almacén de lago
Al decidir si quiere usar un almacén o un almacén de lago, es importante tener en cuenta las necesidades y el contexto específicos de los requisitos de análisis y administración de datos. Asimismo, recuerde que esto no es una decisión unidireccional.
Siempre tiene la oportunidad de agregar uno u otro más adelante si sus necesidades empresariales cambian e, independientemente de dónde comience su camino, tanto el almacén como el almacén de lago usan el mismo y eficaz motor SQL en todas las consultas de T-SQL.
A continuación se mencionan algunas directrices generales que le ayudarán a tomar una decisión:
Elija un almacenamiento de datos cuando necesite una solución de escala empresarial con formato estándar abierto, sin rendimiento de botones ni configuración mínima. Además de ser adecuado para formatos de datos semiestructurados y estructurados, el almacenamiento de datos es adecuado para profesionales de datos principiantes y experimentados, ya que ofrece experiencias sencillas e intuitivas.
Elija un almacén de lago cuando necesite un repositorio grande de datos que prácticamente no estén estructurados y sean de orígenes heterogéneos, aprovechando a su vez el almacenamiento de objetos de bajo costo y si desea usar SPARK como herramienta de desarrollo principal. Al actuar como almacenamiento de datos "ligero", siempre tiene la opción de usar el punto de conexión de SQL y las herramientas de T-SQL para ofrecer escenarios de informes e inteligencia de datos en su almacén de lago.
Para obtener una guía más detallada que le ayude a tomar una decisión, consulte Guía de decisión de Microsoft Fabric: elegir entre Almacén y Almacén de lago.
Contenido relacionado
- Mejor juntos: el almacén de lago y el almacenamiento
- Crear un almacén en Microsoft Fabric
- Crear un almacén de lago en Microsoft Fabric
- Introducción a los datamart de Power BI
- Crear informes sobre el almacenamiento de datos en Microsoft Fabric
- Control de código fuente del almacén (versión preliminar)