Compartir a través de


Tablas de almacenamiento de datos en Microsoft Fabric

Se aplica a: Almacén en Microsoft Fabric

En este artículo se detallan los conceptos clave para diseñar tablas en Microsoft Fabric.

En las tablas, los datos se organizan con arreglo a un formato de filas y columnas. Cada fila representa un registro único y cada columna un campo dentro del registro.

  • En Warehouse, las tablas son objetos de base de datos que contienen todos los datos transaccionales.

Determinación de la categoría de tabla

Un esquema de estrella organiza los datos en tablas de hechos y tablas de dimensiones. Algunas tablas se utilizan para datos de integración o de almacenamiento provisional antes de moverlos a una tabla de hechos o dimensiones. Al diseñar una tabla, decidirá si los datos de la misma pertenecen a una tabla de hechos, dimensiones o integración. Esta decisión informa de la estructura de tabla adecuada.

  • Las tablas de hechos contienen datos cuantitativos que se suelen generar en un sistema transaccional y, después, se cargan en el almacenamiento de datos. Por ejemplo, una empresa minorista genera transacciones de ventas todos los días y, después, carga los datos en una tabla de hechos en el almacenamiento de datos para su análisis.

  • Las tablas de dimensiones contienen datos de atributos que pueden cambiar, pero normalmente no cambian con frecuencia. Por ejemplo, el nombre y la dirección de un cliente se almacenan en una tabla de dimensiones y solo se actualizan cuando el perfil del cliente cambia. Para minimizar el tamaño de una tabla de hechos de gran tamaño, el nombre y la dirección del cliente no necesitan estar en todas las filas de una tabla de hechos. En su lugar, la tabla de hechos y la tabla de dimensiones pueden compartir un identificador de cliente. Una consulta puede combinar las dos tablas para asociar el perfil y las transacciones de un cliente.

  • Las tablas de integración proporcionan un lugar para integración o almacenamiento provisional de datos. Por ejemplo, puede cargar datos a una tabla de almacenamiento provisional, realizar transformaciones en los datos en el almacenamiento provisional y luego insertar dichos datos en una tabla de producción.

Una tabla almacena datos en OneLake como parte del Warehouse. La tabla y los datos persisten, independientemente de si hay una sesión abierta o no.

Tablas en el Warehouse

Para mostrar la organización de las tablas, podría usar fact, dim o int como prefijos de los nombres de las tablas. La siguiente tabla muestra algunos de los nombres de esquemas y tablas del almacenamiento de datos de ejemplo WideWorldImportersDW.

Nombre de la tabla de origen WideWorldImportersDW Tipo de tabla Nombre de la tabla de Data Warehouse
City Dimensión wwi.DimCity
Orden Fact wwi.FactOrder
  • Los nombres de tabla distinguen mayúsculas de minúsculas.
  • Los nombres de tabla no pueden contener / o \ ni terminar con un ..

Creación de una tabla

Para Warehouse, puede crear una tabla como una nueva tabla vacía. También puede crear y rellenar una tabla con los resultados de una instrucción SELECT. A continuación se muestran los comandos de T-SQL para crear una tabla.

Instrucción T-SQL Descripción
CREATE TABLE Crea una tabla vacía mediante la definición de todas las opciones y columnas de la tabla.
CREATE TABLE AS SELECT Rellena una nueva tabla con los resultados de una instrucción SELECT. Las columnas de tabla y los tipos de datos se basan en los resultados de la instrucción SELECT. Para importar datos, puede seleccionar esta instrucción en una tabla externa.

En este ejemplo se crea una tabla con dos columnas:

CREATE TABLE MyTable (col1 int, col2 int );  

Nombres de esquema

Warehouse admite la creación de esquemas personalizados. Al igual que en SQL Server, los esquemas son una buena forma de agrupar objetos que se usan de forma similar. El siguiente código crea un esquema definido por el usuario denominado wwi.

  • Los nombres de esquema distinguen mayúsculas de minúsculas.
  • Los nombres de esquema no pueden contener / o \ ni terminar con un ..
CREATE SCHEMA wwi;

Tipos de datos

Microsoft Fabric es compatible con los tipos de datos T-SQL más utilizados.

Intercalación

Actualmente, Latin1_General_100_BIN2_UTF8 es el valor predeterminado y solo se admite la intercalación para tablas y metadatos.

Estadísticas

El optimizador de consultas utiliza estadísticas de columna cuando crea el plan de ejecución de una consulta. Para mejorar el rendimiento de las consultas, es importante crear estadísticas en columnas individuales, especialmente en las columnas que se usan en combinaciones de consultas. Warehouse admite la creación automática de estadísticas.

La actualización estadística no se realiza automáticamente. Actualice las estadísticas cuando se agregue o cambie un número significativo de filas. Por ejemplo, actualice las estadísticas después de una carga. Obtenga más información en Estadísticas.

Clave principal, clave externa y clave única

En el caso de Warehouse, la restricción PRIMARY KEY y UNIQUE solo se admiten cuando se usan tanto NONCLUSTERED como NOT ENFORCED.

FOREIGN KEY solo se admite cuando se usa NOT ENFORCED.

Alineación de los datos de origen con el almacenamiento de datos

Las tablas de Warehouse se rellenan cargando datos desde otro origen de datos. Para lograr una carga correcta, el número y los tipos de datos de las columnas de los datos de origen se deben alinear con la definición de tabla en el almacenamiento de datos.

Si los datos proceden de varios almacenamientos de datos, puede portar dichos datos en el almacenamiento de datos y almacenarlos en una tabla de integración. Una vez que los datos están en la tabla de integración, puede usar la potencia del almacenamiento de datos para implementar operaciones de transformación. Una vez que los datos están preparados, puede insertarlos en tablas de producción.

Limitaciones

Warehouse admite muchas, pero no todas, de las características de tabla que ofrecen otras bases de datos.

La siguiente lista muestra algunas de las características de tabla que no son compatibles en la actualidad.

  • Máximo de 1024 columnas por tabla
  • Columnas calculadas
  • Vistas indizadas
  • Tablas con particiones
  • Secuencia
  • Columnas dispersas
  • Claves suplentes en secuencias de números con columnas de identidad
  • Sinónimos
  • Tablas temporales
  • Desencadenadores
  • Índices únicos
  • Tipos definidos por el usuario