sys.pdw_nodes_column_store_row_groups (Transact-SQL)

Article
07/05/2024

Se aplica a: Sistema de plataforma de Análisis de Azure Synapse Analytics (PDW)

Proporciona información de índice de almacén de columnas agrupada por segmento para ayudar al administrador a tomar decisiones de administración del sistema en Azure Synapse Analytics. sys.pdw_nodes_column_store_row_groups tiene una columna para el número total de filas almacenadas físicamente (incluidas las marcadas como eliminadas) y una columna para el número de filas marcadas como eliminadas. Use sys.pdw_nodes_column_store_row_groups para determinar qué grupos de filas tienen un alto porcentaje de filas eliminadas y se deben volver a generar.

Nombre de la columna	Tipo de datos	Descripción
object_id	int	Identificador de la tabla subyacente. Esta es la tabla física del nodo Proceso, no la object_id de la tabla lógica en el nodo Control. Por ejemplo, object_id no coincide con el object_id en sys.tables. Para combinar con sys.tables, use sys.pdw_index_mappings.
id_de_índice	int	Identificador del índice de almacén de columnas agrupado en object_id tabla.
partition_number	int	Identificador de la partición de tabla que contiene el grupo de filas row_group_id. Puede usar partition_number para unir esta DMV a sys.partitions.
row_group_id	int	Identificador de este grupo de filas. Es único en la partición.
dellta_store_hobt_id	bigint	El hobt_id para los grupos de filas delta, o NULL si el tipo del grupo de filas no es delta. Un grupo de filas delta es un grupo de filas de lectura/escritura que acepta nuevos registros. Un grupo de filas delta tiene el estado OPEN . Un grupo de filas delta está todavía en formato de almacén de filas y no se ha comprimido al formato de almacén de columnas.
state	tinyint	Número de identificación asociado con el state_description. 1 = OPEN 2 = CLOSED 3 = COMPRESSED
state_desccription	nvarchar(60)	Descripción del estado persistente del grupo de filas: OPEN: un grupo de filas de lectura y escritura que acepta nuevos registros. Un grupo de filas abierto está todavía en formato de almacén de filas y no se ha comprimido al formato de almacén de columnas. CLOSED: un grupo de filas que se ha rellenado, pero aún no comprimido por el proceso de mover de tupla. COMPRESSED: un grupo de filas que se ha rellenado y comprimido.
total_rows	bigint	Total de filas almacenadas físicamente en el grupo de filas. Es posible que se hayan eliminado algunas, pero estas se siguen almacenando. El número máximo de filas en un grupo de filas es 1.048.576 (hexadecimal FFFFF).
deleted_rows	bigint	Número de filas almacenadas físicamente en el grupo de filas marcados para su eliminación. Siempre 0 para grupos de filas DELTA.
size_in_bytes	int	Tamaño combinado, en bytes, de todas las páginas de este grupo de filas. Este tamaño no incluye el tamaño necesario para almacenar metadatos o diccionarios compartidos.
pdw_node_id	int	Identificador único de un nodo de Azure Synapse Analytics.
distribution_id	int	Identificador único de la distribución.

Comentarios

Devuelve una fila para cada grupo de filas del almacén de columnas de cada tabla que tenga un índice clúster o no clúster de almacén de columnas.

Use sys.pdw_nodes_column_store_row_groups para determinar el número de filas incluidas en el grupo de filas y el tamaño del grupo de filas.

Cuando el número de filas eliminadas de un grupo de filas alcanza un alto porcentaje de las filas totales, la tabla pierde eficiencia. Vuelva a generar el índice de almacén de columnas para reducir el tamaño de la tabla, reduciendo así la E/S de disco necesaria para leer la tabla. Para volver a generar el índice de almacén de columnas, use la opción REBUILD de la instrucción ALTER INDEX .

El almacén de columnas actualizable inserta primero nuevos datos en un grupo de filas OPEN , que se encuentra en formato de almacén de filas y, a veces, también se conoce como una tabla delta. Una vez que un grupo de filas abierto está lleno, su estado cambia a CLOSED. Un grupo de filas cerrado se comprime en formato de almacén de columnas mediante el mover de tupla y el estado cambia a COMPRESSED. La tupla motriz es un proceso en segundo plano que de forma periódica se despierta y comprueba si hay grupos de filas cerrados listos para comprimirse en un grupo de filas de almacén de columnas. La tupla motriz también cancela la asignación de los grupos de filas en los que se han borrado todas las filas. Los grupos de filas desasignados se marcan como RETIRADOS. Para ejecutar el mover de tupla inmediatamente, use la opción REORGANIZE de la instrucción ALTER INDEX .

Cuando se ha rellenado un grupo de filas de almacén de columnas, se comprime y ya no se aceptan filas nuevas. Cuando se eliminan filas de un grupo comprimido, siguen estando allí pero están marcadas como eliminadas. Las actualizaciones de un grupo comprimido se implementan como una eliminación del grupo comprimido, y como una inserción en un grupo abierto.

Permisos

Requiere el permiso VIEW SERVER STATE.

Ejemplos: Azure Synapse Analytics y Sistema de la plataforma de análisis (PDW)

En el ejemplo siguiente se combina la tabla sys.pdw_nodes_column_store_row_groups a otras tablas del sistema para devolver información sobre tablas específicas. La columna PercentFull calculada es una estimación de la eficacia del grupo de filas. Para buscar información sobre una sola tabla, quite los guiones de comentario delante de la cláusula WHERE y proporcione un nombre de tabla.

SELECT IndexMap.object_id,   
  object_name(IndexMap.object_id) AS LogicalTableName,   
  i.name AS LogicalIndexName, IndexMap.index_id, NI.type_desc,   
  IndexMap.physical_name AS PhyIndexNameFromIMap,   
  CSRowGroups.*,  
  100*(ISNULL(deleted_rows,0))/total_rows AS PercentDeletedRows   
FROM sys.tables AS t  
JOIN sys.indexes AS i  
    ON t.object_id = i.object_id  
JOIN sys.pdw_index_mappings AS IndexMap  
    ON i.object_id = IndexMap.object_id  
    AND i.index_id = IndexMap.index_id  
JOIN sys.pdw_nodes_indexes AS NI  
    ON IndexMap.physical_name = NI.name  
    AND IndexMap.index_id = NI.index_id  
JOIN sys.pdw_nodes_column_store_row_groups AS CSRowGroups  
    ON CSRowGroups.object_id = NI.object_id   
    AND CSRowGroups.pdw_node_id = NI.pdw_node_id  
    AND CSRowGroups.distribution_id = NI.distribution_id
    AND CSRowGroups.index_id = NI.index_id      
WHERE total_rows > 0
--WHERE t.name = '<table_name>'   
ORDER BY object_name(i.object_id), i.name, IndexMap.physical_name, pdw_node_id;

En el siguiente ejemplo de Azure Synapse Analytics se cuentan las filas por partición para los almacenes de columnas agrupadas, así como cuántas filas están en grupos de filas abiertas, cerradas o comprimidas:

SELECT
    s.name AS [Schema Name]
    ,t.name AS [Table Name]
    ,rg.partition_number AS [Partition Number]
    ,SUM(rg.total_rows) AS [Total Rows]
    ,SUM(CASE WHEN rg.State = 1 THEN rg.Total_rows Else 0 END) AS [Rows in OPEN Row Groups]
    ,SUM(CASE WHEN rg.State = 2 THEN rg.Total_Rows ELSE 0 END) AS [Rows in Closed Row Groups]
    ,SUM(CASE WHEN rg.State = 3 THEN rg.Total_Rows ELSE 0 END) AS [Rows in COMPRESSED Row Groups]
FROM sys.pdw_nodes_column_store_row_groups rg
  JOIN sys.pdw_nodes_tables pt
    ON rg.object_id = pt.object_id
    AND rg.pdw_node_id = pt.pdw_node_id
    AND pt.distribution_id = rg.distribution_id
  JOIN sys.pdw_table_mappings tm
    ON pt.name = tm.physical_name
  INNER JOIN sys.tables t
    ON tm.object_id = t.object_id
  INNER JOIN sys.schemas s
    ON t.schema_id = s.schema_id
GROUP BY s.name, t.name, rg.partition_number
ORDER BY 1, 2

Consulte también

Vistas de catálogo de Azure Synapse Analytics y Almacenamiento de datos paralelos
CREATE COLUMNSTORE INDEX (Transact-SQL)
sys.pdw_nodes_column_store_segments (Transact-SQL)
sys.pdw_nodes_column_store_dictionaries (Transact-SQL)

Comparteix a través de

sys.pdw_nodes_column_store_row_groups (Transact-SQL)

Comentarios

Permisos

Ejemplos: Azure Synapse Analytics y Sistema de la plataforma de análisis (PDW)

Consulte también

Comentaris

Recursos addicionals