Directiva de combinación

La directiva de combinación define si y cómo se deben combinar extensiones (particiones de datos) en el clúster de Kusto.

Hay dos tipos de operaciones de combinación: Merge, que vuelve a generar índices y Rebuild, que vuelven a analizar completamente los datos.

Ambos tipos de operación dan como resultado una sola extensión que reemplaza las extensiones de origen.

De forma predeterminada, se prefieren las operaciones de recompilación. Si hay extensiones que no se ajustan a los criterios para volver a generarse, se intentará combinarlos.

Nota

  • El etiquetado de extensiones que usan etiquetas diferentesdrop-by hará que no se combinen dichas extensiones, incluso si se ha establecido una directiva de combinación. Para obtener más información, vea Etiquetado de extensiones.
  • Las extensiones cuya unión de etiquetas supere la longitud de 1M caracteres no se combinarán.
  • La directiva de particionamiento de la base de datos o la tabla también tiene algún efecto sobre cómo se combinan las extensiones.

Propiedades de directiva de combinación

La directiva de combinación contiene las siguientes propiedades:

  • RowCountUpperBoundForMerge:
    • El valor predeterminado es 16 000 000.
    • Número máximo permitido de filas de la extensión combinada.
    • Se aplica a las operaciones de combinación, no a recompilar.
  • OriginalSizeMBUpperBoundForMerge:
    • El valor predeterminado es 30 000.
    • Tamaño original máximo permitido (en MB) de la extensión combinada.
    • Se aplica a las operaciones de combinación, no a recompilar.
  • MaxExtentsToMerge:
    • El valor predeterminado es 100.
    • Número máximo permitido de extensiones que se combinarán en una sola operación.
    • Se aplica a las operaciones de combinación.
    • Este valor no se debe cambiar.
  • LoopPeriod:
    • El valor predeterminado es 01:00:00 (1 hora).
    • Tiempo máximo de espera entre iniciar dos iteraciones consecutivas de operaciones de combinación o recompilación por parte del servicio Administración de datos.
    • Se aplica a las operaciones Merge y Rebuild.
    • Este valor no se debe cambiar.
  • AllowRebuild:
    • El valor predeterminado es "true".
    • Define si Rebuild las operaciones están habilitadas (en cuyo caso se prefieren sobre Merge las operaciones).
  • AllowMerge:
    • El valor predeterminado es "true".
    • Define si Merge las operaciones están habilitadas, en cuyo caso, son menos preferidas que Rebuild las operaciones.
  • MaxRangeInHours:
    • El valor predeterminado es 24.
    • Diferencia máxima permitida, en horas, entre los dos tiempos de creación de extensiones diferentes, para que se puedan combinar.
    • Las marcas de tiempo son de creación de extensiones y no se relacionan con los datos reales contenidos en las extensiones.
    • Se aplica a las operaciones Merge y Rebuild.
    • En vistas materializadas: el valor predeterminado es 336 (14 días), a menos que la capacidad de recuperación esté deshabilitada en la directiva de retención efectiva de la vista materializada.
    • Este valor debe establecerse según la directiva de retención efectiva SoftDeletePeriod o los valores de DataHotSpan de la directiva de caché. Tome el valor inferior de SoftDeletePeriod y DataHotSpan. Establezca el valor MaxRangeInHours en entre el 2 y el 3 % de él. Vea los ejemplos .
  • Lookback:
    • Define el intervalo de tiempo durante el cual se consideran extensiones para la recompilación o combinación.
    • Valores admitidos:
      • Default - Valor predeterminado administrado por el sistema. Este es el valor predeterminado y recomendado, cuyo período está establecido actualmente en 14 días.
      • All - Se incluyen todas las extensiones, calientes y frías.
      • HotCache - Solo se incluyen extensiones activas.
      • Custom - Solo se incluyen las extensiones cuya antigüedad esté por debajo del proporcionado CustomPeriod . CustomPeriod es un valor de intervalo de tiempo.

Ejemplo de directiva predeterminada

En el ejemplo siguiente se muestra la directiva predeterminada:

{
  "RowCountUpperBoundForMerge": 16000000,
  "OriginalSizeMBUpperBoundForMerge": 30000,
  "MaxExtentsToMerge": 100,
  "LoopPeriod": "01:00:00",
  "MaxRangeInHours": 8,
  "AllowRebuild": true,
  "AllowMerge": true,
  "Lookback": {
    "Kind": "Default",
    "CustomPeriod": null
  }
}

Ejemplos de MaxRangeInHours

min(SoftDeletePeriod (directiva de retención), DataHotSpan (directiva de caché)) Intervalo máximo en horas (directiva de combinación)
7 días (168 horas) 4
14 días (336 horas) 8
30 días (720 horas) 18
60 días (1440 horas) 36
90 días (2160 horas) 60
180 días (4.320 horas) 120
365 días (8.760 horas) 250

Advertencia

Consulte con el equipo de Azure Data Explorer antes de modificar una directiva de combinación de extensiones.

Cuando se crea una base de datos, se establece con los valores de directiva de combinación predeterminados mencionados anteriormente. La directiva se hereda de forma predeterminada por todas las tablas creadas en la base de datos, a menos que sus directivas se invaliden explícitamente en el nivel de tabla.

Para obtener más información, consulte comandos de control que permiten administrar directivas de combinación para bases de datos o tablas.