Partager via


Stratégie de fusion

S’applique à : ✅Microsoft Fabric✅Azure Data Explorer

La stratégie de fusion définit si et comment les étendues (partitions de données) doivent être fusionnées.

Il existe deux types d’opérations de fusion : Merge, qui reconstruit les index et Rebuild, qui ressère complètement les données.

Les deux types d’opérations entraînent une seule extension qui remplace les étendues sources.

Par défaut, Rebuild les opérations sont préférées. S’il existe des étendues qui ne correspondent pas aux critères de reconstruction, une tentative sera effectuée pour les fusionner.

Remarque

  • Les étendues de balisage utilisant différentes drop-by balises entraînent la fusion de ces étendues, même si une stratégie de fusion a été définie. Pour plus d’informations, consultez Balises d’étendue.
  • Les étendues dont l’union de balises dépasse la longueur de 1M caractères ne seront pas fusionnées.
  • La stratégie de partitionnement de la base de données ou de la table a également un certain effet sur la façon dont les étendues sont fusionnées.

Propriétés de stratégie de fusion

La stratégie de fusion contient les propriétés suivantes :

  • RowCountUpperBoundForMerge :
    • La valeur par défaut est 16 000 000.
    • Nombre maximal de lignes autorisés de l’étendue fusionnée.
    • S’applique aux opérations de fusion, et non à reconstruire.
  • OriginalSizeMBUpperBoundForMerge :
    • La valeur par défaut est 30 000.
    • Taille d’origine maximale autorisée (en Mo) de l’étendue fusionnée.
    • S’applique aux opérations de fusion, et non à reconstruire.
  • MaxExtentsToMerge :
    • La valeur par défaut est 100.
    • Nombre maximal autorisé d’étendues à fusionner dans une seule opération.
    • S’applique aux opérations de fusion.
    • Cette valeur ne doit pas être modifiée.
  • AllowRebuild :
    • La valeur par défaut est « true ».
    • Définit si Rebuild les opérations sont activées (dans ce cas, elles sont préférées aux Merge opérations).
  • AllowMerge :
    • La valeur par défaut est « true ».
    • Définit si Merge les opérations sont activées, auquel cas elles sont moins préférées que Rebuild les opérations.
  • MaxRangeInHours :
    • La valeur par défaut est 24.
    • Différence maximale autorisée, en heures, entre les deux durées de création des étendues différentes, afin qu’elles puissent toujours être fusionnées.
    • Les horodatages sont de création d’étendues et ne sont pas liés aux données réelles contenues dans les étendues.
    • S’applique aux opérations de fusion et de reconstruction.
    • Dans les vues matérialisées : la valeur par défaut est 336 (14 jours), sauf si la récupération est désactivée dans la stratégie de rétention effective de la vue matérialisée.
    • Cette valeur doit être définie en fonction de la stratégie de rétention effective SoftDeletePeriod ou des valeurs DataHotSpan de stratégie de cache. Prenez la valeur inférieure de SoftDeletePeriod et DataHotSpan. Définissez la valeur MaxRangeInHours sur entre 2 et 3 %. Consultez les exemples .
  • Lookback :
    • Définit l’intervalle de temps pendant lequel les étendues sont prises en compte pour la reconstruction/fusion.
    • Valeurs prises en charge :
      • Default - Valeur par défaut gérée par le système. Il s’agit de la valeur recommandée et par défaut, dont la période est actuellement définie sur 14 jours.
      • All - Toutes les étendues, chaudes et froides, sont incluses.
      • HotCache - Seules les étendues chaudes sont incluses.
      • Custom - Seules les étendues dont l’âge est inférieur à celui fourni CustomPeriod sont inclus. CustomPeriod est une valeur d’intervalle de temps au format dd.hh:mm.

Exemple de stratégie par défaut

L’exemple suivant montre la stratégie par défaut :

{
  "RowCountUpperBoundForMerge": 16000000,
  "OriginalSizeMBUpperBoundForMerge": 30000,
  "MaxExtentsToMerge": 100,,
  "MaxRangeInHours": 24,
  "AllowRebuild": true,
  "AllowMerge": true,
  "Lookback": {
    "Kind": "Default",
    "CustomPeriod": null
  }
}

Exemples MaxRangeInHours

min(SoftDeletePeriod (stratégie de rétention), DataHotSpan (stratégie de cache)) Plage maximale en heures (stratégie de fusion)
7 jours (168 heures) 4
14 jours (336 heures) 8
30 jours (720 heures) 18
60 jours (1 440 heures) 36
90 jours (2 160 heures) 60
180 jours (4 320 heures) 120
365 jours (8 760 heures) 250

Avertissement

Consultez l’équipe de support technique avant de modifier une stratégie de fusion d’étendues.

Lorsqu’une base de données est créée, elle est définie avec les valeurs de stratégie de fusion par défaut mentionnées ci-dessus. Par défaut, la stratégie est héritée par toutes les tables créées dans la base de données, sauf si leurs stratégies sont explicitement substituées au niveau de la table.

Pour plus d’informations, consultez les commandes de gestion qui vous permettent de gérer les stratégies de fusion pour les bases de données ou les tables.