Dela via


Fråga kalla data med frekventa fönster

Med frekventa fönster kan du effektivt köra frågor mot kalla data utan att behöva exportera data eller använda andra verktyg. Använd frekventa fönster när den kalla datastorleken är stor och relevanta data kommer från ett tidigare tillfälle. Frekventa fönster definieras i cacheprincipen.

Azure Data Explorer lagrar sina data i tillförlitlig långsiktig lagring och cachelagrar en del av dessa data på klusternoderna. Cacheprincipen styr vilka data som cachelagras. Cachelagrade data anses vara frekventa, medan resten av data anses vara kalla.

För att köra frågor mot kalla data bearbetar Azure Data Explorer ett inläsningssteg som kräver åtkomst till en lagringsnivå med mycket högre svarstid än den lokala disken. När frågan är begränsad till ett litet tidsfönster, som ofta kallas "punkt-i-tid"-frågor, är mängden data som ska hämtas vanligtvis liten och frågan slutförs snabbt. Till exempel faller kriminaltekniska analyser som frågar telemetri en viss dag i den här kategorin. Effekten på frågevaraktigheten beror på storleken på data som hämtas från lagringen och kan vara betydande. Om du skannar en stor mängd kalla data kan frågeprestanda dra nytta av att använda frekventa fönster.

Det här dokumentet visar hur du använder heta fönster för att fråga kalla data.

Förutsättningar

Konfigurera autoskalning i kluster

När du har ändrat cacheprincipen cachelagrar klustret automatiskt relevanta data på diskarna. Du måste skala klustret för att hantera den extra disk som behövs för den nya cachedefinitionen. Vi rekommenderar att du konfigurerar klustret för att använda inställningarna för optimering av autoskalning .

  1. I Azure Portal går du till din Azure Data Explorer-klusterresurs. Under Inställningar väljer du Skala ut.

  2. I fönstret Skala ut väljer du Optimerad autoskalning.

  3. Välj ett minsta antal instanser och ett maximalt antal instanser. Klustrets autoskalning varierar mellan dessa två tal, baserat på belastning.

  4. Välj Spara.

    Optimerad autoskalningsmetod.

Nu kan du förvänta dig optimala prestanda vid användning av heta fönster.

Ange frekventa fönster

Frekventa fönster är en del av syntaxen för cacheprincipkommandon och anges med .alter policy caching kommandot .

Anteckning

Det kan ta upp till en timme att helt uppdatera klusterdiskcachen baserat på den uppdaterade definitionen för cacheprincip.

  1. Anteckna den första cachelagringsprincipen med hjälp .show policy caching av kommandot .

    .show table MyDatabase.MyTable policy caching 
    
  2. Ändra cacheprincipen med hjälp av följande syntax. Flera frekventa fönster kan definieras för en enskild databas eller tabell.

    .alter <entity_type> <database_or_table_or_materialized-view_name> policy caching 
          hot = <timespan> 
          [, hot_window = datetime(*from*) .. datetime(*to*)] 
          [, hot_window = datetime(*from*) .. datetime(*to*)] 
          ...
    

    Plats:

    • from: Starttid för det frekventa fönstret (datetime)
    • to: Sluttid för det frekventa fönstret (datetime)

    Frågor som körs under följande inställningar undersöker till exempel de senaste 14 dagarnas data, på data som sparas i tre år.

    .alter table MyTable policy caching 
            hot = 14d,
            hot_window = datetime(2021-01-01) .. datetime(2021-02-01),
            hot_window = datetime(2021-04-01) .. datetime(2021-05-01)
    

Kör frågan

Kör den fråga eller de frågor som du vill ha under den tidsperiod som anges i de heta fönstren.

Återställ inställningar

  1. Använd de ursprungliga cacheinställningarna som hämtats ovan i Ange frekventa fönster.
  2. Återställ cacheprincipen till de ursprungliga inställningarna med .alter policy caching kommandot .

Eftersom du har konfigurerat optimerad autoskalning för klustret krymper klustret till sin ursprungliga storlek.