Tény- és dimenziótáblák

Az Azure Data Explorer-adatbázisok sémájának tervezésekor a táblákat úgy kell tekinteni, mint amely általában a két kategória egyikéhez tartozik.

Ténytáblák

A ténytáblák olyan táblák, amelyek rekordjai nem módosítható "tények", például szolgáltatásnaplók és mérési adatok. A rekordok fokozatosan, streamelési módon vagy nagy adattömbökben vannak hozzáfűzve a táblához. A rekordok mindaddig ott maradnak, amíg el nem távolítják őket a költségek vagy az értékük elvesztése miatt. A rekordok egyébként soha nem frissülnek.

Az entitásadatok néha ténytáblákban vannak tárolva, ahol az entitásadatok lassan változnak. Például bizonyos fizikai entitásokra, például egy irodai berendezésre vonatkozó adatok, amelyek ritkán változtatják meg a helyet. Mivel a Kusto adatai nem módosíthatók, az általános gyakorlat az, hogy minden tábla két oszlopot tartalmaz:

  • Identitás (string) oszlop, amely azonosítja az entitást
  • Utolsó módosítású (datetime) időbélyegoszlop

Ezután csak az egyes entitásidentitások utolsó rekordját kéri le a rendszer.

Dimenziótáblák

Dimenziótáblák:

  • Referenciaadatok, például keresési táblák megtartása egy entitásazonosítótól a tulajdonságaiig
  • Pillanatkép-szerű adatok tartása olyan táblákban, amelyek teljes tartalma egyetlen tranzakcióban változik

A dimenziótáblák nem rendszeresen érkeznek új adatokkal. Ehelyett a rendszer egyszerre frissíti a teljes adattartalmat olyan műveletek használatával, mint a .set-or-replace, a .move extents vagy az .rename táblák.

Előfordulhat, hogy a dimenziótáblák ténytáblákból származnak. Ez a folyamat a ténytábla materializált nézetén keresztül végezhető el, a táblán egy lekérdezéssel, amely az egyes entitások utolsó rekordját veszi fel.

Tény- és dimenziótáblák megkülönböztetése

A Kustóban vannak olyan folyamatok, amelyek megkülönböztetik a ténytáblákat és a dimenziótáblákat. Ezek egyike a folyamatos exportálás.

Ezek a mechanizmusok garantálják, hogy az adatokat a ténytáblákban pontosan egyszer dolgozzák fel. Az adatbázis-kurzor mechanizmusára támaszkodnak.

Például egy folyamatos exportálási feladat minden végrehajtása exportálja az adatbázis-kurzor utolsó frissítése óta betöltött összes rekordot. A folyamatos exportálási feladatoknak különbséget kell tenniük a ténytáblák és a dimenziótáblák között. A ténytáblák csak az újonnan betöltött adatokat dolgozzák fel, és a dimenziótáblák keresésként használatosak. Ezért a teljes táblát figyelembe kell venni.

A táblát nem lehet "ténytáblaként" vagy "dimenziótáblaként" megjelölni. Az adatok táblázatba való betöltésének módja és a tábla használati módja határozza meg a típust.