Tény- és dimenziótáblák
Az Azure Data Explorer-adatbázisok sémájának tervezésekor a táblákat úgy kell tekinteni, mint amely általában a két kategória egyikéhez tartozik.
Ténytáblák
A ténytáblák olyan táblák, amelyek rekordjai nem módosítható "tények", például szolgáltatásnaplók és mérési adatok. A rekordok fokozatosan, streamelési módon vagy nagy adattömbökben vannak hozzáfűzve a táblához. A rekordok mindaddig ott maradnak, amíg el nem távolítják őket a költségek vagy az értékük elvesztése miatt. A rekordok egyébként soha nem frissülnek.
Az entitásadatok néha ténytáblákban vannak tárolva, ahol az entitásadatok lassan változnak. Például bizonyos fizikai entitásokra, például egy irodai berendezésre vonatkozó adatok, amelyek ritkán változtatják meg a helyet. Mivel a Kusto adatai nem módosíthatók, az általános gyakorlat az, hogy minden tábla két oszlopot tartalmaz:
- Identitás (
string
) oszlop, amely azonosítja az entitást - Utolsó módosítású (
datetime
) időbélyegoszlop
Ezután csak az egyes entitásidentitások utolsó rekordját kéri le a rendszer.
Dimenziótáblák
Dimenziótáblák:
- Referenciaadatok, például keresési táblák megtartása egy entitásazonosítótól a tulajdonságaiig
- Pillanatkép-szerű adatok tartása olyan táblákban, amelyek teljes tartalma egyetlen tranzakcióban változik
A dimenziótáblák nem rendszeresen érkeznek új adatokkal. Ehelyett a rendszer egyszerre frissíti a teljes adattartalmat olyan műveletek használatával, mint a .set-or-replace, a .move extents vagy az .rename táblák.
Előfordulhat, hogy a dimenziótáblák ténytáblákból származnak. Ez a folyamat a ténytábla materializált nézetén keresztül végezhető el, a táblán egy lekérdezéssel, amely az egyes entitások utolsó rekordját veszi fel.
Tény- és dimenziótáblák megkülönböztetése
A Kustóban vannak olyan folyamatok, amelyek megkülönböztetik a ténytáblákat és a dimenziótáblákat. Ezek egyike a folyamatos exportálás.
Ezek a mechanizmusok garantálják, hogy az adatokat a ténytáblákban pontosan egyszer dolgozzák fel. Az adatbázis-kurzor mechanizmusára támaszkodnak.
Például egy folyamatos exportálási feladat minden végrehajtása exportálja az adatbázis-kurzor utolsó frissítése óta betöltött összes rekordot. A folyamatos exportálási feladatoknak különbséget kell tenniük a ténytáblák és a dimenziótáblák között. A ténytáblák csak az újonnan betöltött adatokat dolgozzák fel, és a dimenziótáblák keresésként használatosak. Ezért a teljes táblát figyelembe kell venni.
A táblát nem lehet "ténytáblaként" vagy "dimenziótáblaként" megjelölni. Az adatok táblázatba való betöltésének módja és a tábla használati módja határozza meg a típust.
Visszajelzés
https://aka.ms/ContentUserFeedback.
Hamarosan elérhető: 2024-ben fokozatosan kivezetjük a GitHub-problémákat a tartalom visszajelzési mechanizmusaként, és lecseréljük egy új visszajelzési rendszerre. További információ:Visszajelzés küldése és megtekintése a következőhöz: