Dela via


Fusklapp för dataförberedelse

Avancerade BI-prestanda beror på hur effektivt data förbereds och levereras från Lakehouse. Genom att använda arkitekturmönster, tillämpa en semantisk struktur och använda riktade optimeringar kan du minska frågekomplexiteten, förbättra instrumentpanelens svarstider och sänka beräkningskostnaderna.

I följande tabell sammanfattas rekommenderade metoder, deras förväntade effekt, relaterad dokumentation och tillhörande åtgärdsobjekt. Det här innehållet är avsett för datatekniker, BI-utvecklare och instrumentpanelsförfattare som utformar, optimerar och underhåller analysarbetsbelastningar i Lakehouse.

Dataförberedelser

Bästa metod Påverkan Docs Åtgärdsobjekt
Anta en medaljongarkitektur Snabbare att omvandla rådata till färdiga, tillförlitliga dataprodukter för enkel förbrukning. Granska och implementera medaljonglager
Använd flytande klustring Förbättrar frågeprestanda med fil- och datahopp. Tillämpa på stora tabeller med filtermönster
Använda hanterade tabeller Azure Databricks styr automatiskt och optimerar lagringslagret och frågeprestanda. Skapa hanterade tabeller för dina data
Använda förutsägelseoptimering eller optimera tabeller manuellt Ger bättre frågeprestanda genom att optimera filstorlekar och layout, ta bort gamla filer och uppdatera statistik. Aktivera för produktionstabeller eller schemalägga regelbunden optimering och analysera tabeller efter dataändringar
Modellera data i ett stjärnschemamönster Gör det enkelt att fråga och använda data. Designa fakta- och dimensionstabeller
Undvik breda datatyper och kolumner med hög kardinalitet Optimerar datamodellens storlek och minnesförbrukning och förbättrar frågeeffektiviteten. Granska datatyper och kardinalitet
Deklarera primära och externa nycklar (med RELY) Optimerar frågor genom att eliminera onödiga kopplingar och aggregeringar. Definiera nycklar för fakta- och dimensionstabeller
Använda automatiskt genererade kolumner Minskar behovet av att beräkna värden vid frågetillfället. Identifiera ofta beräknade fält
Använda materialiserade vyer och beständiga tabeller Förbättrar prestanda genom att föra samman data för de vanligaste och resursintensiva frågorna. Skapa aggregerade vyer för vanliga frågor