Synapse Data Warehouse a Microsoft Fabric teljesítményére vonatkozó irányelvekben

Cikk
10/25/2024

A következőre vonatkozik:✅ Warehouse a Microsoft Fabricben

Ezek az irányelvek segítenek megérteni a Microsoft Fabric raktárának teljesítményét. Ebben a cikkben útmutatást és fontos cikkeket talál, amelyekre összpontosíthat. A Microsoft Fabric warehouse egy SaaS-platform, ahol az olyan tevékenységeket, mint a számítási feladatok kezelése, az egyidejűség és a tárolókezelés, a platform belsőleg kezeli. A belső teljesítménykezelés mellett továbbra is javíthatja a teljesítményt a jól megtervezett raktárakon végzett, teljesítménnyel kapcsolatos lekérdezések fejlesztésével.

Hideg futtatás (hideggyorsítótár) teljesítménye

A helyi SSD-vel és a memóriával való gyorsítótárazás automatikus. A lekérdezés első 1–3 végrehajtása jelentősen lassabban teljesít, mint a későbbi végrehajtások. Ha hideg futási teljesítménnyel kapcsolatos problémákat tapasztal, íme néhány dolog, amellyel javíthatja a hideg futás teljesítményét:

Ha az első futtatás teljesítménye kulcsfontosságú, próbálja meg manuálisan létrehozni a statisztikákat. Tekintse át a statisztikákról szóló cikket, hogy jobban megértse a statisztikák szerepét, és útmutatást nyújtson a manuális statisztikák létrehozásához a lekérdezési teljesítmény javítása érdekében. Ha azonban az első futtatás teljesítménye nem kritikus, az első lekérdezésben generált automatikus statisztikákra támaszkodhat, amelyeket a rendszer a későbbi futtatások során is használni fog (mindaddig, amíg a mögöttes adatok nem változnak jelentősen).
Ha a Power BI-t használja, ahol csak lehetséges, használja a Direct Lake módot.

Mérőszámok a teljesítmény monitorozásához

A monitorozási központ jelenleg nem tartalmazza a Warehouse-t. Ha az Adattárházat választja, a navigációs sávon nem fog tudni hozzáférni a Monitorozási központhoz.

A hálógazdák hozzáférhetnek a Kapacitáskihasználtság és metrikák jelentéshez, hogy naprakész információkhoz juthassanak a Raktárt is tartalmazó kapacitás kihasználtságának nyomon követéséhez.

Dinamikus felügyeleti nézetek (DMV-k) használata a lekérdezések végrehajtásának figyeléséhez

Dinamikus felügyeleti nézetek (DMV-k) használatával figyelheti a kapcsolat, a munkamenet és a kérések állapotát a Raktárban.

Statisztika

A Warehouse egy lekérdezési motor használatával hoz létre végrehajtási tervet egy adott SQL-lekérdezéshez. Amikor elküld egy lekérdezést, a lekérdezésoptimalizáló megpróbálja számba venni az összes lehetséges tervet, és kiválasztani a leghatékonyabb jelöltet. Annak meghatározásához, hogy melyik terv igényelné a legkisebb többletterhelést, a motornak képesnek kell lennie kiértékelni az egyes operátorok által feldolgozandó munka vagy sorok mennyiségét. Ezután az egyes tervek költségei alapján kiválasztja azt, amelyik a legkisebb becsült munkamennyiséggel van elszámolva. A statisztikák olyan objektumok, amelyek releváns információkat tartalmaznak az adatokról, így a lekérdezésoptimalizáló megbecsülheti ezeket a költségeket.

Az egyes adatbetöltések vagy adatfrissítések után manuálisan is frissítheti a statisztikákat , így biztosítva, hogy a legjobb lekérdezési terv készüljön.

További információ a statisztikákról és az automatikusan létrehozott statisztikák kiegészítéséről: Statistics in Fabric data warehousing.

Adatbetöltési irányelvek

A raktárba való adatbetöltésre négy lehetőség közül választhat:

COPY (Transact-SQL)
Adatfolyamatok
Adatfolyamok
Raktárközi betöltés

Annak megállapításához, hogy melyik lehetőség a legmegfelelőbb az Ön számára, és hogy áttekintse az adatbetöltés ajánlott eljárásait, tekintse át az adatok betöltését.

INSERT-utasítások csoportosítása kötegekbe (ne szúrja be a beszúrt elemeket)

Egy INSERT utasítással rendelkező kis táblába történő egyszeri terhelés, például az alábbi példában látható, az igényeitől függően a legjobb módszer lehet. Ha azonban több ezer vagy több millió sort kell betöltenie egész nap, az egyszeri BESZÚRÁSok nem optimálisak.

INSERT INTO MyLookup VALUES (1, 'Type 1')

A trükkös betöltési forgatókönyvek kezelésével kapcsolatos útmutatásért tekintse meg az adatok betöltésének ajánlott eljárásait.

Tranzakcióméretek minimalizálása

Az INSERT, UPDATE és DELETE utasítások egy tranzakcióban futnak. Ha nem sikerül, vissza kell őket állítani. A hosszú visszaállítás lehetőségének csökkentése érdekében lehetőség szerint minimalizálja a tranzakcióméreteket. A tranzakcióméretek minimalizálása az INSERT, UPDATE és DELETE utasítások részekre való felosztásával végezhető el. Ha például olyan INSERT-fájlja van, amely várhatóan 1 órát vesz igénybe, az INSERT-t négy részre bonthatja. Ezután minden futtatás 15 percre rövidül.

Fontolja meg a CTAS (Transact-SQL) használatát, hogy a DELETE helyett a táblában tárolni kívánt adatokat írja. Ha egy CTAS ugyanannyi időt vesz igénybe, biztonságosabb a futtatás, mivel minimális tranzakciónaplózással rendelkezik, és szükség esetén gyorsan megszakítható.

Ügyfélalkalmazások és Microsoft Fabric rendezése

Ha ügyfélalkalmazásokat használ, győződjön meg arról, hogy a Microsoft Fabricet az ügyfélszámítógéphez közeli régióban használja. Az ügyfélalkalmazások például a Power BI Desktop, az SQL Server Management Studio és az Azure Data Studio.

Csillagséma adattervének használata

A csillagséma ténytáblákba és dimenziótáblákba rendezi az adatokat. Az elemzési feldolgozást úgy segíti elő, hogy denormalizálja az adatokat a magas normalizált OLTP-rendszerekből, betölti a tranzakciós adatokat és a vállalati főadatokat egy közös, tisztított és ellenőrzött adatstruktúrába, amely minimalizálja a lekérdezések során történő illesztést, csökkenti az olvasási sorok számát, és megkönnyíti az összesítéseket és a csoportosítási feldolgozást.

A Warehouse további tervezési útmutatóját az adattárházak tábláiban talál.

Lekérdezési eredményhalmaz méretének csökkentése

A lekérdezési eredményhalmaz méretének csökkentése segít elkerülni a nagy lekérdezési eredmények által okozott ügyféloldali problémákat. Az SQL Query-szerkesztő eredményhalmazai az első 10 000 sorra vannak korlátozva, hogy elkerüljék ezeket a problémákat ebben a böngészőalapú felhasználói felületen. Ha több mint 10 000 sort kell visszaadnia, használja az SQL Server Management Studiót (SSMS) vagy az Azure Data Studiót.

Válassza ki a legjobb adattípust a teljesítményhez

A táblák meghatározásakor használja a legkisebb adattípust, amely támogatja az adatokat, ezzel javítva a lekérdezési teljesítményt. Ez a javaslat fontos a CHAR és a VARCHAR oszlopok esetében. Ha egy oszlop leghosszabb értéke 25 karakterből áll, akkor VARCHAR(25) típusként határozza meg az oszlopot. Ne definiáljon nagy alapértelmezett hosszúságú karakteroszlopokat.

Ha lehetséges, egész számalapú adattípusokat használjon. A SORT, a JOIN és a GROUP BY műveletek gyorsabban befejeződnek egész számokon, mint a karakteradatokon.

A támogatott adattípusokról és további információkról lásd az adattípusokat.

SQL Analytics-végpont teljesítménye

Az SQL Analytics-végpont teljesítményével kapcsolatos információkért és javaslatokért tekintse meg az SQL Analytics-végpont teljesítményével kapcsolatos szempontokat.

Adatsűrítés

Az adattömörítés kevesebb, nagyobb fájlba összesíti a kisebb Parquet-fájlokat, ami optimalizálja az olvasási műveleteket. Ez a folyamat a törölt sorok hatékony kezelését is segíti azáltal, hogy eltávolítja őket a nem módosítható Parquet-fájlokból. Az adattömörülési folyamat magában foglalja a táblák vagy táblák szegmenseinek újraírását a teljesítményre optimalizált új Parquet-fájlokba. További információ : Blog: Automatic Data Compaction for Fabric Warehouse.

Az adattömörülési folyamat zökkenőmentesen integrálva van a raktárba. A lekérdezések végrehajtásakor a rendszer azonosítja azokat a táblákat, amelyek kihasználhatják a tömörítés előnyeit, és elvégzi a szükséges értékeléseket. Az adattömörülést nem lehet manuálisan aktiválni.

Megosztás a következőn keresztül:

Synapse Data Warehouse a Microsoft Fabric teljesítményére vonatkozó irányelvekben

Hideg futtatás (hideggyorsítótár) teljesítménye

Mérőszámok a teljesítmény monitorozásához

Dinamikus felügyeleti nézetek (DMV-k) használata a lekérdezések végrehajtásának figyeléséhez

Statisztika

Adatbetöltési irányelvek

INSERT-utasítások csoportosítása kötegekbe (ne szúrja be a beszúrt elemeket)

Tranzakcióméretek minimalizálása

Ügyfélalkalmazások és Microsoft Fabric rendezése

Csillagséma adattervének használata

Lekérdezési eredményhalmaz méretének csökkentése

Válassza ki a legjobb adattípust a teljesítményhez

SQL Analytics-végpont teljesítménye

Adatsűrítés

Visszajelzés

További források

Megosztás a következőn keresztül:

Synapse Data Warehouse a Microsoft Fabric teljesítményére vonatkozó irányelvekben

Hideg futtatás (hideggyorsítótár) teljesítménye

Mérőszámok a teljesítmény monitorozásához

Dinamikus felügyeleti nézetek (DMV-k) használata a lekérdezések végrehajtásának figyeléséhez

Statisztika

Adatbetöltési irányelvek

INSERT-utasítások csoportosítása kötegekbe (ne szúrja be a beszúrt elemeket)

Tranzakcióméretek minimalizálása

Ügyfélalkalmazások és Microsoft Fabric rendezése

Csillagséma adattervének használata

Lekérdezési eredményhalmaz méretének csökkentése

Válassza ki a legjobb adattípust a teljesítményhez

SQL Analytics-végpont teljesítménye

Adatsűrítés

Kapcsolódó tartalom

Visszajelzés

További források