Megosztás a következőn keresztül:


Teljesítményhatékonyság a data lakehouse-hoz

Ez a cikk a teljesítményhatékonysági pillér architekturális alapelveit ismerteti, utalva arra, hogy a rendszer képes alkalmazkodni a terhelésváltozásokhoz.

A Databricks teljesítményhatékonysági lakehouse-architektúradiagramja.

A teljesítményhatékonyság alapelvei

  1. Kiszolgáló nélküli architektúrák használata

    A kiszolgáló nélküli architektúrák nem követelik meg az ügyfelektől a számítási infrastruktúra felhőben való üzemeltetését és karbantartását. Ez kiküszöböli a felhőinfrastruktúra üzemeltetési többletterhelését, és csökkenti a tranzakciós költségeket, mivel a felügyelt szolgáltatások felhőalapú szinten működnek. Emellett azonnali rendelkezésre állást, beépített biztonságot is biztosítanak, és minimális konfigurációt vagy felügyeletet igényelnek.

  2. Számítási feladatok tervezése a teljesítményhez

    Az ismétlődő számítási feladatok, például az adatmérnöki folyamatok esetében a teljesítménynek soha nem szabad utógondolatnak lennie. Az adatoknak a következőnek kell lenniük:

    • Hatékonyan olvasható az objektummemória alapján.
    • Hatékonyan átalakítva.
    • Hatékony közzététel felhasználás céljából.

    Emellett a legtöbb folyamat vagy használati minta rendszerláncot használ. A lehető legjobb teljesítmény eléréséhez a teljes láncot figyelembe kell venni, és ki kell választani a legjobb teljesítmény érdekében.

  3. Teljesítménytesztelés futtatása a fejlesztés hatókörében

    Minden fejlesztési számítási feladatnak folyamatos teljesítménytesztelésen kell átesnie. A tesztek biztosítják, hogy a kódbázis módosítása ne befolyásolja hátrányosan a számítási feladat teljesítményét. A tesztek futtatásának rendszeres ütemezése. Futtassa a tesztet egy ütemezett esemény részeként vagy egy folyamatos integrációs buildfolyamat részeként.

    Alakítsa ki a teljesítménykonfigurációkat, és határozza meg a számítási feladatok és a támogató infrastruktúra aktuális hatékonyságát. A teljesítmény alapkonfigurációkhoz viszonyított mérése fejlesztési stratégiákat biztosíthat, és meghatározhatja, hogy az alkalmazás megfelel-e az üzleti célkitűzéseknek.

    Azonosítsa azokat a szűk keresztmetszeteket, amelyek hatással lehetnek a teljesítményre. Ezeket a szűk keresztmetszeteket kódhibák vagy egy szolgáltatás helytelen konfigurálása okozhatja. A szűk keresztmetszetek általában rosszabbak lesznek a terhelés növekedésével.

  4. Teljesítmény monitorozása

    Győződjön meg arról, hogy az erőforrások és szolgáltatások elérhetők maradnak, és hogy a teljesítmény megfelel a felhasználói elvárásoknak vagy a számítási feladatokra vonatkozó követelményeknek. A monitorozás segíthet azonosítani a szűk keresztmetszeteket vagy az erőforrások elégtelenségét, optimalizálni a konfigurációkat, és észlelni a folyamat-/számítási feladatok hibáit.

Következő: Ajánlott eljárások a teljesítményhatékonysághoz

Tekintse meg a teljesítményhatékonyságra vonatkozó ajánlott eljárásokat.