Megosztás a következőn keresztül:


Méretezhetőség az Azure DocumentDB-ben

Az Azure DocumentDB lehetővé teszi a fürtök vertikális és vízszintes skálázását. Bár a számítási fürt szintje és a tárolólemez funkcionálisan egymástól függ, a számítási és tárolási költségek skálázhatósága és költsége el van választva egymástól.

Függőleges skálázás

A vertikális skálázás a következő előnyöket nyújtja:

  • Előfordulhat, hogy az alkalmazáscsapatok nem mindig rendelkeznek egyértelmű elérési útjukkal az adataik logikai horizontális felosztásához. Emellett a logikai partícionálás kollekciónként van definiálva. A több szegmens nélküli gyűjteményt tartalmazó adathalmazokban az adatok particionálására való adatmodellezés gyorsan unalmassá válhat. A fürt vertikális felskálázása megkerülheti a logikai horizontális skálázás szükségességét, miközben kielégíti az alkalmazás növekvő tárolási és számítási igényeit.
  • A vertikális skálázás nem igényel adategyensúlyozást. A fizikai töredékek száma változatlan marad, és csak a fürt kapacitása növekszik, anélkül, hogy ez hatással lenne az alkalmazásra.
  • A vertikális fel- és leskálázás nulla állásidős művelet, amely nem okoz fennakadásokat a szolgáltatásban. Nincs szükség alkalmazásmódosításra, és az állandó állapotú műveletek továbbra is zavartalanul folytathatók.
  • A számítási erőforrások az ismert alacsony tevékenységű időszakokban is leskálázhatók. A leskálázás ismét elkerüli annak szükségességét, hogy kevesebb fizikai szegmensben egyensúlyozzák újra az adatokat, és ez egy állásidő nélküli művelet, amely nem okoz fennakadást a szolgáltatásban. Itt sem szükséges alkalmazásmódosítás a fürt leskálázása után.
  • A legfontosabb, hogy a számítás és a tárolás egymástól függetlenül skálázható. Ha több magra és memóriára van szükség, a lemez méretét változatlanul hagyhatjuk, és a klaszterszint felskálázható. Hasonlóképpen, ha több tárhelyre és IOPS-ra van szükség, a fürtszint változatlanul maradhat, és a tárhely mérete függetlenül skálázható fel. Szükség esetén a számítás és a tárolás egymástól függetlenül is skálázható, hogy az egyes összetevők követelményeire külön-külön optimalizáljon, anélkül, hogy bármelyik összetevő rugalmassági követelményei befolyásolnák a másikat.

Vízszintes skálázás

Végül az alkalmazás olyan pontra nő, ahol a vertikális skálázás nem elegendő. A számítási feladatokra vonatkozó követelmények túlléphetik a legnagyobb fürtszint kapacitását, és végül több szegmensre van szükség. Az Azure DocumentDB horizontális skálázása a következő előnyöket kínálja:

  • A logikailag skálázott adathalmazok nem igényelnek felhasználói beavatkozást az alapul szolgáló fizikai szegmensek közötti adategyensúlyozáshoz. A szolgáltatás automatikusan leképozza a logikai szegmenseket fizikai szegmensekre. Csomópontok hozzáadásakor vagy eltávolításakor a rendszer automatikusan újraegyensúlyozza az adatbázist a háttérben.
  • A kérések automatikusan a lekérdezett adatok kivonattartományát birtokoló megfelelő fizikai szegmenshez lesznek irányítva.
  • A földrajzilag elosztott fürtök homogén többcsomópontos konfigurációval rendelkeznek. Így a logikai és a fizikai szegmensleképezések konzisztensek a fürt elsődleges és replikaterületein.

Számítási és tárolási skálázás

A számítási és memóriaerőforrások jobban befolyásolják az Azure DocumentDB olvasási műveleteit, mint a lemez IOPS-ját.

  • Az olvasási műveletek először a számítási réteg gyorsítótárát keresik, és visszaesnek a lemezre, ha az adatok nem kérhetők le a gyorsítótárból. A másodpercenként nagyobb olvasási sebességgel rendelkező számítási feladatok esetében a fürtszint vertikális felskálázása több processzor- és memóriaerőforrás eléréséhez magasabb átviteli sebességet eredményez.
  • Az olvasási sebesség mellett azok a számítási feladatok is profitálnak a fürt számítási erőforrásainak skálázásából, amelyek különösen nagy mennyiségű adatot kezelnek az egyes olvasási műveletek során. Például a több memóriával rendelkező fürtrétegek nagyobb méretű hasznos adatok tárolását teszik lehetővé dokumentumonként, és egy válaszon belül több kisebb dokumentum kezelését.

A lemezes IOPS jobban befolyásolja az Írási műveleteket az Azure DocumentDB-ben, mint a számítási erőforrások processzor- és memóriakapacitása.

  • Az írási műveletek mindig megőrzik az adatokat a lemezen (a memóriában az olvasás optimalizálása mellett). A nagyobb, több IOPS-t tartalmazó lemezek nagyobb írási teljesítményt biztosítanak, különösen nagy léptékű futtatás esetén.
  • A szolgáltatás szegmensenként legfeljebb 32 TB lemezt támogat, és szegmensenként több IOPS-t is támogat a nagy számítási feladatok írása érdekében, különösen nagy léptékű futtatás esetén.

Nagy számítási feladatok és nagy lemezek tárolása

Fürtszintenként nincs minimális tárolási követelmény

Ahogy korábban említettük, a tárolási és számítási erőforrások szétválasztva vannak a számlázáshoz és a szolgáltatásnyújtáshoz. Bár összetartó egységként működnek, egymástól függetlenül skálázhatók. Az M30 fürtszinten 32 TB lemezeket lehet telepíteni. Hasonlóképpen, az M200-fürtszinthez 32 GB-os lemezek rendelhetők a tárolási és számítási költségek optimalizálása érdekében.

Alsó TCO nagy lemezekkel (32 TB és újabb)

A NoSQL-adatbázisok általában 4 TB-ra korlátozzák a fizikai szegmensenkénti tárolást. Az Azure DocumentDB legfeljebb 8x ilyen kapacitást biztosít 32 TB-os lemezekkel. A nagy méretű számítási feladatok tárolásához a fizikai szegmensenként 4 TB-os tárolókapacitáshoz nagy mennyiségű számítási erőforrás szükséges, csak a számítási feladat tárolási követelményeinek fenntartása érdekében. A számítás drágább, mint a tárolás, és a szolgáltatás kapacitáskorlátai miatt túlterjeszkedő számítás gyorsan megnövelheti a költségeket.

Tekintsünk egy nagy tárolási számítási feladatot 200 TB adattal.

Tárterület mérete darabonként Minimális töredékek szükségesek a 200 TB fenntartásához
4 TiB 50
32 TiB 7

A számítási követelmények csökkentése a nagyobb lemezek esetén jelentősen csökken. Bár a fizikai szegmensek minimális számánál többre lehet szükség a számítási feladat átviteli sebességére vonatkozó követelmények fenntartásához, a szegmensek számának megduplázása vagy megháromozása is költséghatékonyabb, mint egy kisebb lemezeket tartalmazó 50 szegmensfürt.

Tár-rétegzés kihagyása nagy lemezek segítségével

A nagy tárolási forgatókönyvekben a számítási költségekre adott azonnali válasz az adatok "rétegzése". A tranzakciós adatbázisban lévő adatok a leggyakrabban használt "gyakori" adatokra korlátozódnak, míg a nagyobb mennyiségű "hideg" adat le van választva egy hűtőtárolóra. Ez működési összetettséget okoz. A teljesítmény szintén kiszámíthatatlan, és a elért adatszinttől függ. Továbbá a teljes rendszer rendelkezésre állása a gyakori és a ritka elérésű adattárak együttes rugalmasságától függ. A szolgáltatásban lévő nagy lemezek esetén nincs szükség rétegzett tárolásra, mivel a nagy méretű számítási feladatok tárolási költsége minimálisra csökken.

Következő lépések