Azure Data Lake Storage Gen2 hierarchikus névtér

Egy hierarchikus névtér hozzáadása egy kulcsfontosságú mechanizmus, amely lehetővé teszi, hogy Azure Data Lake Storage Gen2 biztosítsa a fájlrendszer teljesítményét objektumtárolási skálán és az árakon. Ez lehetővé teszi, hogy a fiókon belüli objektumok/fájlok gyűjteményét ugyanúgy rendezze könyvtárak és beágyazott alkönyvtárak hierarchiájába, mint a számítógépen lévő fájlrendszer. Ha engedélyezve van a hierarchikus névtér, a tárfiók képessé válik az objektumtárolás méretezhetőségének és költséghatékonyságának biztosítására, az elemzési motorok és keretrendszerek számára jól ismert fájlrendszer-szemantikával.

A hierarchikus névtér előnyei

Az alábbi előnyök olyan fájlrendszerekhez vannak társítva, amelyek hierarchikus névteret implementálnak blobadatokon keresztül:

  • Atomi könyvtárkezelés: Az objektum úgy tárolja a közelítő könyvtárhierarchiát, hogy bevezeti a perjelek (/) objektumnévbe való beágyazásának konvencióját az elérésiút-szegmensek jelölésére. Bár ez a konvenció objektumok rendszerezésére szolgál, a konvenció nem nyújt segítséget az olyan műveletekhez, mint a könyvtárak áthelyezése, átnevezése vagy törlése. Valós címtárak nélkül az alkalmazásoknak potenciálisan több millió blobot kell feldolgozniuk a címtárszintű feladatok eléréséhez. Ezzel szemben a hierarchikus névtér egyetlen bejegyzés (a szülőkönyvtár) frissítésével dolgozza fel ezeket a feladatokat.

    Ez a drámai optimalizálás különösen jelentős számos big data-elemzési keretrendszer esetében. Eszközök, például Hive, Spark stb. gyakran írja a kimenetet ideiglenes helyekre, majd nevezze át a helyet a feladat befejezésekor. Hierarchikus névtér nélkül ez az átnevezés gyakran hosszabb időt vehet igénybe, mint maga az elemzési folyamat. Az alacsonyabb feladatkésés alacsonyabb teljes bekerülési költséget (TCO) eredményez az elemzési számítási feladatok esetében.

  • Ismerős felületstílus: A fájlrendszereket a fejlesztők és a felhasználók egyaránt jól ismerik. Nem kell új tárolási paradigmát megtanulnia a felhőbe való áttéréskor, mivel a Data Lake Storage Gen2 által közzétett fájlrendszer-felület ugyanaz a paradigma, amelyet a számítógépek használnak, nagy és kicsi.

Az egyik ok, amiért az objektumtárolók korábban nem támogatták a hierarchikus névtereket, az az, hogy a hierarchikus névtérkorlátok skálázhatók. A Data Lake Storage Gen2 hierarchikus névtér azonban lineárisan skálázható, és nem rontja sem az adatkapacitást, sem a teljesítményt.

Döntés arról, hogy engedélyezi-e a hierarchikus névteret

Miután engedélyezte a hierarchikus névteret a fiókjában, nem állíthatja vissza egybesimított névtérre. Ezért fontolja meg, hogy érdemes-e hierarchikus névteret engedélyezni az objektumtároló számítási feladatainak természete alapján. A hierarchikus névtér számítási feladatokra, alkalmazásokra, költségekre, szolgáltatásintegrációkra, eszközökre, funkciókra és dokumentációra gyakorolt hatásának értékeléséhez lásd: Azure Blob Storage frissítése Azure Data Lake Storage Gen2 képességekkel.

Előfordulhat, hogy egyes számítási feladatok nem nyernek előnyt egy hierarchikus névtér engedélyezésével. Ilyenek például a biztonsági másolatok, a rendszerképek tárolása és más olyan alkalmazások, amelyekben az objektumszervezést maguktól az objektumoktól külön tárolják (például egy külön adatbázisban).

Emellett, bár a Blob Storage-funkciók és az Azure-szolgáltatási ökoszisztéma támogatása folyamatosan nő, továbbra is vannak olyan funkciók és Azure-szolgáltatások, amelyek még nem támogatottak a hierarchikus névtérrel rendelkező fiókokban. Lásd: Ismert problémák.

Általában azt javasoljuk, hogy kapcsolja be a hierarchikus névteret a könyvtárakat módosító fájlrendszerekhez tervezett tárolási számítási feladatokhoz. Ez magában foglalja az összes olyan számítási feladatot, amely elsősorban az elemzések feldolgozására vonatkozik. A magas szintű szervezetet igénylő adathalmazok számára is előnyös a hierarchikus névtér engedélyezése.

A hierarchikus névterek engedélyezésének okait egy TCO-elemzés határozza meg. Általánosságban elmondható, hogy a számítási feladatok tárolási gyorsítás miatti késésének javítása kevesebb ideig igényel számítási erőforrásokat. Számos számítási feladat késése javítható a hierarchikus névtér által engedélyezett atomi címtár-manipuláció miatt. Számos számítási feladat esetében a számítási erőforrás a teljes költség 85%-át jelenti > , így még a számítási feladatok késésének szerény csökkentése is jelentős TCO-megtakarításnak felel meg. Még abban az esetben is, ha a hierarchikus névtér engedélyezése növeli a tárolási költségeket, a TCO továbbra is csökken a csökkentett számítási költségek miatt.

Ha elemezni szeretné az adattárolási árak, a tranzakcióárak és a tárkapacitás-foglalások díjszabása közötti különbségeket a hierarchikus névtérrel rendelkező fiókok és a hierarchikus névtér között, tekintse meg Azure Data Lake Storage Gen2 díjszabást.

Következő lépések