Az Azure Data Lake Storage főbb szempontjai
Ismerje meg az Azure data lake-ekkel kapcsolatos legfontosabb tárolási szempontokat.
Életciklus-kezelés
Az Azure Storage különböző hozzáférési szinteket kínál, így a blobobjektumok adatait a lehető legköltséghatékonyabb módon tárolhatja. A tárolási rétegek köre:
- Gyakori: A gyakran használt adatok tárolására van optimalizálva.
- Ritka elérésű: Ritkán elért adatok tárolására van optimalizálva. Az adatok tárolása legalább 30 napig történik.
- Hideg réteg: Ritkán elért vagy módosított adatok tárolására van optimalizálva. Az adatok tárolása legalább 90 napig történik. A nagyon ritka elérésű hozzáférési szintnek a ritka elérésű szinthez képest alacsonyabbak a tárolási és magasabbak az elérési költségei.
- Archívum: A ritkán használt adatok tárolására van optimalizálva. Az adatok tárolása legalább 180 napig, rugalmas késési követelményekkel, órák sorrendjében történik.
Fontos
A különböző online hozzáférési szintek között nincs megbízhatósági, biztonsági, működési kiválósági vagy teljesítményhatékonysági kompromisszum, így az online szint kiválasztása blobonként pénzügyi döntés lesz a számítási feladatokhoz való hozzáférés adatainak mérete, a működési interakciók és a blob törlése előtti idő alapján. Válassza ki a megfelelő szintet blobonként az előző tényezők számítása alapján. További információ: Az Azure Blob Storage költségeinek megtervezése és kezelése.
A hozzáférési szintek használatakor vegye figyelembe a következő információkat:
Fiókszinten csak a gyakori elérésű és a ritka elérésű hozzáférési szintek állíthatók be. Az archív hozzáférési szint nem érhető el a fiók szintjén.
A gyakori elérésű, a ritka elérésű és az archív szintek mind blobszinten állíthatók be feltöltéskor vagy feltöltés után.
A ritka elérésű és a ritka elérésű rétegek adatai valamivel alacsonyabb rendelkezésre állással rendelkeznek, de ugyanolyan magas tartósságot, lekérési késést és átviteli sebességet kínálnak, mint a gyakori elérésű réteg adatai. A ritka elérésű vagy a hideg rétegben lévő adatok esetében a rendelkezésre állás és a magasabb hozzáférési költségek elfogadható kompromisszumot jelenthetnek a gyakori elérésű szinthez képest alacsonyabb teljes tárolási költségek esetén.
Az archív tároló offline állapotban tárolja az adatokat, és a legalacsonyabb tárolási költségeket kínálja. Ugyanakkor a legmagasabb adatrehidratálási és hozzáférési költségeket is magában hordozza.
További információ: Access-szintek blobadatokhoz.
Figyelemfelhívás
A felhőalapú elemzésekhez javasoljuk, hogy egyéni mikroszolgáltatással implementálja az életciklus-felügyeletet , és gondosan vegye figyelembe a felhasználói felderíthető adatok ritka elérésű tárolóba való áthelyezésének hatását.
A jól ismert számítási feladatokhoz csak a data lake szakaszait helyezze át a ritka elérésű szintre.
Data Lakes-kapcsolat
Minden adattónak magánvégpontokat kell használnia, amelyek az adat-kezdőzóna virtuális hálózatába vannak injektálva. A célzónák közötti hozzáférés biztosításához csatlakoztassa az adat-kezdőzónákat virtuális hálózati társviszony-létesítésen keresztül. Ez a kapcsolat költség- és hozzáférés-vezérlési szempontból is optimális megoldást nyújt.
További információ: Privát végpontok és adatkezelési célzóna az adat-kezdőzónában.
Fontos
Az adat-kezdőzónából származó adatok egy másik adat-kezdőzónából érhetők el a zónák közötti virtuális hálózati társviszony-létesítésen keresztül. Ez az egyes Data Lake-fiókokhoz társított privát végpontok használatával történik. Javasoljuk, hogy kapcsolja ki a tavakhoz való nyilvános hozzáférést és a privát végpontok használatát. A platformműveleti csapatnak szabályoznia kell a hálózati kapcsolatot az adat-kezdőzónákban.
Tárolók helyreállítható törlése
A tárolók helyreállítható törlése megvédi az adatokat a véletlen vagy rosszindulatú törléstől. Ha engedélyezi a tárolók helyreállítható törlését a tárfiókhoz, a törölt tárolók és azok tartalmai a választott ideig megmaradnak az Azure Storage-ban. Az adatmegőrzési időszak alatt visszaállíthatja a korábban törölt tárolókat. A tároló visszaállítása azokat a blobokat is visszaállítja, amelyek a tárolóban voltak a törléskor.
Engedélyezze a következő adatvédelmi funkciókat a blobok teljes körű védelmének eléréséhez:
- Tároló helyreállítható törlése a törölt tároló visszaállításához. A tárolók helyreállítható törlésének engedélyezéséről további információt a tárolók helyreállítható törlésének engedélyezése és kezelése című témakörben talál.
- Blob helyreállítható törlése egy törölt blob vagy verzió visszaállításához. A blobok helyreállítható törlésének engedélyezéséről további információt a blobok helyreállítható törlésének engedélyezése és kezelése című témakörben talál.
Figyelmeztetés
A tárfiók törlése nem vonható vissza. A tároló helyreállítható törlése nem véd a tárfiókok törlése ellen, csak a fiókokon belüli tárolók törlése ellen. A tárfiók törlés elleni védelméhez konfiguráljon egy zárolást a tárfiók-erőforráson. További információ az Azure Resource Manager-erőforrások zárolásáról: Erőforrások zárolása a váratlan változások megelőzése érdekében.
Figyelés
Egy adat-kezdőzónában minden monitorozást el kell küldeni a nagyvállalati szintű felügyeleti előfizetésnek elemzés céljából.
Az Azure Storage által használt monitorozási adatokról az Azure-erőforrások monitorozása az Azure Monitorral című témakörben olvashat. Az Azure Storage által létrehozott naplókkal és metrikákkal kapcsolatos további információkért lásd az Azure Blob Storage monitorozását.
A naplóbejegyzések csak akkor jönnek létre, ha a szolgáltatásvégpontra irányuló kérések történnek. A naplózott hitelesített kérések típusai a következők:
- Sikeres kérelmek
- Sikertelen kérések, köztük az időtúllépések, torlódások, valamint a hálózati, hitelesítési és egyéb hibák
- Közös hozzáférésű jogosultságkódot (SAS) vagy OAuthot használó kérések, beleértve a sikertelen és sikeres kéréseket is
- Adatelemzési kérelmek, például a
$logs
tárolóban lévő klasszikus naplóadatok és a táblák osztálymetrikáinak$metric
adatai
A társzolgáltatás által küldött kérések( például a napló létrehozása vagy törlése) nincsenek naplózva. A naplózott névtelen kérések típusai a következők:
- Sikeres kérelmek
- Kiszolgálóhibák
- Ügyfél- és kiszolgálóoldali időtúllépési hibák
- Sikertelen HTTP GET-kérelmek a 304-s hibakóddal (
Not Modified
)
A rendszer nem naplózza az összes többi sikertelen névtelen kérést.
Fontos
Állítsa be az alapértelmezett figyelési szabályzatot a tárolás naplózására, és küldje el a naplókat a nagyvállalati szintű felügyeleti előfizetésnek.