Porovnání Azure Data Lake Storage Gen1 a Azure Blob Storage
Poznámka
Azure Data Lake Storage Gen1 je teď vyřazený. Podívejte se na oznámení o vyřazení z provozu tady. Data Lake Storage Gen1 prostředky už nejsou přístupné. Pokud potřebujete zvláštní pomoc, kontaktujte nás.
Tabulka v tomto článku shrnuje rozdíly mezi Azure Data Lake Storage Gen1 a Azure Blob Storage spolu s některými klíčovými aspekty zpracování velkých objemů dat. Azure Blob Storage je škálovatelné úložiště objektů pro obecné účely, které je navržené pro širokou škálu scénářů úložiště. Azure Data Lake Storage Gen1 je úložiště s hyperškálací, které je optimalizované pro úlohy analýzy velkých objemů dat.
Kategorie | Azure Data Lake Storage Gen1 | Azure Blob Storage |
---|---|---|
Účel | Optimalizované úložiště pro úlohy analýzy velkých objemů dat | Úložiště objektů pro obecné účely pro širokou škálu scénářů úložiště, včetně analýzy velkých objemů dat |
Případy použití | Dávková, interaktivní, streamovaná analytická data a data strojového učení, jako jsou soubory protokolů, data IoT, streamy kliknutí, velké datové sady | Jakýkoli typ textových nebo binárních dat, jako jsou back-end aplikace, zálohovaná data, úložiště médií pro streamování a data pro obecné účely. Kromě toho plná podpora analytických úloh; dávková, interaktivní, streamovaná analytická data a data strojového učení, jako jsou soubory protokolů, data IoT, streamy kliknutí, velké datové sady |
Klíčové koncepty | Data Lake Storage Gen1 účet obsahuje složky, které zase obsahují data uložená jako soubory. | Účet úložiště obsahuje kontejnery, které zase mají data ve formě objektů blob. |
Struktura | Hierarchický systém souborů | Úložiště objektů s plochým oborem názvů |
rozhraní API | REST API přes HTTPS | ROZHRANÍ REST API přes HTTP/HTTPS |
Rozhraní API na straně serveru | Rozhraní REST API kompatibilní s WebHDFS | rozhraní REST API Azure Blob Storage |
Klient systému souborů Hadoop | Yes | Yes |
Operace s daty – ověřování | Na základě Microsoft Entra identit | Na základě sdílených tajných klíčů – přístupové klíče účtu a klíče sdíleného přístupového podpisu. |
Operace s daty – ověřovací protokol | OpenID Connect. Volání musí obsahovat platný JWT (webový token JSON) vydaný Microsoft Entra ID. | Kód HMAC (Hash-based Message Authentication Code). Volání musí obsahovat hodnotu hash SHA-256 s kódováním Base64 nad částí požadavku HTTP. |
Operace s daty – autorizace | Access Control Seznamy POSIX (seznamy ACL). Seznamy ACL založené na Microsoft Entra identit je možné nastavit na úrovni souborů a složek. | Pro autorizaci na úrovni účtu – použijte přístupové klíče účtu. Pro autorizaci účtu, kontejneru nebo objektu blob – použití klíčů sdíleného přístupového podpisu |
Operace s daty – auditování | K dispozici. Další informace najdete tady . | K dispozici. |
Šifrování neaktivních uložených dat |
|
|
Operace správy (například vytvoření účtu) | Řízení přístupu na základě role v Azure (Azure RBAC) pro správu účtů | Řízení přístupu na základě role v Azure (Azure RBAC) pro správu účtů |
Sady SDK pro vývojáře | .NET, Java, Python, Node.js | .NET, Java, Python, Node.js, C++, Ruby, PHP, Go, Android, iOS |
Výkon analytických úloh | Optimalizovaný výkon pro úlohy paralelní analýzy. Vysoká propustnost a IOPS. | Optimalizovaný výkon pro úlohy paralelní analýzy. |
Omezení velikosti | Bez omezení velikosti účtů, velikostí souborů nebo počtu souborů | Konkrétní omezení najdete v tématech Cíle škálovatelnosti pro účty úložiště úrovně Standard a Škálovatelnost a výkonnostní cíle pro úložiště objektů blob. Pokud máte k dispozici větší limity účtu, obraťte se na podporu Azure. |
Geografická redundance | Místně redundantní (několik kopií dat v jedné oblasti Azure) | Místně redundantní (LRS), zónově redundantní (ZRS), globálně redundantní (GRS), globálně redundantní přístup pro čtení (RA-GRS). Další informace najdete tady. |
Stav služby | Obecná dostupnost | Obecná dostupnost |
Regionální dostupnost | Informace najdete zde | K dispozici ve všech oblastech Azure |
Cena | Zobrazit ceny | Zobrazit ceny |