Porównanie Azure Data Lake Storage Gen1 i Azure Blob Storage

Uwaga

Azure Data Lake Storage Gen1 została wycofana. Zobacz ogłoszenie o wycofaniu tutaj. Data Lake Storage Gen1 zasoby nie są już dostępne. Jeśli potrzebujesz specjalnej pomocy, skontaktuj się z nami.

Tabela w tym artykule zawiera podsumowanie różnic między Azure Data Lake Storage Gen1 i Azure Blob Storage w niektórych kluczowych aspektach przetwarzania danych big data. Azure Blob Storage to skalowalny magazyn obiektów ogólnego przeznaczenia przeznaczony dla wielu różnych scenariuszy magazynowania. Azure Data Lake Storage Gen1 to repozytorium hiperskalowe zoptymalizowane pod kątem obciążeń analizy danych big data.

Kategoria Usługa Azure Data Lake Storage 1. generacji Azure Blob Storage
Przeznaczenie Zoptymalizowany magazyn pod kątem obciążeń analizy danych big data Magazyn obiektów ogólnego przeznaczenia dla wielu różnych scenariuszy magazynowania, w tym analizy danych big data
Przypadki użycia Usługa Batch, interaktywna analiza przesyłania strumieniowego i dane uczenia maszynowego, takie jak pliki dziennika, dane IoT, strumienie kliknięć, duże zestawy danych Dowolny typ danych tekstowych lub binarnych, takich jak zaplecze aplikacji, dane kopii zapasowej, magazyn multimediów na potrzeby przesyłania strumieniowego i danych ogólnego przeznaczenia. Ponadto pełna obsługa obciążeń analitycznych; batch, interactive, streaming analytics i machine learning data, takich jak pliki dziennika, dane IoT, strumienie kliknięć, duże zestawy danych
Kluczowe pojęcia konto Data Lake Storage Gen1 zawiera foldery, które z kolei zawierają dane przechowywane jako pliki Konto magazynu zawiera kontenery, które z kolei zawierają dane w postaci obiektów blob
Struktura Hierarchiczny system plików Magazyn obiektów z płaską przestrzenią nazw
interfejs API Interfejs API REST za pośrednictwem protokołu HTTPS Interfejs API REST za pośrednictwem protokołu HTTP/HTTPS
Interfejs API po stronie serwera Interfejs API REST zgodny z systemem plików WebHDFS interfejs API REST Azure Blob Storage
Klient systemu plików hadoop Tak Tak
Operacje na danych — uwierzytelnianie Na podstawie tożsamości Microsoft Entra Na podstawie udostępnionych wpisów tajnych — klucze dostępu do konta i klucze sygnatury dostępu współdzielonego.
Operacje na danych — protokół uwierzytelniania OpenID Connect. Wywołania muszą zawierać prawidłowy token internetowy JWT (JSON) wystawiony przez Tożsamość Microsoft Entra. Oparty na skrótach kod uwierzytelniania komunikatów (HMAC). Wywołania muszą zawierać skrót SHA-256 zakodowany w formacie Base64 w ramach części żądania HTTP.
Operacje na danych — autoryzacja ACCESS CONTROL LISTY POSIX (ACL). Listy ACL oparte na tożsamościach Microsoft Entra można ustawić na poziomie pliku i folderu. W przypadku autoryzacji na poziomie konta — użyj kluczy dostępu do konta
W przypadku autoryzacji konta, kontenera lub obiektu blob — użyj kluczy sygnatury dostępu współdzielonego
Operacje na danych — inspekcja Dostępne. Aby uzyskać informacje, zobacz tutaj . Dostępne
Szyfrowanie danych magazynowanych
  • Przezroczyste, po stronie serwera
    • Za pomocą kluczy zarządzanych przez usługę
    • Za pomocą kluczy zarządzanych przez klienta w usłudze Azure KeyVault
  • Przezroczyste, po stronie serwera
    • Za pomocą kluczy zarządzanych przez usługę
    • Za pomocą kluczy zarządzanych przez klienta w usłudze Azure KeyVault (wersja zapoznawcza)
  • Szyfrowania po stronie klienta
Operacje zarządzania (na przykład Tworzenie konta) Kontrola dostępu oparta na rolach (RBAC) platformy Azure na potrzeby zarządzania kontami Kontrola dostępu oparta na rolach (RBAC) platformy Azure na potrzeby zarządzania kontami
Zestawy SDK dla deweloperów .NET, Java, Python, Node.js .NET, Java, Python, Node.js, C++, Ruby, PHP, Go, Android, iOS
Wydajność obciążeń analitycznych Zoptymalizowana wydajność pod kątem obciążeń analizy równoległej. Wysoka przepływność i liczba operacji we/wy na sekundę. Zoptymalizowana wydajność pod kątem obciążeń analizy równoległej.
Limity rozmiaru Brak ograniczeń dotyczących rozmiarów kont, rozmiarów plików ani liczby plików Aby uzyskać informacje o określonych limitach, zobacz Cele skalowalności dla kont magazynu w warstwie Standardowa oraz Cele skalowalności i wydajności dla usługi Blob Storage. Większe limity kont są dostępne, kontaktując się z pomocą techniczną platformy Azure
Nadmiarowość geograficzna Lokalnie nadmiarowy (wiele kopii danych w jednym regionie świadczenia usługi Azure) Lokalnie nadmiarowy (LRS), strefowo nadmiarowy (ZRS), globalnie nadmiarowy (GRS), dostęp do odczytu globalnie nadmiarowy (RA-GRS). Więcej informacji można znaleźć tutaj
Stan usługi Ogólnie dostępne Ogólnie dostępne
Dostępność w regionach Zobacz tutaj Dostępne we wszystkich regionach świadczenia usługi Azure
Cena Zobacz Cennik Zobacz Cennik