Porównanie Azure Data Lake Storage Gen1 i Azure Blob Storage
Uwaga
Azure Data Lake Storage Gen1 została wycofana. Zobacz ogłoszenie o wycofaniu tutaj. Data Lake Storage Gen1 zasoby nie są już dostępne. Jeśli potrzebujesz specjalnej pomocy, skontaktuj się z nami.
Tabela w tym artykule zawiera podsumowanie różnic między Azure Data Lake Storage Gen1 i Azure Blob Storage w niektórych kluczowych aspektach przetwarzania danych big data. Azure Blob Storage to skalowalny magazyn obiektów ogólnego przeznaczenia przeznaczony dla wielu różnych scenariuszy magazynowania. Azure Data Lake Storage Gen1 to repozytorium hiperskalowe zoptymalizowane pod kątem obciążeń analizy danych big data.
Kategoria | Usługa Azure Data Lake Storage 1. generacji | Azure Blob Storage |
---|---|---|
Przeznaczenie | Zoptymalizowany magazyn pod kątem obciążeń analizy danych big data | Magazyn obiektów ogólnego przeznaczenia dla wielu różnych scenariuszy magazynowania, w tym analizy danych big data |
Przypadki użycia | Usługa Batch, interaktywna analiza przesyłania strumieniowego i dane uczenia maszynowego, takie jak pliki dziennika, dane IoT, strumienie kliknięć, duże zestawy danych | Dowolny typ danych tekstowych lub binarnych, takich jak zaplecze aplikacji, dane kopii zapasowej, magazyn multimediów na potrzeby przesyłania strumieniowego i danych ogólnego przeznaczenia. Ponadto pełna obsługa obciążeń analitycznych; batch, interactive, streaming analytics i machine learning data, takich jak pliki dziennika, dane IoT, strumienie kliknięć, duże zestawy danych |
Kluczowe pojęcia | konto Data Lake Storage Gen1 zawiera foldery, które z kolei zawierają dane przechowywane jako pliki | Konto magazynu zawiera kontenery, które z kolei zawierają dane w postaci obiektów blob |
Struktura | Hierarchiczny system plików | Magazyn obiektów z płaską przestrzenią nazw |
interfejs API | Interfejs API REST za pośrednictwem protokołu HTTPS | Interfejs API REST za pośrednictwem protokołu HTTP/HTTPS |
Interfejs API po stronie serwera | Interfejs API REST zgodny z systemem plików WebHDFS | interfejs API REST Azure Blob Storage |
Klient systemu plików hadoop | Tak | Tak |
Operacje na danych — uwierzytelnianie | Na podstawie tożsamości Microsoft Entra | Na podstawie udostępnionych wpisów tajnych — klucze dostępu do konta i klucze sygnatury dostępu współdzielonego. |
Operacje na danych — protokół uwierzytelniania | OpenID Connect. Wywołania muszą zawierać prawidłowy token internetowy JWT (JSON) wystawiony przez Tożsamość Microsoft Entra. | Oparty na skrótach kod uwierzytelniania komunikatów (HMAC). Wywołania muszą zawierać skrót SHA-256 zakodowany w formacie Base64 w ramach części żądania HTTP. |
Operacje na danych — autoryzacja | ACCESS CONTROL LISTY POSIX (ACL). Listy ACL oparte na tożsamościach Microsoft Entra można ustawić na poziomie pliku i folderu. | W przypadku autoryzacji na poziomie konta — użyj kluczy dostępu do konta W przypadku autoryzacji konta, kontenera lub obiektu blob — użyj kluczy sygnatury dostępu współdzielonego |
Operacje na danych — inspekcja | Dostępne. Aby uzyskać informacje, zobacz tutaj . | Dostępne |
Szyfrowanie danych magazynowanych |
|
|
Operacje zarządzania (na przykład Tworzenie konta) | Kontrola dostępu oparta na rolach (RBAC) platformy Azure na potrzeby zarządzania kontami | Kontrola dostępu oparta na rolach (RBAC) platformy Azure na potrzeby zarządzania kontami |
Zestawy SDK dla deweloperów | .NET, Java, Python, Node.js | .NET, Java, Python, Node.js, C++, Ruby, PHP, Go, Android, iOS |
Wydajność obciążeń analitycznych | Zoptymalizowana wydajność pod kątem obciążeń analizy równoległej. Wysoka przepływność i liczba operacji we/wy na sekundę. | Zoptymalizowana wydajność pod kątem obciążeń analizy równoległej. |
Limity rozmiaru | Brak ograniczeń dotyczących rozmiarów kont, rozmiarów plików ani liczby plików | Aby uzyskać informacje o określonych limitach, zobacz Cele skalowalności dla kont magazynu w warstwie Standardowa oraz Cele skalowalności i wydajności dla usługi Blob Storage. Większe limity kont są dostępne, kontaktując się z pomocą techniczną platformy Azure |
Nadmiarowość geograficzna | Lokalnie nadmiarowy (wiele kopii danych w jednym regionie świadczenia usługi Azure) | Lokalnie nadmiarowy (LRS), strefowo nadmiarowy (ZRS), globalnie nadmiarowy (GRS), dostęp do odczytu globalnie nadmiarowy (RA-GRS). Więcej informacji można znaleźć tutaj |
Stan usługi | Ogólnie dostępne | Ogólnie dostępne |
Dostępność w regionach | Zobacz tutaj | Dostępne we wszystkich regionach świadczenia usługi Azure |
Cena | Zobacz Cennik | Zobacz Cennik |