Сравнение Azure Data Lake Store с хранилищем блоб-данных Azure

Завершено

В хранилище BLOB-объектов Azure можно хранить большие объемы неструктурированных ("object") данных в плоском пространстве имен в контейнере BLOB-объектов. Имена BLOB-объектов могут содержать символы "/" для упорядочивания их в виртуальные "папки", но с точки зрения управления BLOB-объектами они хранятся как единый уровень в плоском пространстве имен.

Схема хранилища BLOB-объектов с плоским пространством имен.

Доступ к этим данным можно получить с помощью HTTP или HTTPs

Azure Data Lake Storage 2-го поколения строится на хранилище BLOB-объектов и оптимизирует операции ввода-вывода больших объемов данных с помощью иерархического пространства имен, которое упорядочивает данные BLOB-объектов в каталоги и сохраняет метаданные о каждом каталоге и файлах в нем. Данная структура позволяет выполнять такие операции, как переименование и удаление каталога, в одной атомарной операции. Неструктурированные пространства имен, напротив, требуют выполнения нескольких операций, число которых пропорционально количеству объектов в структуре. Иерархические пространства имен хранят данные в упорядоченном виде, что повышает эффективность хранения и извлечения данных для аналитического варианта использования, а также снижает стоимость анализа.

Схема хранилища BLOB-объектов с иерархическим пространством имен.

Совет

Если вы хотите хранить данные без их анализа, настройте учетную запись хранения как учетную запись хранилища BLOB-объектов Azure, установив для параметра Иерархическое пространство имен значение Отключено. Кроме того, хранилище BLOB-объектов можно использовать для архивации редко используемых данных или для хранения ресурсов веб-сайта, таких как изображения и мультимедиа.

Если вы осуществляете аналитику данных, настройте учетную запись хранения как Azure Data Lake Storage 2-го поколения, установив для параметра Иерархическое пространство имен значение Включено. Так как Azure Data Lake Storage 2-го поколения интегрировано в платформу службы хранилища Azure, приложения могут использовать для доступа к данным API BLOB-объектов или API файловой системы Azure Data Lake Storage 2-го поколения.