Comparación entre Azure Data Lake Storage y Azure Blob Storage

Completado

En Azure Blob Storage se pueden almacenar grandes cantidades de datos no estructurados ("objeto") en un espacio de nombres plano dentro de un contenedor de blobs. Los nombres de blobs pueden incluir caracteres "/" para organizar los blobs en "carpetas" virtuales, pero, para facilitar su administración, los blobs se almacenan como una jerarquía de nivel único en un espacio de nombres plano.

A diagram of a blob store with a flat namespace.

Puede acceder a estos datos usando HTTP o HTTPs.

Azure Data Lake Storage Gen2 se basa en Blob Storage y optimiza la E/S de datos de gran volumen usando un espacio de nombres jerárquico que organiza los datos de los blobs en directorios y almacena metadatos sobre cada directorio y los archivos que contiene. Esta estructura permite que operaciones como las eliminaciones y los cambios de nombre de directorios se realicen en una sola operación atómica. Por el contrario, los espacios de nombres planos requieren varias operaciones proporcionales al número de objetos de la estructura. Los espacios de nombres jerárquicos mantienen los datos organizados, lo que resulta en un mejor rendimiento de almacenamiento y recuperación para un caso de uso de análisis y reduce el costo de análisis.

A diagram of a blob store with a hierarchical namespace.

Sugerencia

Si quiere almacenar datos sin realizar un análisis de ellos, establezca la opción Espacio de nombres jerárquico en Deshabilitado para configurar la cuenta de almacenamiento como una cuenta de Azure Blob Storage. También puede usar Blob Storage para archivar datos que se usan con poca frecuencia o para almacenar recursos de sitios web, como imágenes y elementos multimedia.

Si va a realizar un análisis de los datos, configure la cuenta de almacenamiento como una cuenta de Azure Data Lake Storage Gen2. Para ello, establezca la opción Espacio de nombres jerárquico en Habilitado. Dado que Azure Data Lake Storage Gen2 está integrado en la plataforma Azure Storage, las aplicaciones pueden usar las API de Blob o las API del sistema de archivos de Azure Data Lake Storage Gen2 para acceder a los datos.