Problemas conocidos con Azure Data Lake Storage Gen2

En este artículo se describen las limitaciones y los problemas conocidos de las cuentas que tienen habilitada la característica de espacio de nombres jerárquico.

Nota:

Es posible que algunas de las características descritas en este artículo no se admitan en cuentas que tengan habilitada la compatibilidad con Network File System (NFS) 3.0. Para ver una tabla que muestra el impacto de la compatibilidad con características cuando se habilitan varias funcionalidades, consulte Compatibilidad con características de Blob Storage en cuentas de Azure Storage.

Características de Blob Storage compatibles

Ahora, un número creciente de características de Blob Storage funciona con cuentas que tienen un espacio de nombres jerárquico. Para obtener una lista completa, consulte Características de Blob Storage disponibles en Azure Data Lake Storage Gen2.

Integraciones de servicios de Azure admitidos

Azure Data Lake Storage Gen2 admite varios servicios de Azure que se pueden usar para ingerir datos, realizar análisis y crear representaciones visuales. Para ver una lista de los servicios de Azure admitidos, consulte el documento en que se indica cuáles son los servicios de Azure que admiten Azure Data Lake Storage Gen2.

Para obtener más información, consulte Servicios de Azure que admiten Azure Data Lake Storage Gen2.

Plataformas de código abierto compatibles

Varias plataformas de código abierto son compatibles con Data Lake Storage Gen2. Para ver una lista completa, consulte Plataformas de código abierto que admiten Azure Data Lake Storage Gen2.

Para obtener más información, consulte Plataformas de código abierto que admiten Azure Data Lake Storage Gen2.

API de Blob Storage

Data Lake Storage Gen2, NFS 3.0 y las API de Blob pueden operar en los mismos datos.

En esta sección se describen los problemas y las limitaciones del uso de las API de Blob, de NFS 3.0 y de las API de Data Lake Storage Gen2 para operar en los mismos datos.

  • No puede usar las API de Blob, NFS 3.0 y las API de Data Lake Storage para escribir en la misma instancia de un archivo. Si escribe en un archivo con las API de Data Lake Storage Gen2 o NFS 3.0, los bloques de ese archivo no estarán visibles para las llamadas a la API de blob Get Block List. La única excepción es cuando se está sobrescribiendo. Puede sobrescribir un archivo o blob con la API o NFS 3.0 mediante la opción de truncamiento cero.

    Los blobs creados mediante una operación de Data Lake Storage Gen2, como la operación Ruta de acceso - Crear, no se pueden sobrescribir mediante las operaciones PutBlock o PutBlockList, pero se pueden sobrescribir mediante una operación PutBlob sujeta al tamaño máximo permitido del blob impuesto por la versión de API correspondiente que usa PutBlob.

  • Cuando use la operación List Blobs (Enumerar blobs) sin especificar un delimitador, los resultados incluirán tanto los directorios como los blobs. Si decide usar un delimitador, use solo una barra diagonal (/). Este es el único delimitador admitido.

  • Si usa la API Delete Blob para eliminar un directorio, solo se eliminará si está vacío. Esto significa que no puede utilizar la API de blob para eliminar los directorios de forma recursiva.

Las siguientes API REST de blob no se admiten:

No se admiten discos de máquina virtual no administrados en cuentas que tengan un espacio de nombres jerárquico. Si desea habilitar un espacio de nombres jerárquico en una cuenta de almacenamiento, coloque los discos de máquina virtual no administrados en una cuenta de almacenamiento que no tenga habilitada la característica de espacio de nombres jerárquico.

Compatibilidad con la configuración de listas de control de acceso (ACL) de forma recursiva

La capacidad de aplicar cambios de ACL de forma recursiva desde el directorio principal a los elementos secundarios está disponible con carácter general. En la versión actual de esta funcionalidad, puede aplicar cambios de ACL mediante Azure Storage Explorer, PowerShell, la CLI de Azure y el SDK de .NET, Java y Python. Todavía no está disponible la compatibilidad con Azure Portal.

Listas de control de acceso (ACL) y acceso de lectura anónimo

Si se ha concedido acceso de lectura anónimo a un contenedor, las ACL no tendrán ningún efecto en ese contenedor o los archivos de ese contenedor. Esto solo afecta a las solicitudes de lectura. Las solicitudes de escritura seguirán respetando las ACL. Se recomienda requerir autorización para todas las solicitudes a los datos de blobs.

AzCopy

Use solo la versión más reciente de AzCopy (AzCopy v10). No se admiten versiones anteriores de AzCopy, como AzCopy v8.1.

Explorador de Azure Storage

Use solo las versiones 1.6.0 o superiores.

Explorador de almacenamiento en Azure Portal

En el explorador de almacenamiento que aparece en Azure Portal, no puede acceder a un archivo o carpeta especificando una ruta de acceso. En su lugar, debe examinar las carpetas para acceder a un archivo. Por lo tanto, si una ACL concede a un usuario acceso de lectura a un archivo pero no acceso de lectura a todas las carpetas que conducen al archivo, ese usuario no podrá ver el archivo en el explorador de almacenamiento.

Aplicaciones de terceros

Las aplicaciones de terceros que usan las API REST para funcionar seguirán funcionando si se usan con Data Lake Storage Gen2. Lo más probable es que las aplicaciones que llaman a las API de Blob funcionen.

Controlador Azure Storage Blob para Windows (WASB)

Actualmente, el controlador WASB, que se diseñó para funcionar solo con la API Blob, experimenta problemas en algunos escenarios comunes. En concreto, cuando es un cliente en una cuenta de almacenamiento habilitada para espacios de nombres jerárquicos. El acceso multiprotocolo en Data Lake Storage no mitigará estos problemas.

No se admite el uso del controlador WASB como cliente para una cuenta de almacenamiento habilitada para espacios de nombres jerárquicos. En su lugar, se recomienda que utilice el controlador de Azure Blob File System (ABFS) en su entorno de Hadoop. Si está intentando migrar de un entorno de Hadoop local con una versión anterior a la rama de Hadoop 3, abra una incidencia de soporte técnico de Azure para que podamos ponernos en contacto con usted para indicarle el camino correcto para usted y su organización.

Capacidad de eliminación temporal para blobs

Si se cambia el nombre de los directorios primarios para archivos o directorios eliminados temporalmente, es posible que los elementos eliminados temporalmente no se muestren correctamente en Azure Portal. En esos casos, puede usar PowerShell o la CLI de Azure para enumerar y restaurar los elementos eliminados temporalmente.

Eventos

Si su cuenta dispone de una suscripción a eventos, las operaciones de lectura en el punto de conexión secundario producirán un error. Para resolver este problema, quite las suscripciones a eventos. Además, el uso del punto de conexión de Data Lake Storage (abfss://URI) para las cuentas habilitadas para espacios de nombres no jerárquicos no generará eventos, pero el punto de conexión de blob (wasb:// URI) sí lo hará.

Sugerencia

El acceso de lectura al punto de conexión secundario está disponible solo cuando se habilita el almacenamiento con redundancia geográfica con acceso de lectura (RA-GRS) o el almacenamiento con redundancia de zona geográfica con acceso de lectura (RA-GZRS).