Problèmes connus avec Azure Data Lake Storage Gen2
Cet article décrit les limitations et les problèmes connus liés aux comptes pour lesquels la fonctionnalité d’espace de noms hiérarchique est activée.
Notes
Certaines des fonctionnalités décrites dans cet article peuvent ne pas être prises en charge dans les comptes pour lesquels la prise en charge du Système de fichiers réseau (NFS) 3.0 est activée. Pour afficher un tableau qui indique l’impact de la prise en charge des fonctionnalités lorsque différentes fonctionnalités sont activées, consultez prise en charge des fonctionnalités de stockage d’objets Blob dans les comptes de stockage Azure.
Fonctionnalités du stockage Blob prises en charge
Les comptes ayant un espace de noms hiérarchique prennent en charge un nombre croissant de fonctionnalités de stockage Blob. Pour en obtenir la liste complète, consultez Fonctionnalités de stockage blob disponibles dans Azure Data Lake Storage Gen2.
Intégrations de service Azure prises en charge
Azure Data Lake Storage Gen2 prend en charge plusieurs services Azure permettant d’ingérer des données, d’obtenir des données d’analytique et de créer des représentations visuelles. Pour obtenir la liste des services Azure pris en charge, consultez Services Azure prenant en charge Azure Data Lake Storage Gen2.
Pour plus d’informations, consultez les Services Azure prenant en charge Azure Data Lake Storage Gen2.
Plateformes open source prises en charge
Plusieurs plateformes open source prennent en charge le stockage Data Lake Gen2. Pour obtenir une liste complète, consultez Plateformes open source prenant en charge Azure Data Lake Storage Gen2.
Pour plus d’informations, consultez plateformes Open source prenant en charge Azure Data Lake Storage Gen2.
API Stockage Blob
Les API Data Lake Storage Gen2, NFS 3.0 et les API d’objets Blob peuvent utiliser les mêmes données.
Cette section décrit les problèmes et les limitations liés à l’utilisation des API d’objets Blob, de NFS 3.0 et des API Data Lake Storage Gen 2 pour fonctionner sur les mêmes données.
Vous ne pouvez pas utiliser les API d’objet Blob, NFS 3.0 et les API Data Lake Storage pour écrire dans la même instance d’un fichier. Si vous écrivez dans un fichier à l’aide des API Data Lake Storage Gen2 ou de NFS 3.0, les blocs de ce fichier ne seront pas visibles pour les appels vers l’API d’objets blob Obtenir la liste rouge. La seule exception est quand vous effectuez un remplacement. Vous pouvez remplacer un fichier/objet blob à l’aide de l’API ou de NFS 3.0 en utilisant l’option de troncation zéro.
Les objets blob créés à l’aide d’une opération Data Lake Storage Gen2, telle qu’une opération Chemin d’accès – Créer, ne peuvent pas être remplacés à l’aide d’opérations PutBlock ou PutBlockList, mais plutôt à l’aide d’une opération PutBlob soumise à la taille maximale autorisée d’objets blob, imposée par la version d’API correspondante utilisée par PutBlob.
Quand vous utilisez l’opération Lister les objets Blob sans spécifier de délimiteur, les résultats incluent à la fois des répertoires et des objets Blob. Si vous choisissez d’utiliser un délimiteur, n’utilisez qu’une barre oblique (
/
). Il s’agit du seul délimiteur pris en charge.Si vous utilisez l’API Supprimer un objet Blob pour supprimer un répertoire, ce répertoire est supprimé seulement s’il est vide. Cela signifie que vous ne pouvez pas utiliser les répertoires de suppression de l’API d’objet BLOB de manière récursive.
Ces API REST BLOB ne sont pas prises en charge :
- Placer BLOB (Page)
- Put Page
- Obtenir les portées de page
- Copie incrémentielle BLOB
- Placer la page à partir de l’URL
Les disques de machine virtuelle non managés ne sont pas pris en charge dans les comptes qui ont un espace de noms hiérarchique. Si vous souhaitez activer un espace de noms hiérarchique sur un compte de stockage, placez les disques de machine virtuelle non gérés dans un compte de stockage pour lequel la fonctionnalité espace de noms hiérarchique n’est pas activée.
Prise en charge de la définition de listes de contrôle d’accès (ACL) de manière récursive
La possibilité d’appliquer les modifications aux listes ACL de manière récursive du répertoire parent vers les éléments enfants est mise à la disposition générale. Dans la version actuelle de cette fonctionnalité, vous pouvez appliquer des modifications à la liste de contrôle d'accès à l’aide de l’Explorateur Stockage Azure, PowerShell, Azure CLI, et du Kit de développement logiciel (SDK) .NET, Java et Python. La prise en charge n’est pas encore disponible pour le portail Azure.
Listes de contrôle d’accès (ACL) et accès en lecture anonyme
Si l’accès en lecture anonyme a été accordé à un conteneur, les listes de contrôle d’accès n’ont aucun effet sur ce conteneur ou les fichiers de ce conteneur. Cela affecte uniquement les demandes de lecture. Les demandes d’écriture continuent de respecter les listes de contrôle d’accès. Nous vous recommandons d’exiger une autorisation pour toutes les demandes de données blob.
AzCopy
Utilisez uniquement la dernière version d’AzCopy (AzCopy v10). Les versions antérieures d’AzCopy, comme AzCopy v8.1, ne sont pas prises en charge.
Explorateur de stockage Azure
Utilisez uniquement les versions 1.6.0
ou ultérieures.
Navigateur de stockage dans le portail Azure
Dans le navigateur de stockage qui apparaît dans le portail Azure, vous ne pouvez pas accéder à un fichier ou dossier en spécifiant un chemin. Vous devez plutôt parcourir les dossiers pour atteindre un fichier. Par conséquent, si une liste de contrôle d’accès accorde à un utilisateur un accès en lecture à un fichier, mais pas à tous les dossiers menant à ce fichier, cet utilisateur ne pourra pas afficher le fichier dans le navigateur de stockage.
Applications tierces
Les applications tierces qui utilisent l’API REST continueront à fonctionner si vous les utilisez avec Data Lake Storage Gen2. Les applications qui appellent des API Blob ont de grandes chances de fonctionner.
Pilote Windows Azure Storage Blob (WASB)
Actuellement, le pilote WASB, qui a été conçu pour fonctionner avec l’API Blob uniquement, rencontre des problèmes dans quelques scénarios courants. C’est le cas en particulier quand il s’agit d’un client pour un compte de stockage activé pour un espace de noms hiérarchique. L’accès multiprotocole sur Data Lake Storage n’atténue pas ces problèmes.
L’utilisation du pilote WASB comme client pour un compte de stockage activé pour un espace de noms hiérarchique n’est pas prise en charge. Nous vous recommandons plutôt d’utiliser le pilote Azure Blob File System (ABFS) dans votre environnement Hadoop. Si vous tentez d’effectuer une migration à partir d’un environnement Hadoop local avec une version antérieure à Hadoop Branch-3, ouvrez un ticket de support Azure pour que nous puissions vous contacter et vous indiquer la bonne procédure pour vous et votre organisation.
Suppression réversible pour les fonctionnalités blob
Si les répertoires parents des fichiers ou répertoires supprimés de manière conditionnelle sont renommés, les éléments supprimés de manière conditionnelle peuvent ne pas s’afficher correctement dans le portail Azure. Dans ce cas, vous pouvez utiliser PowerShell ou Azure CLI pour restaurer les éléments supprimés de manière conditionnelle.
Événements
Si votre compte dispose d’un abonnement aux événements, les opérations de lecture sur le point de terminaison secondaire provoqueront une erreur. Pour résoudre ce problème, supprimez les abonnements aux événements. L’utilisation du point de terminaison Data Lake Storage (abfss://URI) pour des comptes non activés pour les espaces de noms hiérarchiques ne va pas générer d’événements, mais le point de terminaison d’objet blob (wasb:// URI) va générer des événements.
Conseil
L’accès en lecture au point de terminaison secondaire est disponible uniquement lorsque vous activez le stockage géo-redondant avec accès en lecture (RA-GRS) ou le stockage géo-redondant avec accès en lecture (RA-GZRS).