Exploration d’Azure Data Lake Storage Gen2

Effectué

Azure Data Lake Store (Gen1) est un service distinct pour le stockage de données hiérarchique pour les lacs de données analytiques, souvent utilisé par les solutions d’analyse Big Data qui fonctionnent avec des données structurées, semi-structurées et non structurées stockées dans des fichiers. Azure Data Lake Storage Gen2 est une version plus récente de ce service, qui est intégrée au Stockage Azure, ce qui vous permet de tirer parti de l’extensibilité du stockage d’objets BLOB et du contrôle des coûts des niveaux de stockage, associés aux fonctionnalités de système de fichiers hiérarchiques et à la compatibilité avec les principaux systèmes d’analyse d’Azure Data Lake Store.

An Azure blob storage container with a hierarchical namespace

Les systèmes comme Hadoop dans Azure HDInsight, Azure Databricks et Azure Synapse Analytics peuvent monter un système de fichiers distribués hébergé dans Azure Data Lake Store Gen2 et l’utiliser pour traiter d’énormes volumes de données.

Pour créer un système de fichiers Azure Data Lake Store Gen2, vous devez activer l’option d’espace de noms hiérarchique d’un compte Stockage Azure. Vous pouvez effectuer cette opération lors de la création initiale du compte de stockage, ou vous pouvez mettre à niveau un compte Stockage Azure existant pour prendre en charge Data Lake Gen2. Veuillez noter que la mise à niveau est un processus unidirectionnel : après la mise à niveau d’un compte de stockage pour prendre en charge un espace de noms hiérarchique pour le stockage d’objets BLOB, vous ne pouvez pas le restaurer en tant qu’espace de noms plat.