Explorar o Azure DataLake Storage Gen2

Concluído

O Azure Data Lake Store (Gen1) é um serviço separado de armazenamento de dados hierárquicos para data lakes analíticos, geralmente usado pelas chamadas soluções analíticas de big data que funcionam com dados estruturados, semiestruturados e não estruturados armazenados em arquivos. O Azure Data Lake Storage Gen2 é uma versão mais recente desse serviço integrado ao Armazenamento do Azure, o que permite que você aproveite a escalabilidade do armazenamento de blobs e o controle de custos das camadas de armazenamento. Isso tudo combinado com os recursos do sistema de arquivos hierárquicos e a compatibilidade com os principais sistemas de análise do Azure Data Lake Store.

An Azure blob storage container with a hierarchical namespace

Sistemas como o Hadoop no Azure HDInsight, Azure Databricks e Azure Synapse Analytics podem montar uma rede de arquivos distribuídos hospedada no Azure Data Lake Store Gen2 e usá-lo para processar grandes volumes de dados.

Para criar um sistema de arquivos do Azure Data Lake Store Gen2, você deve habilitar a opção Namespace Hierárquico de uma conta de armazenamento do Azure. Você pode fazer isso ao criar inicialmente a conta de armazenamento, ou pode atualizar uma conta de armazenamento do Azure existente para dar suporte ao Data Lake Gen2. No entanto, esteja ciente de que a atualização é um processo unidirecional – depois de atualizar uma conta de armazenamento para dar suporte a um namespace hierárquico para armazenamento de blobs, você não pode revertê-lo para um namespace simples.