Atualizar o Armazenamento de Blobs do Azure com os recursos do Azure Data Lake Storage Gen2

Este artigo ajuda você a habilitar um namespace hierárquico e desbloquear recursos, como segurança em nível de arquivo e diretório e operações mais rápidas. Esses recursos são amplamente usados por cargas de trabalho de análise de big data e são chamados coletivamente de Azure Data Lake Storage Gen2.

Para saber mais sobre esses recursos e avaliar o impacto dessa atualização em cargas de trabalho, aplicativos, custos, integrações de serviços, ferramentas, recursos e documentação, consulte Atualizando o Armazenamento de Blobs do Azure com os recursos do Azure Data Lake Storage Gen2.

Importante

Uma atualização é definitiva. Não há forma de reverter a conta depois de ter feito a atualização. Recomendamos que você valide sua atualização em um ambiente que não seja de produção.

Prepare-se para atualizar

Para se preparar para atualizar sua conta de armazenamento para o Data Lake Storage Gen2:

Rever o suporte a funcionalidades

Sua conta de armazenamento pode estar configurada para usar recursos que ainda não são suportados nas contas habilitadas para o Data Lake Storage Gen2. Se sua conta estiver usando esses recursos, a atualização não passará na etapa de validação. Analise o artigo Suporte ao recurso de Armazenamento de Blob nas contas de Armazenamento do Azure para identificar recursos sem suporte. Se estiver a utilizar essas funcionalidades na sua conta, desative-as antes de iniciar a atualização.

Os seguintes recursos são suportados para contas do Data Lake Storage Gen2, mas não são suportados pelo processo de atualização:

  • Instantâneos de Blob
  • Âmbitos de encriptação
  • Armazenamento imutável
  • Rastreamento do tempo do último acesso para gerenciamento do ciclo de vida
  • Eliminação recuperável para blobs
  • Eliminação recuperável para contentores

Se a sua conta de armazenamento tiver esses recursos ativados, você deverá desativá-los antes de executar a atualização. Se quiser continuar a usar os recursos após a conclusão da atualização, reative-os.

Em alguns casos, você terá que dar tempo para operações de limpeza depois que um recurso for desativado antes da atualização. Um exemplo é o recurso de exclusão suave de blob. Você deve desativar a exclusão suave de blob e, em seguida, permitir que todos os blobs de exclusão suave expirem antes de poder atualizar a conta.

Importante

Não é possível atualizar uma conta de armazenamento para o Data Lake Storage Gen2 que teve o recurso de feed de alterações habilitado. Simplesmente desativar o feed de alterações não permitirá que você execute uma atualização. Em vez disso, você deve criar uma conta com o recurso de namespace hierárquico habilitado nela e mover e transferir seus dados para essa conta.

Verifique se os segmentos de cada caminho de blob estão nomeados

O processo de migração cria um diretório para cada segmento de caminho de um blob. Os diretórios do Data Lake Storage Gen2 devem ter um nome, portanto, para que a migração seja bem-sucedida, cada segmento de caminho em um diretório virtual deve ter um nome. O mesmo requisito é verdadeiro para segmentos que são nomeados apenas com um caractere de espaço. Se quaisquer segmentos de caminho não tiverem nome () ou forem nomeados apenas com um caractere de espaço (//_), antes de prosseguir com a migração, você deverá copiar esses blobs para um novo caminho compatível com esses requisitos de nomenclatura.

Impedir a atividade de gravação na conta de armazenamento

A atualização pode falhar se um aplicativo gravar na conta de armazenamento durante a atualização. Para evitar essa atividade de gravação:

  1. Desative todos os aplicativos ou serviços que possam executar operações de gravação.

  2. Liberar ou quebrar locações existentes em contêineres e blobs na conta de armazenamento.

Após a conclusão da atualização, interrompa as concessões criadas para continuar permitindo acesso de gravação aos contêineres e blobs.

Aviso

Interromper uma concessão ativa sem desabilitar normalmente aplicativos ou máquinas virtuais que estão acessando esses recursos no momento pode ter resultados inesperados. Certifique-se de desativar todas as atividades de gravação atuais antes de quebrar qualquer locação atual.

Executar a atualização

  1. Entre no portal do Azure para começar.

  2. Localize sua conta de armazenamento e exiba a visão geral da conta.

  3. Selecione Migração do Data Lake Gen2.

    A página de configuração Atualizar para uma conta de armazenamento com os recursos do Azure Data Lake Gen2 é exibida.

    Configuration page

  4. Expanda a seção Etapa 1: revisar as alterações da conta antes de atualizar e clique em Revisar e concordar com as alterações.

  5. Na página Rever alterações na conta, selecione a caixa de verificação e, em seguida, clique em Concordar com alterações.

  6. Expanda a seção Etapa 2: Validar conta antes de atualizar e clique em Iniciar validação.

    Se a validação falhar, um erro aparecerá na página. Em alguns casos, um link Exibir erros é exibido. Se esse link aparecer, selecione-o.

    View errors link

    Em seguida, no menu de contexto do arquivo error.json , selecione Download.

    Error json page

    Abra o arquivo baixado para determinar por que a conta não passou na etapa de validação. O JSON a seguir indica que um recurso incompatível está habilitado na conta. Nesse caso, você desativaria o recurso e, em seguida, iniciaria o processo de validação novamente.

    {
     "startTime": "2021-08-04T18:40:31.8465320Z",
     "id": "45c84a6d-6746-4142-8130-5ae9cfe013a0",
     "incompatibleFeatures": [
         "Blob Delete Retention Enabled"
     ],
     "blobValidationErrors": [],
     "scannedBlobCount": 0,
     "invalidBlobCount": 0,
     "endTime": "2021-08-04T18:40:34.9371480Z"
    }
    
  7. Depois que sua conta for validada com êxito, expanda a seção Etapa 3: Atualizar conta e clique em Iniciar atualização.

    Importante

    As operações de gravação são desativadas enquanto sua conta está sendo atualizada. As operações de leitura não estão desativadas, mas é altamente recomendável que você suspenda as operações de leitura, pois elas podem desestabilizar o processo de atualização.

    Quando a migração for concluída com êxito, será exibida uma mensagem semelhante à seguinte.

    Migration completed page

Parar a atualização

Você pode interromper a migração antes que ela seja concluída.

Para interromper a atualização antes que ela seja concluída, selecione Cancelar atualização enquanto a atualização estiver em andamento.

Cancel upgrade

Migrar dados, cargas de trabalho e aplicativos

  1. Configure serviços em suas cargas de trabalho para apontar para o ponto de extremidade do serviço Blob ou para o ponto de extremidade de armazenamento do Data Lake.

    Account endpoints

  2. Para cargas de trabalho Hadoop que usam o driver de Blob de Armazenamento do Windows Azure ou o driver WASB, certifique-se de modificá-las para usar o driver do Sistema de Arquivos de Blob do Azure (ABFS). Ao contrário do driver WASB que faz solicitações para o ponto de extremidade do serviço Blob, o driver ABFS fará solicitações para o ponto de extremidade do Armazenamento Data Lake da sua conta.

  3. Teste aplicativos personalizados para garantir que eles funcionem conforme o esperado com sua conta atualizada.

    O acesso multiprotocolo no Data Lake Storage permite que a maioria dos aplicativos continue usando APIs de Blob sem modificações. Se você encontrar problemas ou quiser usar APIs para trabalhar com operações de diretório e ACLs, considere mover parte do seu código para usar APIs do Data Lake Storage Gen2. Consulte os guias para .NET, Java, Python, Node.js e REST.

  4. Teste todos os scripts personalizados para garantir que eles funcionem conforme o esperado com sua conta atualizada.

    Como é o caso das APIs de Blob, muitos dos seus scripts provavelmente funcionarão sem exigir que você os modifique. No entanto, se necessário, você pode atualizar arquivos de script para usar cmdlets do PowerShell do Data Lake Storage Gen2 e comandos da CLI do Azure.

Consulte também

Introdução ao armazenamento do Azure Data Lake Gen2