Compartilhar via


Tutorial: Usar o serviço de cópia de dados para copiar dados para o Azure Data Box

Este tutorial descreve como ingerir dados usando o serviço de cópia de dados sem um host intermediário. O serviço de cópia de dados é executado localmente no Azure Data Box, conecta-se ao dispositivo de armazenamento anexado à rede (NAS) por meio do protocolo SMB e copia dados para o Data Box.

Use o serviço de cópia de dados:

  • Em ambientes NAS, nos quais os hosts intermediários podem não estar disponíveis.
  • Com arquivos pequenos que levam semanas para a ingestão e para o upload dos dados. O serviço de cópia de dados melhora consideravelmente o tempo de ingestão e upload de arquivos pequenos.

Observação

Não há suporte para a compatibilidade do serviço de cópia com dispositivos NAS não Windows.

Neste tutorial, você aprenderá a:

  • Copiar dados para caixa de dados

Pré-requisitos

Antes de começar este tutorial:

  1. Conclua o tutorial Configurar o Azure Data Box.
  2. Certifique-se de que seu dispositivo Data Box foi entregue e que o status do pedido no portal é Entregue.
  3. Certifique-se de ter as credenciais do dispositivo NAS que contém os dados de origem.
  4. Certifique-se de estar conectado a uma rede de alta velocidade. Recomendamos expressamente que você tenha, pelo menos, uma conexão de 10 GbE (Gigabits Ethernet). Você poderá usar um link de dados de 1 GbE se uma conexão de 10 GbE não estiver disponível, mas a velocidade de cópia for afetada.

Copiar dados para caixa de dados

Depois que você estiver conectado ao dispositivo NAS, a próxima etapa será copiar os dados.

Importante

Para evitar a possibilidade de corrupção ou perda de dados, siga as práticas recomendadas:

  • Antes de iniciar as operações de cópia de dados, certifique-se de que o tamanho dos dados está em conformidade com os limites de tamanho descritos no artigo Armazenamento do Azure e limites da Caixa de Dados.
  • Certifique-se de que os dados não sejam carregados no Data Box por outros aplicativos fora do Data Box. Operações simultâneas de cópia de dados podem resultar em falhas no trabalho de upload e corrupção de dados.
  • Certifique-se de que os dados de origem não estejam sendo modificados durante a leitura pelo serviço de cópia de dados. A modificação de dados durante operações de cópia pode causar falhas ou corrupção de dados.
  • Certifique-se de manter uma cópia dos dados de origem até que o processo de transferência do Data Box seja concluído e seus dados estejam acessíveis no Armazenamento do Microsoft Azure.

Para copiar dados usando o serviço de cópia de dados, é necessário criar um trabalho:

  1. Na UI web local do seu dispositivo Data Box, selecione Gerenciar>Copiar dados.

  2. Na página Copiar dados, selecione Criar.

    Captura de tela da página Copiar dados destacando a localização do botão Criar.

  3. Na caixa de diálogo Configurar trabalho e iniciar, preencha os seguintes campos:

    Campo Valor
    Nome do trabalho Um único nome com menos de 230 caracteres para o trabalho. Estes caracteres não são permitidos no nome do trabalho: <, >, |, ?, *, \, :, / e \.
    Localização de origem Forneça o caminho do SMB para a fonte de dados no formato: \\<ServerIPAddress>\<ShareName> ou \\<ServerName>\<ShareName>.
    Nome de usuário Nome de usuário no formato \\<DomainName><UserName> para acessar a fonte de dados. Os administradores locais exigem permissões de segurança explícitas. Clique com o botão direito na pasta, selecione Propriedades e selecione Segurança para adicionar o administrador local na guia Segurança.
    Senha A senha para acessar a fonte de dados.
    Conta de armazenamento de destino Selecione na lista a conta de armazenamento de destino na qual os dados serão carregados.
    Tipo de destino Selecione o tipo de armazenamento de destino na lista: Blob de Blocos, Blob de Páginas ou Arquivos do Azure ou Blob de Blocos (Arquivos).
    Contêiner/compartilhamento de destino Insira o nome do contêiner ou do compartilhamento no qual deseja carregar os dados em sua conta de armazenamento de destino. O nome pode ser um nome do compartilhamento ou um nome de contêiner. Por exemplo, use myshare ou mycontainer. Insira também o nome no formato sharename\directory_name ou containername\virtual_directory_name.
    Copiar arquivos que correspondem a um padrão Você pode inserir o nome do arquivo que corresponde a um padrão das duas seguintes maneiras:
    • Usar expressões curinga: Há suporte apenas para * e ? em expressões curinga. Por exemplo, a expressão *.vhd corresponde a todos os arquivos que têm a extensão .vhd. Da mesma forma, *.dl? corresponde a todos os arquivos com a extensão .dl ou que começam com .dl, como .dll. Da mesma forma, *foo corresponde a todos os arquivos cujos nomes terminam com foo.
      É possível inserir a expressão curinga diretamente no campo. Por padrão, o valor inserido no campo é tratado como uma expressão curinga.
    • Usar expressões regulares: Há suporte para expressões regulares baseadas em POSIX. Por exemplo, a expressão regular .*\.vhd corresponde a todos os arquivos que possuem a extensão .vhd. Para expressões regulares, forneça o <pattern> diretamente como regex(<pattern>). Para obter mais informações sobre expressões regulares, acesse Linguagem de expressões regulares – referência rápida.
      Otimização de arquivo Quando esse recurso é habilitado, os arquivos menores que 1 MB são empacotados durante a ingestão. Esse empacotamento agiliza a cópia de dados para arquivos pequenos. Ele também economiza uma quantidade de tempo significativa quando o número de arquivos é muito maior do que o número de diretórios.
      Se você usar a otimização de arquivo:
      • Depois de executar preparar para envio, você pode fazer download de um arquivo de lista de materiais (BOM), que lista os nomes dos arquivos originais, para ajudá-lo a garantir que todos os arquivos corretos sejam copiados.
      • Não exclua os arquivos compactados, cujos nomes de arquivo começam com ADB_PACK_. Se você excluir um arquivo empacotado, o arquivo original não será carregado durante cópias de dados futuras.
      • Não copie os mesmos arquivos que você copia com o Serviço de Cópia por meio de outros protocolos, como SMB, NFS ou API REST. O uso de protocolos diferentes pode resultar em conflitos e falhas durante uploads de dados.
      • A otimização de arquivos não tem suporte para Arquivos do Azure. Para ver quais carimbos de data/hora, atributos de arquivo e listas de controle de acesso (ACLs) são copiados para uma tarefa de cópia de dados não otimizada, consulte o artigo metadados transferidos.
    • Selecione Iniciar. As entradas são validadas e, se a validação é bem-sucedida, o trabalho é iniciado. Poderá levar alguns minutos para o trabalho ser iniciado.

      Captura de tela mostrando a localização do botão Iniciar na caixa de diálogo

    • É criado um trabalho com as configurações especificadas. Você pode pausar, retomar, cancelar ou reiniciar um trabalho. Marque a caixa de seleção ao lado do nome do trabalho e, em seguida, selecione o botão apropriado.

      Captura de tela da página Copiar dados destacando o local da caixa de seleção usada para selecionar um trabalho de cópia.

      • Você pode pausar um trabalho se ele está afetando os recursos do dispositivo NAS durante o horário de pico:

        Captura de tela da página Copiar dados destacando a localização do botão Pausar.

        Você pode retomar o trabalho fora dos horários de pico:

        Captura de tela da página Copiar dados destacando a localização do botão Continuar.

      • Você pode cancelar um trabalho a qualquer momento:

        Captura de tela da página Copiar dados destacando a localização do botão Cancelar. Cancelar um trabalho na página “Copiar dados”

        Quando você cancela um trabalho, uma confirmação é necessária:

        Captura de tela da mensagem de diálogo “Confirmar cancelamento”.

        O cancelamento de um trabalho de cópia não exclui nenhum dado já copiado para o dispositivo durante um trabalho. Para excluir dados já copiados para seu dispositivo Data Box, reinicie o dispositivo.

        Captura de tela da página Redefinir dispositivo, usada para excluir todos os dados do dispositivo.

        Observação

        Se você cancelar ou pausar um trabalho, os arquivos grandes poderão ser apenas parcialmente copiados. Esses arquivos parcialmente copiados são carregados no mesmo estado para o Azure. Ao cancelar ou pausar um trabalho, verifique se os arquivos foram copiados corretamente. Para validar os arquivos, examine os compartilhamentos SMB ou baixe o arquivo BOM.

      • Você pode reiniciar um trabalho com falha resultante de um erro transitório, como uma falha na rede. No entanto, um trabalho não pode ser reiniciado depois de atingir um status de terminal, como Bem-sucedido ou Concluído com erros. Erros resultantes de problemas de nomenclatura ou tamanho de arquivo são registrados, mas o trabalho não pode ser reiniciado após a conclusão.

        Captura de tela da página Copiar dados destacando a localização do botão Reiniciar.

        Se ocorrer uma falha e não conseguir reiniciar o trabalho, baixe os logs de erros e localize a falha subjacente. Após corrigir o problema, crie um novo trabalho para copiar os arquivos. Alternativamente, você também pode copiar os arquivos via SMB.

      • A versão atual não oferece suporte à exclusão de trabalhos.

      • Você pode criar trabalhos ilimitados, mas só pode executar um máximo de 10 trabalhos em paralelo por vez.

      • Se a Otimização de arquivo estiver ativada, os arquivos pequenos serão compactados na ingestão e descompactados durante o upload para melhorar o desempenho da cópia. Esses arquivos compactados são nomeados usando um GUID. Não exclua arquivos compactados.

    • Os seguintes dados são apresentados na página Copiar dados enquanto o trabalho está em andamento:

      • A coluna Status exibe o status do trabalho de cópia. Os status válidos incluem:
        • Executando
        • Com falha
        • Êxito
        • Pausando
        • Em pausa
        • Cancelando
        • Cancelado
        • Concluído com erros
      • A coluna Arquivos exibe o número e o tamanho total dos arquivos que estão sendo copiados.
      • A coluna Processado exibe o número e o tamanho total dos arquivos que são processados.
      • A coluna Detalhes do trabalho fornece um link para visualizar detalhes do trabalho.
      • A coluna # Erros exibe o número de erros encontrados durante o processo de cópia. Para baixar os logs de erros para solução de problemas, selecione o link na coluna Log de erros correspondente.

    Aguarde a conclusão do trabalho de cópia. Como alguns erros são registrados apenas na página Conectar e copiar, certifique-se de que o trabalho de cópia esteja concluído e não relate nenhum erro antes de avançar para a próxima etapa.

    Captura de tela da página

    Para garantir a integridade dos dados, uma soma de verificação é computada embutida à medida que os dados são copiados. Depois que a cópia for concluída, selecione Exibir painel para verificar o espaço usado e o espaço livre no dispositivo.

    Captura de tela da página do Painel mostrando a quantidade de espaço livre e usado.

    Após a conclusão do trabalho de cópia, você poderá selecionar Preparar para o envio.

    Observação

    A Preparação para o envio não poderá ser executada enquanto os trabalhos de cópia estiverem em andamento.

    Próximas etapas

    Avance para o próximo tutorial para saber como enviar o dispositivo Data Box novamente à Microsoft.