Transferir dados com o AzCopy v7 no Linux
o AzCopy é um utilitário da linha de comandos concebido para copiar dados de/para o Armazenamento de Blobs e Ficheiros do Microsoft Azure através de comandos simples com um desempenho ideal. Pode copiar dados entre um sistema de ficheiros e uma conta de armazenamento ou entre contas de armazenamento.
Importante
Este artigo descreve uma versão mais antiga do AzCopy. Para instalar a versão mais recente do AzCopy, consulte AzCopy v10.
Nota
A partir da versão AzCopy 7.2, as dependências do .NET Core são empacotadas com o pacote AzCopy. Se você usar a versão 7.2 ou posterior, não precisará mais instalar o .NET Core como pré-requisito.
Nota
Talvez seja necessário instalar as dependências do .NET Core 2.1 destacadas neste artigo de pré-requisitos do .NET Core, dependendo da sua distribuição.
Para distribuições RHEL 7, instale as dependências ICU e libunwind: yum install -y libunwind icu
Instalar o AzCopy no Linux (v7.2 ou posterior) é tão fácil quanto extrair um pacote tar e executar o script de instalação.
Distribuições baseadas em RHEL 6: link para download
wget -O azcopy.tar.gz https://aka.ms/downloadazcopylinuxrhel6
tar -xf azcopy.tar.gz
sudo ./install.sh
Todas as outras distribuições Linux: link para download
wget -O azcopy.tar.gz https://aka.ms/downloadazcopylinux64
tar -xf azcopy.tar.gz
sudo ./install.sh
Você pode remover os arquivos extraídos assim que o AzCopy no Linux estiver instalado. Como alternativa, se você não tiver privilégios de superusuário, também poderá executar azcopy
usando o shell script azcopy na pasta extraída.
Ubuntu 14.04
Adicione o código fonte apt para o repositório de produtos Microsoft Linux e instale o AzCopy:
sudo echo "deb [arch=amd64] https://packages.microsoft.com/repos/microsoft-ubuntu-trusty-prod/ trusty main" > azure.list
sudo cp ./azure.list /etc/apt/sources.list.d/
sudo apt-key adv --keyserver packages.microsoft.com --recv-keys EB3E94ADBE1229CF
sudo apt-get update
sudo apt-get install azcopy
Ubuntu 16.04
Adicione o código fonte apt para o repositório de produtos Microsoft Linux e instale o AzCopy:
echo "deb [arch=amd64] https://packages.microsoft.com/repos/microsoft-ubuntu-xenial-prod/ xenial main" > azure.list
sudo cp ./azure.list /etc/apt/sources.list.d/
sudo apt-key adv --keyserver packages.microsoft.com --recv-keys EB3E94ADBE1229CF
sudo apt-get update
sudo apt-get install azcopy
A sintaxe básica para comandos AzCopy é:
azcopy --source <source> --destination <destination> [Options]
Os exemplos a seguir demonstram vários cenários para copiar dados de e para Blobs e Arquivos do Microsoft Azure. Consulte o azcopy --help
menu para obter uma explicação detalhada dos parâmetros usados em cada amostra.
azcopy \
--source https://myaccount.blob.core.windows.net/mycontainer/abc.txt \
--destination /mnt/myfiles/abc.txt \
--source-key <key>
Se a pasta /mnt/myfiles
não existir, o AzCopy cria-a e transfere-a abc.txt
para a nova pasta.
azcopy \
--source https://myaccount-secondary.blob.core.windows.net/mynewcontainer/abc.txt \
--destination /mnt/myfiles/abc.txt \
--source-key <key>
Observe que você deve ter o armazenamento com redundância geográfica de acesso de leitura habilitado.
azcopy \
--source https://myaccount.blob.core.windows.net/mycontainer \
--destination /mnt/myfiles \
--source-key <key> \
--recursive
Suponha que os seguintes blobs residam no contêiner especificado:
abc.txt
abc1.txt
abc2.txt
vd1/a.txt
vd1/abcd.txt
Após a operação de download, o diretório /mnt/myfiles
inclui os seguintes arquivos:
/mnt/myfiles/abc.txt
/mnt/myfiles/abc1.txt
/mnt/myfiles/abc2.txt
/mnt/myfiles/vd1/a.txt
/mnt/myfiles/vd1/abcd.txt
Se você não especificar a opção --recursive
, nenhum blob será baixado.
azcopy \
--source https://myaccount.blob.core.windows.net/mycontainer \
--destination /mnt/myfiles \
--source-key <key> \
--include "a" \
--recursive
Suponha que os blobs a seguir residam no contêiner especificado. Todos os blobs que começam com o prefixo a
são baixados.
abc.txt
abc1.txt
abc2.txt
xyz.txt
vd1\a.txt
vd1\abcd.txt
Após a operação de download, a pasta /mnt/myfiles
inclui os seguintes arquivos:
/mnt/myfiles/abc.txt
/mnt/myfiles/abc1.txt
/mnt/myfiles/abc2.txt
O prefixo se aplica ao diretório virtual, que forma a primeira parte do nome do blob. No exemplo mostrado acima, o diretório virtual não corresponde ao prefixo especificado, portanto, nenhum blob é baixado. Além disso, se a opção --recursive
não for especificada, o AzCopy não baixará nenhum blobs.
azcopy \
--source https://myaccount.blob.core.windows.net/mycontainer \
--destination "/mnt/myfiles" \
--source-key <key> \
--preserve-last-modified-time
Você também pode excluir blobs da operação de download com base em seu tempo de última modificação. Por exemplo, se você quiser excluir blobs cuja hora da última modificação seja igual ou mais recente que o arquivo de destino, adicione a --exclude-newer
opção:
azcopy \
--source https://myaccount.blob.core.windows.net/mycontainer \
--destination /mnt/myfiles \
--source-key <key> \
--preserve-last-modified-time \
--exclude-newer
Ou se você quiser excluir blobs cuja hora da última modificação seja igual ou mais antiga que o arquivo de destino, adicione a --exclude-older
opção:
azcopy \
--source https://myaccount.blob.core.windows.net/mycontainer \
--destination /mnt/myfiles \
--source-key <key> \
--preserve-last-modified-time \
--exclude-older
azcopy \
--source /mnt/myfiles/abc.txt \
--destination https://myaccount.blob.core.windows.net/mycontainer/abc.txt \
--dest-key <key>
Se o contentor de destino especificado não existir, o AzCopy cria-o e carrega o ficheiro para o mesmo.
azcopy \
--source /mnt/myfiles/abc.txt \
--destination https://myaccount.blob.core.windows.net/mycontainer/vd/abc.txt \
--dest-key <key>
Se o diretório virtual especificado não existir, o AzCopy carregará o arquivo para incluir o diretório virtual no nome do blob (por exemplo, vd/abc.txt
no exemplo acima).
gzip myarchive.tar -c | azcopy \
--destination https://myaccount.blob.core.windows.net/mycontainer/mydir/myarchive.tar.gz \
--dest-key <key>
azcopy \
--source /mnt/myfiles \
--destination https://myaccount.blob.core.windows.net/mycontainer \
--dest-key <key> \
--recursive
A opção --recursive
de especificação carrega o conteúdo do diretório especificado para o armazenamento de Blob recursivamente, o que significa que todas as subpastas e seus arquivos também são carregados. Por exemplo, suponha que os seguintes arquivos residam na pasta /mnt/myfiles
:
/mnt/myfiles/abc.txt
/mnt/myfiles/abc1.txt
/mnt/myfiles/abc2.txt
/mnt/myfiles/subfolder/a.txt
/mnt/myfiles/subfolder/abcd.txt
Após a operação de carregamento, o contêiner inclui os seguintes arquivos:
abc.txt
abc1.txt
abc2.txt
subfolder/a.txt
subfolder/abcd.txt
Quando a opção --recursive
não é especificada, apenas os três arquivos a seguir são carregados:
abc.txt
abc1.txt
abc2.txt
azcopy \
--source /mnt/myfiles \
--destination https://myaccount.blob.core.windows.net/mycontainer \
--dest-key <key> \
--include "a*" \
--recursive
Suponha que os seguintes arquivos residam na pasta /mnt/myfiles
:
/mnt/myfiles/abc.txt
/mnt/myfiles/abc1.txt
/mnt/myfiles/abc2.txt
/mnt/myfiles/xyz.txt
/mnt/myfiles/subfolder/a.txt
/mnt/myfiles/subfolder/abcd.txt
Após a operação de carregamento, o contêiner inclui os seguintes arquivos:
abc.txt
abc1.txt
abc2.txt
subfolder/a.txt
subfolder/abcd.txt
Quando a opção --recursive
não é especificada, AzCopy ignora arquivos que estão em subdiretórios:
abc.txt
abc1.txt
abc2.txt
Por padrão, AzCopy define o tipo de conteúdo de um blob de destino como application/octet-stream
. No entanto, você pode especificar explicitamente o tipo de conteúdo por meio da opção --set-content-type [content-type]
. Essa sintaxe define o tipo de conteúdo para todos os blobs em uma operação de carregamento.
azcopy \
--source /mnt/myfiles \
--destination https://myaccount.blob.core.windows.net/myContainer/ \
--dest-key <key> \
--include "ab" \
--set-content-type "video/mp4"
Se a opção --set-content-type
for especificada sem um valor, o AzCopy definirá cada blob ou tipo de conteúdo do arquivo de acordo com sua extensão de arquivo.
azcopy \
--source /mnt/myfiles \
--destination https://myaccount.blob.core.windows.net/myContainer/ \
--dest-key <key> \
--include "ab" \
--set-content-type
AzCopy usa um arquivo de configuração que contém um mapeamento de extensão de arquivo para o tipo de conteúdo. Você pode personalizar esse mapeamento e adicionar novos pares conforme necessário. O mapeamento está localizado em /usr/lib/azcopy/AzCopyConfig.json
azcopy \
--source https://myaccount.blob.core.windows.net/mycontainer1/abc.txt \
--destination https://myaccount.blob.core.windows.net/mycontainer2/abc.txt \
--source-key <key> \
--dest-key <key>
Quando você copia um blob sem a opção --sync-copy, uma operação de cópia do lado do servidor é executada.
azcopy \
--source https://sourceaccount.blob.core.windows.net/mycontainer1/abc.txt \
--destination https://destaccount.blob.core.windows.net/mycontainer2/abc.txt \
--source-key <key1> \
--dest-key <key2>
Quando você copia um blob sem a opção --sync-copy, uma operação de cópia do lado do servidor é executada.
azcopy \
--source https://myaccount1-secondary.blob.core.windows.net/mynewcontainer1/abc.txt \
--destination https://myaccount2.blob.core.windows.net/mynewcontainer2/abc.txt \
--source-key <key1> \
--dest-key <key2>
Observe que você deve ter o armazenamento com redundância geográfica de acesso de leitura habilitado.
azcopy \
--source https://sourceaccount.blob.core.windows.net/mycontainer1/ \
--destination https://destaccount.blob.core.windows.net/mycontainer2/ \
--source-key <key1> \
--dest-key <key2> \
--include "abc.txt" \
--include-snapshot
Após a operação de cópia, o contêiner de destino inclui o blob e seus instantâneos. O contêiner inclui o seguinte blob e seus instantâneos:
abc.txt
abc (2013-02-25 080757).txt
abc (2014-02-21 150331).txt
Por padrão, o AzCopy copia dados entre dois pontos de extremidade de armazenamento de forma assíncrona. Portanto, a operação de cópia é executada em segundo plano usando capacidade de largura de banda sobressalente que não tem SLA em termos de velocidade com que um blob é copiado.
A --sync-copy
opção garante que a operação de cópia obtenha uma velocidade consistente. O AzCopy executa a cópia síncrona baixando os blobs para copiar da origem especificada para a memória local e, em seguida, carregando-os para o destino de armazenamento de Blob.
azcopy \
--source https://myaccount1.blob.core.windows.net/myContainer/ \
--destination https://myaccount2.blob.core.windows.net/myContainer/ \
--source-key <key1> \
--dest-key <key2> \
--include "ab" \
--sync-copy
--sync-copy
pode gerar custo de saída adicional em comparação com a cópia assíncrona. A abordagem recomendada é usar essa opção em uma VM do Azure, que está na mesma região da sua conta de armazenamento de origem para evitar custos de saída.
azcopy \
--source https://myaccount.file.core.windows.net/myfileshare/myfolder1/abc.txt \
--destination /mnt/myfiles/abc.txt \
--source-key <key>
Se a fonte especificada for um compartilhamento de arquivos do Azure, você deverá especificar o nome exato do arquivo (por exemploabc.txt
) para baixar um único arquivo ou especificar a opção --recursive
para baixar todos os arquivos no compartilhamento recursivamente. A tentativa de especificar um padrão de arquivo e uma opção --recursive
juntos resulta em um erro.
azcopy \
--source https://myaccount.file.core.windows.net/myfileshare/ \
--destination /mnt/myfiles \
--source-key <key> \
--recursive
Observe que as pastas vazias não são baixadas.
azcopy \
--source /mnt/myfiles/abc.txt \
--destination https://myaccount.file.core.windows.net/myfileshare/abc.txt \
--dest-key <key>
azcopy \
--source /mnt/myfiles \
--destination https://myaccount.file.core.windows.net/myfileshare/ \
--dest-key <key> \
--recursive
Observe que as pastas vazias não são carregadas.
azcopy \
--source /mnt/myfiles \
--destination https://myaccount.file.core.windows.net/myfileshare/ \
--dest-key <key> \
--include "ab*" \
--recursive
azcopy \
--source https://myaccount1.file.core.windows.net/myfileshare1/ \
--destination https://myaccount2.file.core.windows.net/myfileshare2/ \
--source-key <key1> \
--dest-key <key2> \
--recursive
Quando você copia um arquivo entre compartilhamentos de arquivos, uma operação de cópia do lado do servidor é executada.
azcopy \
--source https://myaccount1.file.core.windows.net/myfileshare/ \
--destination https://myaccount2.blob.core.windows.net/mycontainer/ \
--source-key <key1> \
--dest-key <key2> \
--recursive
Quando você copia um arquivo do compartilhamento de arquivos para o blob, uma operação de cópia do lado do servidor é executada.
azcopy \
--source https://myaccount1.blob.core.windows.net/mycontainer/ \
--destination https://myaccount2.file.core.windows.net/myfileshare/ \
--source-key <key1> \
--dest-key <key2> \
--recursive
Quando você copia um arquivo de blob para compartilhamento de arquivos, uma operação de cópia do lado do servidor é executada.
Você pode especificar a --sync-copy
opção para copiar dados do Armazenamento de Arquivos para o Armazenamento de Arquivos, do Armazenamento de Arquivos para o Armazenamento de Blobs e do Armazenamento de Blobs para o Armazenamento de Arquivos de forma síncrona. AzCopy executa esta operação baixando os dados de origem para a memória local e, em seguida, carregando-os para o destino. Neste caso, aplica-se o custo de saída padrão.
azcopy \
--source https://myaccount1.file.core.windows.net/myfileshare1/ \
--destination https://myaccount2.file.core.windows.net/myfileshare2/ \
--source-key <key1> \
--dest-key <key2> \
--recursive \
--sync-copy
Ao copiar do Armazenamento de Arquivos para o Armazenamento de Blobs, o tipo de blob padrão é blob de bloco, o usuário pode especificar a opção --blob-type page
para alterar o tipo de blob de destino. Os tipos disponíveis são page | block | append
.
Observe que --sync-copy
isso pode gerar custo de saída adicional em comparação com a cópia assíncrona. A abordagem recomendada é usar essa opção em uma VM do Azure, que está na mesma região da sua conta de armazenamento de origem para evitar custos de saída.
Os --exclude-older
parâmetros e --exclude-newer
permitem excluir recursos de origem mais antigos ou mais recentes de serem copiados, respectivamente. Se você quiser copiar apenas recursos de origem que não existem no destino, poderá especificar ambos os parâmetros no comando AzCopy:
--source http://myaccount.blob.core.windows.net/mycontainer --destination /mnt/myfiles --source-key <sourcekey> --recursive --exclude-older --exclude-newer
--source /mnt/myfiles --destination http://myaccount.file.core.windows.net/myfileshare --dest-key <destkey> --recursive --exclude-older --exclude-newer
--source http://myaccount.blob.core.windows.net/mycontainer --destination http://myaccount.blob.core.windows.net/mycontainer1 --source-key <sourcekey> --dest-key <destkey> --recursive --exclude-older --exclude-newer
azcopy --config-file "azcopy-config.ini"
Você pode incluir quaisquer parâmetros de linha de comando AzCopy em um arquivo de configuração. AzCopy processa os parâmetros no arquivo como se eles tivessem sido especificados na linha de comando, executando uma substituição direta com o conteúdo do arquivo.
Suponha um arquivo de configuração chamado copyoperation
, que contém as seguintes linhas. Cada parâmetro AzCopy pode ser especificado em uma única linha.
--source http://myaccount.blob.core.windows.net/mycontainer --destination /mnt/myfiles --source-key <sourcekey> --recursive --quiet
ou em linhas separadas:
--source http://myaccount.blob.core.windows.net/mycontainer
--destination /mnt/myfiles
--source-key<sourcekey>
--recursive
--quiet
AzCopy falhará se você dividir o parâmetro em duas linhas, como mostrado aqui para o --source-key
parâmetro:
http://myaccount.blob.core.windows.net/mycontainer
/mnt/myfiles
--sourcekey
<sourcekey>
--recursive
--quiet
azcopy \
--source https://myaccount.blob.core.windows.net/mycontainer1/abc.txt \
--destination https://myaccount.blob.core.windows.net/mycontainer2/abc.txt \
--source-sas <SAS1> \
--dest-sas <SAS2>
Você também pode especificar uma SAS no URI do contêiner:
azcopy \
--source https://myaccount.blob.core.windows.net/mycontainer1/?SourceSASToken \
--destination /mnt/myfiles \
--recursive
Cada vez que você emite um comando para AzCopy, ele verifica se um arquivo de diário existe na pasta padrão ou se existe em uma pasta que você especificou por meio dessa opção. Se o arquivo de diário não existir em nenhum dos lugares, o AzCopy tratará a operação como nova e gerará um novo arquivo de diário.
Se o arquivo de diário existir, o AzCopy verificará se a linha de comando inserida corresponde à linha de comando no arquivo de diário. Se as duas linhas de comando corresponderem, o AzCopy retomará a operação incompleta. Se eles não corresponderem, o AzCopy solicitará que o usuário substitua o arquivo de diário para iniciar uma nova operação ou cancele a operação atual.
Se você quiser usar o local padrão para o arquivo de diário:
azcopy \
--source /mnt/myfiles \
--destination https://myaccount.blob.core.windows.net/mycontainer \
--dest-key <key> \
--resume
Se você omitir a opção --resume
, ou especificar a opção --resume
sem o caminho da pasta, como mostrado acima, o AzCopy criará o arquivo de diário no local padrão, que é ~\Microsoft\Azure\AzCopy
. Se o arquivo de diário já existir, o AzCopy retomará a operação com base no arquivo de diário.
Se desejar especificar um local personalizado para o arquivo de diário:
azcopy \
--source /mnt/myfiles \
--destination https://myaccount.blob.core.windows.net/mycontainer \
--dest-key key \
--resume "/mnt/myjournal"
Este exemplo cria o arquivo de diário se ele ainda não existir. Se ele existir, o AzCopy retomará a operação com base no arquivo de diário.
Se você quiser retomar uma operação AzCopy, repita o mesmo comando. AzCopy no Linux, em seguida, solicitará a confirmação:
Incomplete operation with same command line detected at the journal directory "/home/myaccount/Microsoft/Azure/AzCopy", do you want to resume the operation? Choose Yes to resume, choose No to overwrite the journal to start a new operation. (Yes/No)
azcopy \
--source /mnt/myfiles \
--destination https://myaccount.blob.core.windows.net/mycontainer \
--dest-key <key> \
--verbose
Option --parallel-level
especifica o número de operações de cópia simultâneas. Por padrão, o AzCopy inicia um determinado número de operações simultâneas para aumentar a taxa de transferência de dados. O número de operações simultâneas é igual a oito vezes o número de processadores que você tem. Se você estiver executando o AzCopy em uma rede de baixa largura de banda, poderá especificar um número menor para --parallel-level para evitar falhas causadas pela concorrência de recursos.
Gorjeta
Para ver a lista completa de parâmetros AzCopy, confira o menu 'azcopy --help'.
AzCopy no Linux (v7.1 e versões anteriores apenas) requer o .NET Core framework. As instruções de instalação estão disponíveis na página de instalação do .NET Core.
Por exemplo, comece instalando o .NET Core no Ubuntu 16.10. Para obter o guia de instalação mais recente, visite a página de instalação do .NET Core no Linux .
sudo sh -c 'echo "deb [arch=amd64] https://apt-mo.trafficmanager.net/repos/dotnet-release/ yakkety main" > /etc/apt/sources.list.d/dotnetdev.list'
sudo apt-key adv --keyserver hkp://keyserver.ubuntu.com:80 --recv-keys 417A0893
sudo apt-get update
sudo apt-get install dotnet-sdk-2.0.0
Depois de instalar o .NET Core, baixe e instale o AzCopy.
wget -O azcopy.tar.gz https://aka.ms/downloadazcopyprlinux
tar -xf azcopy.tar.gz
sudo ./install.sh
Você pode remover os arquivos extraídos assim que o AzCopy no Linux estiver instalado. Como alternativa, se você não tiver privilégios de superusuário, também poderá executar azcopy
usando o shell script azcopy na pasta extraída.
Se você encontrar problemas com a instalação do AzCopy, você pode tentar executar o AzCopy usando o script bash na pasta extraída azcopy
.
cd azcopy
./azcopy
Quando você copia blobs ou arquivos com o AzCopy, lembre-se de que outro aplicativo pode estar modificando os dados enquanto você os copia. Se possível, certifique-se de que os dados que está a copiar não estão a ser modificados durante a operação de cópia. Por exemplo, ao copiar um VHD associado a uma máquina virtual do Azure, certifique-se de que nenhum outro aplicativo esteja gravando no VHD no momento. Uma boa maneira de fazer isso é alugando o recurso a ser copiado. Como alternativa, você pode criar um instantâneo do VHD primeiro e, em seguida, copiá-lo.
Se você não puder impedir que outros aplicativos gravem em blobs ou arquivos enquanto eles estão sendo copiados, lembre-se de que, quando o trabalho terminar, os recursos copiados podem não ter mais paridade total com os recursos de origem.
Você pode executar vários processos AzCopy em um único cliente, desde que você use pastas de diário diferentes. Não há suporte para o uso de uma única pasta de diário para vários processos AzCopy.
1º processo:
azcopy \
--source /mnt/myfiles1 \
--destination https://myaccount.blob.core.windows.net/mycontainer/myfiles1 \
--dest-key <key> \
--resume "/mnt/myazcopyjournal1"
2º processo:
azcopy \
--source /mnt/myfiles2 \
--destination https://myaccount.blob.core.windows.net/mycontainer/myfiles2 \
--dest-key <key> \
--resume "/mnt/myazcopyjournal2"
Para obter mais informações sobre o Armazenamento do Azure e o AzCopy, veja os seguintes recursos:
- Introdução ao Armazenamento do Azure
- Criar uma conta de armazenamento
- Gerir blobs com o Explorador de Armazenamento
- Utilizar a CLI do Azure com o Armazenamento do Azure
- Como usar o armazenamento de Blob a partir de C++
- Como utilizar o Armazenamento de blobs do Java
- Como utilizar o Armazenamento de blobs do Node.js
- Como utilizar o Armazenamento de blobs do Python
- Anunciando o AzCopy no Linux Preview
- Apresentando a visualização da Biblioteca de Movimentação de Dados de Armazenamento do Azure
- AzCopy: Introdução à cópia síncrona e ao tipo de conteúdo personalizado
- AzCopy: Anunciando a disponibilidade geral do AzCopy 3.0 mais a versão prévia do AzCopy 4.0 com suporte a tabelas e arquivos
- AzCopy: Otimizado para cenários de cópia em grande escala
- AzCopy: Suporte para armazenamento com redundância geográfica de acesso de leitura
- AzCopy: Transfira dados com modo reinicializável e token SAS
- AzCopy: Usando o Blob de cópia entre contas
- AzCopy: Carregando/baixando arquivos para Blobs do Azure