Självstudie: Kopiera data till Azure Data Box via NFS

Viktigt!

Azure Data Box har nu stöd för tilldelning på åtkomstnivå på blobnivå. Stegen i den här självstudien återspeglar den uppdaterade datakopieringsprocessen och är specifika för blockblobar.

Hjälp med att fastställa lämplig åtkomstnivå för dina blockblobdata finns i avsnittet Fastställa lämpliga åtkomstnivåer för blockblobar . Följ stegen i avsnittet Kopiera data till Data Box för att kopiera dina data till lämplig åtkomstnivå.

Informationen i detta avsnitt gäller för beställningar som gjorts efter den 1 april 2024.

I den här självstudien beskrivs hur du ansluter till och kopierar data från värddatorn med det lokala webbgränssnittet.

I den här självstudien lär du dig att:

  • Förutsättningar
  • Ansluta till Data Box
  • Kopiera data till Data Box

Förutsättningar

Innan du börjar bör du kontrollera att:

  1. Du slutför självstudien : Konfigurera Azure Data Box.
  2. Du får din Data Box och orderstatusen i portalen levereras.
  3. Du har en värddator som har de data du vill kopiera över till Data Box. Värddatorn måste:
    • Köra ett operativsystem som stöds.
    • Vara ansluten till en höghastighetsnätverk. Vi rekommenderar starkt att du har en anslutning på minst 10 GbE. Om en 10 GbE anslutning inte är tillgänglig kan en 1 GbE datalänk användas, men då påverkas kopieringshastigheten.

Ansluta till Data Box

Utifrån det lagringskontot som väljs skapar Data Box upp till:

  • Tre resurser för varje associerat lagringskonto för GPv1 och GPv2.
  • En resurs för premiumlagring.
  • En resurs för ett bloblagringskonto som innehåller en mapp för var och en av de fyra åtkomstnivåerna.

I följande tabell identifieras namnen på de Data Box-resurser som du kan ansluta till och vilken typ av data som laddas upp till mållagringskontot. Den identifierar också hierarkin med resurser och kataloger som du kopierar dina källdata till.

Lagringstyp Resursnamn Entitet på första nivån Entitet på andra nivån Entitet på tredje nivån
Blockblob <storageAccountName>_BlockBlob <\accessTier> <\containerName> <\blockBlob>
Sidblob <\storageAccountName>_PageBlob <\containerName> <\pageBlob>
File Storage <\storageAccountName>_AzFile <\fileShareName> <\Filen>

Du kan inte kopiera filer direkt till rotmappen för någon Data Box-resurs. Skapa i stället mappar i Data Box-resursen beroende på ditt användningsfall.

Blockblobar stöder tilldelning av åtkomstnivåer på filnivå. Innan du kopierar filer till blockblobresursen rekommenderar vi att du lägger till nya undermappar på lämplig åtkomstnivå. När du har skapat nya undermappar fortsätter du sedan att lägga till filer i varje undermapp efter behov.

En ny container skapas för alla mappar som finns i roten för blockblobresursen. Alla filer i mappen kopieras till lagringskontots standardåtkomstnivå som en blockblob.

Mer information om blobåtkomstnivåer finns i Åtkomstnivåer för blobdata. Mer detaljerad information om metodtips för åtkomstnivå finns i Metodtips för att använda blobåtkomstnivåer.

I följande tabell visas UNC-sökvägen till resurserna i din Data Box och motsvarande URL för Azure Storage-sökväg som data laddas upp till. URL:en till den sista Azure Storage-sökvägen kan härledas från sökvägen till UNC-resursen.

Azure Storage-typer Data Box-resurser
Azure Block blobs
  • UNC-sökväg till resurser: \\<DeviceIPAddress>\<storageaccountname_BlockBlob>\<accessTier>\<ContainerName>\myBlob.txt
  • URL för Azure Storage: https://<storageaccountname>.blob.core.windows.net/<ContainerName>/myBlob.txt
  • Azure-sidblobar
  • UNC-sökväg till resurser: \\<DeviceIPAddress>\<storageaccountname_PageBlob>\<ContainerName>\myBlob.vhd
  • URL för Azure Storage: https://<storageaccountname>.blob.core.windows.net/<ContainerName>/myBlob.vhd
  • Azure Files
  • UNC-sökväg till resurser: \\<DeviceIPAddress>\<storageaccountname_AzFile>\<ShareName>\myFile.txt
  • URL för Azure Storage: https://<storageaccountname>.file.core.windows.net/<ShareName>/myFile.txt
  • Om du använder en Linux-värddator utför du följande steg för att konfigurera Data Box för att tillåta åtkomst till NFS-klienter.

    1. Ange IP-adresserna för de tillåtna klienterna som har åtkomst till resursen. I det lokala webbgränssnittet går du till sidan Anslut och kopiera. Under NFS-inställningar väljer du NFS-klientåtkomst.

      Konfigurera NFS-klientåtkomst

    2. Ange IP-adressen för NFS-klienten och välj Lägg till. Du kan konfigurera åtkomst för flera NFS genom att upprepa det här steget. Välj OK.

      Konfigurera IP-adressen för en NFS-klient

    3. Kontrollera att Linux-värddatorn har en NFS-klient av en version som stöds installerad. Använd den specifika versionen för din Linux-distribution.

    4. När NFS-klienten har installerats använder du följande kommando för att montera NFS-resursen på Data Box-enheten:

      sudo mount <Data Box device IP>:/<NFS share on Data Box device> <Path to the folder on local Linux computer>

      Använd följande exempel för att ansluta till en Data Box-resurs med hjälp av NFS. I exemplet är 10.161.23.130Data Box-enhetens IP-adress . Mystoracct_Blob Resursen monteras på ubuntuVM och monteringspunkten är /home/databoxubuntuhost/databox.

      sudo mount -t nfs 10.161.23.130:/Mystoracct_Blob /home/databoxubuntuhost/databox

      För Mac-klienter måste du lägga till ett extra alternativ på följande sätt:

      sudo mount -t nfs -o sec=sys,resvport 10.161.23.130:/Mystoracct_Blob /home/databoxubuntuhost/databox

      Viktigt!

      Du kan inte kopiera filer direkt till lagringskontots rotmapp . I rotmappen för ett blockbloblagringskonto hittar du en mapp som motsvarar var och en av de tillgängliga åtkomstnivåerna.

      Om du vill kopiera dina data till Azure Data Box måste du först välja den mapp som motsvarar någon av åtkomstnivåerna. Skapa sedan en undermapp i den nivåns mapp för att lagra dina data. Kopiera slutligen dina data till den nyligen skapade undermappen. Den nya undermappen representerar containern som skapades i lagringskontot under inmatningen. Dina data laddas upp till den här containern som blobar.

    Fastställa lämpliga åtkomstnivåer för blockblobar

    Viktigt!

    Informationen i detta avsnitt gäller beställningar som görs efter den 1 april 2024.

    Med Azure Storage kan du lagra blockblobdata på flera åtkomstnivåer inom samma lagringskonto. Med den här möjligheten kan data organiseras och lagras mer effektivt baserat på hur ofta de används. Följande tabell innehåller information och rekommendationer om Azure Storage-åtkomstnivåer.

    Nivå Rekommendation Bästa metod
    Het Användbart för onlinedata som används eller ändras ofta. Den här nivån har de högsta lagringskostnaderna, men de lägsta åtkomstkostnaderna. Data på den här nivån bör användas regelbundet och aktivt.
    Lågfrekvent Användbart för onlinedata som används eller ändras sällan. Den här nivån har lägre lagringskostnader och högre åtkomstkostnader än den frekventa nivån. Data på den här nivån ska lagras i minst 30 dagar.
    Kall Användbart för onlinedata som används eller ändras sällan men som fortfarande kräver snabb hämtning. Den här nivån har lägre lagringskostnader och högre åtkomstkostnader än lågfrekvent nivå. Data på den här nivån ska lagras i minst 90 dagar.
    Arkiv Användbart för offlinedata som sällan används och som har lägre svarstidskrav. Data på den här nivån bör lagras i minst 180 dagar. Data som tas bort från arkivnivån inom 180 dagar debiteras en avgift för tidig borttagning.

    Mer information om blobåtkomstnivåer finns i Åtkomstnivåer för blobdata. Mer detaljerade metodtips finns i Metodtips för att använda blobåtkomstnivåer.

    Du kan överföra blockblobdata till lämplig åtkomstnivå genom att kopiera dem till motsvarande mapp i Data Box. Den här processen beskrivs mer detaljerat i avsnittet Kopiera data till Azure Data Box .

    Kopiera data till Data Box

    När du har anslutit till en eller flera Data Box-resurser är nästa steg att kopiera data. Innan du påbörjar datakopian bör du tänka på följande begränsningar:

    • Se till att du kopierar dina data till den resurs som motsvarar det dataformat som krävs. Kopiera till exempel blockblobdata till resursen för blockblobar. Kopiera virtuella hårddiskar till sidblobresursen. Om dataformatet inte matchar lämplig resurstyp misslyckas datauppladdningen till Azure under ett senare steg.
    • När du kopierar data till AzFile - eller PageBlob-resurserna skapar du först en mapp i resursens rot och kopierar sedan filer till den mappen.
    • När du kopierar data till BlockBlob-resursen skapar du en undermapp inom önskad åtkomstnivå och kopierar sedan data till den nyligen skapade undermappen. Undermappen representerar en container till vilken data laddas upp som blobar. Du kan inte kopiera filer direkt till en resurs rotmapp.
    • När du kopierar data kontrollerar du att datastorleken överensstämmer med de storleksgränser som beskrivs i storleksgränserna för Azure-lagringskontot.
    • Samtidiga uppladdningar av Data Box och ett annat program som inte är Data Box kan potentiellt leda till fel i uppladdningsjobbet och skadade data.
    • Om du använder både SMB- och NFS-protokollen för datakopior rekommenderar vi att du:
      • Använd olika lagringskonton för SMB och NFS.
      • Kopiera inte samma data till samma slutmål i Azure med både SMB och NFS. I sådana fall kan slutresultatet inte fastställas.
      • Även om kopiering via både SMB och NFS parallellt kan fungera rekommenderar vi inte att du gör det eftersom det är utsatt för mänskliga fel. Vänta tills SMB-datakopian är klar innan du startar en NFS-datakopia.
    • När du kopierar data till blockblobresursen skapar du en undermapp inom önskad åtkomstnivå och kopierar sedan data till den nyligen skapade undermappen. Undermappen representerar en container som dina data laddas upp till som blobar. Du kan inte kopiera filer direkt till rotmappen i lagringskontot.
    • Om du matar in skiftlägeskänsliga katalog- och filnamn från en NFS-resurs till NFS på Data Box:
      • Ärendet bevaras i namnet.

      • Filerna är skiftlägeskänsliga.

        Om du till exempel kopierar SampleFile.txt och Samplefile.Txtbevaras ärendet i namnet när det kopieras till Data Box. Men eftersom de anses vara samma fil skriver den senaste uppladdade filen över den första filen.

    Viktigt!

    Se till att du underhåller en kopia av källdata tills du kan bekräfta att dina data har kopierats till Azure Storage.

    Om du använder en Linux-värddator använder du en kopieringsverktyg som liknar Robocopy. Några av alternativen som är tillgängliga i Linux är rsync, FreeFileSync, Unison eller Ultracopier.

    Kommandot cp är ett av de bästa alternativen för att kopiera en katalog. Mer information om användningen finns på cp man-sidorna.

    Om du använder rsync alternativet för en kopia med flera trådar följer du dessa riktlinjer:

    • Installera CIFS Utils- eller NFS Utils-paketet, beroende på vilket filsystem din Linux-klient använder.

      sudo apt-get install cifs-utils

      sudo apt-get install nfs-utils

    • Installera rsync och parallell (varierar beroende på den Linux-distribuerade versionen).

      sudo apt-get install rsync

      sudo apt-get install parallel

    • Skapa en monteringspunkt.

      sudo mkdir /mnt/databox

    • Montera volymen.

      sudo mount -t NFS4 //Databox IP Address/share_name /mnt/databox

    • Spegla mappkatalogstrukturen.

      rsync -za --include='*/' --exclude='*' /local_path/ /mnt/databox

    • Kopiera filerna.

      cd /local_path/; find -L . -type f | parallel -j X rsync -za {} /mnt/databox/{}

      där j anger antalet parallelliseringar, X = antal parallella kopior

      Vi rekommenderar att du börjar med 16 parallella kopior och öka antalet trådar beroende på tillgängliga resurser.

    Viktigt!

    Följande Linux-filtyper stöds inte: symboliska länkar, teckenfiler, blockfiler, sockets och pipes. Dessa filtyper resulterar i fel under steget Förbered för att skicka .

    Meddelanden visas under kopieringsskicket för att identifiera fel.

    Ladda ned och visa fel från Anslut och kopiera

    Välj Ladda ned lista med ärenden.

    Ladda ned problemlistan för ett kopieringsfel

    Öppna listan för att visa information om felet och välj lösnings-URL:en för att visa den rekommenderade lösningen.

    Problem i en lista över problem med kopieringsfel

    Mer information finns i Visa felloggar under datakopiering till Data Box. En detaljerad lista över fel i samband med datakopieringen finns i Felsöka problem med Data Box.

    För att säkerställa dataintegriteten beräknas kontrollsumman infogat när data kopieras. När kopieringen är klar kontrollerar du det använda utrymmet och det lediga utrymmet på enheten.

    Kontrollera ledigt och använt utrymme på instrumentpanelen

    Nästa steg

    I den här kursen har du lärt dig om Azure Data Box-ämnen som att:

    • Krav för Data Box-datakopiering
    • Anslut till Data Box
    • Fastställa lämpliga åtkomstnivåer för blockblobar
    • Kopiera data till Data Box

    Gå vidare till nästa självstudie och lär dig hur du skickar tillbaka din Data Box-enhet till Microsoft.