Tutorial: Salin data ke Azure Data Box melalui SMB

Salin data ke Azure Data Box

Penting

Azure Data Box sekarang mendukung penetapan tingkat akses di tingkat blob. Langkah-langkah yang terkandung dalam tutorial ini mencerminkan proses salinan data yang diperbarui dan khusus untuk memblokir blob.

Untuk bantuan dalam menentukan tingkat akses yang sesuai untuk data blob blok Anda, lihat bagian Menentukan tingkat akses yang sesuai untuk blob blok. Ikuti langkah-langkah yang terkandung dalam bagian Salin data ke Azure Data Box untuk menyalin data Anda ke tingkat akses yang sesuai.

Informasi yang terkandung dalam bagian ini berlaku untuk pesanan yang dilakukan setelah 1 April 2024.

Tutorial ini menjelaskan cara menyambungkan dan menyalin data dari komputer host Anda menggunakan UI web lokal.

Dalam tutorial ini, Anda akan mempelajari cara:

  • Prasyarat
  • Menyambungkan ke Data Box
  • Menentukan tingkat akses yang sesuai untuk blob blok
  • Menyalin data ke Data Box

Prasyarat

Sebelum Anda mulai, pastikan bahwa:

  1. Anda telah menyelesaikan Tutorial: Menyiapkan Azure Data Box.
  2. Anda telah menerima Data Box Anda dan status pesanan di portal Terkirim.
  3. Anda memiliki komputer host yang memiliki data yang ingin Anda salin ke Data Box. Komputer host Anda harus:
    • Menjalankan Sistem operasi yang didukung.
    • Tersambung ke jaringan berkecepatan tinggi. Kami sangat menyarankan Anda memiliki setidaknya satu koneksi 10 GbE. Jika koneksi 10 GbE tidak tersedia, gunakan tautan data 1 GbE tetapi kecepatan salin terpengaruh.

Menyambungkan ke Data Box

Berdasarkan akun penyimpanan yang dipilih, Data Box dibuat hingga:

  • Tiga bagian untuk setiap akun penyimpanan yang terkait untuk GPv1 dan GPv2.
  • Satu berbagi untuk penyimpanan premium.
  • Satu berbagi untuk akun penyimpanan blob, berisi satu folder untuk masing-masing dari empat tingkat akses.

Tabel berikut mengidentifikasi nama berbagi Data Box yang dapat Anda sambungkan, dan jenis data yang diunggah ke akun penyimpanan target Anda. Ini juga mengidentifikasi hierarki berbagi dan direktori tempat Anda menyalin data sumber Anda.

Jenis penyimpanan Nama berbagi Entitas tingkat pertama Entitas tingkat kedua Entitas tingkat ketiga
Blob blok <storageAccountName>_BlockBlob <\accessTier> <\containerName> <\blockBlob>
Blob Halaman <\storageAccountName>_PageBlob <\containerName> <\pageBlob>
Penyimpanan file <\storageAccountName>_AzFile <\fileShareName> <\File>

Anda tidak dapat menyalin file langsung ke folder akar berbagi Data Box apa pun. Sebagai gantinya, buat folder dalam berbagi Data Box tergantung pada kasus penggunaan Anda.

Blob blok mendukung penetapan tingkat akses di tingkat file. Saat menyalin file ke berbagi blob blok, praktik terbaik yang direkomendasikan adalah menambahkan subfolder baru dalam tingkat akses yang sesuai. Setelah membuat subfolder baru, lanjutkan menambahkan file ke setiap subfolder yang sesuai.

Kontainer baru dibuat untuk folder apa pun yang berada di akar berbagi blob blok. File apa pun dalam folder tersebut disalin ke tingkat akses default akun penyimpanan sebagai blob blok.

Untuk informasi selengkapnya tentang tingkat akses blob, lihat Tingkat akses untuk data blob. Untuk informasi selengkapnya tentang praktik terbaik tingkat akses, lihat Praktik terbaik untuk menggunakan tingkat akses blob.

Tabel berikut ini memperlihatkan jalur UNC ke berbagi di Data Box Anda dan URL jalur Azure Storage terkait tempat data diunggah. URL jalur Azure Storage akhir dapat diperoleh dari jalur berbagi UNC.

Jenis Azure Storage Pembagian Data Box
Blob Blok Azure
  • Jalur UNC ke berbagi: \\<DeviceIPAddress>\<storageaccountname_BlockBlob>\<accessTier>\<ContainerName>\myBlob.txt
  • URL Azure Storage: https://<storageaccountname>.blob.core.windows.net/<ContainerName>/myBlob.txt
  • Blob Halaman Azure
  • Jalur UNC ke berbagi: \\<DeviceIPAddress>\<storageaccountname_PageBlob>\<ContainerName>\myBlob.vhd
  • URL Azure Storage: https://<storageaccountname>.blob.core.windows.net/<ContainerName>/myBlob.vhd
  • Azure Files
  • Jalur UNC ke berbagi: \\<DeviceIPAddress>\<storageaccountname_AzFile>\<ShareName>\myFile.txt
  • URL Azure Storage: https://<storageaccountname>.file.core.windows.net/<ShareName>/myFile.txt
  • Jika menggunakan komputer host Windows Server, ikuti langkah-langkah ini untuk menyambungkan ke Data Box.

    1. Langkah pertama adalah mengautentikasi dan memulai sesi. Buka Sambungkan dan salin. Pilih SMB untuk mendapatkan info masuk (kredensial) akses untuk berbagi yang terkait dengan akun penyimpanan Anda.

      Dapatkan kredensial bersama untuk berbagi SMB

    2. Dari kotak dialog berbagi Akses dan salin data, salin Nama Pengguna dan Kata Sandi yang terkait dengan berbagi. Kemudian pilih OK.

      Mendapatkan nama pengguna dan kata sandi untuk berbagi

    3. Contoh berikut menggunakan contoh akun penyimpanan bernama utsac1. Untuk mengakses berbagi yang terkait dengan akun penyimpanan Anda dari komputer host Anda, buka jendela perintah. Pada command prompt, ketik:

      net use \\<DeviceIPAddress>\<share name> /u:<IP address of the device>\<user name for the share>

      Bergantung pada format data Anda, jalur berbaginya adalah sebagai berikut:

      • Blob Blokir Azure - \\<DeviceIPAddress>\utsac1_BlockBlob
      • Blob Halaman Azure - \\<DeviceIPAddress>\utsac1_PageBlob
      • File Azure - \\<DeviceIPAddress>\utsac1_AzFile
    4. Masukkan kata sandi untuk berbagi ketika diminta. Jika kata sandi memiliki karakter khusus, tambahkan tanda kutip ganda sebelum dan sesudahnya. Contoh berikut menunjukkan menyambungkan ke berbagi melalui perintah sebelumnya.

      C:\Users\Databoxuser>net use \\<DeviceIPAddress>\utSAC1_202006051000_BlockBlob /u:<DeviceIPAddress>\testuser1
      Enter the password for 'testuser1' to connect to '<DeviceIPAddress>': "ab1c2def$3g45%6h7i&j8kl9012345"
      The command completed successfully.
      
    5. Tekan Windows + R. Di jendela Run, tentukan \\<DeviceIPAddress>. Pilih OK untuk membuka File Explorer.

      Hubungkan untuk berbagi melalui File Explorer

      Sekarang Anda akan melihat berbagi sebagai folder.

      Berbagi diperlihatkan di File Explorer

      Penting

      Anda tidak dapat menyalin file langsung ke folder akar akun penyimpanan. Dalam folder akar akun penyimpanan blob blok, Anda akan menemukan folder yang sesuai dengan setiap tingkat akses yang tersedia.

      Untuk menyalin data Anda ke Azure Data Box, Anda harus terlebih dahulu memilih folder yang sesuai dengan salah satu tingkat akses. Selanjutnya, buat sub-folder di dalam folder tingkat tersebut untuk menyimpan data Anda. Terakhir, salin data Anda ke sub-folder yang baru dibuat. Sub-folder baru Anda mewakili kontainer yang dibuat dalam akun penyimpanan selama penyerapan. Data Anda diunggah ke kontainer ini sebagai blob.

    Jika Anda menggunakan klien Linux, gunakan perintah berikut untuk memasang berbagi SMB. Nilai vers parameter mengidentifikasi versi SMB yang didukung host Linux Anda. Sisipkan versi yang sesuai ke dalam perintah sampel yang disediakan. Untuk melihat daftar versi SMB yang didukung oleh Data Box, lihat Sistem file yang didukung untuk klien Linux.

    sudo mount -t cifs -o vers=2.1 10.126.76.138:/utsac1_BlockBlob /home/databoxubuntuhost/databox
    

    Menentukan tingkat akses yang sesuai untuk blob blok

    Penting

    Informasi yang terkandung dalam bagian ini berlaku untuk pesanan yang dilakukan setelah 1 April 2024.

    Azure Storage memungkinkan Anda menyimpan data blob blok dalam beberapa tingkat akses dalam akun penyimpanan yang sama. Kemampuan ini memungkinkan data diatur dan disimpan lebih efisien berdasarkan seberapa sering data diakses. Tabel berikut ini berisi informasi dan rekomendasi tentang tingkat akses Azure Storage.

    Tingkat Rekomendasi Praktik terbaik
    Populer Berguna untuk data online yang sering diakses atau dimodifikasi. Tingkat ini memiliki biaya penyimpanan tertinggi, tetapi biaya akses terendah. Data dalam tingkat ini harus dalam penggunaan reguler dan aktif.
    Cool Berguna untuk data online yang jarang diakses atau dimodifikasi. Tingkat ini memiliki biaya penyimpanan yang lebih rendah dan biaya akses yang lebih tinggi daripada tingkat panas. Data dalam tingkat ini harus disimpan setidaknya selama 30 hari.
    Dingin Berguna untuk data online yang diakses atau dimodifikasi jarang tetapi masih membutuhkan pengambilan cepat. Tingkat ini memiliki biaya penyimpanan yang lebih rendah dan biaya akses yang lebih tinggi daripada tingkat dingin. Data dalam tingkat ini harus disimpan selama minimal 90 hari.
    Arsip Berguna untuk data offline yang jarang diakses dan memiliki persyaratan latensi yang lebih rendah. Data dalam tingkat ini harus disimpan selama minimal 180 hari. Data yang dihapus dari tingkat arsip dalam waktu 180 hari dikenakan biaya penghapusan awal.

    Untuk informasi selengkapnya tentang tingkat akses blob, lihat Tingkat akses untuk data blob. Untuk praktik terbaik yang lebih rinci, lihat Praktik terbaik untuk menggunakan tingkat akses blob.

    Anda dapat mentransfer data blob blok anda ke tingkat akses yang sesuai dengan menyalinnya ke folder yang sesuai dalam Data Box. Proses ini dibahas secara lebih rinci dalam bagian Salin data ke Azure Data Box .

    Menyalin data ke Data Box

    Setelah menyambungkan ke satu atau beberapa berbagi Data Box, langkah selanjutnya adalah menyalin data. Sebelum Anda memulai salinan data, pertimbangkan batasan berikut:

    • Pastikan Anda menyalin data ke berbagi yang sesuai dengan format data yang diperlukan. Misalnya, salin data blob blok ke berbagi untuk blob blok. Salin VHD ke berbagi blob halaman. Jika format data tidak cocok dengan jenis berbagi yang sesuai, pengunggahan data ke Azure gagal selama langkah selanjutnya.
    • Saat menyalin data ke berbagi AzFile atau PageBlob , pertama-tama buat folder di akar berbagi, lalu salin file ke folder tersebut.
    • Saat menyalin data ke berbagi BlockBlob , buat subfolder dalam tingkat akses yang diinginkan, lalu salin data ke subfolder yang baru dibuat. Subfolder mewakili kontainer tempat data diunggah sebagai blob. Anda tidak dapat menyalin file langsung ke folder akar berbagi.
    • Saat menyalin data, pastikan bahwa ukuran data sesuai dengan batas ukuran yang dijelaskan dalam batas ukuran akun Azure Storage.
    • Jika Anda ingin mempertahankan metadata (ACL, stempel waktu, dan atribut file) saat mentransfer data ke Azure Files, ikuti panduan dalam Mempertahankan ACL, atribut, dan tanda waktu file dengan Azure Data Box
    • Unggahan simultan oleh Data Box dan aplikasi non-Data Box lainnya berpotensi mengakibatkan kegagalan pekerjaan unggahan dan kerusakan data.
    • Jika Anda menggunakan protokol SMB dan NFS untuk salinan data, kami sarankan Anda:
      • Menggunakan akun penyimpanan yang berbeda untuk SMB dan NFS.
      • Tidak menyalin data yang sama ke tujuan akhir yang sama di Azure menggunakan SMB dan NFS. Dalam kasus seperti itu, hasil akhir tidak dapat ditentukan.
      • Meski menyalin melalui SMB dan NFS secara paralel dapat berhasil, sebaiknya jangan melakukannya karena tindakan tersebut rentan terhadap kesalahan manusia. Tunggu hingga penyalinan data SMB Anda selesai sebelum Anda memulai penyalinan data NFS.

    Penting

    Pastikan Anda menyimpan salinan data sumber hingga Anda dapat mengonfirmasi bahwa data Anda telah disalin ke Azure Storage.

    Setelah Anda tersambung ke berbagi SMB, mulai penyalinan data. Anda juga dapat menggunakan alat penyalin file yang kompatibel dengan SMB seperti Robocopy untuk menyalin data Anda. Beberapa pekerjaan salinan dapat dimulai menggunakan Robocopy. Gunakan perintah berikut:

    robocopy <Source> <Target> * /e /r:3 /w:60 /is /nfl /ndl /np /MT:32 or 64 /fft /B /Log+:<LogFile>
    

    Atributnya dijelaskan dalam tabel berikut.

    Atribut Deskripsi
    /e Menyalin subdirektori termasuk direktori kosong.
    /r: Menentukan jumlah percobaan kembali pada salinan yang gagal.
    /w: Menentukan waktu tunggu antara percobaan kembali, dalam detik.
    /is Menyertakan file yang sama.
    /nfl Menentukan bahwa nama file tidak dicatat.
    /ndl Menentukan bahwa nama direktori tidak dicatat.
    /np Menentukan bahwa kemajuan operasi penyalinan (jumlah file atau direktori yang disalin sejauh ini) tidak akan ditampilkan. Menampilkan proses yang secara signifikan menurunkan performa.
    /MT Menggunakan multithreading, direkomendasikan 32 atau 64 alur. Opsi ini tidak digunakan dengan file terenkripsi. Anda mungkin perlu memisahkan file terenkripsi dan terenkripsi. Namun, salinan dengan alur tunggal secara signifikan menurunkan performa.
    /fft Digunakan untuk mengurangi granuralitas stempel waktu untuk sistem file apa pun.
    /B Menyalin file dalam mode Pencadangan.
    /z Menyalin file dalam mode Hidupkan Ulang; gunakan sakelar ini jika lingkungan tidak stabil. Opsi ini mengurangi throughput karena pengelogan tambahan.
    /zb Menggunakan mode Hidupkan Ulang. Jika akses ditolak, opsi ini menggunakan mode Pencadangan. Opsi ini mengurangi throughput karena terdapat titik pemeriksaan.
    /efsraw Menyalin semua file terenkripsi dalam mode mentah EFS. Gunakan hanya dengan file terenkripsi.
    log+:<LogFile> Menambahkan output ke berkas log yang ada.

    Contoh berikut menunjukkan output perintah robocopy untuk menyalin file ke Data Box.

    C:\Users>robocopy
    
        -------------------------------------------------------------------------------
        ROBOCOPY     ::     Robust File Copy for Windows
        -------------------------------------------------------------------------------
    
            Started : Thursday, March 8, 2018 2:34:53 PM
            Simple Usage :: ROBOCOPY source destination /MIR
    
            source :: Source Directory (drive:\path or \\server\share\path).
            destination :: Destination Dir  (drive:\path or \\server\share\path).
                    /MIR :: Mirror a complete directory tree.
    
        For more usage information run ROBOCOPY /?
    
        ****  /MIR can DELETE files as well as copy them !
    
    C:\Users>Robocopy C:\Git\azure-docs-pr\contributor-guide \\10.126.76.172\devicemanagertest1_AzFile\templates /MT:32
    
        -------------------------------------------------------------------------------
        ROBOCOPY     ::     Robust File Copy for Windows
        -------------------------------------------------------------------------------
    
            Started : Thursday, March 8, 2018 2:34:58 PM
            Source : C:\Git\azure-docs-pr\contributor-guide\
                Dest : \\10.126.76.172\devicemanagertest1_AzFile\templates\
    
            Files : *.*
    
            Options : *.* /DCOPY:DA /COPY:DAT /MT:32 /R:5 /W:60
    
        ------------------------------------------------------------------------------
    
        100%        New File                 206        C:\Git\azure-docs-pr\contributor-guide\article-metadata.md
        100%        New File                 209        C:\Git\azure-docs-pr\contributor-guide\content-channel-guidance.md
        100%        New File                 732        C:\Git\azure-docs-pr\contributor-guide\contributor-guide-index.md
        100%        New File                 199        C:\Git\azure-docs-pr\contributor-guide\contributor-guide-pr-criteria.md
                    New File                 178        C:\Git\azure-docs-pr\contributor-guide\contributor-guide-pull-request-co100%  .md
                    New File                 250        C:\Git\azure-docs-pr\contributor-guide\contributor-guide-pull-request-et100%  e.md
        100%        New File                 174        C:\Git\azure-docs-pr\contributor-guide\create-images-markdown.md
        100%        New File                 197        C:\Git\azure-docs-pr\contributor-guide\create-links-markdown.md
        100%        New File                 184        C:\Git\azure-docs-pr\contributor-guide\create-tables-markdown.md
        100%        New File                 208        C:\Git\azure-docs-pr\contributor-guide\custom-markdown-extensions.md
        100%        New File                 210        C:\Git\azure-docs-pr\contributor-guide\file-names-and-locations.md
        100%        New File                 234        C:\Git\azure-docs-pr\contributor-guide\git-commands-for-master.md
        100%        New File                 186        C:\Git\azure-docs-pr\contributor-guide\release-branches.md
        100%        New File                 240        C:\Git\azure-docs-pr\contributor-guide\retire-or-rename-an-article.md
        100%        New File                 215        C:\Git\azure-docs-pr\contributor-guide\style-and-voice.md
        100%        New File                 212        C:\Git\azure-docs-pr\contributor-guide\syntax-highlighting-markdown.md
        100%        New File                 207        C:\Git\azure-docs-pr\contributor-guide\tools-and-setup.md
        ------------------------------------------------------------------------------
    
                    Total    Copied   Skipped  Mismatch    FAILED    Extras
        Dirs :         1         1         1         0         0         0
        Files :        17        17         0         0         0         0
        Bytes :     3.9 k     3.9 k         0         0         0         0
    C:\Users>
    

    Untuk skenario yang lebih spesifik seperti menggunakan robocopy unyuk mendaftar, menyalin, atau menghapus file pada Azure Data Box, lihat Menggunakan robocopy untuk mendaftarkan, menyalin, memodifikasi file di Azure Data Box.

    Untuk mengoptimalkan performa, gunakan parameter robocopy berikut saat menyalin data.

    Platform Sebagian besar file < kecil 512 KB Sebagian besar file sedang 512 KB - 1 MB Sebagian besar file > besar 1 MB
    Data Box 2 Sesi Robocopy
    16 utas per sesi
    3 Sesi Robocopy
    16 utas per sesi
    2 Sesi Robocopy
    24 utas per sesi

    Untuk informasi selengkapnya tentang perintah Robocopy, buka Robocopy dan beberapa contohnya.

    Pemberitahuan ditampilkan selama proses penyalinan untuk mengidentifikasi kesalahan.

    Pemberitahuan kesalahan salin di Sambungkan dan salin

    Pilih Unduh daftar masalah.

    Sambungkan dan salin, Unduh daftar masalah

    Buka daftar untuk melihat detail kesalahan dan pilih URL resolusi untuk melihat resolusi yang direkomendasikan.

    Sambungkan dan salin, unduh dan lihat kesalahan

    Untuk informasi selengkapnya, lihat Melihat log kesalahan selama penyalinan data ke Data Box. Untuk daftar kesalahan mendetail selama penyalinan data, lihat Memecahkan masalah Data Box.

    Untuk memastikan integritas data, checksum dikomputasi sebaris saat data disalin. Setelah penyalinan selesai, verifikasi ruang yang digunakan dan ruang kosong di perangkat Anda.

    Verifikasi ruang bebas dan yang digunakan di dasbor

    Anda dapat menyalin data dari server sumber ke Data Box Anda melalui SMB, NFS, REST, layanan salinan data, atau ke disk terkelola.

    Dalam setiap kasus, pastikan bahwa nama berbagi dan folder, serta ukuran data mengikuti panduan yang dijelaskan dalam Batas layanan Azure Storage dan Azure Data Box.

    Menyalin data melalui SMB

    Untuk menyalin data melalui SMB:

    1. Jika Anda menggunakan host Windows, gunakan perintah berikut untuk menyambungkan ke berbagi SMB:

      \\<Device IP address>\ShareName

    2. Untuk mengambil kredensial akses berbagi, buka halaman Koneksi & salin dalam antarmuka pengguna web lokal Data Box.

    3. Gunakan alat salinan file yang kompatibel dengan SMB seperti Robocopy untuk menyalin data ke berbagi.

    Untuk instruksi langkah demi langkah, buka Tutorial: Menyalin data ke Azure Data Box melalui SMB.

    Menyalin data melalui NFS

    Untuk menyalin data melalui NFS:

    1. Saat menggunakan host NFS, gunakan perintah berikut untuk memasang berbagi NFS di Data Box Anda:

      sudo mount <Data Box device IP>:/<NFS share on Data Box device> <Path to the folder on local Linux computer>

    2. Untuk mendapatkan info masuk akses berbagi, buka halaman Sambungkan & salin di antarmuka pengguna web lokal Data Box.

    3. Gunakan perintah cp atau rsync untuk menyalin data Anda.

    Untuk instruksi langkah demi langkah, buka Tutorial: Menyalin data ke Azure Data Box melalui NFS.

    Menyalin data melalui REST

    Untuk menyalin data melalui REST:

    1. Untuk menyalin data menggunakan penyimpanan Blob Data Box melalui REST API, Anda dapat tersambung melalui http atau https.
    2. Untuk menyalin data ke penyimpanan Blob Data Box, Anda dapat menggunakan AzCopy.

    Untuk instruksi langkah demi langkah, buka Tutorial: Menyalin data ke penyimpanan Blob Azure Data Box melalui REST API.

    Menyalin data melalui layanan salin data

    Untuk menyalin data melalui layanan salin data:

    1. Untuk menyalin data dengan menggunakan layanan salin data, Anda perlu membuat sebuah pekerjaan. Di antarmuka pengguna web lokal Data Box Anda, buka Mengelola > Buat data > Salin.
    2. Isi parameter dan buat pekerjaan.

    Untuk instruksi langkah demi langkah, buka Tutorial: Menggunakan layanan salin data untuk menyalin data ke Azure Data Box.

    Menyalin data ke disk terkelola

    Untuk menyalin data ke disk terkelola:

    1. Saat memesan perangkat Data Box, pilih disk terkelola sebagai tujuan penyimpanan Anda.
    2. Koneksi ke Data Box melalui berbagi SMB atau NFS.
    3. Salin data melalui alat SMB atau NFS.

    Untuk instruksi langkah demi langkah, buka Tutorial: Menggunakan Azure Data Box untuk mengimpor data sebagai disk terkelola di Azure.

    Langkah berikutnya

    Dalam tutorial ini, Anda mempelajari tentang topik Azure Data Box seperti:

    • Prasyarat
    • Menyambungkan ke Data Box
    • Menyalin data ke Data Box

    Lanjutkan ke tutorial berikutnya untuk mempelajari cara mengirimkan Data Box Anda kembali ke Microsoft.