Transfer data untuk kumpulan data besar dengan bandwidth jaringan sedang hingga tinggi

Artikel ini memberi gambaran umum tentang solusi transfer data ketika Anda memiliki bandwidth jaringan sedang hingga tinggi di lingkungan dan Anda berencana untuk mentransfer kumpulan data besar. Artikel ini juga menjelaskan opsi transfer data yang disarankan dan matriks kemampuan kunci masing-masing untuk skenario ini.

Untuk memahami gambaran umum semua opsi transfer data yang tersedia, buka Memilih solusi transfer data Azure.

Deskripsi skenario

Kumpulan data besar mengacu pada data dalam urutan TB sampai PB. Bandwidth jaringan sedang hingga tinggi mengacu pada 100 Mbps hingga 10 Gbps.

Opsi yang disarankan dalam skenario ini bergantung pada apakah Anda memiliki bandwidth jaringan sedang atau bandwidth jaringan tinggi.

Bandwidth jaringan sedang (100 Mbps - 1 Gbps)

Dengan bandwidth jaringan sedang, Anda perlu memproyeksikan waktu transfer data melalui jaringan.

Gunakan tabel berikut untuk memperkirakan waktu dan berdasarkan itu, pilih antara transfer offline atau melalui jaringan. Tabel menunjukkan proyeksi waktu transfer data jaringan, untuk berbagai bandwidth jaringan yang tersedia (dengan asumsi pemanfaatan 90%).

Transfer jaringan atau transfer offline

  • Jika transfer jaringan diproyeksikan terlalu lambat, Anda harus menggunakan perangkat fisik. Opsi yang disarankan dalam hal ini adalah perangkat transfer offline dari keluarga Azure Data Box atau Azure Import/Export menggunakan cakram Anda sendiri.

    • Keluarga Azure Data Box untuk transfer offline – Gunakan perangkat Data Box yang disediakan Microsoft untuk memindahkan data dalam jumlah besar ke Azure saat Anda dibatasi oleh waktu, ketersediaan jaringan, atau biaya. Salin data lokal dengan menggunakan alat seperti Robocopy. Bergantung pada ukuran data yang akan ditransfer, Anda dapat memilih dari Cakram Data Box, Data Box, atau Data Box Heavy.
    • Azure Import/Export – Gunakan layanan Azure Import/Export untuk mengimpor data dalam jumlah besar dengan aman ke penyimpanan Azure Blob dan Azure Files dengan mengirim drive cakram pribadi Anda. Layanan ini juga dapat digunakan untuk mentransfer data dari penyimpanan Azure Blob ke drive cakram dan dikirim ke situs lokal Anda.
  • Jika transfer jaringan diproyeksikan masuk akal, maka Anda dapat menggunakan salah satu alat berikut yang dirinci dalam Bandwidth jaringan tinggi.

Bandwidth jaringan tinggi (1 Gbps - 100 Gbps)

Jika bandwidth jaringan yang tersedia tinggi, gunakan salah satu alat berikut.

  • AzCopy - Gunakan alat baris perintah ini untuk menyalin data dengan mudah ke dan dari penyimpanan Azure Blobs, Files, dan Table dengan performa optimal. AzCopy mendukung konkurensi dan paralelisme,serta kemampuan untuk melanjutkan operasi penyalinan saat terganggu.
  • Azure Storage REST API/SDK – Saat membuat aplikasi, Anda dapat mengembangkan aplikasi di Azure Storage REST API dan menggunakan Azure SDK yang ditawarkan dalam beberapa bahasa.
  • Keluarga Azure Data Box untuk transfer online – Azure Stack Edge dan Data Box Gateway merupakan perangkat jaringan online yang bisa memindahkan data ke dalam dan ke luar Azure. Menggunakan perangkat fisik Azure Stack Edge ketika terdapat kebutuhan untuk pengolahan dan pra-pemrosesan data secara bersamaan serta berkelanjutan sebelum mengunggahnya. Data Box Gateway adalah versi virtual perangkat dengan kemampuan transfer data yang sama. Dalam setiap kasus, transfer data dikelola oleh perangkat.
  • Azure Data Factory – Data Factory harus digunakan untuk memperluas skala operasi transfer, dan jika ada kebutuhan untuk kemampuan orkestrasi dan pemantauan tingkat perusahaan. Gunakan Data Factory untuk mentransfer file secara teratur di antara beberapa layanan Azure, lokal, atau kombinasi keduanya. Dengan Data Factory, Anda dapat membuat dan menjadwalkan alur kerja berbasis data (disebut sebagai alur) yang mengolah data dari penyimpanan data yang berbeda dan mengotomatiskan pergerakan dan transformasi data.

Perbandingan kapabilitas kunci

Tabel berikut ini meringkas perbedaan kapabilitas utama untuk opsi yang disarankan.

Bandwidth jaringan sedang

Jika menggunakan transfer data offline, gunakan tabel berikut untuk memahami perbedaan kapabilitas utama.

Cakram Data Box Data Box Data Box Heavy Import/Export
Ukuran data Hingga 35 TB Hingga 80 TB per perangkat Hingga 800 TB per perangkat Variabel
Jenis data Azure Blobs
Azure Files*
Azure Blobs
File Azure
Azure Blobs
File Azure
Azure Blobs
File Azure
Bentuk dan ukuran 5 SSD per pesanan 1 X 50-lbs. perangkat berukuran desktop per pesanan 1 X ~500-lbs. perangkat besar per pesanan Hingga 10 HDD/SSD per pesanan
Waktu persiapan awal Rendah
(15 menit)
Rendah hingga sedang
(<30 menit)
Sedang
(1-2 jam)
Sedang hingga sulit
(variabel)
Kirim data ke Azure Ya Ya Ya Ya
Ekspor data dari Azure Tidak Tidak Tidak Ya
Enkripsi AES 128-bit AES 256-bit AES 256-bit AES 128-bit
Perangkat Keras Disediakan Microsoft Disediakan Microsoft Disediakan Microsoft Disediakan pelanggan
Antarmuka jaringan USB 3.1/SATA RJ 45, SFP+ RJ45, QSFP+ SATA II/SATA III
Integrasi mitra Beberapa Tinggi Tinggi Beberapa
Pengiriman Dikelola Microsoft Dikelola Microsoft Dikelola Microsoft Dikelola pelanggan
Gunakan saat data berpindah Dalam batas komersil Dalam batas komersil Dalam batas komersil Di seluruh batas geografis, misalnya AS ke UE
Harga Harga Harga Harga Harga

* Data Box Disk tidak mendukung Berbagi File Besar dan tidak mempertahankan metadata file

Jika menggunakan transfer data online, gunakan tabel di bagian berikut untuk bandwidth jaringan tinggi.

Bandwidth jaringan tinggi

Alat AzCopy,
Azure PowerShell,
Azure CLI
Azure Storage REST API, SDK Data Box Gateway ataupun Azure Stack Edge Azure Data Factory
Jenis data Azure Blobs, Azure Files, Azure Tables Azure Blobs, Azure Files, Azure Tables Azure Blobs, Azure Files Mendukung 70+ konektor data untuk penyimpanan dan format data
Bentuk dan ukuran Alat baris perintah Antarmuka terprogram Microsoft menyediakan perangkat
virtual atau fisik
Layanan di portal Azure
Penyetelan awal satu kali Mudah Sedang Mudah (<30 menit) hingga sedang (1-2 jam) Luas
Pra-proses data Tidak Tidak Ya (Dengan komputasi Edge) Ya
Transfer dari awan lain Tidak Tidak Tidak Ya
Jenis pengguna IT Pro atau dev Dev Profesional IT Profesional IT
Harga Gratis, biaya keluar data berlaku Gratis, biaya keluar data berlaku Harga Azure Stack Edge
Harga Data Box Gateway
Harga

Langkah berikutnya