Penyimpanan DPM Deduplikasi

Penting

Versi Data Protection Manager (DPM) ini telah mencapai akhir dukungan. Kami menyarankan Anda untuk meningkatkan ke DPM 2022.

System Center Data Protection Manager (DPM) dapat menggunakan deduplikasi data.

Deduplikasi data (dedup) menemukan dan menghapus data duplikat dalam volume sambil memastikan data tetap benar dan lengkap. Pelajari selengkapnya tentang perencanaan deduplikasi.

  • Dedup mengurangi konsumsi penyimpanan. Meskipun jumlah redundansi untuk sekumpulan data akan bergantung pada beban kerja dan jenis data, biasanya data cadangan menunjukkan penghematan yang kuat saat dedup digunakan.

  • Redundansi data dapat dikurangi lebih lanjut dengan dedup ketika data yang dicadangkan dari jenis dan beban kerja serupa diproses bersama-sama.

  • Dedup dirancang untuk diinstal pada volume data utama tanpa perangkat keras khusus tambahan sehingga tidak memengaruhi beban kerja utama di server. Pengaturan default tidak mengganggu, karena memungkinkan data menua selama lima hari sebelum memproses file tertentu dan memiliki ukuran file minimum default 32 KB. Implementasi ini dirancang untuk penggunaan memori dan CPU yang rendah.

  • Dedup dapat diimplementasikan pada beban kerja berikut:

    • Berbagi file umum: Publikasi dan berbagi konten grup, folder beranda pengguna, dan Pengalihan Folder/File Offline

    • Berbagi penyebaran perangkat lunak: Biner, gambar, dan pembaruan perangkat lunak

    • Pustaka VHD: Penyimpanan file hard disk virtual (VHD) untuk provisi ke hypervisor

    • Penyebaran VDI (khusus Windows Server 2012 R2): Penyebaran Infrastruktur Desktop Virtual (VDI) menggunakan Hyper-V

    • Pencadangan virtual: Solusi pencadangan (seperti DPM yang berjalan di komputer virtual Hyper-V) yang menyimpan data cadangan ke file VHD/VHDX di Windows File Server

DPM dan dedup

Menggunakan dedup dengan DPM dapat menghasilkan penghematan besar. Jumlah ruang yang disimpan oleh dedup saat mengoptimalkan data cadangan DPM bervariasi tergantung pada jenis data yang dicadangkan. Misalnya, cadangan server database terenkripsi dapat mengakibatkan penghematan minimal karena data duplikat disembunyikan oleh proses enkripsi. Namun, pencadangan penyebaran Infrastruktur Desktop Virtual (VDI) yang besar dapat menghasilkan penghematan besar dalam kisaran 70-90+%, karena biasanya ada sejumlah besar duplikasi data antara lingkungan desktop virtual. Dalam konfigurasi yang dijelaskan dalam artikel, kami menjalankan berbagai beban kerja pengujian dan melihat penghematan berkisar antara 50% dan 90%.

Untuk menggunakan dedup untuk penyimpanan DPM, DPM harus berjalan di komputer virtual Hyper-V dan menyimpan data cadangan ke VHD di folder bersama dengan dedup data diaktifkan.

Untuk menyebarkan DPM sebagai komputer virtual yang mencadangkan data ke volume dedupl, kami merekomendasikan topologi penyebaran berikut:

  • DPM yang berjalan di komputer virtual di kluster host Hyper-V.

  • Penyimpanan DPM menggunakan file VHD/VHDX yang disimpan di berbagi SMB 3.0 di server file.

  • Untuk contoh pengujian kami, kami mengonfigurasi server file sebagai server file yang diskalakan (SOFS) yang disebarkan menggunakan volume penyimpanan yang dikonfigurasi dari kumpulan Ruang Penyimpanan yang dibangun menggunakan drive SAS yang terhubung langsung. Penyebaran ini memastikan performa dalam skala besar.

Perhatikan bahwa:

  • Penyebaran ini didukung untuk DPM 2012 R2 dan yang lebih baru dan untuk semua data beban kerja yang dapat dicadangkan oleh DPM 2012 R2 dan yang lebih baru.

  • Semua simpul Windows File Server tempat hard disk virtual DPM berada dan di mana dedup akan diaktifkan harus menjalankan Windows Server 2012 R2 dengan Pembaruan Rollup November 2014 atau yang lebih baru.

  • Kami akan memberikan rekomendasi dan instruksi umum untuk penyebaran skenario. Setiap kali contoh khusus perangkat keras diberikan, perangkat keras yang disebarkan di Microsoft Cloud Platform System (CPS) digunakan untuk referensi.

  • Contoh ini menggunakan berbagi SMB 3.0 jarak jauh untuk menyimpan data cadangan, sehingga persyaratan perangkat keras utama berpusat di sekitar simpul Server File daripada simpul Hyper-V. Konfigurasi perangkat keras berikut digunakan dalam CPS untuk pencadangan dan penyimpanan produksi. Perangkat keras keseluruhan digunakan untuk penyimpanan cadangan dan produksi, tetapi jumlah drive yang tercantum dalam penutup drive hanya yang digunakan untuk pencadangan.

    • Empat kluster Server File Peluasan Skala Simpul

    • Konfigurasi per simpul

      • 2x Intel(R) Xeon(R) CPU E5-2650 0 @ 2,00 GHz, 2001 MHz, 8 core, 16 prosesor logis

      • Memori RDIMM 128 GB 1333 MHz

      • Koneksi penyimpanan: 2 port SAS, 1 port 10 GbE iWarp/RDMA

    • Empat penutup drive JBOD

      • 18 Disk di setiap JBOD - HDD 16 x 4 TB + SSD 2 x 800 GB

      • Jalur ganda ke setiap drive - Kebijakan penyeimbangan beban I/O multipath diatur ke failover saja

      • SSD dikonfigurasi untuk cache write-back (WBC) dan sisanya untuk drive jurnal khusus

Menyiapkan volume dedup

Mari kita pertimbangkan seberapa besar volume harus mendukung file VHDX deduplikasi yang berisi data DPM. Di CPS, kami telah membuat volume masing-masing 7,2 TB. Ukuran volume optimal terutama tergantung pada seberapa banyak dan seberapa sering data pada volume berubah, dan pada tingkat throughput akses data subsistem penyimpanan disk. Penting untuk dicatat bahwa jika pemrosesan deduplikasi tidak dapat mengikuti tingkat perubahan data harian (churn), tingkat penghematan akan turun sampai pemrosesan dapat selesai. Untuk informasi selengkapnya, lihat Mengukur Volume untuk Deduplikasi Data. Panduan umum berikut direkomendasikan untuk volume dedup:

  • Gunakan Ruang Penyimpanan Paritas dengan kesadaran penutup untuk ketahanan dan peningkatan pemanfaatan disk.

  • Format NTFS dengan unit alokasi 64 KB dan segmen rekaman file besar untuk bekerja lebih baik dengan penggunaan dedup file jarang.

  • Dalam konfigurasi perangkat keras di atas ukuran volume yang direkomendasikan sebesar volume 7,2 TB, volume akan dikonfigurasi sebagai berikut:

    • Enclosure sadar paritas ganda 7,2 TB + 1 GB Write-back cache

      • ResiliencySettingName == Parity

      • PhysicalDiskRedundancy == 2

      • NumberOfColumns == 7

      • Interleave == 256 KB (Performa paritas ganda pada interleave 64 KB jauh lebih rendah daripada pada interleave 256 KB default)

      • IsEnclosureAware == $true

      • AllocationUnitSize=64 KB

      • FRS Besar

      Siapkan disk virtual baru di kumpulan penyimpanan yang ditentukan sebagai berikut:

      New-VirtualDisk -Size 7.2TB -PhysicalDiskRedundancy 2 -ResiliencySettingName Parity -StoragePoolFriendlyName BackupPool -FriendlyName BackupStorage -NumberOfColumns 7 -IsEnclosureAware $true
      
    • Masing-masing volume ini kemudian harus diformat sebagai:

      Format-Volume -Partition <volume> -FileSystem NTFS -AllocationUnitSize 64 KB -UseLargeFRS -Force
      

      Dalam penyebaran CPS, ini kemudian dikonfigurasi sebagai CSV.

    • Dalam volume ini, DPM akan menyimpan serangkaian file VHDX untuk menyimpan data cadangan. Aktifkan deduplikasi pada volume setelah memformatnya sebagai berikut:

      Enable-DedupVolume -Volume <volume> -UsageType HyperV
      Set-DedupVolume -Volume <volume> -MinimumFileAgeDays 0 -OptimizePartialFiles:$false
      

      Perintah ini juga memodifikasi pengaturan dedup tingkat volume berikut:

      • Atur UsageType ke HyperV: Ini menghasilkan pemrosesan dedup file terbuka, yang diperlukan karena file VHDX yang digunakan untuk penyimpanan cadangan oleh DPM tetap terbuka dengan DPM yang berjalan di komputer virtualnya.

      • Nonaktifkan PartialFileOptimization: Ini menyebabkan dedup mengoptimalkan semua bagian file terbuka daripada memindai bagian yang diubah dengan usia minimum.

      • Atur parameter MinFileAgeDays ke 0: Dengan PartialFileOptimization dinonaktifkan, MinFileAgeDays mengubah perilakunya sehingga dedup hanya mempertimbangkan file yang belum berubah dalam beberapa hari itu. Karena kami ingin dedup mulai memproses data cadangan di semua file DPM VHDX tanpa penundaan, kita perlu mengatur MinFileAgeDays ke 0.

Untuk informasi selengkapnya tentang menyiapkan deduplikasi, lihat Menginstal dan Mengonfigurasi Duplikasi Data.

Menyiapkan penyimpanan DPM

Untuk menghindari masalah fragmentasi dan menjaga efisiensi, penyimpanan DPM dialokasikan menggunakan file VHDX yang berada di volume deduplikasi. Sepuluh file VHDX dinamis masing-masing 1 TB dibuat pada setiap volume dan dilampirkan ke DPM. Selain itu, 3 TB provisi penyimpanan berlebihan dilakukan untuk memanfaatkan penghematan penyimpanan yang dihasilkan oleh dedup. Karena dedup menghasilkan penghematan penyimpanan tambahan, file VHDX baru dapat dibuat pada volume ini untuk menggunakan ruang yang disimpan. Kami menguji server DPM dengan hingga 30 file VHDX yang melekat padanya.

  1. Jalankan perintah berikut untuk membuat hard disk virtual yang akan ditambahkan nanti ke server DPM:

    New-SCVirtualDiskDrive -Dynamic -SCSI -Bus $Bus -LUN $Lun -JobGroup $JobGroupId -VirtualHardDiskSizeMB 1048576 -Path $Using:Path -FileName <VHDName>
    
  2. Kemudian tambahkan hard disk virtual yang dibuat ke server DPM sebagai berikut:

    Import-Module "DataProtectionManager"
    Set-StorageSetting -NewDiskPolicy OnlineAll
    $dpmdisks = @()
    $dpmdisks = Get-DPMDisk -DPMServerName $env:computername | ? {$_.CanAddToStoragePool -
    eq $true -and $_.IsInStoragePool -eq $false -and $_.HasData -eq $false}
    Add-DPMDisk $dpmdisks
    

    Langkah ini mengonfigurasi kumpulan penyimpanan sebagai disk atau disk tempat DPM menyimpan replika dan titik pemulihan untuk data yang dilindungi. Kumpulan ini adalah bagian dari konfigurasi DPM dan terpisah dari kumpulan Ruang Penyimpanan yang digunakan untuk membuat volume data yang dijelaskan di bagian sebelumnya. Untuk informasi selengkapnya tentang kumpulan penyimpanan DPM, lihat Mengonfigurasi penyimpanan disk dan kumpulan penyimpanan.

Menyiapkan kluster Windows File Server

Dedup memerlukan serangkaian opsi konfigurasi khusus untuk mendukung penyimpanan DPM virtual karena skala data dan ukuran file individual. Opsi ini bersifat global untuk kluster atau node kluster. Dedup harus diaktifkan dan pengaturan kluster harus dikonfigurasi secara individual pada setiap node kluster.

  1. Aktifkan dedup pada penyimpanan Windows File Server- Peran Deduplikasi harus diinstal pada semua simpul kluster Windows File Server. Untuk melakukan ini, jalankan perintah PowerShell berikut pada setiap simpul kluster:

    Install-WindowsFeature -Name FileAndStorage-Services,FS-Data-Deduplication -ComputerName <node name>
    
  2. Menyetel pemrosesan dedup untuk file data cadangan- Jalankan perintah PowerShell berikut untuk mengatur untuk memulai pengoptimalan tanpa penundaan dan tidak mengoptimalkan penulisan file parsial. Secara default pekerjaan Pengumpulan Sampah (GC) dijadwalkan setiap minggu, dan setiap minggu keempat, pekerjaan GC berjalan dalam mode "GC mendalam" untuk pencarian data yang lebih lengkap dan intensif waktu untuk dihapus. Untuk beban kerja DPM, mode "GC mendalam" ini tidak menghasilkan keuntungan apresiatif dan mengurangi jumlah waktu di mana dedup dapat mengoptimalkan data. Oleh karena itu, kami menonaktifkan mode dalam ini.

    Set-ItemProperty -Path HKLM:\Cluster\Dedup -Name DeepGCInterval -Value 0xFFFFFFFF
    
  3. Sesuaikan performa untuk operasi skala besar- Jalankan skrip PowerShell berikut untuk:

    • Menonaktifkan pemrosesan dan I/O tambahan saat pengumpulan sampah dalam berjalan

    • Memesan memori tambahan untuk pemrosesan hash

    • Aktifkan pengoptimalan prioritas untuk memungkinkan defragmentasi segera file besar

    Set-ItemProperty -Path HKLM:\Cluster\Dedup -Name HashIndexFullKeyReservationPercent -Value 70
    Set-ItemProperty -Path HKLM:\Cluster\Dedup -Name EnablePriorityOptimization -Value 1
    

    Pengaturan ini mengubah hal berikut:

    • HashIndexFullKeyReservationPercent: Nilai ini mengontrol berapa banyak memori pekerjaan pengoptimalan yang digunakan untuk hash gugus yang ada versus hash potongan baru. Pada skala tinggi, 70% menghasilkan throughput pengoptimalan yang lebih baik daripada default 50%.

    • EnablePriorityOptimization: Dengan file mendekati 1 TB, fragmentasi satu file dapat mengakumulasi fragmen yang cukup untuk mendekati batas per file. Pemrosesan pengoptimalan mengonsolidasikan fragmen ini dan mencegah batas ini tercapai. Dengan mengatur kunci registri ini, dedup akan menambahkan proses tambahan untuk menangani file yang sangat terfragmentasi dengan prioritas tinggi.

Menyiapkan penjadwalan DPM dan dedup

Operasi pencadangan dan deduplikasi intensif I/O. Jika dijalankan pada saat yang sama, overhead tambahan untuk beralih antar operasi bisa mahal dan mengakibatkan lebih sedikit data yang dicadangkan atau dideduplikasi setiap hari. Kami sarankan Anda mengonfigurasi deduplikasi dan jendela cadangan khusus dan terpisah. Ini membantu memastikan bahwa lalu lintas I/O untuk setiap operasi ini didistribusikan secara efisien selama operasi sistem harian. Panduan yang direkomendasikan untuk penjadwalan adalah:

  • Pisahkan hari menjadi pencadangan yang tidak tumpang tindih dan jendela dedup.

  • Siapkan jadwal pencadangan kustom.

  • Siapkan jadwal dedup kustom.

  • Jadwalkan pengoptimalan di jendela dedup harian.

  • Siapkan jadwal dedup akhir pekan secara terpisah, menggunakan waktu tersebut untuk pengumpulan sampah dan pekerjaan menggosok.

Anda bisa menyiapkan jadwal DPM dengan perintah PowerShell berikut ini:

Set-DPMConsistencyCheckWindow -ProtectionGroup $mpg -StartTime $startTime -
DurationInHours $duration
Set-DPMBackupWindow -ProtectionGroup $mpg -StartTime $startTime -DurationInHours
$duration

Dalam konfigurasi ini, DPM dikonfigurasi untuk mencadangkan komputer virtual antara pukul 22.00 dan 06.00. Deduplikasi dijadwalkan selama 16 jam tersisa dalam sehari. Waktu dedup aktual yang Anda konfigurasi akan bergantung pada ukuran volume. Untuk informasi selengkapnya, lihat Volume Ukuran untuk Deduplikasi Data. Jendela deduplikasi 16 jam mulai pukul 6 pagi setelah jendela cadangan berakhir akan dikonfigurasi sebagai berikut dari node kluster individual:

#disable default schedule
Set-DedupSchedule * -Enabled:$false
#Remainder of the day after an 8 hour backup window starting at 10pm $dedupDuration = 16
$dedupStart = "6:00am"
#On weekends GC and scrubbing start one hour earlier than optimization job.
# Once GC/scrubbing jobs complete, the remaining time is used for weekend
# optimization.
$shortenedDuration = $dedupDuration - 1
$dedupShortenedStart = "7:00am"
#if the previous command disabled priority optimization schedule
#reenable it
if ((Get-DedupSchedule -name PriorityOptimization -ErrorAction SilentlyContinue) -ne $null)
{
Set-DedupSchedule -Name PriorityOptimization -Enabled:$true
}
#set weekday and weekend optimization schedules
New-DedupSchedule -Name DailyOptimization -Type Optimization -DurationHours $dedupDuration -Memory 50 -Priority Normal -InputOutputThrottleLevel None -Start $dedupStart -Days Monday,Tuesday,Wednesday,Thursday,Friday
New-DedupSchedule -Name WeekendOptimization -Type Optimization -DurationHours $shortenedDuration -Memory 50 -Priority Normal -InputOutputThrottleLevel None -Start $dedupShortenedStart -Days Saturday,Sunday
#re-enable and modify scrubbing and garbage collection schedules
Set-DedupSchedule -Name WeeklyScrubbing -Enabled:$true -Memory 50 -DurationHours $dedupDuration -Priority Normal -InputOutputThrottleLevel None -Start $dedupStart -StopWhenSystemBusy:$false -Days Sunday
Set-DedupSchedule -Name WeeklyGarbageCollection -Enabled:$true -Memory 50 -DurationHours $dedupDuration -Priority Normal -InputOutputThrottleLevel None -Start $dedupStart -StopWhenSystemBusy:$false -Days Saturday
#disable background optimization
if ((Get-DedupSchedule -name BackgroundOptimization -ErrorAction SilentlyContinue) -ne $null)
{
Set-DedupSchedule -Name BackgroundOptimization -Enabled:$false
}

Setiap kali jendela cadangan dimodifikasi, sangat penting bahwa jendela deduplikasi dimodifikasi bersama dengannya sehingga tidak tumpang tindih. Jendela deduplikasi dan cadangan tidak perlu mengisi 24 jam penuh dalam sehari; namun, sangat disarankan bahwa mereka melakukannya untuk memungkinkan variasi waktu pemrosesan karena perubahan harian yang diharapkan dalam beban kerja dan churn data.

Implikasi untuk performa pencadangan

Setelah satu set file dideduplikasi, mungkin ada sedikit biaya performa saat mengakses file. Hal ini disebabkan oleh pemrosesan tambahan yang diperlukan untuk mengakses format file yang digunakan oleh file deduplikasi. Dalam skenario ini, file adalah sekumpulan file VHDX yang melihat penggunaan berkelanjutan oleh DPM selama jendela cadangan. Efek dari file-file ini dideduplikasi berarti bahwa operasi pencadangan dan pemulihan bisa sedikit lebih lambat daripada tanpa deduplikasi. Adapun produk cadangan apa pun, DPM adalah beban kerja tulis-berat dengan operasi baca menjadi yang paling penting selama operasi pemulihan. Rekomendasi untuk mengatasi implikasi untuk performa pencadangan karena deduplikasi adalah:

  • Operasi baca/pulihkan: Efek pada operasi baca biasanya dapat diabaikan dan tidak memerlukan pertimbangan khusus karena cache fitur deduplikasi mendeduplikasi gugus.

  • Operasi tulis/pencadangan: Rencanakan peningkatan waktu pencadangan 5-10% saat menentukan jendela cadangan. (Ini adalah peningkatan dibandingkan dengan waktu pencadangan yang diharapkan saat menulis ke volume yang tidak dideduplikasi.)

Pemantauan

DPM dan deduplikasi data dapat dipantau untuk memastikan bahwa:

  • Ruang disk yang memadai disediakan untuk menyimpan data cadangan

  • Pekerjaan pencadangan DPM selesai secara normal

  • Deduplikasi diaktifkan pada volume cadangan

  • Jadwal deduplikasi diatur dengan benar

  • Pemrosesan deduplikasi selesai secara normal setiap hari

  • Tingkat penghematan Deduplikasi cocok dengan asumsi yang dibuat untuk konfigurasi sistem

Keberhasilan deduplikasi tergantung pada kemampuan perangkat keras sistem secara keseluruhan (termasuk kecepatan pemrosesan CPU, bandwidth I/O, kapasitas penyimpanan), konfigurasi sistem yang benar, beban sistem rata-rata, dan jumlah harian data yang dimodifikasi.

Anda dapat memantau DPM menggunakan Konsol Pusat DPM. Lihat Menginstal Central Console.

Anda dapat memantau dedup untuk memeriksa status dedup, laju penghematan, dan status jadwal menggunakan perintah PowerShell berikut:

Dapatkan status:

PS C:\> Get-DedupStatus
FreeSpace SavedSpace OptimizedFiles InPolicyFiles Volume
-------------- ---------- -------------- ------------- ------
280.26 GB 529.94 GB 36124 36125 X:
151.26 GB 84.19 GB 43017 43017 Z:

Dapatkan penghematan:

PS C:\> Get-DedupVolume
Enabled SavedSpace SavingsRate Volume
------- ---------- ----------- ------
True 529.94 GB 74 % X:

Dapatkan status jadwal menggunakan cmdlet Get-DedupSchedule.

Pantau acara

Memantau log peristiwa dapat membantu memahami peristiwa dan status deduplikasi.

  • Untuk melihat peristiwa deduplikasi, dalam File Explorer, navigasikan ke Log> Aplikasi dan LayananMicrosoft>Windows>Deduplication.

  • Jika nilai LastOptimizationResult = 0x00000000 muncul di Get-DedupStatus |fl Windows PowerShell hasil, seluruh himpunan data diproses oleh pekerjaan pengoptimalan sebelumnya. Jika tidak, sistem tidak dapat menyelesaikan pemrosesan deduplikasi dan Anda mungkin ingin memeriksa pengaturan konfigurasi Anda, misalnya ukuran volume.

Untuk contoh cmdlet yang lebih rinci, lihat Memantau dan Melaporkan Deduplikasi Data.

Memantau penyimpanan cadangan

Dalam contoh konfigurasi kami, volume 7,2 TB diisi dengan 10 TB data "logis" (ukuran data saat tidak dideduplikasi) yang disimpan dalam file VHDX dinamis 10 x 1 TB. Karena file-file ini mengakumulasi data cadangan tambahan, file tersebut akan secara perlahan mengisi volume. Jika persentase penghematan yang dihasilkan dari deduplikasi cukup tinggi, semua 10 file akan dapat mencapai ukuran logis maksimumnya dan masih pas dalam volume 7,2 TB (berpotensi bahkan mungkin ada ruang tambahan untuk mengalokasikan file VHDX tambahan untuk digunakan server DPM). Tetapi jika penghematan ukuran dari deduplikasi tidak cukup, ruang pada volume mungkin habis sebelum file VHDX mencapai ukuran logis penuh dan volume akan penuh. Untuk mencegah volume menjadi penuh, kami merekomendasikan hal berikut:

  • Jadilah konservatif dalam persyaratan ukuran volume dan memungkinkan beberapa provisi penyimpanan yang berlebihan. Disarankan untuk memungkinkan buffer setidaknya 10% ketika merencanakan penggunaan penyimpanan cadangan untuk memungkinkan variasi yang diharapkan dalam penghematan deduplikasi dan churn data.

  • Pantau volume yang digunakan untuk penyimpanan cadangan untuk memastikan bahwa pemanfaatan ruang dan tingkat penghematan deduplikasi berada pada tingkat yang diharapkan.

Jika volume menjadi penuh, gejala berikut menghasilkan:

  • Komputer virtual DPM akan dimasukkan ke dalam status jeda-kritis dan tidak ada pekerjaan pencadangan lebih lanjut yang dapat dikeluarkan oleh VM tersebut.

  • Semua pekerjaan pencadangan yang menggunakan file VHDX pada volume penuh akan gagal.

Untuk memulihkan dari kondisi ini dan memulihkan sistem ke operasi normal, penyimpanan tambahan dapat disediakan, dan migrasi penyimpanan komputer virtual DPM atau VHDX-nya dapat dilakukan untuk mengosongkan ruang:

  1. Hentikan Server DPM yang memiliki file VHDX pada berbagi cadangan lengkap.

  2. Buat volume tambahan dan berbagi cadangan menggunakan konfigurasi dan pengaturan yang sama seperti yang digunakan untuk berbagi yang ada, termasuk pengaturan untuk NTFS dan deduplikasi.

  3. Migrasikan Penyimpanan untuk komputer virtual DPM Server dan migrasikan setidaknya satu file VHDX dari berbagi cadangan lengkap ke berbagi cadangan baru yang dibuat di langkah 2.

  4. Jalankan pekerjaan pengumpulan sampah (GC) Deduplikasi Data pada berbagi cadangan sumber yang penuh. Pekerjaan GC harus berhasil dan merebut kembali ruang kosong.

  5. Mulai ulang komputer virtual DPM Server.

  6. Pekerjaan pemeriksaan konsistensi DPM akan dipicu selama jendela cadangan berikutnya untuk semua sumber data yang gagal sebelumnya.

  7. Semua pekerjaan pencadangan sekarang harus berhasil.

Ringkasan

Kombinasi deduplikasi dan DPM memberikan penghematan ruang yang substansial. Ini memungkinkan tingkat retensi yang lebih tinggi, pencadangan yang lebih sering, dan TCO yang lebih baik untuk penyebaran DPM. Panduan dan rekomendasi dalam dokumen ini harus memberi Anda alat dan pengetahuan untuk mengonfigurasi deduplikasi untuk penyimpanan DPM dan melihat manfaat untuk diri Anda sendiri dalam penyebaran Anda sendiri.

Pertanyaan umum

T: File DPM VHDX harus berukuran 1 TB. Apakah ini berarti DPM tidak dapat mencadangkan VM atau SharePoint atau SQL DB atau volume file berukuran > 1 TB?

J: Tidak. DPM menggabungkan beberapa volume menjadi satu untuk menyimpan cadangan. Jadi, ukuran file 1 TB tidak memiliki implikasi untuk ukuran sumber data yang dapat dicadangkan DPM.

T: Sepertinya file VHDX penyimpanan DPM harus disebarkan hanya pada berbagi file SMB jarak jauh. Apa yang akan terjadi jika saya menyimpan file VHDX cadangan pada volume yang diaktifkan dedup pada sistem yang sama tempat komputer virtual DPM berjalan?

J: Seperti yang dibahas di atas, DPM, Hyper-V, dan dedup adalah operasi penyimpanan dan komputasi intensif. Menggabungkan ketiganya dalam satu sistem dapat menyebabkan I/O- dan operasi intensif proses yang dapat membuat Hyper-V dan VM-nya kelaparan. Jika Anda memutuskan untuk bereksperimen mengonfigurasi DPM dalam VM dengan volume penyimpanan cadangan pada komputer yang sama, Anda harus memantau performa dengan hati-hati untuk memastikan bahwa ada cukup bandwidth I/O dan kapasitas komputasi untuk mempertahankan ketiga operasi pada komputer yang sama.

T: Anda merekomendasikan deduplikasi khusus dan terpisah dan jendela cadangan. Mengapa saya tidak dapat mengaktifkan dedup saat DPM dicadangkan? Saya perlu mencadangkan SQL DB saya setiap 15 menit.

J: Dedup dan DPM adalah operasi intensif penyimpanan dan keduanya berjalan pada saat yang sama dapat tidak efisien dan menyebabkan kelaparan I/O. Oleh karena itu, untuk melindungi beban kerja lebih dari sekali sehari (misalnya SQL Server setiap 15 menit) dan untuk mengaktifkan dedup pada saat yang sama, pastikan bahwa ada cukup bandwidth I/O dan kapasitas komputer untuk menghindari kelaparan sumber daya.

T: Berdasarkan konfigurasi yang dijelaskan, DPM perlu berjalan di komputer virtual. Mengapa saya tidak dapat mengaktifkan dedup pada volume replika dan volume salinan bayangan secara langsung daripada pada file VHDX?

J: Dedup melakukan deduplikasi per volume yang beroperasi pada file individual. Karena dedup mengoptimalkan pada tingkat file, dedup tidak dirancang untuk mendukung teknologi VolSnap yang digunakan DPM untuk menyimpan data cadangannya. Dengan menjalankan DPM dalam VM, Hyper-V memetakan operasi volume DPM ke tingkat file VHDX, memungkinkan dedup untuk mengoptimalkan data cadangan dan memberikan penghematan penyimpanan yang lebih besar.

T: Konfigurasi sampel di atas hanya membuat volume 7,2 TB. Dapatkah saya membuat volume yang lebih besar atau lebih kecil?

J: Dedup menjalankan satu utas per volume. Ketika ukuran volume menjadi lebih besar, dedup membutuhkan lebih banyak waktu untuk menyelesaikan pengoptimalannya. Di sisi lain dengan volume kecil, ada lebih sedikit data untuk menemukan potongan duplikat, yang dapat mengakibatkan berkurangnya penghematan. Jadi, disarankan untuk menyempurnakan ukuran volume berdasarkan total churn dan kemampuan perangkat keras sistem untuk penghematan optimal. Informasi lebih rinci tentang menentukan ukuran volume yang digunakan dengan deduplikasi dapat ditemukan dalam volume Ukuran untuk Deduplikasi di Windows Server. Untuk informasi lebih rinci tentang menentukan ukuran volume yang digunakan dengan deduplikasi, lihat Ukuran Volume untuk Deduplikasi Data.