Bagikan melalui


Pencadangan dan pemulihan

Menjelaskan cara kerja pencadangan dan pemulihan data untuk Parallel Data Warehouse (PDW). Operasi pencadangan dan pemulihan digunakan untuk pemulihan bencana. Pencadangan dan pemulihan juga dapat digunakan untuk menyalin database dari satu appliance ke appliance lain.

Dasar-dasar pencadangan dan pemulihan

Cadangan database PDW adalah salinan database appliance, disimpan dalam format sehingga dapat digunakan untuk memulihkan database asli ke appliance.

Cadangan database PDW dibuat dengan pernyataan t-sql BACKUP DATABASE dan diformat untuk digunakan dengan pernyataan RESTORE DATABASE ; tidak dapat digunakan untuk tujuan lain. Cadangan hanya dapat dipulihkan ke appliance dengan angka yang sama atau jumlah simpul Komputasi yang lebih besar.

PDW menggunakan teknologi pencadangan SQL Server untuk mencadangkan dan memulihkan database appliance. Opsi pencadangan SQL Server telah dikonfigurasi sebelumnya untuk menggunakan kompresi cadangan. Anda tidak dapat mengatur opsi cadangan seperti kompresi, checksum, ukuran blok, dan jumlah buffer.

Cadangan database disimpan di satu atau beberapa server cadangan, yang ada di jaringan pelanggan Anda sendiri. PDW menulis cadangan database pengguna secara paralel langsung dari simpul Komputasi ke satu server cadangan dan memulihkan cadangan database pengguna secara paralel langsung dari server cadangan ke simpul Komputasi.

Cadangan disimpan di server cadangan sebagai sekumpulan file dalam sistem file Windows. Cadangan database PDW hanya dapat dipulihkan ke PDW. Namun, Anda dapat mengarsipkan cadangan database dari server cadangan ke lokasi lain dengan menggunakan proses pencadangan file Windows standar. Untuk informasi selengkapnya tentang server cadangan, lihat Memperoleh dan mengonfigurasi server cadangan.

Jenis pencadangan database

Ada dua jenis data yang memerlukan cadangan: database pengguna dan database sistem (misalnya, database master). PDW tidak mencadangkan log transaksi.

Cadangan database lengkap adalah cadangan dari seluruh database PDW. Ini adalah jenis cadangan default. Pencadangan penuh database pengguna mencakup pengguna database, dan peran database. Cadangan master mencakup login.

Cadangan diferensial berisi semua perubahan sejak pencadangan penuh terakhir. Pencadangan diferensial biasanya membutuhkan waktu lebih sedikit daripada pencadangan penuh dan dapat dilakukan lebih sering. Ketika beberapa cadangan diferensial didasarkan pada pencadangan penuh yang sama, setiap diferensial mencakup semua perubahan dalam diferensial sebelumnya.

Misalnya, Anda dapat membuat cadangan penuh setiap minggu dan cadangan diferensial setiap hari. Untuk memulihkan database pengguna, pencadangan penuh ditambah diferensial terakhir (jika ada) perlu dipulihkan.

Cadangan diferensial hanya didukung untuk database pengguna. Cadangan master selalu merupakan cadangan penuh.

Untuk mencadangkan seluruh appliance, Anda perlu melakukan pencadangan semua database pengguna dan cadangan database master.

Proses pencadangan database

Diagram berikut menunjukkan aliran data selama pencadangan database.

PDW backup process

Proses pencadangan berfungsi sebagai berikut:

  1. Pengguna mengirimkan pernyataan tsql BACKUP DATABASE ke simpul Kontrol.

    • Cadangan adalah cadangan penuh atau diferensial.
  2. Untuk database pengguna, simpul Kontrol (Mesin MPP) membuat rencana kueri terdistribusi untuk melakukan pencadangan database paralel.

  3. Setiap simpul yang terlibat dalam cadangan menyalin file cadangannya ke server cadangan menggunakan fungsionalitas cadangan SQL Server.

    • Setiap simpul yang terlibat menyalin satu file cadangan ke server cadangan.

    • Pencadangan database pengguna (penuh atau diferensial) mencakup cadangan bagian database yang disimpan pada setiap simpul Komputasi, dan cadangan pengguna database dan peran database.

  4. Appliance melakukan pencadangan secara paralel menggunakan jaringan InfiniBand.

    • PDW melakukan setiap pencadangan penuh dan diferensial secara paralel. Namun, beberapa pencadangan database tidak berjalan bersamaan. Setiap permintaan pencadangan harus menunggu pencadangan yang dikirim sebelumnya selesai.

    • Cadangan database master hanya mencadangkan data dari simpul Kontrol. Jenis cadangan ini dilakukan secara serial.

  5. Cadangan database PDW adalah sekelompok file yang disimpan dalam direktori yang berada di luar appliance. Nama direktori ditentukan sebagai jalur jaringan dan nama direktori. Direktori tidak dapat berupa jalur lokal, dan tidak dapat berada di appliance.

  6. Setelah pencadangan selesai, Anda dapat menggunakan sistem file Windows untuk menyalin direktori cadangan ke lokasi lain, jika diinginkan.

    • Cadangan hanya dapat dipulihkan ke appliance PDW yang memiliki jumlah node Komputasi yang sama atau lebih besar.

    • Anda tidak dapat mengubah nama cadangan sebelum melakukan pemulihan. Nama direktori cadangan harus cocok dengan nama asli cadangan. Nama asli cadangan terletak di file backup.xml dalam direktori cadangan. Untuk memulihkan database ke nama lain, Anda bisa menentukan nama baru dalam perintah pemulihan. Sebagai contoh: RESTORE DATABASE MyDB1 FROM DISK = ꞌ\\10.192.10.10\backups\MyDB2ꞌ.

Mode pemulihan database

Pemulihan database lengkap membuat ulang database PDW dengan menggunakan data dalam cadangan database. Pemulihan database dilakukan dengan terlebih dahulu memulihkan cadangan penuh, lalu secara opsional memulihkan satu cadangan diferensial. Pemulihan database mencakup pengguna database dan peran database.

Pemulihan header hanya mengembalikan informasi header untuk database. Ini tidak memulihkan data ke appliance.

Pemulihan appliance adalah pemulihan seluruh appliance. Ini termasuk memulihkan semua database pengguna dan database master.

Pulihkan Proses

Diagram berikut menunjukkan aliran data selama pemulihan database.

Restore process

Memulihkan ke Appliance dengan Jumlah Node Komputasi yang Sama**

Saat memulihkan data, appliance mendeteksi jumlah simpul Komputasi pada appliance sumber dan appliance tujuan. Jika kedua appliance memiliki jumlah node Komputasi yang sama, proses pemulihan berfungsi sebagai berikut:

  1. Cadangan database yang akan dipulihkan tersedia pada berbagi file Windows di server cadangan non-appliance. Untuk performa terbaik, server ini terhubung ke jaringan InfiniBand appliance.

  2. Pengguna mengirimkan pernyataan RESTORE DATABASE tsql ke simpul Kontrol.

    • Pemulihan adalah pemulihan penuh atau pemulihan header. Pemulihan penuh memulihkan cadangan penuh lalu secara opsional memulihkan cadangan diferensial.
  3. Simpul Kontrol (Mesin MPP) membuat rencana kueri terdistribusi untuk melakukan pemulihan database paralel.

    • Analytics Platform System (PDW) melakukan pemulihan database pengguna secara paralel. Namun, beberapa pencadangan dan pemulihan database tidak dijalankan secara bersamaan. Mesin MPP menempatkan setiap pernyataan pemulihan ke dalam antrean; itu harus menunggu permintaan pencadangan dan pemulihan yang dikirim sebelumnya selesai.

    • Pemulihan database master hanya memulihkan data ke simpul Kontrol; pemulihan dilakukan secara serial.

    • Pemulihan informasi header adalah operasi cepat dan tidak memulihkan data apa pun ke simpul Komputasi atau Kontrol. Sebagai gantinya, simpul Kontrol mengembalikan hasil sebagai output kueri.

  4. File cadangan disalin ke simpul Komputasi yang benar secara paralel, biasanya melalui jaringan InfiniBand appliance.

  5. Setiap simpul Komputasi memulihkan bagiannya dari database pengguna. Jika salah satu pemulihan tidak berhasil diselesaikan, semua database dihapus dan pemulihan selesai tidak berhasil.

Memulihkan ke Appliance Dengan Jumlah Simpul Komputasi yang Lebih Besar

Memulihkan cadangan ke appliance dengan jumlah simpul Komputasi yang lebih besar meningkatkan ukuran database yang dialokasikan sebanding dengan jumlah simpul Komputasi.

Misalnya, saat memulihkan database 60 GB dari appliance 2 node (30 GB per simpul) ke appliance 6 node, SQL Server PDW membuat database 180 GB (6 simpul dengan 30 GB per simpul) pada appliance 6 node. SQL Server PDW awalnya memulihkan database ke 2 simpul agar sesuai dengan konfigurasi sumber, lalu mendistribusikan ulang data ke semua 6 simpul.

Setelah redistribusi, setiap simpul Komputasi akan berisi data yang kurang aktual dan lebih banyak ruang kosong daripada setiap simpul Komputasi pada appliance sumber yang lebih kecil. Gunakan ruang tambahan untuk menambahkan lebih banyak data ke database. Jika ukuran database yang dipulihkan lebih besar dari yang Anda butuhkan, Anda dapat menggunakan ALTER DATABASE untuk menyusutkan ukuran file database.

Tugas Pencadangan dan Pemulihan Deskripsi
Siapkan server sebagai server cadangan. Memperoleh dan mengonfigurasi server cadangan
Mencadangkan database. DATABASE CADANGAN
Memulihkan database. PULIHKAN DATABASE