Apa itu pemulihan bencana?

Bencana adalah peristiwa besar tunggal dengan dampak yang lebih besar dan tahan lama daripada aplikasi dapat mengurangi melalui bagian ketersediaan tinggi dari desainnya. Pemulihan bencana (DR) adalah tentang pemulihan dari peristiwa berdampak tinggi, seperti bencana alam atau penyebaran yang gagal, yang mengakibatkan waktu henti dan kehilangan data. Terlepas dari penyebabnya, obat terbaik untuk bencana adalah rencana DR yang terdefinisi dan teruji dengan baik dan desain aplikasi yang secara aktif mendukung DR.

Tujuan pemulihan

Paket DR lengkap harus menentukan persyaratan bisnis penting berikut untuk setiap proses yang diterapkan aplikasi:

  • Tujuan Titik Pemulihan (RPO) adalah durasi maksimum kehilangan data yang dapat diterima. RPO diukur dalam satuan waktu, bukan volume, seperti "30 menit data" atau "empat jam data." RPO adalah tentang membatasi dan memulihkan dari kehilangan data, bukan pencurian data.

  • Tujuan Waktu Pemulihan (RTO) adalah durasi maksimum waktu henti yang dapat diterima, di mana "waktu henti" ditentukan oleh spesifikasi Anda. Misalnya, jika durasi waktu henti yang dapat diterima dalam bencana adalah delapan jam, maka RTO adalah delapan jam.

Screenshot of RTO and RPO durations in hours.

Setiap proses utama atau beban kerja yang diterapkan aplikasi harus memiliki nilai RPO dan RTO terpisah dengan memeriksa risiko skenario bencana dan strategi pemulihan potensial. Proses menentukan RPO dan RTO secara efektif menciptakan persyaratan DR untuk aplikasi Anda sebagai akibat dari masalah bisnis unik Anda (biaya, dampak, kehilangan data, dll.).

Desain untuk pemulihan bencana

Pemulihan bencana bukan fitur otomatis, tetapi harus dirancang, dibangun, dan diuji. Untuk mendukung strategi DR yang solid, Anda harus membangun aplikasi dengan mengingat DR dari bawah ke atas. Azure menawarkan layanan, fitur, dan panduan untuk membantu Anda mendukung DR saat membuat aplikasi.

Pemulihan data

Selama bencana, ada dua metode utama memulihkan data: pencadangan dan replikasi.

Pencadangan memulihkan data ke titik waktu tertentu. Dengan menggunakan cadangan, Anda dapat memberikan solusi sederhana, aman, dan hemat biaya untuk mencadangkan dan memulihkan data Anda ke cloud Microsoft Azure. Gunakan Azure Backup untuk membuat rekam jepret data baca-saja berumur panjang untuk digunakan dalam pemulihan.

Replikasi Data membuat salinan data langsung secara real time atau hampir real-time di beberapa replika penyimpanan data dengan pertimbangkan kehilangan data minimal. Tujuan replikasi adalah untuk menjaga replika tetap disinkronkan dengan latensi sesedikit mungkin sambil menjaga tingkat respons aplikasi. Sebagian besar sistem database dengan fitur penuh dan produk dan layanan penyimpanan data lainnya mencakup beberapa jenis replikasi sebagai fitur yang terintegrasi erat, karena persyaratan fungsional dan performanya. Contohnya adalah penyimpanan geo-redundan (GRS).

Desain replikasi yang berbeda menempatkan prioritas yang berbeda pada konsistensi, performa, dan biaya data.

  • Replikasi aktif memerlukan pembaruan untuk terjadi pada beberapa replika secara bersamaan, menjamin konsistensi dengan biaya throughput.

  • Replikasi pasif melakukan sinkronisasi di latar belakang, menghapus replikasi sebagai batasan pada performa aplikasi, tetapi meningkatkan RPO.

  • Replikasi aktif-aktif atau multimaster memungkinkan penggunaan beberapa replika secara bersamaan, memungkinkan penyeimbangan beban dengan biaya konsistensi data yang rumit.

  • Replikasi pasif aktif mencadangkan replika untuk penggunaan langsung selama failover saja.

Catatan

Sebagian besar sistem database berfitur lengkap dan produk dan layanan penyimpanan data lainnya mencakup beberapa jenis replikasi, seperti penyimpanan geo-redundan (GRS), karena persyaratan fungsional dan performanya.

Membangun aplikasi tangguh

Skenario bencana juga umumnya mengakibatkan waktu henti, baik karena masalah konektivitas jaringan, pemadaman pusat data, komputer virtual (VM) yang rusak, atau penyebaran perangkat lunak yang rusak. Dalam kebanyakan kasus, pemulihan aplikasi melibatkan failover ke penyebaran kerja yang terpisah. Akibatnya, mungkin perlu untuk memulihkan proses di wilayah Azure lain jika terjadi bencana skala besar. Pertimbangan tambahan dapat mencakup: lokasi pemulihan, jumlah lingkungan yang direplikasi, dan cara mempertahankan lingkungan ini.

Bergantung pada desain aplikasi, Anda dapat menggunakan beberapa strategi dan fitur Azure yang berbeda, seperti Azure Site Recovery, untuk meningkatkan dukungan aplikasi Anda untuk pemulihan proses setelah bencana.

Fitur pemulihan bencana khusus layanan

Sebagian besar layanan yang berjalan pada penawaran platform as a service (PaaS) Azure seperti Azure App Service menyediakan fitur dan panduan untuk mendukung DR. Untuk beberapa skenario, Anda dapat menggunakan fitur khusus layanan untuk mendukung pemulihan cepat. Misalnya, Azure SQL Server mendukung replikasi geografis untuk memulihkan layanan dengan cepat di wilayah lain. Azure App Service memiliki fitur Pencadangan dan Pemulihan, dan dokumentasi menyertakan panduan untuk menggunakan Azure Traffic Manager untuk mendukung lalu lintas perutean ke wilayah sekunder.

Langkah berikutnya