Bagikan melalui


Keandalan di Azure Traffic Manager

Artikel ini berisi pemulihan bencana lintas wilayah dan dukungan kelangsungan bisnis untuk Azure Traffic Manager.

Pemulihan bencana lintas wilayah dan kelangsungan bisnis

Pemulihan bencana (DR) mengacu pada praktik yang digunakan organisasi untuk pulih dari peristiwa berdampak tinggi, seperti bencana alam atau penyebaran gagal yang mengakibatkan waktu henti dan kehilangan data. Terlepas dari penyebabnya, obat terbaik untuk bencana adalah rencana DR yang terdefinisi dan teruji dengan baik dan desain aplikasi yang secara aktif mendukung DR. Sebelum Anda mulai membuat rencana pemulihan bencana, lihat rekomendasi untuk merancang strategi pemulihan bencana.

Untuk DR, Microsoft menggunakan model tanggung jawab bersama . Dalam model ini, Microsoft memastikan bahwa infrastruktur dasar dan layanan platform tersedia. Namun, banyak layanan Azure tidak secara otomatis mereplikasi data atau beralih dari wilayah yang gagal untuk mereplikasi ke wilayah lain yang tersedia. Untuk layanan tersebut, Anda bertanggung jawab untuk menyiapkan rencana pemulihan bencana yang berfungsi untuk beban kerja Anda. Sebagian besar layanan yang berjalan di penawaran platform as a service (PaaS) Azure menyediakan fitur dan panduan untuk mendukung DR. Anda dapat menggunakan fitur khusus layanan untuk mendukung pemulihan cepat dan membantu mengembangkan rencana DR Anda.

Azure Traffic Manager adalah penyeimbang beban lalu lintas berbasis DNS yang memungkinkan Anda mendistribusikan lalu lintas ke aplikasi publik Anda di seluruh wilayah Azure global. Traffic Manager juga menyediakan titik akhir publik Anda dengan ketersediaan tinggi dan respons cepat.

Traffic Manager menggunakan DNS untuk mengarahkan permintaan klien ke titik akhir layanan yang sesuai berdasarkan metode perutean lalu lintas. Manajer lalu lintas juga menyediakan pemantauan kesehatan untuk setiap titik akhir. Endpoint dapat berupa layanan berorientasi internet yang dihosting di dalam atau di luar Azure. Traffic Manager menyediakan berbagai metode perutean lalu lintas dan opsi pemantauan titik akhiragar sesuai dengan kebutuhan aplikasi yang berbeda dan model failover otomatis. Traffic Manager tahan terhadap kegagalan, termasuk kegagalan seluruh wilayah Azure.

Pemulihan bencana dalam geografi multi-wilayah

DNS adalah salah satu mekanisme paling efisien untuk mengalihkan lalu lintas jaringan. DNS efisien karena DNS sering bersifat global dan eksternal ke pusat data. DNS juga diisolasi dari kegagalan tingkat regional atau zona ketersediaan (AZ).

Ada dua aspek teknis untuk menyiapkan arsitektur pemulihan bencana Anda:

  • Penggunaan mekanisme penyebaran untuk mereplikasi instans, data, dan konfigurasi antara lingkungan utama dan siaga. Jenis pemulihan bencana ini dapat dilakukan secara asli melalui Azure Site Recovery, lihat Dokumentasi Azure Site Recovery melalui appliance/layanan mitra Microsoft Azure seperti Veritas atau NetApp.

  • Pengembangan solusi untuk mengalihkan lalu lintas jaringan/web dari situs utama ke situs siaga. Jenis pemulihan bencana ini dapat dicapai melalui Azure DNS, Azure Traffic Manager (DNS), atau penyeimbang beban global pihak ketiga.

Artikel ini berfokus khusus pada perencanaan pemulihan bencana Azure Traffic Manager.

Deteksi, pemberitahuan, dan manajemen pemadaman

Selama bencana, titik akhir utama akan dicari dan status berubah menjadi terdegradasi dan situs pemulihan bencana tetap Online. Secara default, Traffic Manager mengirimkan semua lalu lintas ke titik akhir utama (prioritas tertinggi). Jika titik akhir utama tampak terdegradasi, Traffic Manager merutekan lalu lintas ke titik akhir kedua selama ia tetap sehat. Seseorang dapat mengonfigurasi lebih banyak titik akhir dalam Traffic Manager yang dapat berfungsi sebagai titik akhir perlindungan kegagalan ekstra, atau, sebagai penyeimbang beban yang berbagi beban antar titik akhir.

Menyiapkan pemulihan bencana dan deteksi pemadaman

Ketika Anda memiliki arsitektur yang kompleks dan beberapa set sumber daya yang mampu melakukan fungsi yang sama, Anda dapat mengonfigurasi Azure Traffic Manager (berdasarkan DNS) untuk memeriksa kesehatan sumber daya Anda dan merutekan lalu lintas dari sumber daya yang tidak sehat ke sumber daya yang sehat.

Dalam contoh berikut, wilayah primer maupun wilayah sekunder memiliki penyebaran penuh. Penyebaran ini mencakup layanan cloud dan database yang disinkronkan.

Diagram failover otomatis menggunakan Azure Traffic Manager.

Gambar - Failover otomatis menggunakan Azure Traffic Manager

Akan tetapi, hanya wilayah primer yang secara aktif menangani permintaan jaringan dari pengguna. Wilayah sekunder akan aktif hanya saat wilayah primer mengalami gangguan layanan. Dalam hal ini, semua permintaan jaringan baru dirutekan ke wilayah sekunder. Karena pencadangan database hampir seketika, kedua penyeimbang beban memiliki IP yang dapat diperiksa kesehatannya, dan instans selalu aktif dan berjalan, topologi ini menyediakan pilihan untuk mencapai RTO rendah dan failover tanpa intervensi manual. Wilayah cadangan sekunder harus siap untuk diaktifkan segera setelah terjadi kegagalan wilayah primer.

Skenario ini ideal untuk penggunaan Azure Traffic Manager yang memiliki probe bawaan untuk berbagai jenis pemeriksaan kesehatan termasuk http / https dan TCP. Azure Traffic Manager juga memiliki mesin aturan yang dapat dikonfigurasi untuk alih jalur pada saat kegagalan seperti yang dijelaskan di bawah ini. Mari pertimbangkan solusi berikut untuk menggunakan Traffic Manager:

  • Pelanggan memiliki titik akhir Region #1 yang dikenal sebagai prod.contoso.com dengan IP statis 100.168.124.44 dan titik akhir wilayah #2 yang dikenal sebagai dr.contoso.com dengan IP statis 100.168.124.43.
  • Masing-masing lingkungan ini dihadapkan ke publik oleh properti seperti penyeimbang beban (load balancer). Penyeimbang beban dapat dikonfigurasi untuk memiliki titik akhir berbasis DNS atau nama domain yang sepenuhnya memenuhi syarat (FQDN) seperti yang ditampilkan di atas.
  • Semua instans di Wilayah 2 merupakan replikasi mendekati waktu nyata dari Wilayah 1. Selain itu, citra mesin telah diperbarui, dan semua data perangkat lunak/konfigurasi telah di-patch dan sesuai dengan Region 1.
  • Penyekalaan otomatis telah dikonfigurasi terlebih dahulu.

Untuk mengonfigurasi failover dengan Azure Traffic Manager:

  1. Buat profil Azure Traffic Manager baru Buat profil Azure Traffic manager baru dengan nama contoso123 dan pilih metode Perutean sebagai Prioritas. Jika Anda memiliki grup sumber daya yang sudah ada sebelumnya yang ingin Anda kaitkan, maka Anda dapat memilih grup sumber daya yang ada, jika tidak, membuat grup sumber daya baru.

    Cuplikan layar pembuatan profil Traffic Manager.

    Gambar - Membuat profil Pengelola Lalu Lintas

  2. Membuat titik akhir dalam profil Traffic Manager

    Dalam langkah ini, Anda membuat titik akhir yang mengarah ke situs produksi dan pemulihan bencana. Di sini, pilih Jenis sebagai titik akhir eksternal, tetapi jika sumber daya di-host di Azure, maka Anda juga dapat memilih Titik akhir Azure. Jika Anda memilih Titik akhir Azure, berikutnya pilih Sumber daya target yang merupakan App Service atau IP Publik yang dialokasikan oleh Azure. Prioritas diatur sebagai 1 karena ini adalah layanan utama untuk Wilayah 1. Demikian pula, buat juga titik akhir pemulihan bencana dalam Traffic Manager.

    Cuplikan layar pembuatan titik akhir pemulihan bencana.

    Figur - Membuat titik akhir pemulihan bencana

  3. Menyiapkan pengaturan pemeriksaan kesehatan dan konfigurasi failover

    Dalam langkah ini, Anda mengatur DNS TTL ke 10 detik, yang dipatuhi oleh sebagian besar resolver rekursif yang terhubung dengan internet. Konfigurasi ini berarti tidak ada resolver DNS yang akan menyimpan cache informasi selama lebih dari 10 detik.

    Untuk pengaturan monitor titik akhir, jalur saat ini diatur ke / atau root, tetapi Anda dapat mengustomisasi pengaturan titik akhir untuk mengevaluasi sebuah jalur, contohnya, prod.contoso.com/index.

    Contoh di bawah ini menampilkan https sebagai protokol pencarian. Akan tetapi, Anda juga dapat memilih http atau tcp. Pilihan protokol tergantung pada aplikasi akhir. Interval pencarian diatur ke 10 detik, yang memungkinkan pencarian cepat, dan coba lagi diatur ke 3. Akibatnya, Traffic Manager akan beralih ke titik akhir kedua jika tiga interval berturut-turut menunjukkan kegagalan.

    Rumus berikut menentukan total waktu untuk failover otomatis:

    Time for failover = TTL + Retry * Probing interval

    Dan dalam hal ini, nilainya adalah 10 + 3 * 10 = 40 detik (Maks).

    Jika Coba Lagi diatur ke 1 dan TTL diatur ke 10 detik, maka waktu untuk alih tugas menjadi 10 + 1 * 10 = 20 detik.

    Atur Coba Lagi ke nilai yang lebih besar dari 1 untuk menghilangkan kemungkinan pemulihan gagal karena positif palsu atau gangguan jaringan kecil.

    Cuplikan layar pengaturan pemeriksaan kesehatan.

    Gambar - Menyiapkan konfigurasi pemeriksaan kesehatan dan failover

Langkah berikutnya