Bagikan melalui


Keandalan di Azure NAT Gateway

Azure NAT Gateway adalah layanan Network Address Translation (NAT) yang dikelola sepenuhnya yang menyediakan konektivitas internet keluar untuk sumber daya yang terhubung ke jaringan virtual privat Anda. Layanan ini menyediakan Terjemahan Alamat Jaringan Sumber (SNAT) untuk koneksi keluar dan Terjemahan Alamat Jaringan Tujuan (DNAT) hanya untuk paket respons pada koneksi yang berasal dari luar. Karena Azure NAT Gateway menangani lalu lintas untuk sumber daya jaringan virtual penting, Azure NAT Gateway dirancang untuk memberikan ketahanan tinggi.

Saat Anda menggunakan Azure, keandalan adalah tanggung jawab bersama. Microsoft menyediakan berbagai kemampuan untuk mendukung ketahanan dan pemulihan. Anda bertanggung jawab untuk memahami cara kerja kemampuan tersebut dalam semua layanan yang Anda gunakan, dan memilih kemampuan yang Anda butuhkan untuk memenuhi tujuan bisnis dan tujuan waktu aktif Anda.

Artikel ini menjelaskan cara membuat Azure NAT Gateway tahan terhadap berbagai potensi pemadaman dan masalah, termasuk kesalahan sementara dan pemadaman zona ketersediaan. Ini juga menyoroti informasi utama tentang perjanjian tingkat layanan (SLA) Azure NAT Gateway.

Penting

Saat Anda mempertimbangkan keandalan gateway NAT, pertimbangkan juga keandalan komputer virtual (VM), disk, infrastruktur jaringan lainnya, dan aplikasi yang berjalan pada VM. Meningkatkan ketahanan gateway NAT mungkin memiliki dampak terbatas jika komponen lain tidak sama-sama tangguh. Bergantung pada persyaratan ketahanan Anda, Anda mungkin membuat perubahan konfigurasi di beberapa komponen.

Rekomendasi implementasi produksi untuk keandalan

Untuk beban kerja produksi, kami merekomendasikan praktik berikut:

  • Gunakan SKU StandardV2 untuk mendapatkan redundansi zona otomatis di wilayah yang didukung.

    Nota

    Sebelum penyebaran, tinjau batasan utama Azure NAT Gateway StandardV2 untuk memastikan bahwa ia mendukung konfigurasi Anda.

  • Alokasikan alamat IP publik yang cukup untuk persyaratan koneksi puncak Anda. Alamat IP yang tidak mencukup dapat menyebabkan kelelahan port SNAT dan masalah ketersediaan.

  • Gunakan alamat IP publik SKU StandardV2 dengan Azure NAT Gateway StandardV2. StandardV2 Azure NAT Gateway tidak mendukung alamat IP publik SKU Standar.

Gambaran umum arsitektur keandalan

Bagian ini menjelaskan beberapa aspek penting tentang cara kerja layanan yang paling relevan dari perspektif keandalan. Bagian ini memperkenalkan arsitektur logis, yang mencakup beberapa sumber daya dan fitur yang Anda sebarkan dan gunakan. Ini juga membahas arsitektur fisik, yang memberikan detail tentang cara kerja layanan di bawah sampul.

Arsitektur logika

Gateway NAT adalah sumber daya yang Anda sebarkan. Untuk menggunakan gateway NAT sebagai rute default untuk lalu lintas internet keluar, lampirkan ke satu atau beberapa subnet di jaringan virtual Anda. Anda tidak perlu mengonfigurasi rute kustom atau pengaturan perutean lainnya.

Arsitektur fisik

Secara internal, gateway NAT terdiri dari satu atau beberapa instans, yang mewakili infrastruktur dasar yang diperlukan untuk mengoperasikan layanan.

Azure NAT Gateway menerapkan arsitektur terdistribusi dengan menggunakan jaringan yang ditentukan perangkat lunak (SDN) untuk memberikan keandalan dan skalabilitas tinggi. Layanan ini beroperasi di beberapa domain kesalahan sehingga dapat menahan beberapa kegagalan komponen infrastruktur tanpa dampak layanan. Azure mengelola operasi layanan yang mendasar, termasuk distribusi di seluruh domain kesalahan dan redundansi infrastruktur.

Untuk informasi selengkapnya tentang arsitektur dan redundansi Azure NAT Gateway, lihat Sumber daya Azure NAT Gateway.

Ketahanan terhadap kesalahan sementara

Kesalahan sementara adalah kegagalan yang bersifat sementara dan intermiten dalam komponen. Mereka sering terjadi di lingkungan terdistribusi seperti cloud, dan mereka adalah bagian normal dari operasi. Kesalahan sementara memperbaiki diri setelah waktu yang singkat. Penting bahwa aplikasi Anda dapat menangani kesalahan sementara, biasanya dengan mencoba kembali permintaan yang terpengaruh.

Semua aplikasi yang dihosting cloud harus mengikuti panduan penanganan kesalahan sementara Azure saat berkomunikasi dengan API, database, dan komponen lain yang dihosting cloud. Untuk informasi selengkapnya, lihat Rekomendasi untuk menangani kesalahan sementara.

Kelelahan port SNAT terjadi ketika aplikasi membuat beberapa koneksi independen ke alamat IP dan port yang sama, yang menghabiskan port SNAT yang tersedia untuk alamat IP keluar. Kelelahan port SNAT dapat muncul sebagai kesalahan sementara dalam aplikasi Anda. Untuk mengurangi kemungkinan kesalahan sementara yang terkait dengan NAT, lakukan tugas berikut:

  • Minimalkan kemungkinan kelelahan port SNAT. Konfigurasikan aplikasi Anda untuk menangani SNAT dengan anggun dengan menerapkan pengumpulan koneksi dan manajemen siklus hidup koneksi yang tepat.

  • Sebarkan alamat IP publik yang memadai. Gateway NAT tunggal mendukung beberapa alamat IP publik, dan setiap alamat IP publik menyediakan sekumpulan port SNAT terpisah.

  • Pantau metrik ketersediaan jalur data gateway NAT. Gunakan Azure Monitor untuk mendeteksi potensi masalah konektivitas lebih awal. Siapkan pemberitahuan untuk kegagalan koneksi dan kelelahan port SNAT untuk secara proaktif mengidentifikasi dan mengatasi kondisi kesalahan sementara sebelum memengaruhi konektivitas keluar aplikasi Anda. Untuk informasi selengkapnya, lihat Metrik dan pemberitahuan Azure NAT Gateway.

  • Hindari mengatur nilai batas waktu diam tinggi. Saat Anda menetapkan nilai batas waktu diam secara signifikan lebih tinggi dari default 4 menit untuk koneksi gateway NAT, kelelahan port SNAT dapat terjadi selama volume koneksi tinggi.

Untuk informasi selengkapnya tentang manajemen koneksi dan pemecahan masalah di Azure NAT Gateway, lihat Memecahkan masalah konektivitas Azure NAT Gateway.

Ketahanan terhadap kegagalan zona ketersediaan

Zona ketersediaan adalah grup pusat data yang terpisah secara fisik dalam wilayah Azure. Ketika satu zona gagal, layanan dapat melakukan failover ke salah satu zona yang tersisa.

Azure NAT Gateway mendukung zona ketersediaan dalam konfigurasi zona redundan dan zonal.

  • Zona-redundan: StandardV2 SKU untuk Azure NAT Gateway menyediakan redundansi zona otomatis. Redundansi zona menyebarkan instans gateway NAT di semua zona ketersediaan di suatu wilayah. Konfigurasi zona-redundan meningkatkan ketahanan dan keandalan beban kerja produksi.

    Diagram penyebaran redundansi zona Azure NAT Gateway.

    Diagram menunjukkan internet di bagian atas. Di bawah internet adalah sumber daya NAT Gateway yang berada di jaringan virtual dan mencakup tiga zona ketersediaan. Subnet di jaringan virtual berisi tiga VM. Setiap VM diposisikan di zona ketersediaan yang berbeda. VM pertama berada di zona ketersediaan 1, VM kedua berada di zona ketersediaan 2, dan VM ketiga berada di zona ketersediaan 3. Tiga panah terpisah di setiap zona ketersediaan menunjukkan arus lalu lintas keluar dari NAT Gateway ke internet.

  • Zonal: Saat Anda menggunakan SKU Standar (v1), Anda dapat secara opsional membuat konfigurasi zonal. Anda menyebarkan gateway NAT zona di zona ketersediaan yang Anda pilih. Saat Anda menyebarkan gateway NAT ke zona tertentu, gateway tersebut menyediakan konektivitas keluar ke internet secara eksplisit dari zona tersebut. Alamat IP publik zonal dari zona ketersediaan yang berbeda tidak diizinkan. Semua lalu lintas dari subnet yang terhubung dihanrtukarkan melalui gateway NAT, bahkan jika sumber daya subnet tersebut berada di zona ketersediaan yang berbeda.

    Diagram dari penyebaran Azure NAT Gateway yang bersifat zonal.

    Diagram menunjukkan internet di bagian atas. Di bawah internet adalah sumber daya NAT Gateway yang disebarkan dalam zona ketersediaan 1 saja. NAT Gateway tersambung ke subnet yang berisi satu VM. Jaringan virtual berisi subnet, semuanya terletak di zona ketersediaan 1. Zona ketersediaan 2 dan zona ketersediaan 3 kosong. Panah menunjukkan arus lalu lintas keluar dari NAT Gateway ke internet.

    Jika gateway NAT dalam zona ketersediaan mengalami pemadaman, semua VM di subnet yang terhubung gagal terhubung ke internet, bahkan jika VM tersebut berada di zona ketersediaan yang sehat.

    Penting

    Menyematkan ke satu zona ketersediaan hanya disarankan ketika latensi lintas zona terlalu tinggi untuk kebutuhan Anda dan setelah Anda memverifikasi bahwa latensi tersebut tidak sesuai dengan kebutuhan Anda. Dengan sendirinya, sumber daya zonal tidak memberikan ketahanan terhadap pemadaman pada zona ketersediaan. Untuk meningkatkan resiliensi sumber daya zonal, Anda perlu secara eksplisit menyebarkan sumber daya terpisah ke beberapa zona ketersediaan dan mengonfigurasi perutean lalu lintas dan pengalihfungsian otomatis. Untuk informasi selengkapnya, lihat Sumber daya zonal dan ketahanan zona.

    Jika Anda menyebarkan VM di beberapa zona ketersediaan dan perlu menggunakan gateway NAT zonal, Anda dapat membuat tumpukan zona di setiap zona ketersediaan. Untuk membuat tumpukan zona, sebarkan sumber daya berikut:

    • Beberapa subnet: Buat subnet terpisah untuk setiap zona ketersediaan daripada menggunakan satu subnet yang mencakup zona.

    • Gateway NAT zona: Sebarkan gateway NAT di zona ketersediaan yang sama dengan subnet terlampirnya.

    • Penetapan VM manual: Tempatkan setiap VM di zona ketersediaan yang benar dan subnet terkait zona ketersediaan.

    Diagram isolasi zona dengan membuat tumpukan zona.

    Diagram menunjukkan internet di bagian atas dan tiga zona ketersediaan di bawah internet. Setiap zona ketersediaan berisi instans NAT Gateway zonal khusus, subnet, dan VM. Semua sumber daya ini berada di jaringan virtual bersama. Panah menunjukkan lalu lintas yang mengalir keluar dari setiap instans NAT Gateway zona ketersediaan ke internet.

Jika Anda menyebarkan gateway NAT Standar (v1) dan tidak menentukan zona ketersediaan, gateway NAT nonzonal, yang berarti Azure memilih zona ketersediaan. Jika ada zona ketersediaan di wilayah tersebut yang mengalami pemadaman, zona tersebut dapat memengaruhi gateway NAT Anda. Kami tidak merekomendasikan konfigurasi nonzonal karena tidak memberikan perlindungan terhadap pemadaman zona ketersediaan.

Persyaratan

  • Dukungan wilayah: Anda dapat menyebarkan gateway NAT zona-redundan dan zona ke wilayah mana pun yang mendukung zona ketersediaan.

  • SKU: Untuk menyebarkan gateway NAT zona-redundan, gunakan SKU StandardV2. Untuk menyebarkan gateway NAT zonal, gunakan SKU Standar. Kami merekomendasikan SKU StandardV2.

  • Alamat IP publik: Persyaratan untuk alamat IP publik yang dilampirkan ke gateway NAT bergantung pada konfigurasi SKU dan penyebaran.

    Azure NAT Gateway SKU Jenis dukungan zona ketersediaan Persyaratan alamat IP publik
    StandardV2 Redundansi Zona Alamat IP publik StandardV2
    Standar Zonal Alamat IP publik standar yang memiliki redundansi zona atau berada di zona yang sama dengan NAT gateway
    Standar Nonzonal Alamat IP publik standar yang redundan zona atau berada di zona mana pun

Biaya

Dukungan zona ketersediaan untuk Azure NAT Gateway tidak memiliki biaya tambahan. Untuk informasi selengkapnya, lihat Harga Azure NAT Gateway.

Mengonfigurasi dukungan zona ketersediaan

  • Sumber daya baru: Langkah-langkah penyebaran bergantung pada konfigurasi zona ketersediaan Anda:

    • Zona-redundan: Untuk menyebarkan gateway NAT zona-redundan baru dengan menggunakan SKU StandardV2, lihat Membuat Azure NAT Gateway StandardV2.

    • Zonal: Untuk menyebarkan gateway NAT zonal baru dengan menggunakan SKU Standar, lihat Membuat gateway NAT. Saat Anda membuat gateway NAT, pilih zona ketersediaannya alih-alih memilih Tidak ada zona.

  • Aktifkan dukungan zona ketersediaan: Anda tidak dapat mengubah konfigurasi zona ketersediaan untuk Azure NAT Gateway setelah penyebaran. Untuk mengubah konfigurasi zona ketersediaan, Anda harus menyebarkan gateway NAT baru dengan pengaturan zona yang diinginkan.

    Untuk meningkatkan dari gateway STANDAR ke NAT StandardV2, Anda harus membuat alamat IP publik baru yang menggunakan SKU StandardV2.

Perilaku ketika semua zona sehat

Bagian ini menjelaskan apa yang diharapkan ketika gateway NAT dikonfigurasi untuk dukungan zona ketersediaan dan semua zona ketersediaan beroperasi.

  • Perutean lalu lintas antar zona: Cara lalu lintas dari VM Anda dirutekan melalui gateway NAT bergantung pada konfigurasi zona ketersediaan yang digunakan oleh gateway NAT Anda.

    • Zona redundant: Lalu lintas dapat dialihkan melalui instans gateway NAT di dalam zona ketersediaan mana pun.

    • Zonal: Setiap instans gateway NAT beroperasi secara independen dalam zona ketersediaan yang ditetapkan. Lalu lintas keluar dari sumber daya subnet dirutekan melalui zona gateway NAT, bahkan jika VM terletak di zona yang berbeda.

  • Replikasi data antar zona: Azure NAT Gateway tidak mereplikasi data antar zona karena merupakan layanan stateless untuk konektivitas keluar. Setiap instans gateway NAT beroperasi secara independen dalam zona ketersediaannya dan tidak memerlukan sinkronisasi dengan instans di zona lain.

Perilaku selama kegagalan zona

Bagian ini menjelaskan apa yang diharapkan ketika gateway NAT dikonfigurasi untuk dukungan zona ketersediaan dan ada pemadaman zona ketersediaan.

  • Deteksi dan respons: Tanggung jawab untuk deteksi dan respons tergantung pada konfigurasi zona ketersediaan yang digunakan gateway NAT Anda.

    • Redundansi zona: Azure NAT Gateway mendeteksi dan merespons kegagalan di zona ketersediaan. Anda tidak perlu melakukan apa pun untuk memulai failover zona ketersediaan.

    • Zonal: Anda bertanggung jawab untuk menerapkan failover tingkat aplikasi ke metode konektivitas alternatif atau gateway NAT di zona lain.

  • Pemberitahuan: Microsoft tidak secara otomatis memberi tahu Anda saat zona tidak berfungsi. Namun, Anda dapat menggunakan Azure Resource Health untuk memantau kesehatan sumber daya individual, dan Anda dapat menyiapkan pemberitahuan Resource Health untuk memberi tahu Anda tentang masalah. Anda juga dapat menggunakan Azure Service Health untuk memahami kesehatan layanan secara keseluruhan, termasuk kegagalan zona apa pun, dan Anda dapat menyiapkan pemberitahuan Service Health untuk memberi tahu Anda tentang masalah.

    Anda juga dapat menggunakan metrik ketersediaan jalur data gateway NAT untuk memantau kesehatan gateway NAT Anda. Konfigurasikan pemberitahuan pada metrik ketersediaan jalur data untuk mendeteksi masalah konektivitas.

  • Permintaan aktif: Perilaku permintaan aktif bergantung pada konfigurasi zona ketersediaan yang digunakan gateway NAT Anda.

    • Zona-redundan: Instans di zona yang rusak menghilangkan koneksi keluar aktif. Klien harus mengulangi permintaan koneksi mereka, dan upaya pengulangan tersebut akan diarahkan melalui instans gateway NAT di zona ketersediaan lain.

    • Zonal: Gateway NAT zona yang gagal menghilangkan koneksi keluar aktif. Anda harus memutuskan apakah dan cara membangun kembali konektivitas melalui jalur konektivitas alternatif. Aplikasi harus menerapkan logika coba lagi untuk menangani kegagalan koneksi.

      Jika Anda mengalihkan lalu lintas, alamat IP publik keluar berubah, sehingga sesi Protokol Kontrol Transmisi (TCP) mungkin perlu dibuat ulang.

  • Kehilangan data yang diharapkan: Tidak ada kehilangan data yang terjadi karena Azure NAT Gateway adalah layanan stateless untuk konektivitas keluar. Kondisi koneksi diciptakan kembali ketika koneksi terjalin ulang.

  • Waktu henti yang diharapkan: Waktu henti yang diharapkan tergantung pada konfigurasi zona ketersediaan yang digunakan gateway NAT Anda.

    • Zona redundan: Sambungan yang berasal dari zona yang mengalami kegagalan mungkin akan terputus. Klien dapat segera mencoba kembali koneksi, dan meminta rute ke instans di zona lain. Semua koneksi yang tersisa dari zona sehat tetap ada.

    • Zonal: Konektivitas keluar tetap tidak tersedia sampai zona pulih atau sampai Anda mengalihkan lalu lintas melalui metode konektivitas alternatif atau gateway NAT di zona lain.

  • Pengalihan lalu lintas: Perilaku perutean ulang lalu lintas tergantung pada konfigurasi zona ketersediaan yang digunakan gateway NAT Anda.

    • Zona-redundan: Permintaan koneksi baru dilanarkan melalui instans gateway NAT di zona ketersediaan andal.

      Selama kegagalan zona, VM di zona tersebut juga biasanya berhenti beroperasi. Tetapi jika kegagalan zona parsial hanya memengaruhi gateway NAT sementara VM tetap berjalan, koneksi keluar dari VM tersebut diarahkan melalui instance gateway NAT di zona lain.

    • Zonal: Anda harus menerapkan failover tingkat aplikasi, seperti menggunakan metode konektivitas alternatif atau mengalihkan lalu lintas ke gateway NAT di zona lain.

Pemulihan Zona

Azure NAT Gateway adalah layanan stateless, sehingga operasi failback tidak memerlukan intervensi manual.

Saat zona ketersediaan pulih, instans gateway NAT di zona tersebut secara otomatis tersedia untuk koneksi keluar baru. Koneksi yang dibuat melalui instans gateway NAT di zona lain selama pemadaman terus menggunakan jalur konektivitas yang ada hingga koneksi tersebut ditutup.

Uji kegagalan zona

Opsi untuk pengujian kegagalan zona bergantung pada konfigurasi zona ketersediaan yang digunakan instans Anda.

  • Zona-redundansi: Platform Azure NAT Gateway mengelola perutean lalu lintas, failover, dan failback untuk gateway NAT yang memiliki redundansi zona. Fitur terkelola ini tidak mengharuskan Anda memulai tindakan manual atau memvalidasi proses kegagalan zona ketersediaan.

  • Zonal: Anda bertanggung jawab untuk menyiapkan dan menguji rencana failover untuk menangani potensi kegagalan zona.

Ketahanan terhadap kegagalan di seluruh wilayah

Azure NAT Gateway adalah layanan wilayah tunggal yang beroperasi dalam batas wilayah Azure tertentu. Layanan ini tidak menyediakan kemampuan multi-wilayah asli atau failover otomatis antar wilayah. Jika suatu wilayah menjadi tidak tersedia, gateway NAT di wilayah tersebut juga tidak tersedia.

Jika Anda merancang pendekatan jaringan yang mencakup beberapa wilayah, sebarkan gateway NAT independen di setiap wilayah.

Perjanjian tingkat layanan

Perjanjian tingkat layanan (SLA) untuk layanan Azure menjelaskan ketersediaan yang diharapkan dari setiap layanan dan kondisi yang harus dipenuhi solusi Anda untuk mencapai harapan ketersediaan tersebut. Untuk informasi selengkapnya, lihat SLA untuk layanan online.

Azure VNet NAT SLA mencakup Azure NAT Gateway. SLA ketersediaan hanya berlaku ketika Anda memiliki dua atau lebih VM yang sehat. Ini juga mengecualikan kelelahan port SNAT dari perhitungan waktu henti.