Bagikan melalui


Mengganti perangkat jaringan di Azure Operator Nexus Network Fabric (NNF)

Artikel ini menjelaskan cara mengganti perangkat jaringan yang rusak atau kurang baik di Azure Operator Nexus Network Fabric (NNF). Ini mencakup perangkat seperti sakelar Top of Rack (TOR), sakelar Customer Edge (CE), Network Packet Broker (NPB), dan Sakelar Manajemen. Penggantian dilakukan menggunakan proses Return Material Authorization (RMA). Proses ini dirancang untuk meminimalkan gangguan layanan dan mengintegrasi ulang perangkat keras baru dengan aman ke dalam fabric.

Skenario untuk penggantian perangkat

Penggantian perangkat mungkin diperlukan dalam situasi berikut:

  • Performa Tidak Konsisten (Flakiness): Perangkat menunjukkan konektivitas terputus-terputus atau penurunan performa.

  • Kegagalan Perangkat Keras: Perangkat mengalami kerusakan perangkat keras penting yang tidak dapat diperbaiki melalui pemecahan masalah standar.

  • Persistent Unreachability: Perangkat tidak dapat dijangkau secara permanen meskipun upaya pemulihan berulang.

Prasyarat

Untuk memastikan proses RMA yang lancar dan tepat waktu, verifikasi prasyarat berikut sebelum memulai penyebaran:

  • Azure CLI diinstal dan dikonfigurasi dengan benar

  • Izin diberikan untuk mengelola sumber daya Microsoft.ManagedNetworkFabric

  • Perangkat pengganti dinyalakan dan tersambung secara fisik

  • Perangkat pengganti mendukung Zero Touch Provisioning (ZTP)

  • Untuk mencegah kegagalan selama tindakan nonaktifkan perangkat jika perangkat dipengaruhi oleh boot ulang berkelanjutan karena masalah perangkat keras, disarankan untuk mematikan perangkat sebelum memulai proses RMA.

  • Sebelum memulai penyebaran RMA, lakukan pemeriksaan berikut:

    • Validasi Kecepatan Antarmuka

      • Konfirmasikan bahwa kecepatan antarmuka ma1 diatur ke 100 Mbps atau lebih tinggi.

      • Jika kecepatan di bawah 100 Mbps, perbarui untuk mencegah penundaan atau potensi batas waktu selama proses RMA.

    • Pemeriksaan Penyimpanan Perangkat

      • Pastikan perangkat memiliki ruang kosong minimal 3 GB yang tersedia.

      • Tindakan ini diperlukan untuk berhasil mengunduh dan menahapkan file gambar yang diperlukan.

Jenis perangkat yang didukung

  • Customer Edge (CE)
  • Atas Rak (TOR)
  • Sakelar Manajemen (Sakelar Mgmt)
  • Broker Paket Jaringan (NPB)

Nota

Harap dicatat bahwa alur kerja ini hanya mendukung RMA untuk satu perangkat pada satu waktu melalui tindakan POST, yang menerima input yang terkait dengan satu perangkat per permintaan.

Langkah-langkah untuk mengganti perangkat

Langkah 1: Nonaktifkan status administratif

Gunakan perintah berikut untuk menonaktifkan status administratif perangkat:

az networkfabric device update-admin-state \
  --state Disable \
  --resource-name "nf-device-name" \
  --resource-group "resource-group-name"

Tindakan ini menetapkan status berikut:

  • Status Administratif Perangkat: Dinonaktifkan

  • Status Administratif Jaringan: DiaktifkanTerganggu

Nota

Tindakan ini tidak diizinkan oleh layanan, jika salah satu operasi berikut sedang berlangsung pada tingkat infrastruktur:

  • Peningkatan perangkat
  • Dorongan konfigurasi
  • Pembaruan rahasia atau sertifikat
  • Kunci administratif
  • Provisi ulang Server Terminal (TS).

Langkah 2: Perbarui nomor seri

Kondisi eksekusi:

  • Status Administratif Perangkat harus Disabled
  • Status Administratif Jaringan harus EnabledDegraded

Setelah perangkat pengganti diinstal secara fisik, perbarui nomor serinya di sumber daya fabric:

az networkfabric device update \
  --serial-number "replacement-serial-number" \
  --resource-name "nf-device-name" \
  --resource-group "resource-group-name"

Panduan pemulihan kesalahan:

  • Jika RMA gagal karena nomor seri yang salah, pengiriman ulang diizinkan tanpa tiket dukungan.

  • Jika validasi gagal setelah bootstrap perangkat, sistem menampilkan status: Perangkat Tidak Dapat Boot Ulang - Gagal.

Tindakan ini melakukan tugas-tugas berikut:

  • Memperbarui nomor seri yang disimpan di sumber daya Azure ARM

  • Menjaga perangkat tetap dalam status Disabled dan "Fabric Administrative State" di EnabledDegraded.

Nota

Format yang diharapkan untuk nomor seri harus: <Manufacturer;Model;Hardware Version;Serial Number>
Misalnya: "Arista;DCS-7280DR3-XX;12.05;ABC23XXXXXX"

Langkah 3: Pastikan perangkat berada dalam Mode ZTP

Verifikasi bahwa perangkat pengganti dalam mode ZTP. Jika tidak, konfigurasikan perangkat untuk ZTP sebelum melanjutkan.

Nota

ZTP memungkinkan pengambilan konfigurasi otomatis selama proses RMA.

Langkah 4: Memulai proses RMA

Mulai proses RMA menggunakan perintah berikut:

az networkfabric device update-admin-state \
  --state RMA \
  --resource-name "nf-device-name" \
  --resource-group "resource-group-name"
  • Network Fabric Controller mendorong semua file konfigurasi yang diperlukan ke perangkat baru yang diganti. Disarankan untuk mencoba kembali operasi jika ada kegagalan sementara sampai keberhasilan dikonfirmasi.

  • Perangkat melakukan boot ke konfigurasi dasarnya menggunakan profil pemeliharaan. Kondisi ini hanya berlaku untuk jenis perangkat TOR dan CE.

Tindakan ini menetapkan status berikut:

  • Status Administratif Perangkat: Sedang Dalam Pemeliharaan

  • Status Administratif Jaringan: DiaktifkanTerganggu

Langkah 5: Refresh konfigurasi

Operasi ini mendorong konfigurasi terbaru ke perangkat (untuk semua jenis perangkat). Jika profil pemeliharaan sudah dikonfigurasi pada perangkat (berlaku untuk CE dan TOR), profil pemeliharaan akan dipertahankan selama operasi ini.

az networkfabric device refresh-configuration --resource-name <resource-name> --resource-group <rg-name>

Tindakan ini menyimpan perangkat dalam status berikut:

  • Status Administratif Perangkat: Sedang Dalam Pemeliharaan

  • Status Administratif Jaringan: DiaktifkanTerganggu

Langkah 6: Aktifkan status administratif.

Setelah konfigurasi berhasil diterapkan, bawa perangkat kembali ke layanan aktif:

az networkfabric device update-admin-state \
  --state Enable \
  --resource-name "nf-device-name" \
  --resource-group "resource-group-name"

Tindakan ini menetapkan keadaan berikut setelah dalam kondisi sepenuhnya sehat dan disinkronkan dengan jaringan.

  • Status Administratif Perangkat: Enabled

  • Status Administratif dari Fabric: Enabled

Nota

Dalam fabrik tertentu jika ada perangkat lain dalam keadaan Dinonaktifkan, maka Fabric Administrative State akan dipertahankan sebagai : EnabledDegraded

Ringkasan

Alur kerja RMA di Network Fabric memastikan penggantian perangkat yang mulus dengan transisi status terkontrol dan sinkronisasi konfigurasi penuh. Ini membantu menjaga kelangsungan layanan dan konsistensi operasional di seluruh jaringan.

Tindakan yang Diizinkan/Tidak Diizinkan Saat Fabric dalam Keadaan Diaktifkan dan Terdegradasi

Ketika fabric berada dalam Status Terdegradasi yang Diaktifkan, operasi tertentu diperbolehkan, sedangkan yang lain harus ditangguhkan atau ditangani dengan hati-hati. Silakan lihat daftar di bawah ini:


Berikut ini adalah Operasi yang Diizinkan

Kategori Operasi Contoh (API/CLI) Diperbolehkan? Catatan / Praktik yang Direkomendasikan
BACA (tidak bermutasi) GET/List, Tayangkan untuk Fabric / Devices / ISDs / Networks; metrik & kondisi Diperbolehkan Aman untuk memantau kondisi, memvalidasi hasil, dan melacak pendaftaran
Tindakan Penggantian Perangkat RMA Nonaktifkan + Perbarui Serial + RMA + Refresh Konfigurasi + Aktifkan Diperbolehkan Ikuti langkah-langkah panduan Ganti Perangkat standar
Penerapan (konfigurasi berlaku) Mulai / Pantau Penerapan (Terapkan Alur Kerja v2) Diperbolehkan Konfigurasi didorong ke semua perangkat, kecuali pada status Dinonaktifkan.
VALIDATE (pemeriksaan pra-penerbangan) Memvalidasi konfigurasi/ uji coba Diperbolehkan Berguna untuk menangkap masalah sebelum commit
Kunci Administratif / Buka Kunci Kunci / Buka kunci jaringan fabric Diperbolehkan Tidak ada batasan dalam status ini

Kategori Operasi Contoh (API/CLI) Diperbolehkan? Catatan / Praktik yang Direkomendasikan
Konfigurasi CREATE/UPDATE (konfigurasi non-RMA) Menambahkan/Mengubah ISD, Jaringan, Kebijakan Rute, Prefs/vias, Taps, Communities Secara teknis diizinkan tetapi tangguhkan jika memungkinkan Konfigurasi tidak akan menjangkau perangkat yang Dinonaktifkan hingga RMA selesai. Setelah RMA perangkat selesai, semua konfigurasi terbaru akan dikirimkan ke perangkat.
DELETE (konfigurasi fabric) Menghapus ISD, Jaringan, Kebijakan, Ketukan Secara teknis diizinkan tetapi tangguhkan jika memungkinkan Perangkat yang dinonaktifkan dapat mempertahankan konfigurasi yang dihapus hingga diaktifkan kembali.

Operasi yang Tidak Diizinkan

Kategori Operasi Contoh (API/CLI) Diperbolehkan? Catatan / Praktik yang Direkomendasikan
Upgrades Peningkatan runtime Fabric/Device Tidak diizinkan Jadwalkan peningkatan setelah RMA selesai dan fabric kembali diaktifkan
Rotasi rahasia Tindakan Jenewa Tidak diizinkan Provisi ulang TS dan RMA perangkat akan diperlakukan sebagai operasi yang saling eksklusif. Jika satu aktif, yang lain tidak dapat dimulai.