Catatan
Akses ke halaman ini memerlukan otorisasi. Anda dapat mencobamasuk ataumengubah direktori.
Akses ke halaman ini memerlukan otorisasi. Anda dapat mencobamengubah direktori.
Dalam Operator Nexus Network Fabric (NNF), pemantauan Ethernet adalah komponen penting dalam menjaga performa jaringan yang optimal, memastikan ketersediaan, dan secara proaktif mengatasi masalah potensial sebelum menyebabkan gangguan pada fabric. Pemantauan mencakup analisis lalu lintas, kesehatan perangkat, keamanan, dan detail khusus untuk antarmuka Ethernet individual. Dengan memantau infrastruktur fabric dengan cermat, kami dapat memastikan bahwa NNF beroperasi dengan lancar dan efisien, dan bahwa setiap potensi masalah diidentifikasi dan ditangani sejak dini.
Aspek-aspek berikut dari perangkat NNF dipantau:
Ketersediaan: Memantau konektivitas perangkat memastikan bahwa jaringan tersedia dan mencegah waktu henti
Performa: Melacak metrik seperti pemanfaatan bandwidth antarmuka, kehilangan paket, latensi, dan jitter, memungkinkan kami mengevaluasi performa jaringan dan menentukan hambatan apa pun
Keamanan: Pemantauan membantu mengidentifikasi aktivitas mencurigakan, upaya akses tidak sah, atau potensi ancaman keamanan di jaringan
Kesehatan: Memantau CPU perangkat, memori, suhu, kipas, status catu daya, dan status operasional antarmuka, memungkinkan kami mengidentifikasi potensi kegagalan
Penghitung status ACL
Penghitung status untuk Daftar Kontrol Akses (ACL) di perangkat jaringan membantu Anda mengawasi dan mengontrol lalu lintas jaringan. Mereka menawarkan data tentang jumlah paket yang cocok dengan setiap entri ACL. Penghitung ini dapat diperiksa dalam skala global, per antarmuka, atau berdasarkan lalu lintas masuk dan keluar.
| Kategori Metrik | Deskripsi/Penggunaan | Interval pengumpulan | Satuan pengukuran |
|---|---|---|---|
| Paket yang Cocok dengan ACL (Daftar Akses) | Jumlah total paket jaringan yang cocok dengan kriteria yang ditetapkan oleh entri Daftar Kontrol Akses (ACL) saat ini di perangkat jaringan. Jumlah ini membantu dalam memantau dan mengelola lalu lintas jaringan. | 5 menit | Jumlah paket. |
Status BGP
Koneksi Border Gateway Protocol (BGP) sangat penting untuk komunikasi yang efektif antara rekan-rekan BGP, dan performa jaringan yang optimal. Administrator jaringan dapat mendeteksi masalah jaringan atau gangguan dengan mengamati status ini. Misalnya, koneksi yang tersisa dalam status 'Diam' dapat menyarankan masalah konfigurasi. Status 'Mapan', yang menunjukkan pertukaran informasi perutean yang berhasil antara rekan-rekan BGP, sangat penting agar jaringan berfungsi dengan benar.
| Kategori Metrik | Deskripsi/Penggunaan | Interval pengumpulan | Unit terukur |
|---|---|---|---|
| Status Rekan BGP | Status rekan BGP, seperti yang didefinisikan oleh RFC 4271, dan diberikan ringkasannya setelah tabel ini. | 5 menit dan sesuai permintaan | N/A |
Status koneksi BGP adalah:
- Tidak Aktif (1): Kondisi awal koneksi BGP.
- Sambungkan (2): Sistem sedang menunggu koneksi TCP selesai.
- Aktif (3): Sistem mencoba memulai koneksi TCP dengan rekan.
- OpenSent (4): Sistem sedang menunggu menerima pesan OPEN dari rekan.
- OpenConfirm (5): Sistem sedang menunggu pesan KEEPALIVE atau NOTIFICATION dari rekan.
- Didirikan (6): Koneksi BGP sepenuhnya dibuat dan rekan-rekan dapat bertukar pesan UPDATE.
Penting
Status Rekan BGP mewakili metrik status operasional sesi BGP dalam bentuk bilangan bulat 1–6.
Cara menganalisis data dengan benar:
Sesi BGP dapat berfluktuasi beberapa kali dalam satu menit, menghasilkan beberapa sampel per bucket. Untuk menafsirkan ini dengan benar:
- Min: Status terendah diamati (mengungkapkan penurunan ke arah Diam/Aktif)
- Maks: Status tertinggi yang diamati (menunjukkan apakah sesi mencapai Terhubung)
- Hitungan: Jumlah sampel dalam wadah (menunjukkan ketidakstabilan saat tinggi)
Interpretasi yang direkomendasikan:
- Maks=6 & Min=6 & Count=1 → Sesi tetap Tersambung sepanjang menit
- Maks=6 & Min<6 & Hitung>1 → Setidaknya satu transisi terjadi selama menit
- Maks<6 & Min≥1 → Sesi tidak pernah tercapai dalam menit tersebut
- Count≫1 (misalnya, >3) → Potensi fluktuasi atau osilasi cepat
Panduan visualisasi
- Penjelajah Metrik: Gunakan agregasi Min, Max, dan Count. Hindari Rata-rata, karena salah menginpretasikan status kategoris.
- Lembar kerja: Pertimbangkan kisi atau visualisasi garis waktu status yang secara bersamaan menampilkan Min/Max/Count per menit.
- Analitik Log (KQL): Gunakan min(), max(), dan count() melalui bin(..., 1m); secara opsional menghitung penyebaran status (MaxState - MinState) untuk mendeteksi transisi.
- Tanda:
- Ketersediaan: Min < 6 atau Maks < 6
- Ketidakstabilan: SampleCount > batas
- Ketersediaan: Min < 6 atau Maks < 6
Batasan
Jika beberapa transisi terjadi dalam satu menit, Min dan Max hanya menampilkan rentang (misalnya, 1 dan 6) tanpa mengungkapkan status menengah. Gunakan kueri Count dan KQL untuk analisis yang lebih dalam.
Status operasional komponen
Status operasional komponen perangkat keras atau perangkat lunak menunjukkan status fungsinya saat ini.
| Kategori Metrik | Deskripsi/Penggunaan | Interval pengumpulan | Unit terukur |
|---|---|---|---|
| Status Operasi Komponen | Status Operasional entitas yang dapat menjadi bagian dari inventaris perangkat, seperti kartu saluran, transceiver, kipas angin, catu daya, dll. Nilai yang mungkin dijelaskan setelah tabel ini. | 5 menit dan sesuai permintaan | N/A |
Status operasional yang mungkin adalah:
- Aktif (0): Komponen diaktifkan dan aktif (naik)
- Tidak aktif (1): Komponen diaktifkan tetapi tidak aktif (tidak berfungsi)
- Dinonaktifkan (2): Komponen dinonaktifkan secara administratif
Status operasional antarmuka
Status operasional antarmuka dalam perangkat jaringan menunjukkan status fungsinya saat ini.
| Kategori Metrik | Deskripsi/Penggunaan | Interval pengumpulan | Unit terukur |
|---|---|---|---|
| Status Operasional Antarmuka | Status operasional antarmuka. Nilai yang mungkin dijelaskan setelah tabel ini. | 5 menit | N/A |
Status operasional yang mungkin adalah:
- Naik (0): Antarmuka beroperasi dan dapat mengirimkan dan menerima data
- Bawah (1): Antarmuka tidak beroperasi, dan tidak dapat mengirimkan atau menerima data
- Lower_layer_down (2): Antarmuka tidak berfungsi karena kegagalan di lapisan bawah tumpukan jaringan
- Pengujian (3): Antarmuka sedang menjalani pengujian dan belum beroperasi
- Tidak diketahui (4): Status antarmuka tidak diketahui, mungkin karena kegagalan dalam sistem pemantauan perangkat
- Tidak aktif (5): Antarmuka beroperasi tetapi saat ini dalam keadaan tidak aktif, yang berarti tidak mengirimkan atau menerima data
- Not_present (6): Antarmuka tidak ada di perangkat, mungkin karena telah dihapus secara fisik atau belum diinstal
Penghitung status antarmuka
Penghitung status antarmuka melacak jumlah bingkai atau paket yang cocok dengan kondisi tertentu. Semuanya dikumpulkan pada interval 5 menit.
| Kategori Metrik | Deskripsi/Penggunaan |
|---|---|
| Antarmuka Ethernet Dalam Kesalahan CRC | Jumlah semua bingkai yang diterima dengan panjang antara 64 dan 1.518 oktet yang memiliki kesalahan FCS atau kesalahan perataan. Kesalahan ini menunjukkan masalah dalam transmisi data yang perlu ditangani untuk komunikasi yang andal. |
| Antarmuka Ethernet Dalam Bingkai Fragmen | Ini adalah alat ukur yang menghitung jumlah bingkai fragmen mengandung kesalahan yang diterima dari antarmuka ethernet. Bingkai fragmen, yang lebih pendek dari panjang yang ditetapkan protokol Ethernet, memiliki nilai checksum yang salah, yang dikenal sebagai Kesalahan FCS, atau jumlah bit yang tidak tepat, disebut sebagai Kesalahan Perataan. |
| Antarmuka Ethernet Dalam Bingkai Jabber | Jumlah bingkai jabber yang diterima melalui antarmuka. Bingkai Jabber adalah bingkai yang melebihi ukuran standar dan juga memiliki Pemeriksaan Redundansi Siklik (CRC) yang salah. |
| Antarmuka Ethernet Dalam Bingkai Kontrol MAC | Bingkai kontrol pada lapisan MAC yang diterima pada antarmuka. |
| Antarmuka Ethernet pada Bingkai Jeda MAC | PAUSE frame pada lapisan MAC yang diterima melalui antarmuka. |
| Antarmuka Ethernet Ukuran Maksimal Terlampaui | Jumlah total bingkai terstruktur dengan baik yang dihilangkan pada antarmuka karena melampaui ukuran bingkai maksimum. |
| Antarmuka Ethernet Dalam Bingkai Berukuran Berlebihan | Jumlah total bingkai terstruktur dengan baik yang diterima yang melebihi panjang 1.518 oktet (tidak menghitung bit pembingkaian, tetapi termasuk oktet FCS). |
| Antarmuka Ethernet Keluar Bingkai Kontrol MAC | Kontrol bingkai pada lapisan MAC yang dikirim melalui antarmuka |
| Antarmuka Ethernet Keluar Mac Jeda Bingkai | Bingkai PAUSE pada lapisan MAC yang dikirim lewat antarmuka. |
| Antarmuka Dalam Paket Siaran | Jumlah total paket yang ditujukan ke alamat siaran di sublayer ini, termasuk paket yang dibuang atau tidak dikirim. |
| Antarmuka Di Buang | Jumlah paket masuk yang dibuang meskipun tidak ada kesalahan yang terdeteksi untuk mencegah pengirimannya ke protokol lapisan yang lebih tinggi. |
| Kesalahan pada Antarmuka | Untuk antarmuka berorientasi paket, jumlah paket masuk yang berisi kesalahan sehingga tidak dapat dikirimkan ke protokol lapisan yang lebih tinggi. |
| Antarmuka pada Kesalahan FCS | Jumlah paket yang diterima yang memiliki kesalahan dalam urutan pemeriksaan bingkai (Frame Check Sequence, FCS). |
| Antarmuka pada Paket Multicast | Jumlah paket yang dikirimkan oleh sublayer ini ke lapisan atau sublayer yang lebih tinggi yang ditujukan ke alamat multicast di sublayer ini. Untuk protokol lapisan MAC, alamat ini mencakup alamat Grup dan Fungsional. |
| Antarmuka Dalam Oktet | Jumlah keseluruhan oktet yang diterima pada antarmuka, termasuk karakter pembingkaian. |
| Antarmuka Dalam Paket | Jumlah total paket yang diterima pada antarmuka, termasuk semua unicast, multicast, siaran, dan paket yang buruk. |
| Antarmuka pada Paket Unicast | Jumlah paket yang dikirimkan oleh sublayer ini ke lapisan atau sublayer yang lebih tinggi yang tidak ditujukan ke alamat multicast atau siaran di sublayer ini. |
| Antarmuka Keluar Paket Siaran | Jumlah total paket yang ditujukan ke alamat siaran di sublayer ini, termasuk paket yang dibuang atau tidak dikirim. |
| Membuang Antarmuka Keluar | Jumlah paket keluar yang dibuang meskipun tidak ada kesalahan yang terdeteksi untuk mencegah pengirimannya. |
| Kesalahan Pengiriman Antarmuka | Untuk antarmuka berorientasi paket, jumlah paket keluar yang tidak dapat ditransmisikan karena kesalahan. |
| Paket Multicast Antarmuka Keluar | Jumlah total paket keluar yang ditujukan ke alamat multicast di sublayer ini, termasuk paket yang dibuang atau tidak dikirim. Untuk protokol lapisan MAC, alamat ini mencakup alamat Grup dan Fungsional. |
| Oktet Keluaran Antarmuka | Jumlah total oktet yang ditransmisikan dari antarmuka, termasuk karakter bingkai. |
| Paket Keluar Antarmuka | Jumlah total paket yang dikirimkan dari antarmuka, termasuk semua unicast, multicast, siaran, dan paket yang buruk. |
| Paket Unicast Keluar Antarmuka | Jumlah total paket keluar yang tidak ditujukan ke alamat multicast atau siaran di sublayer ini, termasuk paket yang dibuang atau tidak dikirim. |
Tingkat status antarmuka
Tingkat status antarmuka dapat memiliki efek pada performa jaringan dan ketergantungan. Frekuensi perubahan status yang tinggi dapat menandakan koneksi jaringan yang tidak stabil, berpotensi mengakibatkan berkurangnya performa dan kemacetan jaringan.
Semua pengukuran tingkat status dikumpulkan pada interval 5 menit.
| Kategori Metrik | Deskripsi/Penggunaan |
|---|---|
| Rasio Buang Antarmuka | Tingkat di mana paket masuk dibuang pada antarmuka jaringan. Paket dapat dibuang karena berbagai alasan seperti kemacetan jaringan, perangkat keras yang rusak, atau masalah konfigurasi. |
| Tingkat Antarmuka Dalam Paket | Laju paket yang diterima pada antarmuka, termasuk semua unicast, multicast, siaran, dan paket rusak. |
| Tingkat Pembuangan Keluar Antarmuka | Tingkat paket keluar yang dibuang meskipun tidak ada kesalahan yang terdeteksi untuk mencegahnya ditransmisikan. |
| Tingkat Paket Keluar Antarmuka Jaringan | Laju paket yang ditransmisikan dari antarmuka, termasuk semua unicast, multicast, siaran, dan paket buruk. |
Tingkat kondisi LACP
Memantau laju status LACP sangat penting karena efek potensialnya pada performa dan ketergantungan jaringan. Istilah "laju status LACP" dalam konteks Protokol Kontrol Agregasi Tautan menunjukkan kecepatan saat paket kontrol LACP ditransmisikan atau diterima oleh antarmuka yang mendukung LACP.
Semua pengukuran tingkat status dikumpulkan pada interval 5 menit.
| Kategori Metrik | Deskripsi/Penggunaan |
|---|---|
| Kesalahan LACP | Istilah "Jumlah kesalahan paket ilegal LACPDU" menandakan jumlah dari Unit Data Protokol Kontrol Penggabungan Tautan (LACPDU) yang, meskipun diterima, dianggap ilegal karena struktur yang dibentuk secara salah atau nilai subjenis protokol yang tidak sah. |
| Lacp Dalam Paket | Jumlah LACPDUs yang diterima. |
| Paket Lacp Out | Jumlah LACPDUs yang ditransmisikan. |
| Kesalahan LACP RX | Jumlah kesalahan LACPDUs yang diterima. |
| Kesalahan LACP TX | Jumlah kesalahan LACPDUs yang ditransmisikan. |
| Kesalahan Lacp tidak diketahui | Jumlah kesalahan yang tidak diketahui pada LACPDU. |
Penghitung status LLDP
Penghitung status LLDP menunjukkan berapa banyak bingkai LLDP yang telah dikirim dan diterima oleh perangkat jaringan. LLDP adalah singkatan dari Protokol Penemuan Lapisan Tautan, yang merupakan protokol standar yang memungkinkan perangkat untuk mengiklankan identitas, kemampuan, dan tetangga mereka di jaringan area lokal. Penghitung status LLDP dapat membantu administrator jaringan memantau kesehatan dan performa jaringan, memecahkan masalah konektivitas, dan menemukan topologi dan konfigurasi perangkat.
Semua pengukuran dikumpulkan pada interval 5 menit.
| Kategori Metrik | Deskripsi/Penggunaan |
|---|---|
| Kerangka LLDP di | LLDPFrameIn dalam perangkat jaringan mengacu pada jumlah bingkai Link Layer Discovery Protocol (LLDP) yang diterima perangkat. |
| Bingkai Lldp keluar | LLDPFrameOut pada perangkat jaringan mengacu pada jumlah paket yang dikirim oleh perangkat menggunakan Link Layer Discovery Protocol (LLDP). LLDP digunakan oleh perangkat jaringan untuk mengiklankan identitas dan kemampuannya ke perangkat lain di jaringan yang sama. |
| Lldp TLV tidak diketahui | LLDPTLVUnknown dalam perangkat jaringan mengacu pada jumlah frame Link Layer Discovery Protocol (LLDP) yang diterima yang berisi entri Type-Length-Value (TLV) yang tidak diketahui. TLV digunakan dalam protokol jaringan untuk menentukan informasi opsional. TLV "tidak diketahui" menyarankan perangkat menerima data yang tidak dikenali atau tidak dapat ditafsirkan, yang dapat menunjukkan masalah kompatibilitas dalam jaringan. |
Pemantauan Server Terminal
Memantau keterjangkauan IP server terminal (TS Net1 dan TS Net3, IPv4) dan ketersediaan server file HTTP melalui ping ICMP berkala (setiap 5 menit) dan permintaan HTTP GET dari Infrastruktur Pemantauan Azure Fabric. Metrik mencerminkan status keterjangkauan real-time dan mendukung peringatan dan visualisasi yang konsisten di seluruh lingkungan AON.
| Metric | Nilai | Interpretasi | Aturan Pemberitahuan |
|---|---|---|---|
| TS_Ping_Status | 2 | Keberhasilan Ping ICMP | Tidak ada pemberitahuan yang dipicu |
| 1 | Kegagalan Ping ICMP | Pemberitahuan jika nilai < 2 | |
| TS_FileServer_Status | 2 | Server File dapat dijangkau | Tidak ada pemberitahuan yang dipicu |
| 1 | Server File tidak dapat dijangkau | Pemberitahuan jika nilai < 2 |
Pemberitahuan dipicu saat nilai metrik turun di bawah 2. Jika instans terputus dari Azure, instans akan menghasilkan data metrik yang hilang (tidak ada nilai yang dilaporkan).
Pemanfaatan sumber daya perangkat fabric jaringan
Metrik pemanfaatan sumber daya memberikan wawasan penting tentang seberapa efisien sumber daya jaringan digunakan. Metrik ini memberikan wawasan tentang performa dan kesehatan perangkat fabric jaringan. Metrik pemanfaatan sumber daya memberikan tampilan holistik tentang performa dan kesehatan sistem. Mereka mengukur beban kerja CPU, efisiensi pendinginan, ketersediaan memori, performa daya, dan tingkat panas. Metrik ini sangat penting untuk mengoptimalkan performa sistem, mengelola sumber daya secara efektif, dan mencegah kerusakan perangkat keras karena panas yang berlebihan.
| Kategori Metrik | Deskripsi/Penggunaan | Interval Pengumpulan | Satuan Pengukuran |
|---|---|---|---|
| Rata-rata Pemanfaatan CPU | Metrik Rata-Rata Pemanfaatan CPU adalah persentase rata-rata sumber daya komputasi yang digunakan oleh prosesor selama interval waktu tertentu. | 1 menit | Persentase |
| Penggunaan CPU Instan | Persentase langsung sumber daya komputasi yang digunakan oleh prosesor pada waktu tertentu. Ini memberikan wawasan real time tentang beban kerja dan performa CPU. | 1 menit | Persentase |
| Pemanfaatan CPU Maks | Persentase tertinggi sumber daya komputasi yang digunakan oleh prosesor selama interval waktu tertentu. | 1 menit | Persentase |
| Pemanfaatan CPU Min | Persentase terendah sumber daya komputasi yang digunakan oleh prosesor selama interval waktu tertentu. | 1 menit | Persentase |
| Kecepatan Kipas | Laju langsung di mana kipas pendingin berputar. Ini adalah metrik penting untuk mempertahankan suhu pengoperasian yang optimal dan memastikan umur panjang komponen perangkat. | 1 menit | RPM (tidak Tersedia) |
| Memori Tersedia | Memori yang tersedia diinstal secara fisik, atau dialokasikan secara logis ke komponen. | 1 menit | Bita |
| Arus Masukan Catu Daya | Jumlah arus listrik, diukur dalam ampere, yang ditarik oleh unit catu daya (PSU) dari sumbernya. Ini adalah faktor penting dalam menentukan efisiensi PSU dan konsumsi daya perangkat secara keseluruhan. | 1 menit | Amp (tidak Tersedia) |
| Tegangan Input Catu Daya | Jumlah potensi listrik, diukur dalam volt, yang diambil oleh unit catu daya (PSU) dari sumbernya. Ini adalah parameter kunci dalam memastikan PSU dapat mengonversi daya AC ke daya DC secara memadai untuk kebutuhan perangkat. | 1 menit | Volt (Tidak Tersedia) |
| Kapasitas Daya Maksimum Catu Daya | Kapasitas maksimum daya dari catu daya. | 1 menit | Watt (Tidak Tersedia) |
| Arus Keluaran Catu Daya | Arus output yang disediakan oleh catu daya. | 1 menit | Ampere (Tidak tersedia) |
| Tegangan Keluaran Catu Daya | Tegangan output yang disediakan oleh catu daya. | 1 menit | Volt (tidak tersedia) |
| Kekuatan Keluaran Catu Daya | Jumlah daya listrik, diukur dalam watt, yang diberikan unit catu daya (PSU) ke komponen perangkat. Ini adalah faktor penting dalam memastikan perangkat memiliki daya yang cukup untuk performa optimal. | 1 menit | |
| Suhu Instan | Suhu komponen perangkat secara waktu nyata. | 1 menit | |
| Suhu Maks | Suhu pengoperasian tertinggi yang aman untuk komponen perangkat. Melebihi batas ini dapat menyebabkan panas berlebih, yang dapat menyebabkan masalah performa, kerusakan komponen, atau bahkan menyebabkan kegagalan perangkat. Sangat penting untuk memantau dan mengelola suhu perangkat untuk memastikan umur panjang dan performa optimalnya. | 1 menit |