Bagikan melalui


Memantau beberapa sistem Lokal Azure dengan Insight

Berlaku untuk: Penyebaran Azure Local Hyperconverged

Artikel ini menjelaskan cara menggunakan Insight untuk memantau beberapa sistem Lokal Azure. Untuk satu sistem Azure Local, lihat Memantau satu sistem Azure Local dengan Insights.

Untuk informasi tentang manfaat, prasyarat, dan cara mengaktifkan Wawasan pada setiap sistem Azure Local, lihat Manfaat, Prasyarat, dan Mengaktifkan Insight.

Untuk memantau beberapa sistem Azure Local dengan Insights, Anda perlu mengaktifkan Insight pada setiap sistem satu per satu. Sebagai gantinya, Anda dapat mengaktifkan Wawasan dalam skala besar menggunakan kebijakan Azure. Untuk informasi selengkapnya, lihat Mengaktifkan Insight untuk Azure Local dalam skala besar menggunakan kebijakan Azure.

Tonton video untuk pengenalan cepat:

Tampilkan wawasan kesehatan, performa, dan penggunaan

Insight menyimpan datanya di ruang kerja Analitik Log, yang memungkinkannya memberikan agregasi dan pemfilteran yang kuat dan menganalisis tren data dari waktu ke waktu. Tidak ada biaya langsung untuk Insight. Pengguna ditagih berdasarkan pengaturan retensi data dan jumlah data yang terserap di ruang kerja Log Analytics mereka.

Anda dapat mengakses Insight dari Azure Monitor>Insights>Azure Local. Gunakan tab berikut untuk beralih antar tampilan: Tambahkan ke pemantauan, Kesehatan kluster, Node, Komputer virtual, dan Penyimpanan.

Hasil pemfilteran

Visualisasi dapat disaring lintas langganan. Anda dapat memfilter hasilnya berdasarkan menu drop-down berikut:

  • Rentang waktu: Filter ini memungkinkan Anda memilih rentang untuk tampilan tren. Nilai defaultnya adalah 24 jam terakhir.
  • Langganan: Memperlihatkan langganan yang telah mendaftarkan kluster Azure Local. Anda dapat memilih beberapa langganan di filter ini.
  • Cluster: Mencantumkan kluster Azure Local terdaftar yang memiliki kemampuan Log dan Pemantauan yang diaktifkan dalam rentang waktu yang dipilih. Anda dapat memilih beberapa kluster dari filter ini.
  • Grup sumber daya: Filter ini memungkinkan Anda memilih semua kluster dalam grup sumber daya.

Menambahkan ke pemantauan

Fitur ini menyediakan detail kluster yang tidak dipantau oleh pengguna. Untuk mulai memantau kluster, pilih untuk membuka kluster tersebut, lalu pilih Wawasan Kemampuan>. Jika Anda tidak melihat kluster, pastikan kluster tersebut baru-baru ini tersambung ke Azure.

Cuplikan layar untuk memilih kluster untuk pemantauan.

kolom Deskripsi Contoh
Kluster Nama klusternya. 27cls1
Status koneksi Azure Status sumber daya Lokal Azure. Tersambung
Versi OS Sistem operasi dibangun pada simpul. 10.0.20348.10131

Secara default, tampilan kisi menampilkan 250 baris pertama. Anda dapat mengatur nilai dengan mengedit baris kisi seperti yang diperlihatkan dalam gambar berikut:

Cuplikan layar memperlihatkan layar untuk mengatur nilai kisi.

Anda bisa mengekspor detail di Excel dengan memilih Ekspor ke Excel seperti yang diperlihatkan dalam gambar berikut:

Cuplikan layar memperlihatkan tautan untuk diekspor ke Excel.

Excel akan memberikan status koneksi Azure sebagai berikut:

  • 0: Tidak Terdaftar
  • 1: Terputus
  • 2: Tidak Terbaru
  • 3: Tersambung

Kesehatan kluster

Tampilan ini memberikan gambaran umum tentang kesehatan kluster.

Cuplikan layar memperlihatkan informasi gambaran umum kesehatan kluster.

kolom Deskripsi Contoh
Kluster Nama klusternya. 27cls1
Terakhir diperbarui Tanda waktu kapan simpul terakhir diperbarui. 9/4/2022, 12.15.42 PM
Kedudukan Menyediakan status kesehatan simpul dalam kluster. Ini bisa sehat, peringatan, kritis, atau lainnya. Sehat
Sumber daya yang bermasalah Deskripsi sumber daya mana yang menyebabkan kesalahan. Peladen, Kolam Penyimpanan, Sub-sistem
Total simpul Jumlah simpul dalam kluster. 4

Jika kluster Anda hilang atau menunjukkan status Lainnya, buka ruang kerja Log Analytics yang digunakan untuk kluster tersebut dan pastikan konfigurasi Agen menangkap data dari log microsoft-windows-health/operational. Pastikan juga kluster telah tersambung baru-baru ini ke Azure, dan periksa apakah kluster tidak difilter dalam buku kerja ini.

Node

Tampilan ini memberikan gambaran umum tentang kesehatan dan performa simpul, dan penggunaan kluster yang dipilih. Tampilan ini dibangun menggunakan ID peristiwa server 3000 dari Saluran Log Peristiwa Windows Microsoft-Windows-SDDC-Management/Operational. Setiap baris dapat diluaskan lebih lanjut untuk melihat status kesehatan simpul. Anda dapat berinteraksi dengan kluster dan sumber daya simpul untuk menavigasi ke halaman sumber daya masing-masing.

Cuplikan layar memperlihatkan status kesehatan simpul.

Mesin virtual

Tampilan ini memberitahukan status semua mesin virtual di kluster yang dipilih. Tampilan ini dibangun menggunakan ID peristiwa mesin virtual 3003 dari Saluran Log Peristiwa Microsoft-Windows-SDDC-Management/Operational Windows. Setiap baris dapat diperluas lebih lanjut untuk melihat distribusi VM di seluruh simpul dalam kluster. Anda dapat berinteraksi dengan sumber daya kluster dan simpul untuk masuk ke halaman sumber daya masing-masing.

Cuplikan layar memperlihatkan kesehatan komputer virtual.

Ukuran Deskripsi Contoh
Kluster > Node Nama klusternya. Pada ekspansi, ini menunjukkan simpul dalam kluster. Sample-VM-1
Terakhir Diperbarui Tanda tanggal kapan simpul terakhir diperbarui. 9/4/2022, 12.24.02 PM
Total Mesin Virtual Jumlah VM dalam simpul dalam kluster. 1 dari 2 sedang berjalan
Berlari Jumlah VM yang berjalan dalam simpul dalam kluster. 2
Dihentikan Jumlah VM yang dihentikan dalam satu node di dalam kluster. 3
Kegagalan Jumlah mesin virtual yang gagal pada sebuah simpul di dalam kluster. 2
Lainnya Jika VM berada di salah satu status berikut (Tidak Diketahui, Dimulai, Rekam Jepret, Menyimpan, Menghentikan, Menjeda, Melanjutkan, Dijeda, Ditangguhkan), VM dianggap sebagai "Lainnya." 2

Storage

Tampilan ini menunjukkan kesehatan volume, penggunaan, dan performa di seluruh kluster yang dipantau. Perluas kluster untuk melihat status volume individual. Tampilan ini dibangun menggunakan ID peristiwa volume 3002 dari saluran Log Peristiwa Microsoft-Windows-SDDC-Management/Operational di Windows. Elemen di bagian atas memberikan gambaran umum tentang kesehatan penyimpanan.

Cuplikan layar memperlihatkan kesehatan volume penyimpanan.

Ukuran Deskripsi Contoh
Kumpulan > Volume Nama klusternya. Pada ekspansi, ini menunjukkan volume dalam kluster. AltaylCluster1 > ClusterPerformanceHistory
Terakhir diperbarui Stempel tanggal dan waktu saat penyimpanan terakhir diperbarui. 14/4/2022, 14:58:55
Kesehatan volume Status dari volume. Ini bisa sehat, peringatan, kritis, atau lainnya. Sehat
Ukuran Kapasitas total perangkat dalam byte selama periode pelaporan. 25B
Penggunaan Persentase kapasitas yang tersedia selama periode pelaporan. 23,54%
Iops Operasi masukan/keluaran per detik. 45/detik
Kecenderungan Tren IOPS.
Laju Pemrosesan Jumlah byte per detik yang telah dilayani oleh Application Gateway. 5 B/dtk
Tren (B/s) Tren kapasitas pemrosesan.
Rata-rata Latensi Latensi adalah waktu rata-rata yang diperlukan untuk menyelesaikan permintaan I/O. 334 μs

Sesuaikan Insight

Karena pengalaman pengguna dibangun di atas templat buku kerja Azure Monitor, pengguna dapat mengedit visualisasi dan kueri dan menyimpannya sebagai buku kerja yang disesuaikan.

Jika Anda menggunakan visualisasi dari hub Azure Monitor Insights >, pilih > untuk menyimpan salinan versi yang dimodifikasi ke buku kerja kustom.

Buku kerja disimpan dalam grup sumber daya. Setiap orang yang memiliki akses ke grup sumber daya dapat mengakses buku kerja yang disesuaikan.

Sebagian besar kueri ditulis menggunakan Bahasa Kueri Kusto (KQL). Beberapa kueri ditulis menggunakan Kueri Resource Graph. Untuk informasi lebih lanjut, baca artikel berikut:

Dukungan

Untuk membuka tiket dukungan untuk Insights, gunakan jenis layanan Insights untuk Azure Local di bawah Pemantauan & Manajemen.

Saluran Log Peristiwa

Wawasan dan pandangan pemantauan didasarkan pada Microsoft-Windows-SDDC-Management/Operational Windows Event Log Channel. Saat pemantauan diaktifkan, data dari saluran ini disimpan ke ruang kerja Analitik Log.

Melihat dan mengubah interval cache dump

Interval default untuk mengosongkan cache diset ke 3600 detik (1 jam).

Gunakan cmdlet PowerShell berikut untuk melihat nilai interval tembolokan file cadangan:

Get-ClusterResource "sddc management" | Get-ClusterParameter

Gunakan cmdlet berikut untuk mengubah frekuensi pembuangan cache. Jika diset ke 0 ia akan berhenti menerbitkan peristiwa:

Get-ClusterResource "sddc management" | Set-ClusterParameter -Name CacheDumpIntervalInSeconds -Value <value in seconds>

Peristiwa Windows di kanal log

Saluran ini meliputi lima peristiwa. Setiap peristiwa memiliki nama kluster dan ID Azure Resource Manager sebagai EventData.

ID Peristiwa Jenis peristiwa
3000 pelayan
3001 Pengemudi
3002 Kapasitas
3003 Mesin virtual
3004 Kluster

Nilai kolom "DeskripsiTempat" peristiwa server 3000

{
   "m_servers":[
      {
         "m_statusCategory":"Integer",
         "m_status":[
            "Integer",
            "…"
         ],
         "m_id":"String",
         "m_name":"String",
         "m_totalPhysicalMemoryInBytes":"Integer",
         "m_usedPhysicalMemoryInBytes":"Integer",
         "m_totalProcessorsUsedPercentage":"Integer",
         "m_totalClockSpeedInMHz":"Integer",
         "m_uptimeInSeconds":"Integer",
         "m_InboundNetworkUsage":"Double (Bits/sec)",
         "m_OutboundNetworkUsage":"Double (Bits/sec)",
         "m_InboundRdmaUsage":"Double (Bits/sec)",
         "m_OutboundRdmaUsage":"Double (Bits/sec)",
         "m_site":"String",
         "m_location":"String",
         "m_vm":{
            "m_totalVmsUnknown":"Integer",
            "m_totalVmsRunning":"Integer",
            "m_totalVmsStopped":"Integer",
            "m_totalVmsFailed":"Integer",
            "m_totalVmsPaused":"Integer",
            "m_totalVmsSuspended":"Integer",
            "m_totalVmsStarting":"Integer",
            "m_totalVmsSnapshotting":"Integer",
            "m_totalVmsSaving":"Integer",
            "m_totalVmsStopping":"Integer",
            "m_totalVmsPausing":"Integer",
            "m_totalVmsResuming":"Integer"
         },
         "m_osVersion":"String",
         "m_buildNumber":"String",
         "m_totalPhysicalProcessors":"Integer",
         "m_totalLogicalProcessors":"Integer"
      },
      "…"
   ],
   "m_alerts":{
      "m_totalUnknown":"Integer",
      "m_totalHealthy":"Integer",
      "m_totalWarning":"Integer",
      "m_totalCritical":"Integer"
   }
} 

Sebagian besar variabel cukup jelas dari informasi JSON ini. Namun, tabel berikut mencantumkan beberapa variabel yang agak lebih sulit dipahami.

Variabel Deskripsi
m_servers Array simpul.
m_kategoriStatus Status kesehatan dari simpul.
m_status Keadaan simpul. Ini adalah array yang dapat berisi satu atau dua nilai. Nilai pertama adalah wajib (0-4). Nilai kedua adalah opsional (5-9).

Nilai untuk variabel m_statusCategory adalah sebagai berikut:

Nilai Makna
0 Sehat
1 Peringatan
2 Tidak sehat
255 Lainnya

Nilai untuk variabel m_status adalah sebagai berikut:

Nilai Makna
0 Ke atas
1 Ke bawah
2 Dalam pemeliharaan
3 Bergabung
4 Biasa
5 Terdiri sendiri
6 Dikarantina
7 Pengurasan
8 Pengurasan selesai
9 Pengurasan gagal
0xffff Tidak dikenal

Nilai kolom RenderedDescription dari peristiwa drive 3001

Peristiwa mengemudi 3001

{
    "m_drives":[
        {
            "m_uniqueId":"String",
            "m_model":"String",
            "m_type":"Integer",
            "m_canPool":"Boolean",
            "m_sizeInBytes":"Integer",
            "m_sizeUsedInBytes":"Integer",
            "m_alerts":{
                "m_totalUnknown":"Integer",
                "m_totalHealthy":"Integer",
                "m_totalWarning":"Integer",
                "m_totalCritical":"Integer"
            }
        },
        "…"
    ],
    "m_correlationId":"String",
    "m_isLastElement":"Boolean"
}

Nilai kolom RenderedDescription untuk peristiwa volume 3002

Peristiwa Volume 3002

{
   "VolumeList":[
      {
         "m_Id":"String",
         "m_Label":"String",
         "m_Path":"String",
         "m_StatusCategory":"Integer",
         "m_Status":[
            "Integer",
            "…"
         ],
         "m_Size":"Integer (Bytes)",
         "m_SizeUsed":"Integer (Bytes)",
         "m_TotalIops":"Double (Count/second)",
         "m_TotalThroughput":"Double (Bytes/Second)",
         "m_AverageLatency":"Double (Seconds)",
         "m_Resiliency":"Integer",
         "m_IsDedupEnabled":"Boolean",
         "m_FileSystem":"String"
      },
      "…"
   ],
   "m_Alerts":{
      "m_totalUnknown":"Integer",
      "m_totalHealthy":"Integer",
      "m_totalWarning":"Integer",
      "m_totalCritical":"Integer"
   }
} 

Sebagian besar variabel cukup jelas dari informasi JSON di atas. Namun, tabel di bawah ini mencantumkan beberapa variabel yang agak sulit dipahami.

Variabel Deskripsi
Daftar Volume Array volume-volume.
m_KategoriStatus Status kesehatan volume.
m_Status Kondisi volume. Ini adalah array yang dapat berisi satu atau dua nilai. Nilai pertama adalah wajib (0-4). Nilai kedua adalah opsional (5-9).

Nilai untuk variabel m_statusCategory adalah sebagai berikut:

Nilai Makna
0 Sehat
1 Peringatan
2 Tidak sehat
255 Lainnya

Nilai untuk variabel m_status adalah sebagai berikut:

Nilai Makna
0 Tidak dikenal
1 Lainnya
2 OKE
3 Perlu perbaikan
4 Stres
5 Kegagalan prediktif
6 Kesalahan
7 Kesalahan yang tidak dapat dipulihkan
8 Mulai
9 Berhenti
10 Dihentikan
11 Sedang Beroperasi
12 Tidak ada kontak
13 Komunikasi yang hilang
14 Dibatalkan
15 Dalam keadaan diam
16 Entitas pendukung dalam situasi kesalahan
17 Selesai
18 Mode daya
19 Merelokasi
0xD002 Ke bawah
0xD003 Perlu resinkronisasi

Nilai dalam kolom RenderedDescription untuk peristiwa mesin virtual 3003

Peristiwa mesin virtual 3003

{
   "m_totalVmsUnknown":"Integer",
   "m_totalVmsRunning":"Integer",
   "m_totalVmsStopped":"Integer",
   "m_totalVmsFailed":"Integer",
   "m_totalVmsPaused":"Integer",
   "m_totalVmsSuspended":"Integer",
   "m_totalVmsStarting":"Integer",
   "m_totalVmsSnapshotting":"Integer",
   "m_totalVmsSaving":"Integer",
   "m_totalVmsStopping":"Integer",
   "m_totalVmsPausing":"Integer",
   "m_totalVmsResuming":"Integer",
   "m_alerts":{
      "m_totalUnknown":"Integer",
      "m_totalHealthy":"Integer",
      "m_totalWarning":"Integer",
      "m_totalCritical":"Integer"
   }
}

Nilai kolom RenderedDescription untuk peristiwa kluster 3004

Peristiwa kluster 3004

{
   "m_cpuUsage":"Double (%)",
   "m_totalVolumeIops":"Double",
   "m_averageVolumeLatency":"Double (Seconds)",
   "m_totalVolumeThroughput":"Double (Bytes/Second)",
   "m_totalVolumeSizeInBytes":"Integer",
   "m_usedVolumeSizeInBytes":"Integer",
   "m_totalMemoryInBytes":"Integer",
   "m_usedMemoryInBytes":"Integer",
   "m_isStretch":"Boolean",
   "m_QuorumType":"String",
   "m_QuorumMode":"String",
   "m_QuorumState":"String",
   "m_alerts":{
      "m_totalUnknown":"Integer",
      "m_totalHealthy":"Integer",
      "m_totalWarning":"Integer",
      "m_totalCritical":"Integer"
   }

Untuk informasi selengkapnya tentang data yang dikumpulkan, lihat Kesalahan Layanan Kesehatan.

Langkah berikutnya

Untuk informasi terkait, lihat: