Membuat pemberitahuan metrik dengan ambang batas dinamis

Ambang batas dinamis menerapkan pembelajaran mesin tingkat lanjut dan menggunakan serangkaian algoritma dan metode untuk:

  • Mempelajari perilaku historis metrik
  • Menganalisis metrik dari waktu ke waktu dan mengidentifikasi pola seperti pola per jam, harian, atau mingguan
  • Mengenali anomali yang menunjukkan kemungkinan masalah layanan
  • Menghitung ambang yang paling tepat untuk metrik

Saat Anda menggunakan ambang batas dinamis, Anda tidak perlu mengetahui ambang "kanan" untuk setiap metrik, karena ambang batas dinamis menghitung ambang batas yang paling sesuai untuk Anda.

Sebaiknya konfigurasi aturan pemberitahuan dengan ambang batas dinamis pada metrik ini:

  • Persentase CPU komputer virtual
  • Waktu eksekusi permintaan HTTP Application Insights

Ambang dinamis membantu Anda:

  • Membuat peringatan scalable untuk ratusan seri metrik dengan satu aturan peringatan. Jika Anda memiliki lebih sedikit aturan peringatan, Anda menghabiskan lebih sedikit waktu untuk membuat dan mengelola aturan peringatan. Pemberitahuan yang dapat diskalakan sangat berguna untuk beberapa dimensi atau untuk beberapa sumber daya, seperti ke semua sumber daya dalam langganan.
  • Buat aturan tanpa harus tahu ambang batas apa yang akan dikonfigurasi. Dengan menggunakan ambang batas dinamis, Anda dapat mengonfigurasi pemberitahuan metrik menggunakan konsep tingkat tinggi, tanpa memiliki pengetahuan domain yang luas tentang metrik
  • Mengonfigurasi peringatan metrik menggunakan konsep tingkat tinggi tanpa pengetahuan domain yang luas tentang metrik
  • Mencegah ambang yang bising (presisi rendah) atau lebar (pengenalan rendah) yang tidak memiliki pola yang diharapkan
  • Menangani metrik berisik (seperti CPU atau memori mesin) dan metrik dengan dispersi rendah (seperti ketersediaan dan tingkat kesalahan)

Anda dapat menggunakan ambang batas dinamis pada:

  • sebagian besar platform Azure Monitor dan metrik kustom
  • metrik aplikasi dan infrastruktur umum
  • metrik bising, seperti CPU atau memori mesin
  • metrik dengan dispersi rendah, seperti ketersediaan dan tingkat kesalahan Lihat metrik yang tidak didukung oleh ambang batas dinamis untuk daftar metrik yang tidak didukung oleh ambang batas dinamis.

Anda dapat mengonfigurasi ambang batas dinamis menggunakan:

Penghitungan dan pratinjau ambang pemberitahuan

Saat aturan pemberitahuan pertama kali dibuat, ambang batas dinamis menggunakan 10 hari data historis untuk menghitung pola musiman per jam atau harian. Bagan yang Anda lihat di pratinjau pemberitahuan mencerminkan data tersebut. Setelah aturan pemberitahuan dibuat, ambang batas dinamis terus menggunakan semua data historis yang tersedia untuk dipelajari, dan menyesuaikan ambang batas agar lebih akurat. Setelah tiga minggu, ambang batas dinamis memiliki data yang cukup untuk mengidentifikasi pola mingguan juga, dan model disesuaikan untuk menyertakan musiman mingguan. Aturan pemberitahuan yang menggunakan ambang batas dinamis tidak memicu pemberitahuan sebelum mengumpulkan tiga hari dan setidaknya 30 sampel data metrik.

Sistem secara otomatis mengenali pemadaman berkepanjangan dan menghapusnya dari algoritma pembelajaran ambang. Jika ada pemadaman yang berkepanjangan, ambang batas dinamis memahami data, dan mendeteksi masalah sistem dengan tingkat sensitivitas yang sama seperti sebelum pemadaman terjadi.

Pertimbangan saat menggunakan ambang batas dinamis

  • Untuk memastikan perhitungan ambang batas yang akurat, pemberitahuan yang menggunakan ambang batas dinamis tidak memicu pemberitahuan sebelum mengumpulkan tiga hari dan setidaknya 30 sampel data metrik. Oleh karena itu, sumber daya baru atau sumber daya yang kehilangan data metrik tidak memicu pemberitahuan hingga data yang cukup tersedia.
  • Ambang batas dinamis membutuhkan setidaknya tiga minggu data historis untuk mendeteksi musiman mingguan. Beberapa pola terperinci, seperti pola dua jam atau semi mingguan mungkin tidak terdeteksi.
  • Jika perilaku metrik berubah baru-baru ini, perubahan tidak akan segera tercermin dalam batas atas dan bawah ambang batas dinamis. Batas dihitung berdasarkan data metrik dari 10 hari terakhir. Saat melihat batas Dynamic Threshold untuk metrik tertentu, pastikan untuk melihat tren metrik dalam minggu lalu, dan tidak hanya untuk beberapa jam atau hari terakhir.
  • Ambang batas dinamis baik untuk mendeteksi penyimpangan yang signifikan, dibandingkan dengan masalah yang berkembang secara perlahan. Perubahan perilaku lambat mungkin tidak akan memicu pemberitahuan.

Masalah yang diketahui dengan sensitivitas ambang batas dinamis

  • Jika aturan pemberitahuan yang menggunakan ambang batas dinamis terlalu berisik atau terlalu berisik, Anda mungkin perlu mengurangi sensitivitas aturan pemberitahuan ambang batas dinamis Anda. Gunakan salah satu opsi berikut ini:

    • Sensitivitas ambang: Atur sensitivitas ke Rendah agar lebih toleran terhadap penyimpangan.
    • Jumlah pelanggaran (pada pengaturan Tingkat Lanjut): Konfigurasikan aturan pemberitahuan untuk memicu hanya jika sejumlah penyimpangan terjadi dalam jangka waktu tertentu. Pengaturan ini akan membuat aturan kurang rentan terhadap penyimpangan transien.
  • Anda mungkin mengalami aturan pemberitahuan yang menggunakan ambang batas dinamis tidak diaktifkan atau tidak cukup sensitif, meskipun dikonfigurasi dengan sensitivitas tinggi. Ini dapat terjadi ketika distribusi metrik sangat tidak teratur. Pertimbangkan salah satu solusi berikut untuk memperbaiki masalah:

    • Pindah ke pemantauan metrik pelengkap yang cocok untuk skenario Anda (jika ada). Misalnya, periksa perubahan tingkat keberhasilan, bukan tingkat kegagalan.
    • Coba pilih nilai yang berbeda untuk granularitas Agregasi (periode).
    • Periksa apakah ada perubahan drastis dalam perilaku metrik dalam 10 hari terakhir, seperti pemadaman. Perubahan mendadak dapat berdampak pada ambang batas atas dan bawah yang dihitung untuk metrik dan membuatnya lebih luas. Tunggu beberapa hari sampai pemadaman tidak lagi dimasukkan ke dalam perhitungan ambang batas. Anda juga dapat mengedit aturan pemberitahuan untuk menggunakan opsi Abaikan data sebelum di pengaturan Tingkat Lanjut.
    • Jika data Anda memiliki musim mingguan, tetapi tidak tersedia cukup riwayat untuk metrik, ambang batas yang dihitung dapat mengakibatkan batas atas dan bawah yang luas. Misalnya, penghitungan dapat memperlakukan hari kerja dan akhir pekan dengan cara yang sama, dan membuat batas lebar yang tidak selalu sesuai dengan data. Masalah ini harus diselesaikan sendiri setelah riwayat metrik yang cukup tersedia. Kemudian, musiman yang benar terdeteksi dan ambang batas terhitung diperbarui.
  • Ketika nilai metrik menunjukkan fluktuasi besar, ambang batas dinamis dapat membangun model yang luas di sekitar nilai metrik, yang dapat menghasilkan batas yang lebih rendah atau lebih tinggi dari yang diharapkan. Skenario ini dapat terjadi ketika:

    • Sensitivitas diatur ke rendah.
    • Metrik menunjukkan perilaku tidak beraturan dengan varians tinggi, yang muncul sebagai lonjakan atau penurunan dalam data.

    Pertimbangkan untuk membuat model kurang sensitif dengan memilih sensitivitas yang lebih tinggi atau memilih periode Lookback yang lebih besar. Anda juga dapat menggunakan opsi Abaikan data sebelum untuk mengecualikan penyimpangan terbaru dari data historis yang digunakan untuk membangun model.

Mengonfigurasi ambang batas dinamis

Ikuti prosedur untuk membuat atau mengedit aturan pemberitahuan, menggunakan pengaturan ini

  1. Di tab Kondisi ,
    1. Di bidang Ambang, pilih Dinamis.
    2. Dalam jenis Agregasi, kami sarankan Anda tidak memilih Maksimum.
    3. Di bidang Operator, pilih Lebih besar dari kecuali perilaku mewakili penggunaan aplikasi.
    4. Di Sensitivitas Ambang, pilih Sedang atau Rendah untuk mengurangi kebisingan pemberitahuan.
    5. Di bidang Periksa setiap , pertimbangkan untuk menurunkan frekuensi berdasarkan dampak bisnis pemberitahuan.
    6. Pada periode Lookback, atur jendela look-back ke setidaknya 15 menit. Misalnya, jika pemeriksaan setiap bidang diatur ke 5 menit, periode lookback harus setidaknya 3 menit atau lebih.
  2. Lanjutkan dengan sisa proses untuk membuat aturan pemberitahuan.

Catatan

Aturan peringatan metrik yang dibuat melalui portal dibuat dalam grup sumber daya yang sama dengan sumber daya target.

Memahami bagan ambang batas dinamis

Bagan berikut menampilkan metrik, batas ambang dinamisnya, dan beberapa peringatan diaktifkan saat nilai berada di luar ambang yang diizinkan.

Screenshot that shows a metric, its dynamic thresholds limits, and some alerts that fired.

Gunakan informasi berikut untuk menginterpretasikan bagan:

  • Garis biru: Metrik terukur aktual dari waktu ke waktu.
  • Area berbayang biru: Menampilkan rentang yang diizinkan untuk metrik. Jika nilai metrik tetap berada dalam rentang ini, tidak ada pemberitahuan yang dipicu.
  • Titik biru: Jika Anda meninggalkan klik pada bagian bagan lalu mengarahkan mouse ke atas garis biru, titik biru akan muncul di bawah kursor Anda yang menampilkan nilai metrik agregat individual.
  • Pop-up dengan titik biru: Menampilkan nilai metrik terukur (titik biru) dan nilai atas dan bawah dari rentang yang diizinkan.
  • Titik merah dengan lingkaran hitam: Menampilkan nilai metrik pertama dari rentang yang diizinkan. Nilai ini mengaktifkan peringatan metrik dan membuatnya muncul dalam status aktif.
  • Titik merah: Menunjukkan nilai terukur lainnya di luar rentang yang diizinkan. Mereka tidak memicu lebih banyak pemberitahuan metrik, tetapi pemberitahuan tetap dalam status aktif.
  • Area merah: Menampilkan waktu ketika nilai metrik berada di luar rentang yang diizinkan. Peringatan tetap dalam status aktif selama nilai terukur berikutnya berada di luar rentang yang diizinkan, tetapi tidak ada peringatan baru yang ditembakkan.
  • Akhir area merah: Saat garis biru kembali ke dalam nilai yang diizinkan, area merah berhenti dan garis nilai terukur berubah menjadi biru. Status peringatan metrik yang ditembakkan pada saat titik merah dengan garis besar hitam diatur untuk diselesaikan.

Metrik tidak didukung oleh ambang batas dinamis

Ambang dinamis didukung untuk sebagian besar metrik, tetapi beberapa metrik tidak dapat menggunakan ambang dinamis.

Tabel berikut mencantumkan metrik yang tidak didukung oleh ambang batas dinamis.

Jenis Sumber Daya Nama metrik
Microsoft.ClassicStorage/storageAccounts UsedCapacity
Microsoft.ClassicStorage/storageAccounts/blobServices BlobCapacity
Microsoft.ClassicStorage/storageAccounts/blobServices BlobCount
Microsoft.ClassicStorage/storageAccounts/blobServices IndexCapacity
Microsoft.ClassicStorage/storageAccounts/fileServices FileCapacity
Microsoft.ClassicStorage/storageAccounts/fileServices FileCount
Microsoft.ClassicStorage/storageAccounts/fileServices FileShareCount
Microsoft.ClassicStorage/storageAccounts/fileServices FileShareSnapshotCount
Microsoft.ClassicStorage/storageAccounts/fileServices FileShareSnapshotSize
Microsoft.ClassicStorage/storageAccounts/fileServices FileShareQuota
Microsoft.Compute/disks Byte Pembacaan Disk Komposit/detik
Microsoft.Compute/disks Operasi Pembacaan Disk Komposit/dtk
Microsoft.Compute/disks Byte Penulisan Disk Komposit/dtk
Microsoft.Compute/disks Operasi Penulisan Disk Komposit/dtk
Microsoft.ContainerService/managedClusters NodesCount
Microsoft.ContainerService/managedClusters PodCount
Microsoft.ContainerService/managedClusters CompletedJobsCount
Microsoft.ContainerService/managedClusters RestartingContainerCount
Microsoft.ContainerService/managedClusters OomKilledContainerCount
Microsoft.Devices/IotHubs TotalDeviceCount
Microsoft.Devices/IotHubs ConnectedDeviceCount
Microsoft.Devices/IotHubs TotalDeviceCount
Microsoft.Devices/IotHubs ConnectedDeviceCount
Microsoft.DocumentDB/databaseAccounts CassandraConnectionClosures
Microsoft.EventHub/kluster Ukuran
Microsoft.EventHub/namespaces Ukuran
Microsoft.IoTCentral/IoTApps connectedDeviceCount
Microsoft.IoTCentral/IoTApps provisionedDeviceCount
microsoft.kubernetes/connectedClusters NodesCount
microsoft.kubernetes/connectedClusters PodCount
microsoft.kubernetes/connectedClusters CompletedJobsCount
microsoft.kubernetes/connectedClusters RestartingContainerCount
microsoft.kubernetes/connectedClusters OomKilledContainerCount
Microsoft.MachineLearningServices/ruang kerja/onlineEndpoints RequestsPerMinute
Microsoft.MachineLearningServices/ruang kerja/onlineEndpoints/penyebaran DeploymentCapacity
Microsoft.Maps/akun CreatorUsage
Microsoft.Media/mediaservices/streamingEndpoints EgressBandwidth
Microsoft.Network/applicationGateways Throughput
Microsoft.Network/azurefirewalls Throughput
Microsoft.Network/expressRouteGateways ExpressRouteGatewayPacketsPerSecond
Microsoft.Network/expressRouteGateways ExpressRouteGatewayNumberOfVmInVnet
Microsoft.Network/expressRouteGateways ExpressRouteGatewayFrequencyOfRoutesChanged
Microsoft.Network/virtualNetworkGateways ExpressRouteGatewayBitsPerSecond
Microsoft.Network/virtualNetworkGateways ExpressRouteGatewayPacketsPerSecond
Microsoft.Network/virtualNetworkGateways ExpressRouteGatewayNumberOfVmInVnet
Microsoft.Network/virtualNetworkGateways ExpressRouteGatewayFrequencyOfRoutesChanged
Microsoft.ServiceBus/namespaces Ukuran
Microsoft.ServiceBus/namespaces Pesan
Microsoft.ServiceBus/namespaces ActiveMessages
Microsoft.ServiceBus/namespaces DeadletteredMessages
Microsoft.ServiceBus/namespaces ScheduledMessages
Microsoft.ServiceFabricMesh/applications AllocatedCpu
Microsoft.ServiceFabricMesh/applications AllocatedMemory
Microsoft.ServiceFabricMesh/applications ActualCpu
Microsoft.ServiceFabricMesh/applications ActualMemory
Microsoft.ServiceFabricMesh/applications ApplicationStatus
Microsoft.ServiceFabricMesh/applications ServiceStatus
Microsoft.ServiceFabricMesh/applications ServiceReplicaStatus
Microsoft.ServiceFabricMesh/applications ContainerStatus
Microsoft.ServiceFabricMesh/applications RestartCount
Microsoft.Storage/storageAccounts UsedCapacity
Microsoft.Storage/storageAccounts/blobServices BlobCapacity
Microsoft.Storage/storageAccounts/blobServices BlobCount
Microsoft.Storage/storageAccounts/blobServices BlobProvisionedSize
Microsoft.Storage/storageAccounts/blobServices IndexCapacity
Microsoft.Storage/storageAccounts/fileServices FileCapacity
Microsoft.Storage/storageAccounts/fileServices FileCount
Microsoft.Storage/storageAccounts/fileServices FileShareCount
Microsoft.Storage/storageAccounts/fileServices FileShareSnapshotCount
Microsoft.Storage/storageAccounts/fileServices FileShareSnapshotSize
Microsoft.Storage/storageAccounts/fileServices FileShareCapacityQuota
Microsoft.Storage/storageAccounts/fileServices FileShareProvisionedIOPS

Langkah berikutnya