Een waarschuwing voor metrische gegevens maken met dynamische drempelwaarden

Dynamische drempelwaarden passen geavanceerde machine learning toe en gebruiken een set algoritmen en methoden om:

  • Meer informatie over het historische gedrag van metrische gegevens
  • Metrische gegevens in de loop van de tijd analyseren en patronen identificeren, zoals uur-, dagelijkse of wekelijkse patronen
  • Afwijkingen herkennen die mogelijke serviceproblemen aangeven
  • De meest geschikte drempelwaarde voor de metrische waarde berekenen

Wanneer u dynamische drempelwaarden gebruikt, hoeft u niet de juiste drempelwaarde voor elke metriek te kennen, omdat dynamische drempelwaarden de meest geschikte drempelwaarden voor u berekenen.

We raden u aan waarschuwingsregels te configureren met dynamische drempelwaarden voor deze metrische gegevens:

  • CPU-percentage van virtuele machine
  • Uitvoeringstijd voor HTTP-aanvragen in Application Insights

Dynamische drempelwaarden helpen u bij het volgende:

  • Maak schaalbare waarschuwingen voor honderden metrische gegevensreeksen met één waarschuwingsregel. Als u minder waarschuwingsregels hebt, hoeft u minder tijd te besteden aan het maken en beheren van waarschuwingsregels. Schaalbare waarschuwingen zijn met name handig voor meerdere dimensies of voor meerdere resources, zoals voor alle resources in een abonnement.
  • Regels maken zonder te weten welke drempelwaarde moet worden geconfigureerd. Met behulp van dynamische drempelwaarden kunt u metrische waarschuwingen configureren met behulp van concepten op hoog niveau, zonder dat u uitgebreide domeinkennis over de metrische gegevens hebt
  • Waarschuwingen voor metrische gegevens configureren met behulp van concepten op hoog niveau zonder uitgebreide domeinkennis over de metrische gegevens
  • Lawaaierige drempelwaarden (lage precisie) of brede (lage relevante overeenkomsten) voorkomen die geen verwacht patroon hebben
  • Omgaan met metrische gegevens over ruis (zoals CPU of geheugen van de machine) en metrische gegevens met een lage spreiding (zoals beschikbaarheid en foutpercentage)

U kunt dynamische drempelwaarden gebruiken voor:

  • de meeste Azure Monitor-platformen en aangepaste metrische gegevens
  • Algemene metrische gegevens voor toepassingen en infrastructuur
  • Luidruchtige metrische gegevens, zoals CPU van machine of geheugen
  • metrische gegevens met een lage spreiding, zoals beschikbaarheid en foutpercentage, zie metrische gegevens die niet worden ondersteund door dynamische drempelwaarden voor een lijst met metrische gegevens die niet worden ondersteund door dynamische drempelwaarden.

U kunt dynamische drempelwaarden configureren met behulp van:

Berekening van waarschuwingsdrempel en preview

Wanneer een waarschuwingsregel voor het eerst wordt gemaakt, gebruiken dynamische drempelwaarden 10 dagen aan historische gegevens om uur- of dagseizoensgebonden patronen te berekenen. De grafiek die u in het waarschuwingsvoorbeeld ziet, weerspiegelt die gegevens. Nadat een waarschuwingsregel is gemaakt, gebruiken dynamische drempelwaarden voortdurend alle beschikbare historische gegevens om te leren en de drempelwaarden aan te passen zodat deze nauwkeuriger zijn. Na drie weken hebben dynamische drempelwaarden voldoende gegevens om ook wekelijkse patronen te identificeren en wordt het model aangepast om wekelijkse seizoensgebondenheid op te nemen. Waarschuwingsregels die dynamische drempelwaarden gebruiken, activeren geen waarschuwing voordat u drie dagen en ten minste 30 voorbeelden van metrische gegevens verzamelt.

Het systeem herkent automatisch langdurige storingen en verwijdert deze uit het algoritme voor het leren van drempelwaarden. Als er sprake is van een langdurige storing, begrijpen dynamische drempelwaarden de gegevens en detecteren ze systeemproblemen met hetzelfde gevoeligheidsniveau als vóór de storing.

Overwegingen bij het gebruik van dynamische drempelwaarden

  • Om nauwkeurige drempelwaardeberekening te garanderen, activeren waarschuwingen met behulp van dynamische drempelwaarden geen waarschuwing voordat er drie dagen worden verzameld en ten minste 30 voorbeelden van metrische gegevens. Nieuwe resources of resources die metrische gegevens ontbreken, activeren daarom geen waarschuwing totdat er voldoende gegevens beschikbaar zijn.
  • Dynamische drempelwaarden hebben ten minste drie weken historische gegevens nodig om wekelijkse seizoensgebondenheid te detecteren. Sommige gedetailleerde patronen, zoals bi-uurs- of semi-wekelijkse patronen, worden mogelijk niet gedetecteerd.
  • Als het gedrag van een metrische waarde onlangs is gewijzigd, worden de wijzigingen niet onmiddellijk doorgevoerd in de boven- en ondergrenzen van de dynamische drempelwaarde. De randen worden berekend op basis van metrische gegevens uit de afgelopen 10 dagen. Wanneer u de randen voor dynamische drempelwaarden voor een bepaalde metrische waarde bekijkt, bekijkt u de metrische trend in de afgelopen week en niet alleen voor recente uren of dagen.
  • Dynamische drempelwaarden zijn geschikt voor het detecteren van aanzienlijke afwijkingen, in tegenstelling tot langzaam veranderende problemen. Wijzigingen in traag gedrag activeren waarschijnlijk geen waarschuwing.

Bekende problemen met de gevoeligheid voor dynamische drempelwaarden

  • Als een waarschuwingsregel die gebruikmaakt van dynamische drempelwaarden te luidruchtig is of te veel wordt geactiveerd, moet u mogelijk de gevoeligheid van de waarschuwingsregel voor dynamische drempelwaarden verminderen. Gebruik een van de volgende opties:

    • Gevoeligheid voor drempelwaarde: stel de gevoeligheid in op Laag om toleranter te zijn voor afwijkingen.
    • Aantal schendingen (onder Geavanceerde instellingen): configureer de waarschuwingsregel zodanig dat deze alleen wordt geactiveerd als er binnen een bepaalde periode verschillende afwijkingen optreden. Deze instelling maakt de regel minder gevoelig voor tijdelijke afwijkingen.
  • U kunt een waarschuwingsregel tegenkomen die gebruikmaakt van dynamische drempelwaarden wordt niet geactiveerd of niet gevoelig genoeg is, zelfs als deze is geconfigureerd met een hoge gevoeligheid. Dit kan gebeuren wanneer de verdeling van de metrische gegevens zeer onregelmatig is. Overweeg een van de volgende oplossingen om het probleem op te lossen:

    • Ga naar het bewaken van een aanvullende metrische waarde die geschikt is voor uw scenario, indien van toepassing. Controleer bijvoorbeeld op wijzigingen in slagingspercentage in plaats van foutpercentage.
    • Selecteer een andere waarde voor aggregatiegranulariteit (periode).
    • Controleer of er in de afgelopen tien dagen een drastische wijziging is aangebracht in het metrische gedrag, zoals een storing. Een plotselinge wijziging kan van invloed zijn op de bovenste en lagere drempelwaarden die worden berekend voor de metrische waarde en deze breder maken. Wacht enkele dagen totdat de storing niet meer in de berekening van drempelwaarden is opgenomen. U kunt de waarschuwingsregel ook bewerken om de optie Gegevens negeren te gebruiken voordat u de optie Geavanceerde instellingen gebruikt.
    • Als uw gegevens wekelijks seizoensgebonden zijn, maar er onvoldoende geschiedenis beschikbaar is voor de metrische gegevens, kunnen de berekende drempelwaarden leiden tot een brede boven- en ondergrens. De berekening kan bijvoorbeeld weekdagen en weekenden op dezelfde manier behandelen en brede randen bouwen die niet altijd passen bij de gegevens. Dit probleem moet zichzelf oplossen nadat er voldoende metrische geschiedenis beschikbaar is. Vervolgens wordt de juiste seizoensgebondenheid gedetecteerd en worden de berekende drempelwaarden dienovereenkomstig bijgewerkt.
  • Wanneer een metrische waarde grote schommelingen vertoont, kunnen dynamische drempelwaarden een breed model bouwen rond de metrische waarden, wat kan leiden tot een lagere of hogere grens dan verwacht. Dit scenario kan zich voordoen wanneer:

    • De gevoeligheid is ingesteld op laag.
    • De metrische waarde vertoont een onregelmatig gedrag met een hoge variantie, die wordt weergegeven als pieken of dalen in de gegevens.

    Overweeg het model minder gevoelig te maken door een hogere gevoeligheid te kiezen of een grotere lookbackperiode te selecteren. U kunt ook de optie Gegevens negeren gebruiken voordat u een recente onregelmatigheden wilt uitsluiten van de historische gegevens die worden gebruikt om het model te bouwen.

Dynamische drempelwaarden configureren

Volg de procedure om een waarschuwingsregel te maken of te bewerken met behulp van deze instellingen

  1. Op het tabblad Voorwaarden ,
    1. Selecteer Dynamisch in het veld Drempelwaarden.
    2. In het aggregatietype wordt u aangeraden maximum niet te selecteren.
    3. Selecteer in het veld Operator groter dan tenzij het gedrag het toepassingsgebruik vertegenwoordigt.
    4. Selecteer normaal of laag bij drempelwaardegevoeligheid om waarschuwingsruis te verminderen.
    5. Overweeg in het veld Elke controle de frequentie te verlagen op basis van de bedrijfsimpact van de waarschuwing.
    6. Stel in de lookbackperiode het look-back-venster in op ten minste 15 minuten. Als de controle voor elk veld bijvoorbeeld is ingesteld op 5 minuten, moet de lookbackperiode ten minste 3 minuten of langer zijn.
  2. Ga verder met de rest van het proces om een waarschuwingsregel te maken.

Notitie

Waarschuwingsregels voor metrische gegevens die via de portal worden gemaakt, worden gemaakt in dezelfde resourcegroep als de doelresource.

Grafieken met dynamische drempelwaarden begrijpen

In de volgende grafiek ziet u een metrische waarde, de limieten voor dynamische drempelwaarden en enkele waarschuwingen die werden geactiveerd wanneer de waarde buiten de toegestane drempelwaarden lag.

Screenshot that shows a metric, its dynamic thresholds limits, and some alerts that fired.

Gebruik de volgende informatie om de grafiek te interpreteren:

  • Blauwe lijn: de werkelijke gemeten meetwaarde in de loop van de tijd.
  • Blauw gearceerd gebied: Toont het toegestane bereik voor de metrische waarde. Als de metrische waarden binnen dit bereik blijven, wordt er geen waarschuwing geactiveerd.
  • Blauwe stippen: Als u links een deel van de grafiek selecteert en de muisaanwijzer over de blauwe lijn beweegt, wordt er een blauwe stip weergegeven onder de cursor die een afzonderlijke geaggregeerde metrische waarde weergeeft.
  • Pop-up met blauwe stip: toont de gemeten metrische waarde (de blauwe stip) en de bovenste en lagere waarden van het toegestane bereik.
  • Rode stip met een zwarte cirkel: Toont de eerste metrische waarde uit het toegestane bereik. Met deze waarde wordt een metrische waarschuwing geactiveerd en wordt deze geactiveerd in een actieve status.
  • Rode stippen: geef andere gemeten waarden buiten het toegestane bereik aan. Ze activeren geen metrische waarschuwingen, maar de waarschuwing blijft actief.
  • Rood gebied: Geeft de tijd weer waarop de metrische waarde zich buiten het toegestane bereik bevindt. De waarschuwing blijft actief zolang de volgende gemeten waarden buiten het toegestane bereik vallen, maar er worden geen nieuwe waarschuwingen geactiveerd.
  • Einde van rood gebied: wanneer de blauwe lijn weer binnen de toegestane waarden staat, stopt het rode gebied en wordt de gemeten waardelijn blauw. De status van de metrische waarschuwing die wordt geactiveerd op het moment van de rode stip met een zwarte omtrek, is ingesteld op opgelost.

Metrische gegevens worden niet ondersteund door dynamische drempelwaarden

Dynamische drempelwaarden worden ondersteund voor de meeste metrische gegevens, maar sommige metrische gegevens kunnen geen dynamische drempelwaarden gebruiken.

De volgende tabel bevat de metrische gegevens die niet worden ondersteund door dynamische drempelwaarden.

Resourcetype Naam van meetwaarde
Microsoft.ClassicStorage/storageAccounts UsedCapacity
Microsoft.ClassicStorage/storageAccounts/blobServices BlobCapacity
Microsoft.ClassicStorage/storageAccounts/blobServices BlobCount
Microsoft.ClassicStorage/storageAccounts/blobServices IndexCapacity
Microsoft.ClassicStorage/storageAccounts/fileServices FileCapacity
Microsoft.ClassicStorage/storageAccounts/fileServices FileCount
Microsoft.ClassicStorage/storageAccounts/fileServices FileShareCount
Microsoft.ClassicStorage/storageAccounts/fileServices FileShareSnapshotCount
Microsoft.ClassicStorage/storageAccounts/fileServices FileShareSnapshotSize
Microsoft.ClassicStorage/storageAccounts/fileServices FileShareQuota
Microsoft.Compute/disks Samengestelde schijf gelezen bytes per seconde
Microsoft.Compute/disks Leesbewerkingen voor samengestelde schijven per seconde
Microsoft.Compute/disks Bytes per seconde schrijven van samengestelde schijf
Microsoft.Compute/disks Schrijfbewerkingen voor samengestelde schijven per seconde
Microsoft.ContainerService/managedClusters NodesCount
Microsoft.ContainerService/managedClusters PodCount
Microsoft.ContainerService/managedClusters CompletedJobsCount
Microsoft.ContainerService/managedClusters RestartingContainerCount
Microsoft.ContainerService/managedClusters OomKilledContainerCount
Microsoft.Devices/IotHubs TotalDeviceCount
Microsoft.Devices/IotHubs Verbinding maken edDeviceCount
Microsoft.Devices/IotHubs TotalDeviceCount
Microsoft.Devices/IotHubs Verbinding maken edDeviceCount
Microsoft.DocumentDB/databaseAccounts Cassandra Verbinding maken ionClosures
Microsoft.EventHub/clusters Tekengrootte
Microsoft.EventHub/namespaces Tekengrootte
Microsoft.IoTCentral/IoTApps connectedDeviceCount
Microsoft.IoTCentral/IoTApps provisionedDeviceCount
Microsoft.Kubernetes/connectedClusters NodesCount
Microsoft.Kubernetes/connectedClusters PodCount
Microsoft.Kubernetes/connectedClusters CompletedJobsCount
Microsoft.Kubernetes/connectedClusters RestartingContainerCount
Microsoft.Kubernetes/connectedClusters OomKilledContainerCount
Microsoft.MachineLearningServices/workspaces/onlineEndpoints RequestsPerMinute
Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments DeploymentCapacity
Microsoft. Kaarten/accounts CreatorUsage
Microsoft.Media/mediaservices/streamingEndpoints EgressBandwidth
Microsoft.Network/applicationGateways Doorvoer
Microsoft.Network/azureFirewalls Doorvoer
Microsoft.Network/expressRouteGateways ExpressRouteGatewayPacketsPerSecond
Microsoft.Network/expressRouteGateways ExpressRouteGatewayNumberOfVmInVnet
Microsoft.Network/expressRouteGateways ExpressRouteGatewayFrequencyOfRoutesChanged
Microsoft.Network/virtualNetworkGateways ExpressRouteGatewayBitsPerSecond
Microsoft.Network/virtualNetworkGateways ExpressRouteGatewayPacketsPerSecond
Microsoft.Network/virtualNetworkGateways ExpressRouteGatewayNumberOfVmInVnet
Microsoft.Network/virtualNetworkGateways ExpressRouteGatewayFrequencyOfRoutesChanged
Microsoft.ServiceBus/namespaces Tekengrootte
Microsoft.ServiceBus/namespaces Berichten
Microsoft.ServiceBus/namespaces ActiveMessages
Microsoft.ServiceBus/namespaces DeadletteredMessages
Microsoft.ServiceBus/namespaces ScheduledMessages
Microsoft.ServiceFabricMesh/applications AllocatedCpu
Microsoft.ServiceFabricMesh/applications AllocatedMemory
Microsoft.ServiceFabricMesh/applications ActualCpu
Microsoft.ServiceFabricMesh/applications ActualMemory
Microsoft.ServiceFabricMesh/applications ApplicationStatus
Microsoft.ServiceFabricMesh/applications ServiceStatus
Microsoft.ServiceFabricMesh/applications ServiceReplicaStatus
Microsoft.ServiceFabricMesh/applications ContainerStatus
Microsoft.ServiceFabricMesh/applications RestartCount
Microsoft.Storage/storageAccounts UsedCapacity
Microsoft.Storage/storageAccounts/blobServices BlobCapacity
Microsoft.Storage/storageAccounts/blobServices BlobCount
Microsoft.Storage/storageAccounts/blobServices BlobProvisionedSize
Microsoft.Storage/storageAccounts/blobServices IndexCapacity
Microsoft.Storage/storageAccounts/fileServices FileCapacity
Microsoft.Storage/storageAccounts/fileServices FileCount
Microsoft.Storage/storageAccounts/fileServices FileShareCount
Microsoft.Storage/storageAccounts/fileServices FileShareSnapshotCount
Microsoft.Storage/storageAccounts/fileServices FileShareSnapshotSize
Microsoft.Storage/storageAccounts/fileServices FileShareCapacityQuota
Microsoft.Storage/storageAccounts/fileServices FileShareProvisionedIOPS

Volgende stappen