Een waarschuwing voor metrische gegevens maken met dynamische drempelwaarden
Dynamische drempelwaarden passen geavanceerde machine learning toe en gebruiken een set algoritmen en methoden om:
- Meer informatie over het historische gedrag van metrische gegevens.
- Analyseer metrische gegevens in de loop van de tijd en identificeer patronen zoals elk uur, dagelijks of wekelijkse patronen.
- Afwijkingen herkennen die mogelijke serviceproblemen aangeven.
- Bereken de meest geschikte drempelwaarden voor metrische gegevens.
Wanneer u dynamische drempelwaarden gebruikt, hoeft u niet de juiste drempelwaarde voor elke metrische waarde te kennen. Dynamische drempelwaarden berekenen de meest geschikte drempelwaarden voor u.
We raden u aan waarschuwingsregels te configureren met dynamische drempelwaarden voor deze metrische gegevens:
- CPU-percentage van virtuele machine
- Uitvoeringstijd voor HTTP-aanvragen in Application Insights
Dynamische drempelwaarden helpen u bij het volgende:
- Maak schaalbare waarschuwingen voor honderden metrische gegevensreeksen met één waarschuwingsregel. Als u minder waarschuwingsregels hebt, besteedt u minder tijd aan het maken en beheren ervan. Schaalbare waarschuwingen zijn met name handig voor meerdere dimensies of voor meerdere resources, zoals alle resources in een abonnement.
- Regels maken zonder te weten welke drempelwaarde moet worden geconfigureerd.
- Configureer metrische waarschuwingen met behulp van concepten op hoog niveau zonder dat u uitgebreide domeinkennis over de metrische gegevens nodig hebt.
- Voorkom ruisdrempels (lage precisie) of brede (lage relevante overeenkomsten) die geen verwacht patroon hebben.
U kunt dynamische drempelwaarden gebruiken voor:
- De meeste Azure Monitor-platformen en aangepaste metrische gegevens.
- Algemene metrische gegevens voor toepassingen en infrastructuur.
- Luidruchtige metrische gegevens, zoals cpu van machine of geheugen.
- Metrische gegevens met een lage spreiding, zoals beschikbaarheid en foutpercentage.
U kunt dynamische drempelwaarden configureren met behulp van:
- De Azure Portal.
- De volledig geautomatiseerde Azure Resource Manager-API.
- Sjablonen voor metrische waarschuwingen.
Berekening van waarschuwingsdrempel en preview
Wanneer een waarschuwingsregel wordt gemaakt, gebruiken dynamische drempelwaarden 10 dagen aan historische gegevens om uur- of dagelijkse seizoenspatronen te berekenen. De grafiek die u in het waarschuwingsvoorbeeld ziet, weerspiegelt die gegevens.
Dynamische drempelwaarden gebruiken voortdurend alle beschikbare historische gegevens om te leren en maken aanpassingen om nauwkeuriger te zijn. Na drie weken beschikken dynamische drempelwaarden over voldoende gegevens om wekelijkse patronen te identificeren en wordt het model aangepast om wekelijkse seizoensgebondenheid op te nemen.
Het systeem herkent automatisch langdurige storingen en verwijdert deze uit het algoritme voor het leren van drempelwaarden. Als er een langdurige storing is, begrijpen dynamische drempelwaarden de gegevens. Ze detecteren systeemproblemen met hetzelfde gevoeligheidsniveau als vóór de storing.
Overwegingen voor het gebruik van dynamische drempelwaarden
- Om een nauwkeurige drempelwaardeberekening te garanderen, worden waarschuwingsregels die gebruikmaken van dynamische drempelwaarden, geen waarschuwing geactiveerd voordat u drie dagen en ten minste 30 voorbeelden van metrische gegevens verzamelt. Nieuwe resources of resources die ontbrekende metrische gegevens bevatten, activeren geen waarschuwing totdat er voldoende gegevens beschikbaar zijn.
- Dynamische drempelwaarden hebben ten minste drie weken historische gegevens nodig om wekelijkse seizoensgebondenheid te detecteren. Sommige gedetailleerde patronen, zoals bihourly- of semiweekly-patronen, worden mogelijk niet gedetecteerd.
- Als het gedrag van een metrische waarde onlangs is gewijzigd, worden de wijzigingen niet onmiddellijk doorgevoerd in de boven- en ondergrenzen van de dynamische drempelwaarde. De randen worden berekend op basis van metrische gegevens uit de afgelopen 10 dagen. Wanneer u de randen van de dynamische drempelwaarde voor een bepaalde metrische waarde bekijkt, bekijkt u de metrische trend in de afgelopen week en niet alleen voor recente uren of dagen.
- Dynamische drempelwaarden zijn geschikt voor het detecteren van aanzienlijke afwijkingen, in tegenstelling tot langzaam veranderende problemen. Wijzigingen in traag gedrag activeren waarschijnlijk geen waarschuwing.
Bekende problemen met de gevoeligheid voor dynamische drempelwaarden
Als een waarschuwingsregel die gebruikmaakt van dynamische drempelwaarden te luidruchtig is of te veel wordt geactiveerd, moet u mogelijk de gevoeligheid verminderen. Gebruik een van de volgende opties:
- Gevoeligheid voor drempelwaarde: stel de gevoeligheid in op Laag om meer tolerant te zijn voor afwijkingen.
- Aantal schendingen (onder Geavanceerde instellingen): configureer de waarschuwingsregel zodanig dat deze alleen wordt geactiveerd als er binnen een bepaalde periode verschillende afwijkingen optreden. Deze instelling maakt de regel minder gevoelig voor tijdelijke afwijkingen.
Het kan zijn dat een waarschuwingsregel die gebruikmaakt van dynamische drempelwaarden niet wordt geactiveerd of niet gevoelig genoeg is, ook al is deze geconfigureerd met een hoge gevoeligheid. Dit scenario kan optreden wanneer de verdeling van de metrische gegevens zeer onregelmatig is. Overweeg een van de volgende oplossingen:
- Ga naar het bewaken van een aanvullende metrische waarde die geschikt is voor uw scenario, indien van toepassing. Controleer bijvoorbeeld op wijzigingen in slagingspercentage in plaats van foutpercentage.
- Selecteer een andere waarde voor aggregatiegranulariteit (periode).
- Controleer of er een drastische wijziging is opgetreden in het gedrag van de metrische gegevens in de afgelopen 10 dagen, zoals een storing. Een plotselinge wijziging kan van invloed zijn op de bovenste en lagere drempelwaarden die worden berekend voor de metrische waarde en deze breder maken. Wacht enkele dagen totdat de storing niet meer is opgenomen in de drempelwaardeberekening. U kunt de waarschuwingsregel ook bewerken om de optie Gegevens negeren te gebruiken voordat u de optie Geavanceerde instellingen gebruikt.
- Als uw gegevens wekelijks seizoensgebonden zijn, maar er onvoldoende geschiedenis beschikbaar is voor de metrische gegevens, kunnen de berekende drempelwaarden leiden tot brede boven- en ondergrenzen. De berekening kan bijvoorbeeld weekdagen en weekenden op dezelfde manier behandelen en brede randen bouwen die niet altijd passen bij de gegevens. Dit probleem moet zichzelf oplossen nadat er voldoende metrische geschiedenis beschikbaar is. Vervolgens wordt de juiste seizoensgebondenheid gedetecteerd en worden de berekende drempelwaarden dienovereenkomstig bijgewerkt.
Wanneer een metrische waarde grote schommelingen vertoont, kunnen dynamische drempelwaarden een breed model maken rond de metrische waarden, wat kan leiden tot een lagere of hogere grens dan verwacht. Dit scenario kan zich voordoen wanneer:
- De gevoeligheid is ingesteld op laag.
- De metrische waarde vertoont een onregelmatig gedrag met een hoge variantie, die wordt weergegeven als pieken of dalen in de gegevens.
Overweeg om het model minder gevoelig te maken door een hogere gevoeligheid te kiezen of een grotere waarde voor de lookbackperiode te selecteren. U kunt ook de optie Gegevens negeren gebruiken voordat u een recente onregelmatigheden wilt uitsluiten van de historische gegevens die worden gebruikt om het model te bouwen.
Configuratie van dynamische drempelwaarden
Als u dynamische drempelwaarden wilt configureren, volgt u de procedure voor het maken van een waarschuwingsregel. Gebruik deze instellingen op het tabblad Voorwaarde :
- Selecteer Dynamisch voor Drempelwaarde.
- Voor het aggregatietype wordt u aangeraden Maximum niet te selecteren.
- Selecteer voor Operator groter dan tenzij het gedrag het toepassingsgebruik vertegenwoordigt.
- Selecteer Normaal of Laag voor drempelwaarden om waarschuwingsruis te verminderen.
- Selecteer bij Elke controle hoe vaak de waarschuwingsregel controleert of aan de voorwaarde wordt voldaan. Als u de bedrijfsimpact van de waarschuwing wilt minimaliseren, kunt u overwegen een lagere frequentie te gebruiken. Zorg ervoor dat deze waarde kleiner is dan of gelijk is aan de waarde van de Lookback-periode .
- Stel voor de lookbackperiode de periode in om telkens weer te kijken wanneer de gegevens worden gecontroleerd. Zorg ervoor dat deze waarde groter is dan of gelijk is aan de waarde Elke waarde controleren .
- Kies voor geavanceerde opties hoeveel schendingen de waarschuwing binnen een bepaalde periode activeren. Stel desgewenst de datum in vanaf waaruit u de historische metrische gegevens wilt leren en de dynamische drempelwaarden wilt berekenen.
Notitie
Waarschuwingsregels voor metrische gegevens die u maakt via de portal, worden gemaakt in dezelfde resourcegroep als de doelresource.
Grafiek voor dynamische drempelwaarden
In de volgende grafiek ziet u een metrische waarde, de dynamische drempelwaarden en enkele waarschuwingen die werden geactiveerd wanneer de waarde buiten de toegestane drempelwaarden lag.
Gebruik de volgende informatie om de grafiek te interpreteren:
- Blauwe lijn: de metrische waarde die in de loop van de tijd wordt gemeten.
- Blauw gearceerd gebied: het toegestane bereik voor de metrische waarde. Als de metrische waarden binnen dit bereik blijven, wordt er geen waarschuwing geactiveerd.
- Blauwe stippen: geaggregeerde metrische waarden. Als u een deel van de grafiek selecteert en vervolgens de muisaanwijzer boven de blauwe lijn plaatst, wordt onder de cursor een blauwe stip weergegeven om een afzonderlijke geaggregeerde metrische waarde aan te geven.
- Pop-upvak met blauwe stip: de gemeten metrische waarde (blauwe stip) en de bovenste en lagere waarden van het toegestane bereik.
- Rode stip met een zwarte cirkel: de eerste metrische waarde buiten het toegestane bereik. Met deze waarde wordt een metrische waarschuwing geactiveerd en wordt deze geactiveerd in een actieve status.
- Rode stippen: Andere gemeten waarden buiten het toegestane bereik. Ze activeren geen metrische waarschuwingen, maar de waarschuwing blijft actief.
- Rood gebied: het tijdstip waarop de metrische waarde buiten het toegestane bereik lag. De waarschuwing blijft actief zolang de volgende gemeten waarden buiten het toegestane bereik vallen, maar er worden geen nieuwe waarschuwingen geactiveerd.
- Einde van rood gebied: Een terugkeer naar toegestane waarden. Wanneer de blauwe lijn zich weer in de toegestane waarden bevindt, stopt het rode gebied en wordt de gemeten waardelijn blauw. De status van de metrische waarschuwing die is geactiveerd op het moment van de rode stip met een zwarte cirkel, is ingesteld op opgelost.
Metrische gegevens worden niet ondersteund door dynamische drempelwaarden
Dynamische drempelwaarden ondersteunen de meeste metrische gegevens, maar de volgende metrische gegevens kunnen geen dynamische drempelwaarden gebruiken:
Brontype | Naam van meetwaarde |
---|---|
Microsoft.ClassicStorage/storageAccounts | UsedCapacity |
Microsoft.ClassicStorage/storageAccounts/blobServices | BlobCapacity |
Microsoft.ClassicStorage/storageAccounts/blobServices | BlobCount |
Microsoft.ClassicStorage/storageAccounts/blobServices | IndexCapacity |
Microsoft.ClassicStorage/storageAccounts/fileServices | FileCapacity |
Microsoft.ClassicStorage/storageAccounts/fileServices | FileCount |
Microsoft.ClassicStorage/storageAccounts/fileServices | FileShareCount |
Microsoft.ClassicStorage/storageAccounts/fileServices | FileShareSnapshotCount |
Microsoft.ClassicStorage/storageAccounts/fileServices | FileShareSnapshotSize |
Microsoft.ClassicStorage/storageAccounts/fileServices | FileShareQuota |
Microsoft.Compute/disks | Samengestelde schijf gelezen bytes per seconde |
Microsoft.Compute/disks | Leesbewerkingen voor samengestelde schijven per seconde |
Microsoft.Compute/disks | Bytes per seconde schrijven van samengestelde schijf |
Microsoft.Compute/disks | Schrijfbewerkingen voor samengestelde schijven per seconde |
Microsoft.ContainerService/managedClusters | NodesCount |
Microsoft.ContainerService/managedClusters | PodCount |
Microsoft.ContainerService/managedClusters | CompletedJobsCount |
Microsoft.ContainerService/managedClusters | RestartingContainerCount |
Microsoft.ContainerService/managedClusters | OomKilledContainerCount |
Microsoft.Devices/IotHubs | TotalDeviceCount |
Microsoft.Devices/IotHubs | ConnectedDeviceCount |
Microsoft.Devices/IotHubs | TotalDeviceCount |
Microsoft.Devices/IotHubs | ConnectedDeviceCount |
Microsoft.DocumentDB/databaseAccounts | CassandraConnectionClosures |
Microsoft.EventHub/clusters | Tekengrootte |
Microsoft.EventHub/namespaces | Tekengrootte |
Microsoft.IoTCentral/IoTApps | connectedDeviceCount |
Microsoft.IoTCentral/IoTApps | provisionedDeviceCount |
Microsoft.Kubernetes/connectedClusters | NodesCount |
Microsoft.Kubernetes/connectedClusters | PodCount |
Microsoft.Kubernetes/connectedClusters | CompletedJobsCount |
Microsoft.Kubernetes/connectedClusters | RestartingContainerCount |
Microsoft.Kubernetes/connectedClusters | OomKilledContainerCount |
Microsoft.MachineLearningServices/workspaces/onlineEndpoints | RequestsPerMinute |
Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments | DeploymentCapacity |
Microsoft.Maps/accounts | CreatorUsage |
Microsoft.Media/mediaservices/streamingEndpoints | EgressBandwidth |
Microsoft.Network/applicationGateways | Doorvoer |
Microsoft.Network/azureFirewalls | Doorvoer |
Microsoft.Network/expressRouteGateways | ExpressRouteGatewayPacketsPerSecond |
Microsoft.Network/expressRouteGateways | ExpressRouteGatewayNumberOfVmInVnet |
Microsoft.Network/expressRouteGateways | ExpressRouteGatewayFrequencyOfRoutesChanged |
Microsoft.Network/virtualNetworkGateways | ExpressRouteGatewayBitsPerSecond |
Microsoft.Network/virtualNetworkGateways | ExpressRouteGatewayPacketsPerSecond |
Microsoft.Network/virtualNetworkGateways | ExpressRouteGatewayNumberOfVmInVnet |
Microsoft.Network/virtualNetworkGateways | ExpressRouteGatewayFrequencyOfRoutesChanged |
Microsoft.ServiceBus/namespaces | Tekengrootte |
Microsoft.ServiceBus/namespaces | Berichten |
Microsoft.ServiceBus/namespaces | ActiveMessages |
Microsoft.ServiceBus/namespaces | DeadletteredMessages |
Microsoft.ServiceBus/namespaces | ScheduledMessages |
Microsoft.ServiceFabricMesh/applications | AllocatedCpu |
Microsoft.ServiceFabricMesh/applications | AllocatedMemory |
Microsoft.ServiceFabricMesh/applications | ActualCpu |
Microsoft.ServiceFabricMesh/applications | ActualMemory |
Microsoft.ServiceFabricMesh/applications | ApplicationStatus |
Microsoft.ServiceFabricMesh/applications | ServiceStatus |
Microsoft.ServiceFabricMesh/applications | ServiceReplicaStatus |
Microsoft.ServiceFabricMesh/applications | ContainerStatus |
Microsoft.ServiceFabricMesh/applications | RestartCount |
Microsoft.Storage/storageAccounts | UsedCapacity |
Microsoft.Storage/storageAccounts/blobServices | BlobCapacity |
Microsoft.Storage/storageAccounts/blobServices | BlobCount |
Microsoft.Storage/storageAccounts/blobServices | BlobProvisionedSize |
Microsoft.Storage/storageAccounts/blobServices | IndexCapacity |
Microsoft.Storage/storageAccounts/fileServices | FileCapacity |
Microsoft.Storage/storageAccounts/fileServices | FileCount |
Microsoft.Storage/storageAccounts/fileServices | FileShareCount |
Microsoft.Storage/storageAccounts/fileServices | FileShareSnapshotCount |
Microsoft.Storage/storageAccounts/fileServices | FileShareSnapshotSize |
Microsoft.Storage/storageAccounts/fileServices | FileShareCapacityQuota |
Microsoft.Storage/storageAccounts/fileServices | FileShareProvisionedIOPS |
Gerelateerde inhoud
Als u feedback hebt over dynamische drempelwaarden, kunt u ons een e-mail sturen.