Metrikariasztás létrehozása dinamikus küszöbértékekkel
A dinamikus küszöbértékek fejlett gépi tanulást alkalmaznak, és algoritmusok és módszerek készletét használják a következőket:
- A metrikák előzményeinek megismerése
- Metrikák elemzése az idő függvényében, és minták azonosítása, például óránkénti, napi vagy heti minták
- A lehetséges szolgáltatásproblémákat jelző anomáliák felismerése
- A metrika legmegfelelőbb küszöbértékének kiszámítása
Dinamikus küszöbértékek használatakor nem kell ismernie az egyes metrikák "helyes" küszöbértékét, mert a dinamikus küszöbértékek a legmegfelelőbb küszöbértékeket számítják ki.
Javasoljuk, hogy a riasztási szabályokat dinamikus küszöbértékekkel konfigurálja ezeken a metrikákon:
- Virtuális gép processzorhasználatának százalékos aránya
- Alkalmazás Elemzések HTTP-kérés végrehajtási ideje
A dinamikus küszöbértékek segítenek:
- Skálázható riasztások létrehozása több száz metrikasorozathoz egyetlen riasztási szabmánnyal. Ha kevesebb riasztási szabályt használ, kevesebb időt tölt riasztási szabályok létrehozásával és kezelésével. A méretezhető riasztások különösen hasznosak több dimenzió vagy több erőforrás esetében, például az előfizetés összes erőforrása esetében.
- Szabályok létrehozása anélkül, hogy ismernie kellene a konfigurálni kívánt küszöbértéket. Dinamikus küszöbértékek használatával magas szintű fogalmak használatával konfigurálhatja a metrikariasztásokat anélkül, hogy a metrikával kapcsolatos széles körű tartományismerettel rendelkezik
- Metrikariasztások konfigurálása magas szintű fogalmak használatával, a metrikával kapcsolatos széles körű tartományismeret nélkül
- A várt mintázattal nem rendelkező zajos (kis pontosságú) vagy széles (alacsony visszahívási) küszöbértékek megakadályozása
- Kezelje a zajos metrikákat (például a gép CPU-ját vagy memóriáját) és az alacsony szórású metrikákat (például a rendelkezésre állást és a hibaarányt)
A dinamikus küszöbértékeket a következőn használhatja:
- a legtöbb Azure Monitor-platform és egyéni metrikák
- gyakori alkalmazás- és infrastruktúrametrikák
- zajos metrikák, például a gép processzora vagy a memória
- alacsony szórású metrikák, például a rendelkezésre állás és a hibaarány. A dinamikus küszöbértékek által nem támogatott metrikákat a dinamikus küszöbértékek nem támogatják.
A dinamikus küszöbértékeket a következőkkel konfigurálhatja:
- Azure Portal
- a teljesen automatizált Azure Resource Manager API
- metrikariasztási sablonok
Riasztási küszöbérték kiszámítása és előzetes verzió
A riasztási szabály első létrehozásakor a dinamikus küszöbértékek 10 napos előzményadatokat használnak az óránkénti vagy napi szezonális minták kiszámításához. A riasztás előnézetében látható diagram az adatokat tükrözi. A riasztási szabály létrehozása után a dinamikus küszöbértékek folyamatosan használják az összes rendelkezésre álló előzményadatot a tanuláshoz, és a küszöbértékeket pontosabban módosítják. Három hét elteltével a dinamikus küszöbértékek elegendő adattal rendelkeznek a heti minták azonosításához, és a modell a heti szezonalitáshoz igazodik. A dinamikus küszöbértékeket használó riasztási szabályok nem aktiválnak riasztást három nap és legalább 30 metrikaadat-minta összegyűjtése előtt.
A rendszer automatikusan felismeri a hosszan tartó kimaradásokat, és eltávolítja őket a küszöbérték-tanulási algoritmusból. Ha hosszan tartó kimaradás történik, a dinamikus küszöbértékek megértik az adatokat, és észlelik azokat a rendszerproblémákat, amelyek ugyanolyan bizalmassági szintűek, mint a kimaradás előtt.
Megfontolandó szempontok a dinamikus küszöbértékek használatakor
- A küszöbértékek pontos kiszámítása érdekében a dinamikus küszöbértékeket használó riasztások nem aktiválnak riasztást három nap és legalább 30 metrikaadat-minta összegyűjtése előtt. Ezért az új erőforrások vagy a hiányzó metrikaadatok nem aktiválnak riasztást, amíg elegendő adat nem áll rendelkezésre.
- A dinamikus küszöbértékeknek legalább három hét előzményadatra van szükségük a heti szezonalitás észleléséhez. Előfordulhat, hogy bizonyos részletes mintákat, például a kétórás vagy a félhetes mintákat nem észleli a rendszer.
- Ha egy metrika viselkedése nemrég módosult, a változások nem jelennek meg azonnal a felső és alsó határ alatti dinamikus küszöbértékben. A szegélyek kiszámítása az elmúlt 10 nap metrikaadatai alapján történik. Ha megtekinti egy adott metrikához tartozó dinamikus küszöbérték-szegélyeket, tekintse meg az elmúlt hét metrika trendjének alakulását, és ne csak az elmúlt órákat vagy napokat.
- A dinamikus küszöbértékek alkalmasak a jelentős eltérések észlelésére, szemben a lassan változó problémákkal. A lassú viselkedés változásai valószínűleg nem aktiválnak riasztást.
A dinamikus küszöbértékek érzékenységével kapcsolatos ismert problémák
Ha egy dinamikus küszöbértékeket használó riasztási szabály túl zajos vagy túl sokat aktivál, előfordulhat, hogy csökkentenie kell a dinamikus küszöbértékek riasztási szabályának érzékenységét. Használja az alábbi lehetőségek egyikét:
- Küszöbérték-érzékenység: Állítsa a érzékenységet Alacsony értékre, hogy az eltéréseknél toleránsabb legyen.
- Szabálysértések száma (a Speciális beállítások alatt): Konfigurálja úgy a riasztási szabályt, hogy csak akkor aktiválódjon, ha bizonyos időn belül több eltérés történik. Ezzel a beállítással a szabály kevésbé érzékeny az átmeneti eltérésekre.
Előfordulhat, hogy a dinamikus küszöbértékeket használó riasztási szabály nem aktiválódik, vagy nem elég érzékeny, még akkor is, ha nagy érzékenységgel van konfigurálva. Ez akkor fordulhat elő, ha a metrika eloszlása rendkívül szabálytalan. A probléma megoldásához fontolja meg az alábbi megoldások egyikét:
- Ha lehetséges, a forgatókönyvnek megfelelő kiegészítő metrikák monitorozására válthat. Ellenőrizze például, hogy a sikerességi arányban van-e változás a hibaarány helyett.
- Próbáljon meg másik értéket választani az Aggregáció részletességének (Pont) beállításához.
- Ellenőrizze, hogy az elmúlt 10 napban drasztikus változás történt-e a metrika viselkedésében, például kimaradás. A hirtelen változás hatással lehet a metrikához kiszámított felső és alsó küszöbértékekre, és szélesebbé teheti őket. Várjon néhány napot, amíg a kimaradás már nem kerül bele a küszöbértékek kiszámításába. A riasztási szabályt úgy is szerkesztheti, hogy a Speciális beállításokbanaz Adatok figyelmen kívül hagyása lehetőséget használja.
- Ha az adatok heti szezonalitást érnek el, de nem áll rendelkezésre elegendő előzmény a metrika számára, a számított küszöbértékek széles felső és alsó határokat eredményezhetnek. A számítás például ugyanúgy kezelheti a hétköznapokat és a hétvégéket, és széles szegélyeket hozhat létre, amelyek nem mindig felelnek meg az adatoknak. Ezt a problémát meg kell oldania, miután elegendő metrikaelőzmény érhető el. Ezután a rendszer a megfelelő szezonalitást észleli, és a számított küszöbértékek ennek megfelelően frissülnek.
Ha egy metrikaérték nagy ingadozást mutat, a dinamikus küszöbértékek széles modellt hozhatnak létre a metrikaértékek köré, ami a vártnál alacsonyabb vagy magasabb határt eredményezhet. Ez a forgatókönyv akkor fordulhat elő, ha:
- A bizalmasság alacsonyra van állítva.
- A metrika szabálytalan viselkedést mutat nagy szórással, amely kiugró vagy visszaesésként jelenik meg az adatokban.
Fontolja meg, hogy a modell kevésbé érzékeny legyen, ha nagyobb érzékenységet választ, vagy nagyobb visszatekintési időszakot választ. Az Adatok figyelmen kívül hagyása lehetőséggel kizárhat egy legutóbbi szabálytalanságot a modell létrehozásához használt előzményadatokból.
Dinamikus küszöbértékek konfigurálása
Kövesse az alábbi eljárást egy riasztási szabály létrehozásához vagy szerkesztéséhez az alábbi beállításokkal
- A Feltételek lapon
- A Küszöbértékek mezőben válassza a Dinamikus lehetőséget.
- Az összesítés típusában azt javasoljuk, hogy ne válassza a Maximum lehetőséget.
- Az Operátor mezőben válassza a Nagyobb lehetőséget, kivéve, ha a viselkedés az alkalmazáshasználatot jelöli.
- A Küszöbérték-érzékenység területen válassza a Közepes vagy az Alacsony lehetőséget a riasztási zaj csökkentéséhez.
- A Minden mező ellenőrzése területen érdemes csökkenteni a gyakoriságot a riasztás üzleti hatása alapján.
- A visszatekintési időszakban állítsa a visszatekintő ablakot legalább 15 percre. Ha például minden mező ellenőrzése 5 percre van beállítva, a visszatekintési időszaknak legalább 3 percnek kell lennie.
- Folytassa a többi folyamattal egy riasztási szabály létrehozásához.
Megjegyzés:
A portálon létrehozott metrikariasztási szabályok ugyanabban az erőforráscsoportban jönnek létre, mint a célerőforrás.
A dinamikus küszöbérték-diagramok ismertetése
Az alábbi diagram egy metrikát, annak dinamikus küszöbértékeit és néhány riasztást mutat be, amelyek akkor aktiváltak, amikor az érték túllépte az engedélyezett küszöbértékeket.
A diagram értelmezéséhez használja az alábbi információkat:
- Kék vonal: A tényleges mért metrika az idő függvényében.
- Kék árnyalatú terület: A metrika megengedett tartományát jeleníti meg. Ha a metrikaértékek ezen a tartományon belül maradnak, a rendszer nem aktivál riasztást.
- Kék pont: Ha a diagram egy részén bejelölve, majd a kék vonal fölé viszi az egérmutatót, egy kék pont jelenik meg a kurzor alatt, amely egy egyedi összesített metrikaértéket jelenít meg.
- Előugró ablak kék ponttal: Megjeleníti a mért metrikaértéket (a kék pont), valamint az engedélyezett tartomány felső és alsó értékeit.
- Piros pont fekete körrel: Az első metrikaértéket jeleníti meg az engedélyezett tartományon kívül. Ez az érték aktivál egy metrikariasztást, és aktív állapotba helyezi.
- Piros pont: Az engedélyezett tartományon kívüli egyéb mért értékek jelzése. Nem aktiválnak több metrikariasztást, de a riasztás aktív állapotban marad.
- Piros terület: Azt az időpontot jeleníti meg, amikor a metrika értéke kívül volt az engedélyezett tartományon. A riasztás aktív állapotban marad mindaddig, amíg a későbbi mért értékek ki nem kerülnek az engedélyezett tartományból, de a rendszer nem aktivál új riasztásokat.
- Piros terület vége: Ha a kék vonal visszaáll az engedélyezett értékeken belülre, a piros terület leáll, és a mért értéksor kékre változik. A fekete körvonalú piros ponttal aktivált metrikariasztás állapota feloldva.
Dinamikus küszöbértékek által nem támogatott metrikák
A dinamikus küszöbértékek a legtöbb metrika esetében támogatottak, de egyes metrikák nem használhatnak dinamikus küszöbértékeket.
Az alábbi táblázat azokat a metrikákat sorolja fel, amelyeket a dinamikus küszöbértékek nem támogatnak.
Erőforrás típusa | Metrika neve |
---|---|
Microsoft.ClassicStorage/storageAccounts | UsedCapacity |
Microsoft.ClassicStorage/storageAccounts/blobServices | BlobCapacity |
Microsoft.ClassicStorage/storageAccounts/blobServices | BlobCount |
Microsoft.ClassicStorage/storageAccounts/blobServices | IndexCapacity |
Microsoft.ClassicStorage/storageAccounts/fileServices | FileCapacity |
Microsoft.ClassicStorage/storageAccounts/fileServices | FileCount |
Microsoft.ClassicStorage/storageAccounts/fileServices | FileShareCount |
Microsoft.ClassicStorage/storageAccounts/fileServices | FileShareSnapshotCount |
Microsoft.ClassicStorage/storageAccounts/fileServices | FileShareSnapshotSize |
Microsoft.ClassicStorage/storageAccounts/fileServices | FileShareQuota |
Microsoft.Compute/disks | Összetett lemez olvasási bájt/mp |
Microsoft.Compute/disks | Összetett lemez olvasási műveletei/mp |
Microsoft.Compute/disks | Összetett lemez írási bájt/mp |
Microsoft.Compute/disks | Összetett lemez írási műveletei másodpercenként |
Microsoft.ContainerService/managedClusters | NodesCount |
Microsoft.ContainerService/managedClusters | PodCount |
Microsoft.ContainerService/managedClusters | CompletedJobsCount |
Microsoft.ContainerService/managedClusters | RestartingContainerCount |
Microsoft.ContainerService/managedClusters | OomKilledContainerCount |
Microsoft.Devices/IotHubs | TotalDeviceCount |
Microsoft.Devices/IotHubs | Csatlakozás edDeviceCount |
Microsoft.Devices/IotHubs | TotalDeviceCount |
Microsoft.Devices/IotHubs | Csatlakozás edDeviceCount |
Microsoft.DocumentDB/databaseAccounts | Cassandra Csatlakozás ionClosures |
Microsoft.EventHub/fürtök | Méret |
Microsoft.EventHub/namespaces | Méret |
Microsoft.IoTCentral/IoTApps | connectedDeviceCount |
Microsoft.IoTCentral/IoTApps | provisionedDeviceCount |
Microsoft.Kubernetes/connectedClusters | NodesCount |
Microsoft.Kubernetes/connectedClusters | PodCount |
Microsoft.Kubernetes/connectedClusters | CompletedJobsCount |
Microsoft.Kubernetes/connectedClusters | RestartingContainerCount |
Microsoft.Kubernetes/connectedClusters | OomKilledContainerCount |
Microsoft.Machine Tanulás Szolgáltatások/munkaterületek/onlineEndpoints | RequestsPerMinute |
Microsoft.Machine Tanulás Services/workspaces/onlineEndpoints/deployments | DeploymentCapacity |
Microsoft. Térképek/fiókok | CreatorUsage |
Microsoft.Media/mediaservices/streamingEndpoints | EgressBandwidth |
Microsoft.Network/applicationGateways | Átfutás |
Microsoft.Network/azureFirewalls | Átfutás |
Microsoft.Network/expressRouteGateways | ExpressRouteGatewayPacketsPerSecond |
Microsoft.Network/expressRouteGateways | ExpressRouteGatewayNumberOfVmInVnet |
Microsoft.Network/expressRouteGateways | ExpressRouteGatewayFrequencyOfRoutesChanged |
Microsoft.Network/virtualNetworkGateways | ExpressRouteGatewayBitsPerSecond |
Microsoft.Network/virtualNetworkGateways | ExpressRouteGatewayPacketsPerSecond |
Microsoft.Network/virtualNetworkGateways | ExpressRouteGatewayNumberOfVmInVnet |
Microsoft.Network/virtualNetworkGateways | ExpressRouteGatewayFrequencyOfRoutesChanged |
Microsoft.ServiceBus/névterek | Méret |
Microsoft.ServiceBus/névterek | Üzenetek |
Microsoft.ServiceBus/névterek | ActiveMessages |
Microsoft.ServiceBus/névterek | DeadletteredMessages |
Microsoft.ServiceBus/névterek | ScheduledMessages |
Microsoft.ServiceFabricMesh/applications | AllocatedCpu |
Microsoft.ServiceFabricMesh/applications | AllocatedMemory |
Microsoft.ServiceFabricMesh/applications | ActualCpu |
Microsoft.ServiceFabricMesh/applications | ActualMemory |
Microsoft.ServiceFabricMesh/applications | ApplicationStatus |
Microsoft.ServiceFabricMesh/applications | ServiceStatus |
Microsoft.ServiceFabricMesh/applications | ServiceReplicaStatus |
Microsoft.ServiceFabricMesh/applications | ContainerStatus |
Microsoft.ServiceFabricMesh/applications | RestartCount |
Microsoft.Storage/storageAccounts | UsedCapacity |
Microsoft.Storage/storageAccounts/blobServices | BlobCapacity |
Microsoft.Storage/storageAccounts/blobServices | BlobCount |
Microsoft.Storage/storageAccounts/blobServices | BlobProvisionedSize |
Microsoft.Storage/storageAccounts/blobServices | IndexCapacity |
Microsoft.Storage/storageAccounts/fileServices | FileCapacity |
Microsoft.Storage/storageAccounts/fileServices | FileCount |
Microsoft.Storage/storageAccounts/fileServices | FileShareCount |
Microsoft.Storage/storageAccounts/fileServices | FileShareSnapshotCount |
Microsoft.Storage/storageAccounts/fileServices | FileShareSnapshotSize |
Microsoft.Storage/storageAccounts/fileServices | FileShareCapacityQuota |
Microsoft.Storage/storageAccounts/fileServices | FileShareProvisionedIOPS |
További lépések
- Riasztási szabályok kezelése
- Küldjön nekünk visszajelzést a dinamikus küszöbértékekről e-mailben azurealertsfeedback@microsoft.com.