Metrikariasztás létrehozása dinamikus küszöbértékekkel

A dinamikus küszöbértékek fejlett gépi tanulást alkalmaznak, és algoritmusok és módszerek készletét használják a következőket:

  • A metrikák előzményeinek megismerése
  • Metrikák elemzése az idő függvényében, és minták azonosítása, például óránkénti, napi vagy heti minták
  • A lehetséges szolgáltatásproblémákat jelző anomáliák felismerése
  • A metrika legmegfelelőbb küszöbértékének kiszámítása

Dinamikus küszöbértékek használatakor nem kell ismernie az egyes metrikák "helyes" küszöbértékét, mert a dinamikus küszöbértékek a legmegfelelőbb küszöbértékeket számítják ki.

Javasoljuk, hogy a riasztási szabályokat dinamikus küszöbértékekkel konfigurálja ezeken a metrikákon:

  • Virtuális gép processzorhasználatának százalékos aránya
  • Alkalmazás Elemzések HTTP-kérés végrehajtási ideje

A dinamikus küszöbértékek segítenek:

  • Skálázható riasztások létrehozása több száz metrikasorozathoz egyetlen riasztási szabmánnyal. Ha kevesebb riasztási szabályt használ, kevesebb időt tölt riasztási szabályok létrehozásával és kezelésével. A méretezhető riasztások különösen hasznosak több dimenzió vagy több erőforrás esetében, például az előfizetés összes erőforrása esetében.
  • Szabályok létrehozása anélkül, hogy ismernie kellene a konfigurálni kívánt küszöbértéket. Dinamikus küszöbértékek használatával magas szintű fogalmak használatával konfigurálhatja a metrikariasztásokat anélkül, hogy a metrikával kapcsolatos széles körű tartományismerettel rendelkezik
  • Metrikariasztások konfigurálása magas szintű fogalmak használatával, a metrikával kapcsolatos széles körű tartományismeret nélkül
  • A várt mintázattal nem rendelkező zajos (kis pontosságú) vagy széles (alacsony visszahívási) küszöbértékek megakadályozása
  • Kezelje a zajos metrikákat (például a gép CPU-ját vagy memóriáját) és az alacsony szórású metrikákat (például a rendelkezésre állást és a hibaarányt)

A dinamikus küszöbértékeket a következőn használhatja:

  • a legtöbb Azure Monitor-platform és egyéni metrikák
  • gyakori alkalmazás- és infrastruktúrametrikák
  • zajos metrikák, például a gép processzora vagy a memória
  • alacsony szórású metrikák, például a rendelkezésre állás és a hibaarány. A dinamikus küszöbértékek által nem támogatott metrikákat a dinamikus küszöbértékek nem támogatják.

A dinamikus küszöbértékeket a következőkkel konfigurálhatja:

Riasztási küszöbérték kiszámítása és előzetes verzió

A riasztási szabály első létrehozásakor a dinamikus küszöbértékek 10 napos előzményadatokat használnak az óránkénti vagy napi szezonális minták kiszámításához. A riasztás előnézetében látható diagram az adatokat tükrözi. A riasztási szabály létrehozása után a dinamikus küszöbértékek folyamatosan használják az összes rendelkezésre álló előzményadatot a tanuláshoz, és a küszöbértékeket pontosabban módosítják. Három hét elteltével a dinamikus küszöbértékek elegendő adattal rendelkeznek a heti minták azonosításához, és a modell a heti szezonalitáshoz igazodik. A dinamikus küszöbértékeket használó riasztási szabályok nem aktiválnak riasztást három nap és legalább 30 metrikaadat-minta összegyűjtése előtt.

A rendszer automatikusan felismeri a hosszan tartó kimaradásokat, és eltávolítja őket a küszöbérték-tanulási algoritmusból. Ha hosszan tartó kimaradás történik, a dinamikus küszöbértékek megértik az adatokat, és észlelik azokat a rendszerproblémákat, amelyek ugyanolyan bizalmassági szintűek, mint a kimaradás előtt.

Megfontolandó szempontok a dinamikus küszöbértékek használatakor

  • A küszöbértékek pontos kiszámítása érdekében a dinamikus küszöbértékeket használó riasztások nem aktiválnak riasztást három nap és legalább 30 metrikaadat-minta összegyűjtése előtt. Ezért az új erőforrások vagy a hiányzó metrikaadatok nem aktiválnak riasztást, amíg elegendő adat nem áll rendelkezésre.
  • A dinamikus küszöbértékeknek legalább három hét előzményadatra van szükségük a heti szezonalitás észleléséhez. Előfordulhat, hogy bizonyos részletes mintákat, például a kétórás vagy a félhetes mintákat nem észleli a rendszer.
  • Ha egy metrika viselkedése nemrég módosult, a változások nem jelennek meg azonnal a felső és alsó határ alatti dinamikus küszöbértékben. A szegélyek kiszámítása az elmúlt 10 nap metrikaadatai alapján történik. Ha megtekinti egy adott metrikához tartozó dinamikus küszöbérték-szegélyeket, tekintse meg az elmúlt hét metrika trendjének alakulását, és ne csak az elmúlt órákat vagy napokat.
  • A dinamikus küszöbértékek alkalmasak a jelentős eltérések észlelésére, szemben a lassan változó problémákkal. A lassú viselkedés változásai valószínűleg nem aktiválnak riasztást.

A dinamikus küszöbértékek érzékenységével kapcsolatos ismert problémák

  • Ha egy dinamikus küszöbértékeket használó riasztási szabály túl zajos vagy túl sokat aktivál, előfordulhat, hogy csökkentenie kell a dinamikus küszöbértékek riasztási szabályának érzékenységét. Használja az alábbi lehetőségek egyikét:

    • Küszöbérték-érzékenység: Állítsa a érzékenységet Alacsony értékre, hogy az eltéréseknél toleránsabb legyen.
    • Szabálysértések száma (a Speciális beállítások alatt): Konfigurálja úgy a riasztási szabályt, hogy csak akkor aktiválódjon, ha bizonyos időn belül több eltérés történik. Ezzel a beállítással a szabály kevésbé érzékeny az átmeneti eltérésekre.
  • Előfordulhat, hogy a dinamikus küszöbértékeket használó riasztási szabály nem aktiválódik, vagy nem elég érzékeny, még akkor is, ha nagy érzékenységgel van konfigurálva. Ez akkor fordulhat elő, ha a metrika eloszlása rendkívül szabálytalan. A probléma megoldásához fontolja meg az alábbi megoldások egyikét:

    • Ha lehetséges, a forgatókönyvnek megfelelő kiegészítő metrikák monitorozására válthat. Ellenőrizze például, hogy a sikerességi arányban van-e változás a hibaarány helyett.
    • Próbáljon meg másik értéket választani az Aggregáció részletességének (Pont) beállításához.
    • Ellenőrizze, hogy az elmúlt 10 napban drasztikus változás történt-e a metrika viselkedésében, például kimaradás. A hirtelen változás hatással lehet a metrikához kiszámított felső és alsó küszöbértékekre, és szélesebbé teheti őket. Várjon néhány napot, amíg a kimaradás már nem kerül bele a küszöbértékek kiszámításába. A riasztási szabályt úgy is szerkesztheti, hogy a Speciális beállításokbanaz Adatok figyelmen kívül hagyása lehetőséget használja.
    • Ha az adatok heti szezonalitást érnek el, de nem áll rendelkezésre elegendő előzmény a metrika számára, a számított küszöbértékek széles felső és alsó határokat eredményezhetnek. A számítás például ugyanúgy kezelheti a hétköznapokat és a hétvégéket, és széles szegélyeket hozhat létre, amelyek nem mindig felelnek meg az adatoknak. Ezt a problémát meg kell oldania, miután elegendő metrikaelőzmény érhető el. Ezután a rendszer a megfelelő szezonalitást észleli, és a számított küszöbértékek ennek megfelelően frissülnek.
  • Ha egy metrikaérték nagy ingadozást mutat, a dinamikus küszöbértékek széles modellt hozhatnak létre a metrikaértékek köré, ami a vártnál alacsonyabb vagy magasabb határt eredményezhet. Ez a forgatókönyv akkor fordulhat elő, ha:

    • A bizalmasság alacsonyra van állítva.
    • A metrika szabálytalan viselkedést mutat nagy szórással, amely kiugró vagy visszaesésként jelenik meg az adatokban.

    Fontolja meg, hogy a modell kevésbé érzékeny legyen, ha nagyobb érzékenységet választ, vagy nagyobb visszatekintési időszakot választ. Az Adatok figyelmen kívül hagyása lehetőséggel kizárhat egy legutóbbi szabálytalanságot a modell létrehozásához használt előzményadatokból.

Dinamikus küszöbértékek konfigurálása

Kövesse az alábbi eljárást egy riasztási szabály létrehozásához vagy szerkesztéséhez az alábbi beállításokkal

  1. A Feltételek lapon
    1. A Küszöbértékek mezőben válassza a Dinamikus lehetőséget.
    2. Az összesítés típusában azt javasoljuk, hogy ne válassza a Maximum lehetőséget.
    3. Az Operátor mezőben válassza a Nagyobb lehetőséget, kivéve, ha a viselkedés az alkalmazáshasználatot jelöli.
    4. A Küszöbérték-érzékenység területen válassza a Közepes vagy az Alacsony lehetőséget a riasztási zaj csökkentéséhez.
    5. A Minden mező ellenőrzése területen érdemes csökkenteni a gyakoriságot a riasztás üzleti hatása alapján.
    6. A visszatekintési időszakban állítsa a visszatekintő ablakot legalább 15 percre. Ha például minden mező ellenőrzése 5 percre van beállítva, a visszatekintési időszaknak legalább 3 percnek kell lennie.
  2. Folytassa a többi folyamattal egy riasztási szabály létrehozásához.

Megjegyzés:

A portálon létrehozott metrikariasztási szabályok ugyanabban az erőforráscsoportban jönnek létre, mint a célerőforrás.

A dinamikus küszöbérték-diagramok ismertetése

Az alábbi diagram egy metrikát, annak dinamikus küszöbértékeit és néhány riasztást mutat be, amelyek akkor aktiváltak, amikor az érték túllépte az engedélyezett küszöbértékeket.

Screenshot that shows a metric, its dynamic thresholds limits, and some alerts that fired.

A diagram értelmezéséhez használja az alábbi információkat:

  • Kék vonal: A tényleges mért metrika az idő függvényében.
  • Kék árnyalatú terület: A metrika megengedett tartományát jeleníti meg. Ha a metrikaértékek ezen a tartományon belül maradnak, a rendszer nem aktivál riasztást.
  • Kék pont: Ha a diagram egy részén bejelölve, majd a kék vonal fölé viszi az egérmutatót, egy kék pont jelenik meg a kurzor alatt, amely egy egyedi összesített metrikaértéket jelenít meg.
  • Előugró ablak kék ponttal: Megjeleníti a mért metrikaértéket (a kék pont), valamint az engedélyezett tartomány felső és alsó értékeit.
  • Piros pont fekete körrel: Az első metrikaértéket jeleníti meg az engedélyezett tartományon kívül. Ez az érték aktivál egy metrikariasztást, és aktív állapotba helyezi.
  • Piros pont: Az engedélyezett tartományon kívüli egyéb mért értékek jelzése. Nem aktiválnak több metrikariasztást, de a riasztás aktív állapotban marad.
  • Piros terület: Azt az időpontot jeleníti meg, amikor a metrika értéke kívül volt az engedélyezett tartományon. A riasztás aktív állapotban marad mindaddig, amíg a későbbi mért értékek ki nem kerülnek az engedélyezett tartományból, de a rendszer nem aktivál új riasztásokat.
  • Piros terület vége: Ha a kék vonal visszaáll az engedélyezett értékeken belülre, a piros terület leáll, és a mért értéksor kékre változik. A fekete körvonalú piros ponttal aktivált metrikariasztás állapota feloldva.

Dinamikus küszöbértékek által nem támogatott metrikák

A dinamikus küszöbértékek a legtöbb metrika esetében támogatottak, de egyes metrikák nem használhatnak dinamikus küszöbértékeket.

Az alábbi táblázat azokat a metrikákat sorolja fel, amelyeket a dinamikus küszöbértékek nem támogatnak.

Erőforrás típusa Metrika neve
Microsoft.ClassicStorage/storageAccounts UsedCapacity
Microsoft.ClassicStorage/storageAccounts/blobServices BlobCapacity
Microsoft.ClassicStorage/storageAccounts/blobServices BlobCount
Microsoft.ClassicStorage/storageAccounts/blobServices IndexCapacity
Microsoft.ClassicStorage/storageAccounts/fileServices FileCapacity
Microsoft.ClassicStorage/storageAccounts/fileServices FileCount
Microsoft.ClassicStorage/storageAccounts/fileServices FileShareCount
Microsoft.ClassicStorage/storageAccounts/fileServices FileShareSnapshotCount
Microsoft.ClassicStorage/storageAccounts/fileServices FileShareSnapshotSize
Microsoft.ClassicStorage/storageAccounts/fileServices FileShareQuota
Microsoft.Compute/disks Összetett lemez olvasási bájt/mp
Microsoft.Compute/disks Összetett lemez olvasási műveletei/mp
Microsoft.Compute/disks Összetett lemez írási bájt/mp
Microsoft.Compute/disks Összetett lemez írási műveletei másodpercenként
Microsoft.ContainerService/managedClusters NodesCount
Microsoft.ContainerService/managedClusters PodCount
Microsoft.ContainerService/managedClusters CompletedJobsCount
Microsoft.ContainerService/managedClusters RestartingContainerCount
Microsoft.ContainerService/managedClusters OomKilledContainerCount
Microsoft.Devices/IotHubs TotalDeviceCount
Microsoft.Devices/IotHubs Csatlakozás edDeviceCount
Microsoft.Devices/IotHubs TotalDeviceCount
Microsoft.Devices/IotHubs Csatlakozás edDeviceCount
Microsoft.DocumentDB/databaseAccounts Cassandra Csatlakozás ionClosures
Microsoft.EventHub/fürtök Méret
Microsoft.EventHub/namespaces Méret
Microsoft.IoTCentral/IoTApps connectedDeviceCount
Microsoft.IoTCentral/IoTApps provisionedDeviceCount
Microsoft.Kubernetes/connectedClusters NodesCount
Microsoft.Kubernetes/connectedClusters PodCount
Microsoft.Kubernetes/connectedClusters CompletedJobsCount
Microsoft.Kubernetes/connectedClusters RestartingContainerCount
Microsoft.Kubernetes/connectedClusters OomKilledContainerCount
Microsoft.Machine Tanulás Szolgáltatások/munkaterületek/onlineEndpoints RequestsPerMinute
Microsoft.Machine Tanulás Services/workspaces/onlineEndpoints/deployments DeploymentCapacity
Microsoft. Térképek/fiókok CreatorUsage
Microsoft.Media/mediaservices/streamingEndpoints EgressBandwidth
Microsoft.Network/applicationGateways Átfutás
Microsoft.Network/azureFirewalls Átfutás
Microsoft.Network/expressRouteGateways ExpressRouteGatewayPacketsPerSecond
Microsoft.Network/expressRouteGateways ExpressRouteGatewayNumberOfVmInVnet
Microsoft.Network/expressRouteGateways ExpressRouteGatewayFrequencyOfRoutesChanged
Microsoft.Network/virtualNetworkGateways ExpressRouteGatewayBitsPerSecond
Microsoft.Network/virtualNetworkGateways ExpressRouteGatewayPacketsPerSecond
Microsoft.Network/virtualNetworkGateways ExpressRouteGatewayNumberOfVmInVnet
Microsoft.Network/virtualNetworkGateways ExpressRouteGatewayFrequencyOfRoutesChanged
Microsoft.ServiceBus/névterek Méret
Microsoft.ServiceBus/névterek Üzenetek
Microsoft.ServiceBus/névterek ActiveMessages
Microsoft.ServiceBus/névterek DeadletteredMessages
Microsoft.ServiceBus/névterek ScheduledMessages
Microsoft.ServiceFabricMesh/applications AllocatedCpu
Microsoft.ServiceFabricMesh/applications AllocatedMemory
Microsoft.ServiceFabricMesh/applications ActualCpu
Microsoft.ServiceFabricMesh/applications ActualMemory
Microsoft.ServiceFabricMesh/applications ApplicationStatus
Microsoft.ServiceFabricMesh/applications ServiceStatus
Microsoft.ServiceFabricMesh/applications ServiceReplicaStatus
Microsoft.ServiceFabricMesh/applications ContainerStatus
Microsoft.ServiceFabricMesh/applications RestartCount
Microsoft.Storage/storageAccounts UsedCapacity
Microsoft.Storage/storageAccounts/blobServices BlobCapacity
Microsoft.Storage/storageAccounts/blobServices BlobCount
Microsoft.Storage/storageAccounts/blobServices BlobProvisionedSize
Microsoft.Storage/storageAccounts/blobServices IndexCapacity
Microsoft.Storage/storageAccounts/fileServices FileCapacity
Microsoft.Storage/storageAccounts/fileServices FileCount
Microsoft.Storage/storageAccounts/fileServices FileShareCount
Microsoft.Storage/storageAccounts/fileServices FileShareSnapshotCount
Microsoft.Storage/storageAccounts/fileServices FileShareSnapshotSize
Microsoft.Storage/storageAccounts/fileServices FileShareCapacityQuota
Microsoft.Storage/storageAccounts/fileServices FileShareProvisionedIOPS

További lépések