Az Azure SQL Database monitorozása metrikákkal és riasztásokkal

A következőkre vonatkozik:Azure SQL Database

Az Azure Monitor-metrikák segítségével monitorozhat adatbázis- és rugalmas készleterőforrás-felhasználást és -állapotot. Riasztások használatával értesítéseket küldhet, ha a metrikaértékek potenciális problémát jeleznek.

Mérőszámok

A metrikák olyan numerikus értékek sorozatai, amelyek rendszeres időközönként, gyakran olyan egységeket használnak, mint counta , percent, bytesstb. A metrika jellegétől függően a metrikaértékek egy adott időtartamon keresztüli kiszámításához használhat olyan összesítéseket, mint totala , count, average, minimum. maximum Egyes metrikákat dimenziók szerint oszthat fel. Minden dimenzió további kontextust biztosít a numerikus értékekhez.

Az elérhető Azure SQL Database-metrikák például a következők: CPU percentage, Data space used, Deadlocks, Tempdb Percent Log Used.

Tekintse meg az Azure SQL Database-ben elérhető összes metrika adatbázismetrikáit és rugalmas készletmetrikáit .

Megjegyzés:

Egyes metrikák csak bizonyos típusú adatbázisokra vagy rugalmas készletekre vonatkoznak. Az egyes metrikák leírása megemlíti, hogy a használata egy adott adatbázisra vagy rugalmas készlettípusra korlátozódik,például virtuális magra, rugalmas skálázásra, kiszolgáló nélkülire stb.

Az Azure SQL Database Portalon számos gyakran használt metrikát ábrázol az Áttekintés lap Figyelés lapján. A metrikák segítségével egyetlen pillantással felmérheti egy adatbázis vagy egy rugalmas készlet erőforrás-felhasználását és állapotát.

Képernyőkép az Azure Portalról az Azure SQL Database áttekintési oldalán látható metrikák diagramjáról.

A Főbb metrikák csoportban válassza a Metrikaböngésző megnyitásához az összes metrika megjelenítése vagy a diagram bármely pontján lehetőséget. A Metrikák lapon megtekintheti az adatbázishoz vagy a rugalmas készleterőforráshoz elérhető összes többi metrikát. A Metrikák kezelőjében módosíthatja a diagram időtartományát, részletességét és összesítési típusát, módosíthatja a diagram típusát, kibonthatja a hatókört, hogy más Azure-erőforrásokból származó metrikákat is tartalmazzon, riasztási szabályokat hozzon létre stb. A Metrics Explorer megnyitásához válassza a Metrikák menüpontot az erőforrásmenü Figyelés területén.

Metrikák használata adatbázisok és rugalmas készletek monitorozásához

Metrikákkal figyelheti az adatbázis és a rugalmas készlet erőforrás-felhasználását és állapotát. Például a következőt teheti:

  • Az adatbázis vagy a rugalmas készlet megfelelő méretezése az alkalmazás számítási feladataihoz
  • Az erőforrás-felhasználás fokozatos növekedésének észlelése és az adatbázis vagy a rugalmas készlet proaktív vertikális felskálázása
  • Teljesítményproblémák észlelése és elhárítása

Az alábbi táblázat az Azure SQL Database-ben gyakran használt metrikákat ismerteti.

A metrika elnevezése Metrikaazonosító Leírás
CPU-százalék cpu_percent Ez a metrika egy adatbázis vagy egy rugalmas készlet felhasználói számítási feladatokra vonatkozó korlátja felé irányuló processzorhasználatot mutatja százalékban kifejezve. További információ: Erőforrás-felhasználás felhasználói számítási feladatok és belső folyamatok szerint.
SQL-példány CPU-kihasználtsága százalékban sql_instance_cpu_percent Ez a metrika a felhasználó és a rendszer számítási feladatainak teljes processzorhasználatát mutatja százalékban kifejezve. Mivel ezt a metrikát és a processzor százalékos metrikát különböző skálákon mérik, nem hasonlíthatók össze közvetlenül egymással. További információ: Erőforrás-felhasználás felhasználói számítási feladatok és belső folyamatok szerint.
Adat-IO százalék physical_data_read_percent Ez a metrika az adatfájl I/O-felhasználását mutatja egy adatbázis vagy egy rugalmas készlet felhasználói számítási feladatainak korlátja felé százalékban kifejezve. További információ: Adat IO-szabályozás.
Napló I/O százalékos aránya log_write_percent Ez a metrika azt mutatja, hogy a tranzakciónapló írási sebességének felhasználása egy adatbázis vagy egy rugalmas készlet felhasználói számítási feladatainak korlátja felé százalékos értékként van kifejezve. További információ: Tranzakciónaplók sebességszabályozása.
Dolgozók százalékos aránya workers_percent Ez a metrika százalékosan mutatja a munkamenet szálak felhasználását az adatbázis vagy a rugalmas készlet felhasználói munkaterhelési korlátja irányában.
DTU százalék dtu_consumption_percent Ez a metrika egy adatbázis vagy egy rugalmas készlet felhasználói számítási feladatainak korlátja felé irányuló DTU-használatot mutatja százalékban kifejezve. A DTU százalékos értéke három másik mérőszámból származik: cpu-százalék, adat-IO-százalék és napló IO-százalék. A DTU százalékos aránya bármikor megegyezik a három metrika közül a legmagasabb értékkel.
Használt processzor cpu_used Ez a metrika egy adatbázis vagy egy rugalmas készlet felhasználói számítási feladatokra vonatkozó korlátja felé irányuló processzorhasználatot mutatja, a virtuális magok számával kifejezve. További információ: Magas processzorhasználat diagnosztizálása és hibaelhárítása az Azure SQL Database-ben.
Használt DTU dtu_used Ez a metrika az adatbázis vagy egy rugalmas készlet által használt DTU-k számát mutatja.
Az alkalmazás cpu-számlázása app_cpu_billed A kiszolgáló nélküli adatbázisok esetében ez a metrika a számlázott számítási kapacitást (CPU és memória) jeleníti meg virtuális mag másodpercben kifejezve. További információ: Számlázás a kiszolgáló nélküli számítási szinten.
Alkalmazás CPU használati százaléka app_cpu_percent A kiszolgáló nélküli adatbázisok esetében ez a metrika az alkalmazáscsomag maximális virtuális mag-korlátja felé irányuló processzorhasználatot mutatja százalékban kifejezve. További információ: Monitorozás a kiszolgáló nélküli számítási szinten.
Alkalmazásmemória százalékos aránya app_memory_percent A kiszolgáló nélküli adatbázisok esetében ez a metrika az alkalmazáscsomag maximális memóriakorlátja felé irányuló memóriahasználatot mutatja százalékban kifejezve. További információ: Monitorozás a kiszolgáló nélküli számítási szinten.
Munkamenetek száma sessions_count Ez a metrika egy adatbázishoz vagy rugalmas készlethez tartozó létrehozott felhasználói munkamenetek számát mutatja.
használt adatterület storage Az adatbázisok esetében ez a metrika az adatbázis adatfájljaiban használt tárterület mennyiségét mutatja.
használt adatterület storage_used Rugalmas készletek esetén ez a metrika egy rugalmas készlet összes adatbázisának adatfájljaiban használt tárterületet mutatja.
Lefoglalt adatterület allocated_data_storage Ez a metrika egy adatbázis adatfájljai vagy egy rugalmas készlet összes adatbázisának adatfájljai által elfoglalt tárterületet mutatja. Az adatfájlok üres területet tartalmazhatnak. Emiatt az azonos adatbázishoz vagy rugalmas készlethez használt adatterületnél gyakran nagyobb adatterület van lefoglalva. További információ: Adatbázisok fájlterületének kezelése az Azure SQL Database-ben.
Felhasznált adatterület százalékban storage_percent Az adatbázisok esetében ez a metrika az adatbázis adatfájljaiban használt tárterületet mutatja az adatbázis adatméretkorlátja felé. Rugalmas készletek esetén a rugalmas készlet összes adatbázisának adatfájljaiban használt tárterületet jeleníti meg, százalékban kifejezve a rugalmas készlet adatméretkorlátja felé. Előfordulhat, hogy egy adatbázis vagy egy rugalmas készlet adatméretkorlátja alacsonyabb, mint a maximális adatméretkorlát. A maximális adatméretkorlát megkereséséhez tekintse meg a virtuális magos adatbázisok, a rugalmas virtuális magkészletek, a DTU-adatbázisok és a rugalmas DTU-készletek erőforráskorlátait.
Lefoglalt adatterület százalékos aránya allocated_data_storage_percent Rugalmas készletek esetén ez a metrika a rugalmas készletben lévő összes adatbázis adatfájljai által elfoglalt tárterületet mutatja a készlet adatméret-korlátja felé, százalékban kifejezve.
Használt tempdb százalékos napló tempdb_log_used_percent Ez a metrika azt mutatja, hogy az adatbázisban lévő tranzakciónapló-terület mennyire van felhasználva a maximális naplómérethez képest, százalékos formában kifejezve. További információ: tempdb az Azure SQL Database-ben.
Sikeres kapcsolatok connection_successful Ez a metrika az adatbázishoz sikeresen létrehozott kapcsolatok számát mutatja. Ez a metrika két dimenzióval osztható fel, SslProtocol és ValidatedDriverNameAndVersion, hogy láthatóvá váljon a kapcsolatok száma egy adott titkosítási protokollverzióval vagy egy adott ügyfélmeghajtóval.
Sikertelen kapcsolatok : Rendszerhibák connection_failed Ez a metrika a belső szolgáltatáshibák miatt meghiúsult adatbázishoz való kapcsolódási kísérletek számát mutatja. Az ilyen hibák leggyakrabban átmenetiek. Ez a metrika két dimenzióval osztható fel, Error és ValidatedDriverNameAndVersionegy adott hiba vagy egy adott ügyfélillesztő miatt meghiúsult kapcsolati kísérletek számának megtekintéséhez.
Sikertelen kapcsolatok: Felhasználói hibák connection_failed_user_error Ez a metrika a felhasználó által kijavítható hibák miatt meghiúsult adatbázishoz való kapcsolódási kísérletek számát mutatja, például helytelen jelszót vagy tűzfal által blokkolt kapcsolatot. Ez a metrika két dimenzióval osztható fel, Error és ValidatedDriverNameAndVersionegy adott hiba vagy egy adott ügyfélillesztő miatt meghiúsult kapcsolati kísérletek számának megtekintéséhez.
Holtpontok deadlock Ez a metrika az adatbázisban lévő holtpontok számát mutatja.
Elérhetőség availability A rendelkezésre állás a kapcsolatokhoz használható adatbázis alapján van meghatározva. Minden egyperces adatpont esetében a lehetséges értékek vagy 100%, vagy 0%. További információ: Rendelkezésre állási metrikák.
Replikáció késése (előzetes verzió) replication_lag_seconds A replikáció késése az elsődleges tranzakció véglegesítési pontjától és a másodlagos által a tranzakciónapló frissítésének megőrzéséről szóló visszaigazolástól másodpercek alatt eltelt idő. Ez az érték csak az elsődleges adatbázisban érhető el. További információ az RTO-ról és az RPO-ról: Üzletmenet-folytonosság az Azure SQL Database-ben

Rendelkezésre állási metrika

A Rendelkezésre állási metrika az Egyes Azure SQL Database szintjén nyomon követi a rendelkezésre állást.

A rendelkezésre állás egy percnyi kapcsolatkimaradásig részletes. A rendelkezésre állás a kapcsolatokhoz használható adatbázis alapján van meghatározva. Egy perc állásidőnek minősül, vagy nem érhető el, ha a felhasználók minden folyamatos kísérlete az adatbázishoz való kapcsolódásra egy szolgáltatás hibája miatt nem sikerül. Időszakos elérhetetlenség esetén a folyamatos elérhetetlenség időtartamának meg kell haladnia a perchatárt, és állásidőnek kell tekinteni. A rendelkezésre állás megjelenítésének késése általában három percnél rövidebb.

A rendelkezésre állás egyperces intervallumonkénti kiszámításához a következő logikát használjuk:

  • Ha legalább egy sikeres kapcsolat van, akkor a rendelkezésre állás 100%.
  • Ha minden kapcsolat felhasználói hibák miatt meghiúsul, a rendelkezésre állás 100%.
  • Ha nincsenek csatlakozási kísérletek, a rendelkezésre állás 100%.
  • Ha minden kapcsolat rendszerhiba miatt meghiúsul, a rendelkezésre állás 0%.
  • A rendelkezésre állási metrika adatai jelenleg nem támogatottak a kiszolgáló nélküli számítási szint esetében, és 100%jelenít meg.

A rendelkezésre állási metrika tehát egy összetett metrika, amely a következő meglévő metrikákból származik:

  • Sikeres kapcsolatok
  • Sikertelen kapcsolatok: Felhasználói hibák
  • Tűzfal blokkolja
  • Sikertelen kapcsolatok : Rendszerhibák

A felhasználói hibák közé tartozik az összes olyan kapcsolat, amely a felhasználói konfiguráció, a számítási feladat vagy a felügyelet miatt meghiúsul. A rendszerhibák közé tartoznak az Azure SQL Database szolgáltatással kapcsolatos átmeneti problémák miatt meghiúsult kapcsolatok.

Figyelmeztetések

Riasztási szabályokat hozhat létre, amelyek értesítik arról, hogy egy vagy több metrika értéke kívül esik a várt tartományon.

A riasztási szabály hatókörét többféleképpen is beállíthatja az igényeinek megfelelően. A riasztási szabály hatóköre például a következőre állítható be:

  • Egyetlen adatbázis
  • Rugalmas készlet
  • Egy erőforráscsoport összes adatbázisa vagy rugalmas készlete
  • Egy Előfizetés összes adatbázisa vagy rugalmas készlete egy Azure-régión belül
  • Az előfizetés összes adatbázisa vagy rugalmas készletei az összes régióban

A riasztási szabályok rendszeres időközönként kiértékelik az összesített metrikaértékeket egy visszatekintési időszakban, összehasonlítva őket egy küszöbérték értékével. Konfigurálhatja a küszöbértéket, a kiértékelési gyakoriságot és a visszatekintési időszakot.

Ha egy riasztási szabály aktiválódik, a rendszer az értesítési beállításoknak megfelelően értesítést kap, amelyet a riasztási szabályhoz csatolt műveletcsoportban ad meg. Kaphat például e-mailt, SMS-t vagy hangértesítést. A riasztási szabályok olyan műveleteket is aktiválhatnak, mint a webhookok, az automatizálási runbookok, a függvények, a logikai alkalmazások stb. A riasztások integrálhatók a támogatott informatikai szolgáltatásfelügyeleti termékekkel.

Az Azure Monitor-riasztásokkal kapcsolatos további információkért tekintse meg az Azure Monitor-riasztások áttekintését. A metrikariasztások megismeréséhez tekintse át a metrikariasztásokat, a riasztási szabályok kezelését és a műveleti csoportokat.

A riasztási szabályokban használandó metrikák és optimális küszöbértékek az Azure SQL Database ügyfél-számítási feladatainak széles spektrumában változnak.

Az alábbi táblázatban javasolt riasztások kiindulópontként használhatók az Azure SQL Database-erőforrások optimális riasztási konfigurációjának meghatározásához. A követelményektől függően a konfiguráció eltérhet a példától. Különböző küszöbértékeket, kiértékelési gyakoriságokat vagy visszatekintési időszakokat használhat. Dönthet úgy, hogy további riasztásokat hoz létre, vagy különböző riasztási szabálykonfigurációkat használ különböző alkalmazásokhoz és környezetekhez.

Íme néhány példa a riasztási szabályok tipikus konfigurációira.

Riasztási szabály neve Metrika (jel) Riasztási logika Mikor kell kiértékelni? Javasolt súlyosság
Magas felhasználói processzorhasználat CPU-százalék Küszöbérték: Static
Összesítés: Average
Operátor: Greater than
Küszöbérték: 90
Ellenőrizze a következőt: 1 minute
Visszatekintési időszak: 10 minutes
2 – Figyelmeztetés
Magas teljes processzorhasználat SQL-példány CPU-kihasználtsága százalékban Küszöbérték: Static
Összesítés: Average
Operátor: Greater than
Küszöbérték: 90
Ellenőrizze a következőt: 1 minute
Visszatekintési időszak: 10 minutes
2 – Figyelmeztetés
Magas munkavállalói használat Dolgozók százalékos aránya Küszöbérték: Static
Összesítés: Minimum
Operátor: Greater than
Küszöbérték: 60
Ellenőrizze a következőt: 1 minute
Visszatekintési időszak: 5 minutes
1 – Hiba
Magas adat-I/O-használat Adat-IO százalék Küszöbérték: Static
Összesítés: Average
Operátor: Greater than
Küszöbérték: 90
Ellenőrizze a következőt: 1 minute
Visszatekintési időszak: 15 minutes
3 – Tájékoztató
Kevés adatterület Felhasznált adatterület százalékban Küszöbérték: Static
Összesítés: Minimum
Operátor: Greater than
Küszöbérték: 95
Ellenőrizze a következőt: 15 minute
Visszatekintési időszak: 15 minutes
1 – Hiba
Alacsony tempdb naplóterület Használt tempdb százalékos napló Küszöbérték: Static
Összesítés: Minimum
Operátor: Greater than
Küszöbérték: 60
Ellenőrizze a következőt: 1 minute
Visszatekintési időszak: 5 minutes
1 – Hiba
Holtpontok Holtpontok Küszöbérték: Dynamic
Összesítés: Total
Operátor: Greater than
Küszöbérték érzékenysége: Medium
Ellenőrizze a következőt: 15 minutes
Visszatekintési időszak: 1 hour
3 – Tájékoztató
Sikertelen kapcsolatok (felhasználói hibák) Sikertelen kapcsolatok: Felhasználói hibák Küszöbérték: Dynamic
Összesítés: Total
Operátor: Greater than
Küszöbérték érzékenysége: Medium
Ellenőrizze a következőt: 5 minutes
Visszatekintési időszak: 15 minutes
2 – Figyelmeztetés
Sikertelen kapcsolatok (rendszerhibák) Sikertelen kapcsolatok : Rendszerhibák Küszöbérték: Static
Összesítés:Total
Operátor:Greater than
Egység: Count
Küszöbérték:10
Ellenőrizze a következőt: 1 minute
Visszatekintési időszak: 5 minutes
2 – Figyelmeztetés
Rendellenes csatlakozási sebesség Sikeres kapcsolatok Küszöbérték: Dynamic
Összesítés: Total
Operátor: Greater or Less than
Küszöbérték érzékenysége: Low
Ellenőrizze a következőt: 5 minutes
Visszatekintési időszak: 15 minutes
2 – Figyelmeztetés

Néhány ajánlott riasztási szabály dinamikus küszöbértékekkel észleli a figyelmet igénylő rendellenes metrikamintákat. A dinamikus küszöbértékeken alapuló riasztási szabályok csak akkor aktiválhatók, ha elegendő előzményadatot gyűjtenek a normál minták létrehozásához. További információ: Dinamikus küszöbértékek a metrikariasztásokban.

Alapértelmezés szerint a metrikariasztások állapotalapúak. Ez azt jelenti, hogy egy riasztási szabály aktiválása után a rendszer csak egyszer aktiválja a riasztást. A riasztás a fired állapotban marad, amíg meg nem oldódik, amikor egy resolved értesítés kerül kiküldésre. A riasztási szabály csak az előző riasztás feloldása után aktivál egy új riasztást. Az állapotalapú riasztások elkerülik a folyamatos állapotokkal kapcsolatos gyakori értesítéseket. Az állapotalapú és állapot nélküli riasztásokról további információt a Riasztások és az Állapot című témakörben talál.