Sdílet prostřednictvím


Sledujte databázi Azure SQL pomocí metrik a upozornění

Týká se:Azure SQL Database

Můžete použít Azure Monitor metrics k monitorování spotřeby a zdraví zdrojů databází a elastických fondů. Můžete použít upozornění k odesílání oznámení, když hodnoty metrik naznačují možný problém.

Metriky

Metrika je řada číselných hodnot měřených v pravidelných časových intervalech, často s použitím jednotek jako count, percent, bytes, atd. V závislosti na povaze metriky můžete použít agregace jako total, count, average, minimum, maximum k výpočtu hodnot metriky po určité časové období. Některé metriky můžete rozdělit podle dimenzí. Každý rozměr poskytuje dodatečný kontext k číselným hodnotám.

Příklady dostupných metrik Azure SQL Database jsou: CPU percentage, Data space used, Deadlocks, Tempdb Percent Log Used.

Podívejte se na metriky databáze a metriky elastického fondu pro všechny dostupné metriky v Azure SQL Database.

Poznámka

Některé metriky platí pouze pro konkrétní typy databází nebo elastických poolů. Popis každé metriky uvádí, zda je její použití omezeno na konkrétní typ databáze nebo pružného fondu, například vCore, Hyperscale, serverless atd.

Na portálu Azure SQL Database jsou na kartě Monitorování na stránce Přehled zobrazeny grafy několika běžně používaných metrik. Metryky vám umožňují na první pohled posoudit spotřebu zdrojů a stav databáze nebo elastického fondu.

Snímek obrazovky z portálu Azure znázorňující graf metrik zobrazený na stránce Přehled Azure SQL Database.

Pod Klíčové metriky vyberte Zobrazit všechny metriky nebo kdekoliv uvnitř grafu pro otevření průzkumníka metrik. Na stránce Metryky můžete zobrazit všechny další dostupné metriky pro databázi nebo zdroj elastického fondu. V průzkumníku metrik můžete změnit časový rozsah, granularitu a typ agregace pro graf, změnit typ grafu, rozšířit rozsah zahrnout metriky z dalších prostředků Azure, vytvářet pravidla upozornění atd. Průzkumník metrik lze také otevřít výběrem položky Metriky v nabídce pod Sledování v nabídce prostředku.

Použijte metriky ke sledování databází a elastických poolů

Můžete využít metriky ke sledování spotřeby a stavu zdrojů databáze a elastického fondu. Například můžete:

  • Přizpůsobte velikost databáze nebo elastického fondu pracovní zátěži vaší aplikace.
  • Detekujte postupné zvyšování spotřeby zdrojů a proaktivně rozšiřte databázi nebo elastický fond.
  • Zjistit a vyřešit problém s výkonem

Následující tabulka popisuje běžně používané metriky v Azure SQL Database.

Název metriky ID metriky Popis
procento CPU cpu_percent Tento metrik ukazuje spotřebu CPU vzhledem k uživatelskému limitu zátěže databáze nebo elastického fondu, vyjádřenou jako procento. Pro více informací si přečtěte Spotřeba zdrojů pracovními úlohami uživatelů a interními procesy.
Podíl CPU instance SQL sql_instance_cpu_percent Tato metrika ukazuje celkovou spotřebu CPU uživatelskými a systémovými pracovními zátěžemi, vyjádřenou v procentech. Protože tento metr a procento CPU jsou měřeny na různých stupnicích, nejsou přímo srovnatelné. Pro více informací si přečtěte Spotřeba zdrojů pracovními úlohami uživatelů a interními procesy.
Procento vstupu/výstupu dat physical_data_read_percent Tato metrika ukazuje spotřebu IO datového souboru ve vztahu k limitu uživatelského zatížení databáze nebo elastického fondu, vyjádřenou v procentech. Pro více informací viz Data IO governance.
Procento IO protokolu log_write_percent Tento metrik ukazuje spotřebu propustnosti zápisu transakčního protokolu směrem k limitu uživatelského zatížení databáze nebo elastického fondu, vyjádřenou v procentech. Pro více informací, viz Transaction log rate governance.
Procento pracovníků workers_percent Tato metrika ukazuje spotřebu vláken worker vůči uživatelskému limitu pracovního zatížení databáze nebo elastického fondu, vyjádřenou v procentech.
procento DTU dtu_consumption_percent Tato metrika ukazuje spotřebu DTU směrem k uživatelskému pracovnímu zatížení databáze nebo elastického fondu, vyjádřenou jako procento. Procento DTU je odvozeno od tří dalších metrik: Procento CPU, Procento Data IO a Procento Log IO. Kdykoliv v čase odpovídá procento DTU nejvyšší hodnotě mezi těmito třemi metrikami.
Využitá CPU cpu_used Tato metrika ukazuje využití CPU ve vztahu k limitu uživatelské zátěže databáze nebo elastického fondu, vyjádřené jako počet virtuálních jader (vCore). Pro více informací si přečtěte Diagnostikování a řešení problémů s vysokým využitím CPU na Azure SQL Database.
Použitý DTU dtu_used Tato metrika ukazuje počet DTUs využitých databází nebo elastickým balíkem.
Účtování CPU aplikace app_cpu_billed Pro serverless databáze tento metrik ukazuje množství výpočetního výkonu (CPU a paměti), které je účtováno, vyjádřené ve vCore sekundách. Pro více informací se podívejte na Fakturace v serverless výpočetním režimu.
Procento CPU aplikace app_cpu_percent Pro serverless databáze tento metrik ukazuje spotřebu CPU směrem k maximálnímu limitu vCore aplikačního balíčku, vyjádřenou v procentech. Pro více informací si přečtěte Monitorování ve vrstvě serverless výpočet.
Procento paměti aplikace app_memory_percent Pro bezserverové databáze tento metr ukazuje spotřebu paměti ve vztahu k maximálnímu limitu paměti balíčku aplikace, vyjádřenou v procentech. Pro více informací si přečtěte Monitorování ve vrstvě serverless výpočet.
Počet návštěv sessions_count Tato metrika ukazuje počet nastavených uživatelských relací pro databázi nebo elastický fond.
Využitý datový prostor storage Pro databáze tato metrika ukazuje množství úložného prostoru použitého v datových souborech databáze.
Využitý datový prostor storage_used Pro elastické fondy tento metrik ukazuje množství úložného prostoru použitého v datových souborech všech databází v elastickém fondu.
Prostor pro data přidělen allocated_data_storage Tento metrik ukazuje množství úložného prostoru zabraného datovými soubory databáze nebo datovými soubory všech databází v elastickém fondu. Datové soubory mohou obsahovat prázdné místo. Kvůli tomu je přidělený datový prostor často vyšší než použitý datový prostor pro stejnou databázi nebo elastický fond. Pro více informací si přečtěte Správa místa na disku pro databáze v Azure SQL Database.
Procento využitého datového prostoru storage_percent Metrika pro databáze ukazuje množství úložného prostoru využitého v datových souborech databáze ve vztahu k limitu velikosti dat v databázi. Pro elastické fondy zobrazuje množství úložného prostoru využitého v datových souborech všech databází v elastickém fondu, vyjádřené jako procento vůči datovému limitu velikosti elastického fondu. Limit velikosti dat pro databázi nebo elastický pool může být nastaven níže než maximální limit velikosti dat. Chcete-li najít maximální velikost datového limitu, podívejte se na omezení zdrojů pro vCore databáze, vCore elastické fondy, DTU databáze, a DTU elastické fondy.
Procento přiděleného datového prostoru allocated_data_storage_percent Pro elastické fondy tento metrik ukazuje množství úložného prostoru, které zabírají datové soubory všech databází v elastickém fondu, ve vztahu k datovému limitu fondu, vyjádřeno v procentech.
Procento využití protokolu Tempdb tempdb_log_used_percent Tento metrický údaj ukazuje spotřebu prostoru pro transakční log v databázi tempdb vzhledem k maximální velikosti logu, vyjádřenou v procentech. Pro více informací se podívejte na tempdb v Azure SQL Database.
Úspěšná připojení connection_successful Tato metrika ukazuje počet úspěšně navázaných připojení k databázi. Tuto metriku lze rozdělit podle dvou rozměrů, SslProtocol a ValidatedDriverNameAndVersion, aby bylo možné vidět počet připojení pomocí konkrétní verze šifrovacího protokolu nebo konkrétního klientského ovladače.
Neúspěšná připojení: Systémové chyby connection_failed Tato metrika ukazuje počet pokusů o připojení k databázi, které selhaly kvůli interním chybám služby. Nejčastěji jsou takové chyby přechodné. Tento metrik může být rozdělen podle dvou dimenzí, Error a ValidatedDriverNameAndVersion, abychom zjistili počet neúspěšných pokusů o připojení způsobených konkrétní chybou nebo z konkrétního ovladače klienta.
Neúspěšná připojení. Chyby uživatelů connection_failed_user_error Tato metrika ukazuje počet pokusů o připojení k databázi, které selhaly kvůli chybám, které může uživatel opravit, jako je například nesprávné heslo nebo blokování připojení firewallem. Tento metrik může být rozdělen podle dvou dimenzí, Error a ValidatedDriverNameAndVersion, abychom zjistili počet neúspěšných pokusů o připojení způsobených konkrétní chybou nebo z konkrétního ovladače klienta.
Zablokování deadlock Tato metrika ukazuje počet deadlocků v databázi.
dostupnost availability Dostupnost je určena na základě toho, zda je databáze připojená k síti, funkční. Pro každý jednominutový datový bod jsou možné hodnoty buď 100% nebo 0%. Pro více informací viz Metrika dostupnosti.

Metrika dostupnosti

Metrika dostupnosti sleduje dostupnost na úrovni jednotlivých databází Azure SQL.

Dostupnost je podrobně sledována až na jednu minutu výpadku spojení. Dostupnost je určena na základě toho, zda je databáze připojená k síti, funkční. Minuta je považována za dobu nečinnosti nebo nedostupnost, pokud všechny souvislé pokusy uživatelů o navázání spojení s databází v této minutě selžou kvůli problémům se službou. Pokud dochází k občasné nedostupnosti, délka nepřetržité nedostupnosti musí přesáhnout hranici jedné minuty, aby byla považována za výpadek. Typicky je latence zobrazování dostupnosti méně než tři minuty.

Zde je logika použitá pro výpočet dostupnosti pro každý jednorázový minutový interval:

  • Pokud existuje alespoň jedno úspěšné spojení, pak je dostupnost 100 %.
  • Pokud všechny připojení selžou kvůli uživatelským chybám, dostupnost je 100 %.
  • Pokud neprobíhají žádné pokusy o připojení, dostupnost je 100 %.
  • Pokud všechny připojení selžou kvůli systémovým chybám, dostupnost je 0 %.
  • V současné době nejsou data metrik dostupnosti podporovaná pro bezserverovou výpočetní úroveň a zobrazují 100%.

Dostupnostní metrika je tedy složená metrika odvozená z následujících existujících metrik:

  • Úspěšná připojení
  • Neúspěšná připojení. Chyby uživatelů
  • Blokováno firewallovým zásahem
  • Neúspěšná připojení: Systémové chyby

Chyby uživatele zahrnují všechny připojení, která selhávají kvůli uživatelské konfiguraci, zátěži nebo správě. Systémové chyby zahrnují všechna selhání připojení kvůli přechodným problémům souvisejícím se službou Azure SQL Database.

Upozornění

Můžete vytvořit pravidla upozornění, která vás informují, že hodnota jedné metriky nebo několika metrik je mimo očekávaný rozsah.

Rozsah pravidla upozornění můžete nastavit několika způsoby, aby vyhovoval vašim potřebám. Například rozsah pravidla upozornění může být nastaven na:

  • Jednotná databáze
  • Elastický fond
  • Všechny databáze nebo elastické fondy v rámci skupiny prostředků
  • Všechny databáze nebo elastické pooly v předplatném v rámci Azure regionu
  • Všechny databáze nebo elastické pooly v předplatném ve všech regionech

Pravidla upozornění periodicky vyhodnocují agregované hodnoty metrik za období zpětného pohledu a porovnávají je s hraniční hodnotou. Můžete konfigurovat prahovou hodnotu, frekvenci hodnocení a období zpětného pohledu.

Pokud se spustí pravidlo alertu, budete upozorněni podle vašich preferencí oznámení, které specifikujete ve skupině akcí propojené s pravidlem alertu. Například můžete obdržet e-mail, SMS nebo hlasové oznámení. Pravidlo upozornění může také spustit akce, jako jsou webhooky, automatizační runbooky, funkce, logické aplikace atd. Upozornění můžete integrovat s podporovanými produkty pro správu IT služeb.

Chcete-li se dozvědět více o upozorněních Azure Monitor, podívejte se na přehled upozornění Azure Monitor. Chcete-li se seznámit s metrickými upozorněními, přečtěte si Metrická upozornění, Správa pravidel upozornění a Akční skupiny.

Metriky a optimální prahové hodnoty, které se používají v upozorňovacích pravidlech, se liší napříč širokým spektrem pracovních zátěží zákazníků v Azure SQL Database.

Doporučená upozornění v následující tabulce jsou výchozím bodem, který vám pomůže definovat optimální konfiguraci upozornění pro vaše zdroje databáze Azure SQL. V závislosti na vašich požadavcích se vaše konfigurace může lišit od tohoto příkladu. Můžete použít různé prahy, frekvence hodnocení nebo období pro zpětný pohled. Můžete se rozhodnout vytvořit další upozornění nebo použít různé konfigurace pravidel upozornění pro různé aplikace a prostředí.

Zde jsou příklady typických konfigurací pravidel upozornění.

Název pravidla upozornění Metrika (signál) Logika výstrah Kdy hodnotit Navrhovaná závažnost
Vysoké využití CPU uživatelem procento CPU Práh: Static
Agregace: Average
Operátor: Greater than
Hodnota prahu: 90
Zkontrolovat každé: 1 minute
Období zpětného pohledu: 10 minutes
2 - Upozornění
Vysoké celkové využití CPU Podíl CPU instance SQL Práh: Static
Agregace: Average
Operátor: Greater than
Hodnota prahu: 90
Zkontrolovat každé: 1 minute
Období zpětného pohledu: 10 minutes
2 - Upozornění
Vysoké využití pracovníků Procento pracovníků Práh: Static
Agregace: Minimum
Operátor: Greater than
Hodnota prahu: 60
Zkontrolovat každé: 1 minute
Období zpětného pohledu: 5 minutes
1 - Chyba
Vysoké využití datového IO Procento vstupu/výstupu dat Práh: Static
Agregace: Average
Operátor: Greater than
Hodnota prahu: 90
Zkontrolovat každé: 1 minute
Období zpětného pohledu: 15 minutes
3 - Informační
Nízká kapacita úložiště dat Procento využitého datového prostoru Práh: Static
Agregace: Minimum
Operátor: Greater than
Hodnota prahu: 95
Zkontrolovat každé: 15 minute
Období zpětného pohledu: 15 minutes
1 - Chyba
Nízký tempdb protokolový prostor Procento využití protokolu Tempdb Práh: Static
Agregace: Minimum
Operátor: Greater than
Hodnota prahu: 60
Zkontrolovat každé: 1 minute
Období zpětného pohledu: 5 minutes
1 - Chyba
Zablokování Zablokování Práh: Dynamic
Agregace: Total
Operátor: Greater than
Citlivost prahu: Medium
Zkontrolovat každé: 15 minutes
Období zpětného pohledu: 1 hour
3 - Informační
Neúspěšná připojení (uživatelské chyby) Neúspěšná připojení. Chyby uživatelů Práh: Dynamic
Agregace: Total
Operátor: Greater than
Citlivost prahu: Medium
Zkontrolovat každé: 5 minutes
Období zpětného pohledu: 15 minutes
2 - Upozornění
Neúspěšná spojení (systémové chyby) Neúspěšná připojení: Systémové chyby Práh: Static
Agregace: Total
Operátor: Greater than
Jednotka: Count
Hodnota prahu: 10
Zkontrolovat každé: 1 minute
Období zpětného pohledu: 5 minutes
2 - Upozornění
Anomální míra připojení Úspěšná připojení Práh: Dynamic
Agregace: Total
Operátor: Greater or Less than
Citlivost prahu: Low
Zkontrolovat každé: 5 minutes
Období zpětného pohledu: 15 minutes
2 - Upozornění

Některá z doporučených pravidel upozornění používají dynamické prahové hodnoty k detekci anomálních metrických vzorců, které by mohly vyžadovat pozornost. Pravidla upozornění založená na dynamických prahových hodnotách se nespustí, dokud není shromážděno dostatečné množství historických dat pro stanovení normálních vzorců. Pro více informací viz Dynamické prahové hodnoty v metrických upozorněních.

Ve výchozím nastavení jsou metrická upozornění udržující stav. To znamená, že jakmile je pravidlo upozornění spuštěno, upozornění se aktivuje pouze jednou. Výstraha zůstává ve stavu fired, dokud není vyřešena, načež je odesláno oznámení resolved. Pravidlo upozornění vyvolá nové upozornění pouze tehdy, když je vyřešeno předchozí upozornění. Upozornění s uchováním stavu zabraňují častým notifikacím o probíhajícím stavu. Pro více informací o stavových a bezstavových upozorněních viz Upozornění a stav.