Monitorování online koncových bodů
V tomto článku se dozvíte, jak monitorovat online koncové body služby Azure Machine Learning. Pomocí Application Insights můžete zobrazovat metriky a vytvářet upozornění, abyste mohli mít stále aktuální informace o online koncových bodech.
V tomto článku získáte informace o těchto tématech:
- Zobrazení metrik pro online koncový bod
- Vytvoření řídicího panelu pro metriky
- Vytvoření upozornění na metriku
Důležité
Položky označené v tomto článku (Preview) jsou aktuálně ve verzi Public Preview. Verze Preview se poskytuje bez smlouvy o úrovni služeb a nedoporučuje se pro produkční úlohy. Některé funkce se nemusí podporovat nebo mohou mít omezené možnosti. Další informace najdete v dodatečných podmínkách použití pro verze Preview v Microsoft Azure.
Požadavky
- Nasazení online koncového bodu služby Azure Machine Learning
- K koncovému bodu musíte mít alespoň přístup čtenáře .
Metriky
Stránky metrik pro online koncové body nebo nasazení můžete zobrazit v Azure Portal. Snadným způsobem, jak získat přístup k těmto stránkám metrik, jsou odkazy dostupné v uživatelském rozhraní studio Azure Machine Learning – konkrétně na kartě Podrobnosti na stránce koncového bodu. Následující odkazy vás přesnou stránku metrik na Azure Portal koncového bodu nebo nasazení přesnou stránku. Alternativně můžete také přejít do Azure Portal a vyhledat stránku metrik pro koncový bod nebo nasazení.
Přístup ke stránkám metrik prostřednictvím odkazů dostupných ve studiu:
Přejděte na studio Azure Machine Learning.
V levém navigačním panelu vyberte stránku Koncové body .
Vyberte koncový bod kliknutím na jeho název.
Výběrem možnosti Zobrazit metriky v části Atributy koncového bodu otevřete stránku metrik koncového bodu v Azure Portal.
Výběrem možnosti Zobrazit metriky v části pro každé dostupné nasazení otevřete stránku metrik nasazení v Azure Portal.
Přímý přístup k metrikám z Azure Portal:
Přejděte na Azure Portal.
Přejděte k online koncovému bodu nebo prostředku nasazení.
Online koncové body a nasazení jsou prostředky Azure Resource Manager (ARM), které najdete tak, že přejdete do vlastní skupiny prostředků. Vyhledejte typy prostředků online koncový bod služby Machine Learning a online nasazení Služby Machine Learning.
V levém sloupci vyberte Metriky.
Dostupné metriky
Zobrazené metriky se budou lišit v závislosti na vybraném prostředku. Metriky jsou pro online koncové body a online nasazení vymezeny odlišně.
Metriky v oboru koncového bodu
- Latence požadavku
- Latence požadavku P50 (latence požadavků na 50. percentil)
- Latence požadavku P90 (latence požadavku na 90. percentilu)
- Latence požadavku P95 (latence požadavků na 95. percentilu)
- Žádosti za minutu
- Nová připojení za sekundu
- Počet aktivních připojení
- Bajty v síti
Rozdělení na následující dimenze:
- Nasazení
- Stavový kód
- Třída stavového kódu
- Stavový kód modelu
Omezování šířky pásma
Při překročení limitů spravovaných online koncových bodů dojde k omezení šířky pásma (viz část Spravované online koncové body v tématu Správa a zvýšení kvót prostředků pomocí služby Azure Machine Learning). Pokud chcete zjistit, jestli dochází k omezování požadavků:
- Monitorování metriky Síťové bajty
- Upoutávky odpovědí budou mít tato pole:
ms-azureml-bandwidth-request-delay-ms
ams-azureml-bandwidth-response-delay-ms
. Hodnoty polí představují zpoždění omezování šířky pásma v milisekundách.
Metriky v oboru nasazení
- Procento využití procesoru
- Kapacita nasazení (počet instancí požadovaného typu instance)
- Využití disků
- Využití paměti GPU (platí jenom pro instance GPU)
- Využití GPU (platí jenom pro instance GPU)
- Procento využití paměti
Rozdělení na následující dimenzi:
- InstanceId
Vytvoření řídicího panelu
Můžete vytvořit vlastní řídicí panely pro vizualizaci dat z více zdrojů v Azure Portal, včetně metrik pro váš online koncový bod. Další informace najdete v tématu Vytváření vlastních řídicích panelů klíčových ukazatelů výkonu pomocí Application Insights.
Vytvoření upozornění
Můžete také vytvořit vlastní výstrahy, které vás upozorní na důležité aktualizace stavu vašeho online koncového bodu:
V pravém horním rohu stránky metrik vyberte Nové pravidlo upozornění.
Vyberte název podmínky a určete, kdy se má upozornění aktivovat.
Vyberte Přidat skupiny> akcíVytvořit skupiny akcí a určete, co se má stát při aktivaci upozornění.
Kliknutím na Vytvořit pravidlo upozornění dokončete vytváření upozornění.
Protokoly
Pro online koncové body je možné povolit tři protokoly:
AMLOnlineEndpointTrafficLog (Preview): Pokud chcete zkontrolovat informace o požadavku, můžete povolit protokoly provozu. Tady je několik případů:
Pokud odpověď není 200, zkontrolujte hodnotu sloupce ResponseCodeReason a zjistěte, co se stalo. Projděte si také důvod v části Stavové kódy HTTPS článku Řešení potíží s online koncovými body .
Kód odpovědi a důvod odpovědi modelu můžete zkontrolovat ve sloupcích ModelStatusCode a ModelStatusReason.
Chcete zkontrolovat dobu trvání požadavku, jako je celková doba trvání, doba trvání požadavku a odpovědi a zpoždění způsobené omezováním sítě. Latenci rozpisu můžete zkontrolovat v protokolech.
Pokud chcete zkontrolovat, kolik požadavků nebo požadavků v poslední době selhalo. Můžete také povolit protokoly.
AMLOnlineEndpointConsoleLog: Obsahuje protokoly, které kontejnery vypíše do konzoly. Tady je několik případů:
Pokud se kontejner nepodaří spustit, může být pro ladění užitečný protokol konzoly.
Monitorujte chování kontejneru a ujistěte se, že jsou všechny požadavky správně zpracovány.
Zapište ID požadavků do protokolu konzoly. Když připojíte ID požadavku, AMLOnlineEndpointConsoleLog a AMLOnlineEndpointTrafficLog v pracovním prostoru služby Log Analytics, můžete trasovat požadavek ze vstupního síťového bodu online koncového bodu do kontejneru.
Tento protokol můžete použít také k analýze výkonu při určování času potřebného modelem ke zpracování jednotlivých požadavků.
AMLOnlineEndpointEventLog (Preview): Obsahuje informace o událostech týkající se životního cyklu kontejneru. V současné době poskytujeme informace o následujících typech událostí:
Name Message Couvnutí Obnovení restartování neúspěšného kontejneru Vytáhl Image kontejneru "<IMAGE_NAME>" už na počítači existuje Zabíjení Odvození kontejneru – test aktivity serveru selhal, se restartuje Vytvořeno Vytvoření image-fetcher kontejneru Vytvořeno Vytvoření kontejneru inference-server Vytvořeno Vytvoření připojení modelu kontejneru Není v pořádku Test aktivity selhal: <FAILURE_CONTENT> Není v pořádku Test připravenosti selhal: <FAILURE_CONTENT> Zahájeno Spuštění kontejneru image-fetcher Zahájeno Spuštění kontejneru inference-server Zahájeno Spuštění připojení modelu kontejneru Zabíjení Zastavení kontejneru inference-server Zabíjení Zastavení připojení modelu kontejneru
Povolení nebo zakázání protokolů
Důležité
Protokolování používá Azure Log Analytics. Pokud v současné době nemáte pracovní prostor služby Log Analytics, můžete ho vytvořit pomocí postupu v části Vytvoření pracovního prostoru služby Log Analytics v Azure Portal.
V Azure Portal přejděte do skupiny prostředků, která obsahuje váš koncový bod, a vyberte koncový bod.
V části Monitorování na levé straně stránky vyberte Nastavení diagnostiky a pak Přidat nastavení.
Vyberte kategorie protokolů, které chcete povolit, vyberte Odeslat do pracovního prostoru služby Log Analytics a pak vyberte pracovní prostor služby Log Analytics, který chcete použít. Nakonec zadejte název nastavení diagnostiky a vyberte Uložit.
Důležité
Povolení připojení k pracovnímu prostoru služby Log Analytics může trvat až hodinu. Počkejte hodinu a pak pokračujte v dalších krocích.
Odešlete žádosti o bodování do koncového bodu. Tato aktivita by měla v protokolech vytvářet položky.
Ve vlastnostech online koncového bodu nebo v pracovním prostoru služby Log Analytics vyberte na levé straně obrazovky Protokoly .
Zavřete dialogové okno Dotazy , které se otevře automaticky, a potom poklikejte na AmlOnlineEndpointConsoleLog. Pokud ho nevidíte, použijte pole Hledat .
Vyberte Run (Spustit).
Ukázky dotazů
Ukázkové dotazy najdete na kartě Dotazy při zobrazení protokolů. Příklady dotazů najdete vyhledáním online koncového bodu .
Podrobnosti o sloupci protokolu
Následující tabulky obsahují podrobnosti o datech uložených v jednotlivých protokolech:
AMLOnlineEndpointTrafficLog (Preview)
Název pole | Description |
---|---|
Metoda | Požadovaná metoda z klienta. |
Cesta | Požadovaná cesta z klienta. |
SubscriptionId | ID předplatného služby Machine Learning online koncového bodu. |
Id pracovního prostoru AzureML | ID pracovního prostoru Machine Learning online koncového bodu. |
Název pracovního prostoru AzureML | Název pracovního prostoru služby Machine Learning online koncového bodu. |
Název koncového bodu | Název online koncového bodu. |
Název nasazení | Název online nasazení. |
Protokol | Protokol požadavku. |
Kód odpovědi | Konečný kód odpovědi vrácený klientovi. |
ResponseCodeReason | Konečný důvod kódu odpovědi vrácený klientovi. |
ModelStatusCode | Stavový kód odpovědi z modelu. |
ModelStatusReason | Důvod stavu odpovědi z modelu. |
RequestPayloadSize | Celkový počet bajtů přijatých od klienta |
ResponsePayloadSize | Celkový počet bajtů odeslaných zpět klientovi. |
Useragent | Hlavička uživatelského agenta požadavku, včetně komentářů, ale zkrácená na maximálně 70 znaků. |
XRequestId | ID požadavku vygenerované službou Azure Machine Learning pro interní trasování. |
XMSClientRequestId | ID sledování vygenerované klientem. |
TotalDurationMs | Doba trvání v milisekundách od času zahájení požadavku do posledního bajtu odpovědi odeslaného zpět klientovi. Pokud se klient odpojil, měří od času spuštění do času odpojení klienta. |
RequestDurationMs | Doba trvání v milisekundách od času zahájení požadavku do posledního bajtu požadavku přijatého od klienta |
ResponseDurationMs | Doba trvání v milisekundách od času zahájení požadavku do prvního bajtu odpovědi přečtené z modelu. |
RequestThrottlingDelayMs | Zpoždění přenosu dat požadavků v milisekundách kvůli omezování sítě |
ResponseThrottlingDelayMs | Zpoždění přenosu dat odpovědi v milisekundách kvůli omezování sítě |
AMLOnlineEndpointConsoleLog
Název pole | Description |
---|---|
TimeGenerated | Časové razítko (UTC) okamžiku vygenerování protokolu |
OperationName | Operace přidružená k záznamu protokolu. |
InstanceId | ID instance, která vygenerovala tento záznam protokolu. |
DeploymentName | Název nasazení přidruženého k záznamu protokolu. |
ContainerName | Název kontejneru, ve kterém se protokol vygeneroval. |
Message | Obsah protokolu. |
AMLOnlineEndpointEventLog (Preview)
Název pole | Description |
---|---|
TimeGenerated | Časové razítko (UTC) okamžiku vygenerování protokolu |
OperationName | Operace přidružená k záznamu protokolu. |
InstanceId | ID instance, která vygenerovala tento záznam protokolu. |
DeploymentName | Název nasazení přidruženého k záznamu protokolu. |
Name | Název události. |
Message | Obsah události. |
Další kroky
- Zjistěte, jak zobrazit náklady na nasazený koncový bod.
- Přečtěte si další informace o Průzkumníku metrik.