Online végpontok monitorozása

Ebből a cikkből megtudhatja, hogyan monitorozhat online Azure Machine Learning-végpontokat. Az Application Insights segítségével megtekintheti a metrikákat, és riasztásokat hozhat létre az online végpontokkal való naprakészség érdekében.

Ebben a cikkben az alábbiakkal fog megismerkedni:

  • Az online végpont metrikáinak megtekintése
  • Irányítópult létrehozása a metrikákhoz
  • Metrikariasztás létrehozása

Fontos

A cikkben megjelölt (előzetes verziójú) elemek jelenleg nyilvános előzetes verzióban érhetők el. Az előzetes verzió szolgáltatásiszint-szerződés nélkül érhető el, és éles számítási feladatokhoz nem ajánlott. Előfordulhat, hogy néhány funkció nem támogatott, vagy korlátozott képességekkel rendelkezik. További információ: Kiegészítő használati feltételek a Microsoft Azure előzetes verziójú termékeihez.

Előfeltételek

  • Azure Machine Learning online végpont üzembe helyezése.
  • Legalább olvasói hozzáféréssel kell rendelkeznie a végponton.

Mérőszámok

Az online végpontok vagy üzemelő példányok metrikaoldalait a Azure Portal tekintheti meg. Ezeknek a metrikalapoknak a elérésére a Azure Machine Learning stúdió felhasználói felületén – különösen a végpont lapjának Részletek lapján – elérhető hivatkozásokon keresztül van lehetőség. Ezeket a hivatkozásokat követve a végpont vagy az üzembe helyezés Azure Portal pontos metrikák lapjára lép. Másik lehetőségként a Azure Portal is megnyithatja a végpont vagy az üzembe helyezés metrikaoldalának megkereséséhez.

A metrikák lapjainak elérése a stúdióban elérhető hivatkozásokon keresztül:

  1. Lépjen a Azure Machine Learning stúdió.

  2. A bal oldali navigációs sávon válassza a Végpontok lapot.

  3. Válasszon ki egy végpontot a nevére kattintva.

  4. Válassza a Metrikák megtekintése lehetőséget a végpont Attribútumok szakaszában a végpont metrikák lapjának megnyitásához a Azure Portal.

  5. Válassza a Metrikák megtekintése lehetőséget az egyes elérhető üzemelő példányok esetében a Azure Portal üzemelő példány metrikaoldalának megnyitásához.

    Képernyőkép egy végpont és az üzembe helyezés metrikáinak a studio felhasználói felületéről történő eléréséről.

Metrikák közvetlen elérése a Azure Portal:

  1. Nyissa meg az Azure Portal.

  2. Keresse meg az online végpontot vagy az üzembehelyezési erőforrást.

    Az online végpontok és üzemelő példányok olyan Azure Resource Manager (ARM)-erőforrások, amelyek a saját erőforráscsoportjukban találhatók. Keresse meg a Machine Learning online végpont és a Machine Learning online üzembe helyezésének erőforrástípusát.

  3. A bal oldali oszlopban válassza a Metrikák lehetőséget.

Rendelkezésre álló metrikák

A kiválasztott erőforrástól függően a megjelenő metrikák eltérőek lesznek. A metrikák hatóköre eltérő az online végpontok és az online üzemelő példányok esetében.

Metrikák a végpont hatókörében

  • Kérés késése
  • Kérés késése P50 (kérés késése az 50. percentilisnél)
  • Kérés késése P90 (kérések késése a 90. percentilisnél)
  • Kérés késése P95 (kérés késése a 95. percentilisnél)
  • Kérelem/perc
  • Új kapcsolatok/másodperc
  • Aktív kapcsolatok száma
  • Hálózati bájtok

Felosztás az alábbi dimenziók alapján:

  • Üzembe helyezés
  • Állapotkód
  • Állapotkódosztály
  • Modell állapotkódja

Sávszélesség-szabályozás

A sávszélesség szabályozva lesz, ha túllépik a felügyelt online végpontok korlátait (lásd a felügyelt online végpontok azure machine learning-alapú erőforrások kvótáinak kezelése és növelése című szakaszát). Annak megállapítása, hogy a kérések szabályozva vannak-e:

  • A "Hálózati bájtok" metrika monitorozása
  • A válaszelőzetesekben a következő mezők lesznek: ms-azureml-bandwidth-request-delay-ms és ms-azureml-bandwidth-response-delay-ms. A mezők értékei a sávszélesség szabályozásának késleltetése ezredmásodpercben.

Metrikák az üzemelő példány hatókörében

  • CPU-kihasználtság százalékos aránya
  • Üzembehelyezési kapacitás (a kért példánytípus példányainak száma)
  • Lemezhasználat
  • GPU memóriahasználata (csak GPU-példányokra vonatkozik)
  • GPU-kihasználtság (csak GPU-példányokra vonatkozik)
  • Memóriahasználat százalékos aránya

Felosztás az alábbi dimenzió alapján:

  • InstanceId

Irányítópult létrehozása

Egyéni irányítópultokat hozhat létre a Azure Portal több forrásból származó adatok megjelenítéséhez, beleértve az online végpont metrikáit is. További információ: Egyéni KPI-irányítópultok létrehozása az Application Insights használatával.

Riasztás létrehozása

Egyéni riasztásokat is létrehozhat, hogy értesítse Önt az online végpont fontos állapotfrissítéseiről:

  1. A metrikák lap jobb felső sarkában válassza az Új riasztási szabály lehetőséget.

    Online végpontok monitorozása: képernyőkép az

  2. Válasszon ki egy feltételnevet, amely megadja, hogy mikor kell aktiválni a riasztást.

    Online végpontok monitorozása: képernyőkép a

  3. Válassza a Műveletcsoportok> hozzáadásaMűveletcsoportok létrehozása lehetőséget, és adja meg, hogy mi történjen a riasztás aktiválásakor.

  4. Válassza a Riasztási szabály létrehozása lehetőséget a riasztás létrehozásának befejezéséhez.

Naplók

Az online végpontokhoz három napló engedélyezhető:

  • AMLOnlineEndpointTrafficLog (előzetes verzió): Engedélyezheti a forgalmi naplókat, ha ellenőrizni szeretné a kérés adatait. Az alábbiakban néhány esetet talál:

    • Ha a válasz nem 200, ellenőrizze a "ResponseCodeReason" oszlop értékét, hogy lássa, mi történt. Ellenőrizze az online végpontok hibaelhárításáról szóló cikk "HTTPS-állapotkódok" szakaszának okát is.

    • A modell válaszkódját és válaszának okát a "ModelStatusCode" és a "ModelStatusReason" oszlopban ellenőrizheti.

    • Ellenőrizni szeretné a kérés időtartamát, például a teljes időtartamot, a kérés/válasz időtartamát és a hálózati szabályozás által okozott késést. A naplókból ellenőrizheti, hogy látható-e a lebontás késése.

    • Ha ellenőrizni szeretné, hogy hány kérelem vagy sikertelen kérés érkezett mostanában. A naplókat is engedélyezheti.

  • AMLOnlineEndpointConsoleLog: Olyan naplókat tartalmaz, amelyeket a tárolók a konzolnak adnak ki. Az alábbiakban néhány esetet talál:

    • Ha a tároló nem indul el, a konzolnapló hasznos lehet a hibakereséshez.

    • Monitorozza a tároló viselkedését, és győződjön meg arról, hogy minden kérés megfelelően van kezelve.

    • Írjon kérelemazonosítókat a konzolnaplóba. A Log Analytics-munkaterületen található kérelemazonosítóhoz, az AMLOnlineEndpointConsoleLoghoz és az AMLOnlineEndpointTrafficLoghoz csatlakozva egy online végpont hálózati belépési pontjáról a tárolóba követheti a kéréseket.

    • Ezt a naplót teljesítményelemzésre is használhatja a modell által az egyes kérések feldolgozásához szükséges idő meghatározásához.

  • AMLOnlineEndpointEventLog (előzetes verzió): A tároló életciklusával kapcsolatos eseményinformációkat tartalmaz. Jelenleg a következő típusú eseményekről adunk információt:

    Name Üzenet
    Visszalépés Sikertelen tároló újraindításának visszalépése
    Húzta A "<IMAGE_NAME>" tárolólemezkép már megtalálható a gépen
    Megölése A tárolókövetkeztetés-kiszolgáló sikertelen élettartam-mintavétele újraindul
    Létrehozva Tárolórendszerkép-lekérdező létrehozása
    Létrehozva Tárolókövetkeztetési kiszolgáló létrehozva
    Létrehozva Tárolómodell csatlakoztatása
    Nem kifogástalan Az élettartam-mintavétel nem sikerült: <FAILURE_CONTENT>
    Nem kifogástalan Nem sikerült a készültségi teszt: <FAILURE_CONTENT>
    Első lépések A tároló rendszerkép-beolvasója elindítva
    Első lépések Tárolókövetkeztetés-kiszolgáló elindítva
    Első lépések A tárolómodell csatlakoztatása megkezdődött
    Megölése Tárolókövetkeztetés-kiszolgáló leállítása
    Megölése Tárolómodell csatlakoztatásának leállítása

Naplók engedélyezése/letiltása

Fontos

A naplózás az Azure Log Analyticset használja. Ha jelenleg nincs Log Analytics-munkaterülete, létrehozhat egyet a Log Analytics-munkaterület létrehozása a Azure Portal.

  1. A Azure Portal lépjen a végpontot tartalmazó erőforráscsoportra, majd válassza ki a végpontot.

  2. A lap bal oldalán található Figyelés szakaszban válassza a Diagnosztikai beállítások , majd a Beállítások hozzáadása lehetőséget.

  3. Válassza ki az engedélyezni kívánt naplókategóriákat, válassza a Küldés a Log Analytics-munkaterületre lehetőséget, majd válassza ki a használni kívánt Log Analytics-munkaterületet. Végül adjon meg egy diagnosztikai beállításnevet , és válassza a Mentés lehetőséget.

    Képernyőkép a diagnosztikai beállítások párbeszédpanelről.

    Fontos

    A Log Analytics-munkaterülethez való csatlakozás engedélyezése akár egy órát is igénybe vehet. Várjon egy órát, mielőtt továbblép a következő lépésekre.

  4. Küldjön pontozási kéréseket a végpontnak. Ennek a tevékenységnek bejegyzéseket kell létrehoznia a naplókban.

  5. Az online végpont tulajdonságaiból vagy a Log Analytics-munkaterületről válassza a naplókat a képernyő bal oldalán.

  6. Zárja be az automatikusan megnyíló Lekérdezések párbeszédpanelt, majd kattintson duplán az AmlOnlineEndpointConsoleLog elemre. Ha nem látja, használja a Keresés mezőt.

    Képernyőkép a napló lekérdezésekről.

  7. Válassza a Futtatás lehetőséget.

    Képernyőképek a lekérdezés futtatása utáni eredményekről.

Példa a lekérdezésekre

A naplók megtekintésekor a Lekérdezések lapon talál példa lekérdezéseket. Keresse meg az Online végpontot a példalekérdezések kereséséhez.

Képernyőkép a példa lekérdezésekről.

Naplóoszlop részletei

Az alábbi táblázatok az egyes naplókban tárolt adatok részleteit tartalmazzák:

AMLOnlineEndpointTrafficLog (előzetes verzió)

Mező neve Leírás
Metódus A kért metódus az ügyféltől.
Elérési út A kért elérési út az ügyféltől.
SubscriptionId Az online végpont gépi tanulási előfizetés-azonosítója.
AzureMLWorkspaceId Az online végpont gépi tanulási munkaterület-azonosítója.
AzureMLWorkspaceName Az online végpont machine learning-munkaterületének neve.
EndpointName Az online végpont neve.
DeploymentName Az online üzembe helyezés neve.
Protokoll A kérelem protokollja.
ResponseCode Az ügyfélnek visszaadott végső válaszkód.
ResponseCodeReason Az ügyfélnek visszaadott végső válaszkód oka.
ModelStatusCode A modell válaszállapot-kódja.
ModelStatusReason A modell válaszállapotának oka.
RequestPayloadSize Az ügyféltől kapott összes bájt.
ResponsePayloadSize Az ügyfélnek visszaküldött összes bájt.
Useragent A kérelem felhasználói ügynök fejléce, beleértve a megjegyzéseket is, de legfeljebb 70 karakterre csonkítva.
XRequestId Az Azure Machine Learning által a belső nyomkövetéshez létrehozott kérésazonosító.
XMSClientRequestId Az ügyfél által létrehozott nyomkövetési azonosító.
TotalDurationMs Időtartam ezredmásodpercben a kérelem kezdési időpontjától az ügyfélnek visszaküldött utolsó válasz bájtig. Ha az ügyfél kapcsolata megszakadt, az a kezdési időponttól az ügyfél leválasztási időpontjáig méri.
RequestDurationMs Időtartam ezredmásodpercben a kérelem kezdési időpontjától az ügyféltől kapott kérés utolsó bájtjához.
ResponseDurationMs Időtartam ezredmásodpercben a kérelem kezdési időpontjától a modellből beolvasott első válasz bájtig.
RequestThrottlingDelayMs Késés ezredmásodpercben a kérelmek adatátvitelében a hálózati szabályozás miatt.
ResponseThrottlingDelayMs Késés ezredmásodpercben a hálózati szabályozás miatti válaszadat-átvitelben.

AMLOnlineEndpointConsoleLog

Mezőnév Leírás
TimeGenerated A napló létrehozásának időbélyege (UTC).
OperationName A naplórekordhoz társított művelet.
InstanceId A naplórekordot létrehozó példány azonosítója.
DeploymentName A naplórekordhoz társított üzembe helyezés neve.
ContainerName Annak a tárolónak a neve, ahol a napló létre lett hozva.
Üzenet A napló tartalma.

AMLOnlineEndpointEventLog (előzetes verzió)

Mezőnév Leírás
TimeGenerated A napló létrehozásának időbélyege (UTC).
OperationName A naplórekordhoz társított művelet.
InstanceId A naplórekordot létrehozó példány azonosítója.
DeploymentName A naplórekordhoz társított üzembe helyezés neve.
Name Az esemény neve.
Üzenet Az esemény tartalma.

Következő lépések