Přístup k integrovaným metrikám v Azure IoT Edge

Platí pro:Značka zaškrtnutí IoT Edge 1.5 IoT Edge 1.5 Značka zaškrtnutí IoT Edge 1.4 IoT Edge 1.4

Důležité

Podporované verze ioT Edge 1.5 LTS a IoT Edge 1.4 LTS. IoT Edge 1.4 LTS je konec životnosti 12. listopadu 2024. Pokud používáte starší verzi, podívejte se na článek Aktualizace IoT Edge.

Komponenty modulu runtime IoT Edge, Centrum IoT Edge a agent IoT Edge vytvářejí integrované metriky ve formátu expozice Prometheus. K těmto metrikám můžete přistupovat vzdáleně za účelem monitorování a porozumění stavu zařízení IoT Edge.

Pro přístup k těmto metrikám můžete použít vlastní řešení. Nebo můžete použít modul kolektoru metrik, který zpracovává shromažďování předdefinovaných metrik a jejich odesílání do služby Azure Monitor nebo Azure IoT Hub. Další informace najdete v tématu Shromažďování a přenos metrik.

Metriky se ve výchozím nastavení automaticky zveřejňují na portu 9600modulů edgeHub a edgeAgent (http://edgeHub:9600/metrics a http://edgeAgent:9600/metrics). Ve výchozím nastavení nejsou namapované na hostitele.

Přístup k metrikám z hostitele zveřejněním a mapováním portu metrik z modulu createOptions. Následující příklad mapuje výchozí port metrik na port 9601 na hostiteli:

{
  "ExposedPorts": {
    "9600/tcp": {}
  },
  "HostConfig": {
    "PortBindings": {
      "9600/tcp": [
        {
          "HostPort": "9601"
        }
      ]
    }
  }
}

Pokud mapujete koncové body metrik edgeHubu i edgeAgent, zvolte různá a jedinečná čísla portů hostitele.

Poznámka:

Proměnná httpSettings__enabled prostředí by neměla být nastavená na false předdefinované metriky, aby byly dostupné pro kolekci.

Proměnné prostředí, které je možné použít k zakázání metrik, jsou uvedené v dokumentaci k úložišti Azure/iotedge.

Dostupné metriky

Metriky obsahují značky, které pomáhají identifikovat povahu shromažďované metriky. Všechny metriky obsahují následující značky:

Značka Popis
iothub Centrum, na které zařízení mluví
edge_device ID aktuálního zařízení
instance_number Identifikátor GUID představující aktuální modul runtime. Při restartování se resetují všechny metriky. Tento identifikátor GUID usnadňuje odsouhlasení restartování.

Ve formátu expozice Prometheus existují čtyři základní typy metrik: čítač, měřidlo, histogram a souhrn. Další informace o různých typech metrik najdete v dokumentaci k typům metrik Prometheus.

Quantily poskytované pro předdefinovaný histogram a souhrnné metriky jsou 0,1, 0,5, 0,9 a 0,99.

Modul EdgeHub vytvoří následující metriky:

Název Dimenze Popis
edgehub_gettwin_total source (zdroj operace)
id (ID modulu)
Typ: čítač
Celkový počet volání GetTwin
edgehub_messages_received_total route_output (výstup odeslané zprávy)
id
Typ: čítač
Celkový počet zpráv přijatých od klientů
edgehub_messages_sent_total from (zdroj zprávy)
to (cíl zprávy)
from_route_output
to_route_input (cílový vstup zprávy)
priority (priorita zprávy do cíle)
Typ: čítač
Celkový počet zpráv odeslaných klientům nebo upstream
to_route_input je prázdná, když to je $upstream
edgehub_reported_properties_total target(aktualizovat cíl)
id
Typ: čítač
Celkový počet volání aktualizací ohlášených vlastností
edgehub_message_size_bytes id
Typ: souhrn
Velikost zprávy od klientů
Hodnoty mohou být hlášeny, jako NaN by se po určité časové období (aktuálně 10 minut) nezjistit žádná nová měření; pro summary typ, odpovídající _count čítače a _sum čítače se vygenerují.
edgehub_gettwin_duration_seconds source
id
Typ: souhrn
Doba potřebná k získání operací dvojčete
edgehub_message_send_duration_seconds from
to
from_route_output
to_route_input
Typ: souhrn
Čas potřebný k odeslání zprávy
edgehub_message_process_duration_seconds from
to
priority
Typ: souhrn
Doba potřebná ke zpracování zprávy z fronty
edgehub_reported_properties_update_duration_seconds target
id
Typ: souhrn
Doba potřebná k aktualizaci ohlášených vlastností
edgehub_direct_method_duration_seconds from (volající)
to (přijímač)
Typ: souhrn
Doba potřebná k vyřešení přímé zprávy
edgehub_direct_methods_total from
to
Typ: čítač
Celkový počet odeslaných přímých zpráv
edgehub_queue_length endpoint (zdroj zprávy)
priority (priorita fronty)
Typ: měřidlo
Aktuální délka fronty edgeHubu pro danou prioritu
edgehub_messages_dropped_total reason (no_route, ttl_expiry)
from
from_route_output
Typ: čítač
Celkový počet odebraných zpráv z důvodu důvodu
edgehub_messages_unack_total reason (storage_failure)
from
from_route_output
Typ: čítač
Celkový počet nepřiznaných zpráv, protože selhání úložiště
edgehub_offline_count_total id Typ: čítač
Celkový počet, kolikrát edgeHub přešel do offline režimu
edgehub_offline_duration_seconds id Typ: souhrn
Časové hraniční centrum bylo offline
edgehub_operation_retry_total id
operation (název operace)
Typ: čítač
Celkový počet opakování operací EdgeHubu
edgehub_client_connect_failed_total id
reason (není ověřeno)
Typ: čítač
Celkový počet neúspěšných připojení klientů k EdgeHubu

Modul edgeAgent vytvoří následující metriky:

Název Dimenze Popis
edgeAgent_total_time_running_correctly_seconds module_name Typ: měřidlo
Doba, po kterou byl modul zadán v nasazení a byl ve spuštěném stavu
edgeAgent_total_time_expected_running_seconds module_name Typ: měřidlo
Doba, po kterou byl modul zadán v nasazení
edgeAgent_module_start_total module_name, module_version Typ: čítač
Počet, kolikrát agent edgeAgent požádal docker o spuštění modulu
edgeAgent_module_stop_total module_name, module_version Typ: čítač
Kolikrát agent edgeAgent požádal docker o zastavení modulu
edgeAgent_command_latency_seconds command Typ: měřidlo
Jak dlouho trvalo spuštění daného příkazu dockeru. Možné příkazy: vytvoření, aktualizace, odebrání, spuštění, zastavení a restartování
edgeAgent_iothub_syncs_total Typ: čítač
Kolikrát se agent edge pokusil synchronizovat své dvojče s iotHubem, a to jak úspěšně, tak neúspěšně. Toto číslo zahrnuje agenta, který žádá o dvojčete, i centrum s oznámením o aktualizaci dvojčete.
edgeAgent_unsuccessful_iothub_syncs_total Typ: čítač
Kolikrát se agent edgeAgent nepodařilo synchronizovat jeho dvojče s iotHubem.
edgeAgent_deployment_time_seconds Typ: čítač
Doba, kterou trvalo dokončení nového nasazení po přijetí změny
edgeagent_direct_method_invocations_count method_name Typ: čítač
Kolikrát se volá integrovaná přímá metoda edgeAgent, například Ping nebo Restart.
edgeAgent_host_uptime_seconds Typ: měřidlo
Jak dlouho je hostitel zapnutý
edgeAgent_iotedged_uptime_seconds Typ: měřidlo
Jak dlouho iotedged běží
edgeAgent_available_disk_space_bytes disk_name, , disk_filesystemdisk_filetype Typ: měřidlo
Množství volného místa na disku
edgeAgent_total_disk_space_bytes disk_name, , disk_filesystemdisk_filetype Typ: měřidlo
Velikost disku
edgeAgent_used_memory_bytes module_name Typ: měřidlo
Množství paměti RAM používané všemi procesy
edgeAgent_total_memory_bytes module_name Typ: měřidlo
K dispozici je paměť RAM
edgeAgent_used_cpu_percent module_name Typ: histogram
Procento procesoru používaného všemi procesy
edgeAgent_created_pids_total module_name Typ: měřidlo
Počet procesů nebo vláken, které kontejner vytvořil
edgeAgent_total_network_in_bytes module_name Typ: měřidlo
Počet bajtů přijatých ze sítě
edgeAgent_total_network_out_bytes module_name Typ: měřidlo
Počet bajtů odeslaných do sítě
edgeAgent_total_disk_read_bytes module_name Typ: měřidlo
Počet bajtů přečtených z disku
edgeAgent_total_disk_write_bytes module_name Typ: měřidlo
Počet bajtů zapsaných na disk
edgeAgent_metadata edge_agent_version, , experimental_featureshost_information Typ: měřidlo
Obecná metadata o zařízení Hodnota je vždy 0, informace se zakódují do značek. Všimněte si experimental_features a host_information jsou to objekty JSON. host_information vypadá jako {"OperatingSystemType": "linux", "Architecture": "x86_64", "Version": "1.2.7", "Provisioning": {"Type": "dps.tpm", "DynamicReprovisioning": false, "AlwaysReprovisionOnStartup": false}, "ServerVersion": "20.10.11+azure-3", "KernelVersion": "5.11.0-1027-azure", "OperatingSystem": "Ubuntu 20.04.4 LTS", "NumCpus": 2, "Virtualized": "yes"}. Poznámka ServerVersion : Jedná se o verzi Dockeru a Version jedná se o verzi démona zabezpečení IoT Edge.

Další kroky