Sdílet prostřednictvím


Osvědčené postupy monitorování a diagnostiky pro Azure Service Fabric

Monitorování a diagnostika jsou důležité pro vývoj, testování a nasazení úloh v jakémkoli cloudovém prostředí. Můžete například sledovat, jak se používají vaše aplikace, akce prováděné platformou Service Fabric, využití prostředků pomocí čítačů výkonu a celkový stav clusteru. Tyto informace můžete použít k diagnostice a opravě problémů a zabránění jejich výskytu v budoucnu.

Monitorování aplikace

Monitorování aplikací sleduje, jak se používají funkce a komponenty vaší aplikace. Monitorujte aplikace, abyste měli jistotu, že se zachytily problémy, které mají dopad na vaše uživatele. Monitorování aplikací je zodpovědností těch, kdo aplikaci a její služby vyvíjejí, protože je jedinečné pro obchodní logiku vaší aplikace. Doporučujeme nastavit monitorování aplikací pomocí Application Insights, nástroje pro monitorování aplikací Azure.

Monitorování clusteru

Jedním z cílů Service Fabric je zajistit odolnost aplikací vůči selhání hardwaru. Tohoto cíle je dosaženo díky schopnosti systémových služeb platformy zjišťovat problémy s infrastrukturou a rychle převzít služby při selhání na jiné uzly v clusteru. Ale co když mají problémy samotné systémové služby? Nebo při pokusu o nasazení nebo přesunutí úlohy dojde k porušení pravidel pro umístění služeb? Service Fabric poskytuje diagnostiku těchto a dalších problémů, abyste měli jistotu, že máte informace o tom, jak platforma Service Fabric komunikuje s vašimi aplikacemi, službami, kontejnery a uzly.

U clusterů s Windows se doporučuje nastavit monitorování clusteru pomocí agenta diagnostiky a protokolů služby Azure Monitor.

Pro clustery s Linuxem jsou protokoly Azure Monitor také doporučeným nástrojem pro monitorování platformy a infrastruktury Azure. Diagnostika platformy Linux vyžaduje jinou konfiguraci, jak je uvedeno v událostech linuxových clusterů Service Fabric v Syslogu.

Monitorování infrastruktury

Protokoly Služby Azure Monitor se doporučují pro monitorování událostí na úrovni clusteru. Jakmile nakonfigurujete agenta Log Analytics s pracovním prostorem, jak je popsáno na předchozím odkazu, budete moct shromažďovat metriky výkonu, jako je využití procesoru, čítače výkonu .NET, jako je využití procesoru na úrovni procesu, čítače výkonu Service Fabric, jako je počet výjimek ze spolehlivé služby, a metriky kontejnerů, jako je využití procesoru. Protokoly kontejneru budete muset zapsat do stdout nebo stderr, aby byly k dispozici v protokolech služby Azure Monitor.

Watchdogs

Obecně platí, že sledovací zařízení je samostatná služba, která sleduje stav a zatížení napříč službami, ping koncové body a hlásí neočekávané události stavu v clusteru. To může pomoct zabránit chybám, které nemusí být zjištěny pouze na základě výkonu jedné služby. Watchdogs jsou také vhodným místem pro hostování kódu, který provádí nápravné akce, které nevyžadují interakci uživatele, jako je čištění souborů protokolu v úložišti v určitých časových intervalech. Pokud chcete plně implementovanou open source službu watchdog SF, která zahrnuje snadno použitelný model rozšiřitelnosti watchdog a která běží v clusterech s Windows i Linuxem, přečtěte si projekt FabricObserver. FabricObserver je software připravený pro produkční prostředí. Doporučujeme nasadit FabricObserver do testovacích a produkčních clusterů a rozšířit ho tak, aby vyhovoval vašim potřebám, a to buď prostřednictvím modelu modulu plug-in, nebo jeho forku a napsáním vlastních integrovaných pozorovatelů. Doporučujeme použít první moduly (moduly plug-in).

Další kroky