A klaszter felügyelete

Cikk
08/25/2024

Fontos a fürt szintjén monitorozni annak megállapításához, hogy a hardver és a fürt a várt módon működik-e. Bár a Service Fabric képes az alkalmazások hardverhiba idején is futni, de továbbra is diagnosztizálnia kell, hogy hiba történik-e egy alkalmazásban vagy a mögöttes infrastruktúrában. Emellett figyelnie kell a fürtöket, hogy jobban megtervezze a kapacitást, segítve a hardverek hozzáadásával vagy eltávolításával kapcsolatos döntéseket.

A Service Fabric számos strukturált platformeseményt tesz elérhetővé Service Fabric-eseményként az EventStore-on és a különböző naplócsatornákon keresztül.

Windows rendszeren a Service Fabric-események egyetlen ETW-szolgáltatótól érhetők el, és az operatív és az adat- és üzenetkezelési csatornák közötti választáshoz szükséges releváns logLevelKeywordFilters halmazt használjuk – így választjuk el a kimenő Service Fabric-eseményeket, amelyekre szükség szerint szűrni kell.

A Service Fabric és a fürt által végrehajtott magas szintű operatív műveletek, beleértve a hamarosan megjelenő csomópontok eseményeit, az új alkalmazás üzembe helyezését vagy a frissítés visszaállítását stb. Az események teljes listáját itt tekintheti meg.
Működés – részletes
Állapotjelentések és terheléselosztási döntések.

A műveleti csatorna különböző módokon érhető el, beleértve az ETW/Windows eseménynaplókat, az EventStore-t (a Windows 6.2-es és újabb verzióiban érhető el Windows-fürtök esetén). Az EventStore entitásonként (többek között fürt, csomópontok, alkalmazások, szolgáltatások, partíciók, replikák és tárolók) hozzáférést biztosít a fürt eseményeihez, és rest API-kon és Service Fabric-ügyféltáron keresztül teszi elérhetővé őket. Az EventStore használatával figyelheti a fejlesztői/tesztelési fürtöket, és pontos ismereteket szerezhet az éles fürtök állapotáról.

Adatok > üzenetkezelés
Az üzenetkezelésben létrehozott kritikus naplók és események (jelenleg csak a ReverseProxy) és az adatútvonal (megbízható szolgáltatási modellek).
Adat- és üzenetkezelés – részletes
Részletes csatorna, amely a fürt adataiból és üzenetkezeléséből származó összes nem kritikus naplót tartalmazza (ez a csatorna nagy mennyiségű eseményt tartalmaz).

Ezeken kívül két strukturált EventSource-csatornát is biztosítunk, valamint a támogatási célokra gyűjtött naplókat.

A Reliable Services eseményei
Programozási modell specifikus eseményei.
A Reliable Actors eseményei
Programozási modellspecifikus események és teljesítményszámlálók.
Támogatási naplók
A Service Fabric által létrehozott rendszernaplókat csak akkor használjuk, ha támogatást nyújtunk.

Ezek a különböző csatornák az ajánlott platformszintű naplózás nagy részét lefedik. A platformszintű naplózás javítása érdekében fontolja meg az állapotmodell jobb megértését és egyéni állapotjelentések hozzáadását, valamint egyéni teljesítményszámlálók hozzáadását a szolgáltatások és alkalmazások fürtre gyakorolt hatásának valós idejű megértéséhez.

A naplók előnyeinek kihasználásához erősen ajánlott engedélyezni a "Diagnosztika" használatát a fürt létrehozása során az Azure Portalon. A diagnosztika bekapcsolásával a fürt üzembe helyezésekor az Azure Diagnostics képes elismerni az operatív, a reliable services és a reliable actors csatornákat, és tárolni az adatokat az Összesítési események az Azure Diagnostics szolgáltatással című témakörben leírtak szerint.

Az Azure Service Fabric állapot- és terhelésjelentése

A Service Fabric saját állapotmodellel rendelkezik, amelyet az alábbi cikkek részletesen ismertetnek:

Az állapotmonitorozás kritikus fontosságú a szolgáltatás üzemeltetése szempontjából, különösen egy alkalmazásfrissítés során. A szolgáltatás minden frissítési tartományának frissítése után a frissítési tartománynak állapot-ellenőrzéseket kell végrehajtania, mielőtt az üzembe helyezés a következő frissítési tartományra kerül. Ha az OK állapot nem érhető el, a rendszer visszaállítja az üzembe helyezést, hogy az alkalmazás ismert OK állapotban maradjon. Bár egyes ügyfelekre hatással lehet a szolgáltatások visszaállítása, a legtöbb ügyfél nem fog problémát tapasztalni. Emellett a megoldás viszonylag gyorsan történik anélkül, hogy várnia kellene egy emberi operátor beavatkozására. Minél több állapotellenőrzés van beépítve a kódba, annál rugalmasabb a szolgáltatás üzembe helyezési problémái.

A szolgáltatás állapotának egy másik aspektusa a szolgáltatásból származó metrikák jelentése. A metrikák azért fontosak a Service Fabricben, mert az erőforrás-használat kiegyensúlyozására szolgálnak. A metrikák a rendszerállapot mutatói is lehetnek. Előfordulhat például, hogy egy alkalmazás több szolgáltatást is biztosít, és minden példány másodpercenként egy kérést (RPS) jelent. Ha egy szolgáltatás több erőforrást használ, mint egy másik szolgáltatás, a Service Fabric áthelyezi a szolgáltatáspéldányokat a fürt köré, hogy megpróbálja fenntartani az egyenletes erőforrás-kihasználtságot. Az erőforrás-kihasználtság működésével kapcsolatos részletesebb magyarázatért lásd: Erőforrás-felhasználás és terhelés kezelése a Service Fabricben metrikákkal.

A metrikák segítségével betekintést nyerhet a szolgáltatás teljesítményébe. Idővel metrikákkal ellenőrizheti, hogy a szolgáltatás a várt paramétereken belül működik-e. Ha például a trendek azt mutatják, hogy hétfő reggel 9 órakor az átlagos RPS 1000, akkor beállíthat egy állapotjelentést, amely riasztást küld, ha az RPS 500 alatt vagy 1500 felett van. Lehet, hogy minden tökéletesen rendben van, de érdemes lehet megnézni, hogy az ügyfelek nagyszerű élményben vannak-e. A szolgáltatás olyan metrikákat definiálhat, amelyek állapot-ellenőrzés céljából jelenthetők, de ez nem befolyásolja a fürt erőforrás-kiegyensúlyozását. Ehhez állítsa a metrika súlyát nullára. Azt javasoljuk, hogy az összes metrikát nullával kezdje, és ne növelje a súlyt, amíg biztosan nem tudja, hogy a metrikák súlyozása milyen hatással van a fürt erőforrás-kiegyensúlyozására.

Tipp.

Ne használjon túl sok súlyozott metrikát. Nehéz lehet megérteni, hogy miért helyezik át a szolgáltatáspéldányokat a kiegyensúlyozáshoz. Néhány metrika hosszú utat vehet igénybe!

Minden olyan információ, amely az alkalmazás állapotát és teljesítményét jelzi, a metrikák és állapotjelentések jelöltje. A processzorteljesítmény-számlálók meg tudják állapítani, hogyan használják a csomópontot, de nem jelzi, hogy egy adott szolgáltatás kifogástalan állapotban van-e, mivel több szolgáltatás is futhat egyetlen csomóponton. Azonban az olyan metrikák, mint az RPS, a feldolgozott elemek és a kérés késése, mind jelezhetik egy adott szolgáltatás állapotát.

Service Fabric támogatási naplók

Ha segítségre van szüksége a Microsoft ügyfélszolgálatához az Azure Service Fabric-fürttel kapcsolatban, a támogatási naplókra szinte mindig szükség van. Ha a fürt az Azure-ban van üzemeltetve, a rendszer automatikusan konfigurálja és gyűjti a támogatási naplókat egy fürt létrehozása során. A naplók egy dedikált tárfiókban vannak tárolva a fürt erőforráscsoportjában. A tárfióknak nincs rögzített neve, de a fiókban a blobtárolók és a hálóval kezdődő nevű táblák láthatók. Az önálló fürtök naplógyűjteményeinek beállításáról további információt az önálló Azure Service Fabric-fürt létrehozása és kezelése, valamint az önálló Windows-fürtök konfigurációs beállításainak létrehozása és kezelése című témakörben talál. Önálló Service Fabric-példányok esetén a naplókat egy helyi fájlmegosztásba kell küldeni. Ezekhez a naplókhoz támogatásra van szükség, de a Microsoft ügyfélszolgálatán kívül senki nem használhatja őket.

Teljesítmény mérése

A fürt teljesítményének mérésével megtudhatja, hogyan képes kezelni a terhelést, és hogyan hozhat döntéseket a fürt skálázásával kapcsolatban (további információ a fürtök Azure-beli vagy helyszíni skálázásáról). A teljesítményadatok akkor is hasznosak, ha összehasonlítjuk az Ön vagy az alkalmazások és szolgáltatások által a naplók jövőbeni elemzése során végrehajtott műveleteket.

A Service Fabric használatakor gyűjtendő teljesítményszámlálók listáját a Teljesítménymetrikák című témakörben találja .

A fürt teljesítményadatainak gyűjtését kétféleképpen állíthatja be:

Ügynök használata
Ez az előnyben részesített módszer a teljesítmény gépről történő gyűjtésére, mivel az ügynökök általában a lehetséges teljesítménymetrikák listáját gyűjtik össze, és viszonylag egyszerű folyamat kiválasztani a összegyűjteni vagy módosítani kívánt metrikákat. A Service Fabric Azure Monitor-naplóintegrációjában Azure Monitor-naplókat kínáló Azure Monitor-naplók ismertetése és a Log Analytics-ügynök beállítása a Log Analytics-ügynökkel kapcsolatos további információkért. Ez az egyik olyan monitorozási ügynök, amely képes a fürt virtuális gépek és az üzembe helyezett tárolók teljesítményadatainak felvételére.
Teljesítményszámlálók az Azure Table Storage-hoz
A teljesítménymetrikákat az eseményekkel megegyező táblatárolóba is küldheti. Ehhez módosítani kell az Azure Diagnostics konfigurációját, hogy a fürtben lévő virtuális gépekről vegye fel a megfelelő teljesítményszámlálókat, és lehetővé kell tennie, hogy docker-statisztikákat vegyen fel, ha bármilyen tárolót üzembe helyez. További információ a teljesítményszámlálók wad-ban való konfigurálásáról a Service Fabricben a teljesítményszámláló-gyűjtemény beállításához.

Következő lépések

Tudnivalók a Service Fabric Azure Monitor-naplók integrációjáról a fürtdiagnosztika gyűjtéséhez és egyéni lekérdezések és riasztások létrehozásához
Ismerje meg a Service Fabric beépített diagnosztikai élményét, az EventStore-t
A Service Fabric néhány gyakori diagnosztikai forgatókönyvének végigjárása

Megosztás a következőn keresztül:

A klaszter felügyelete

Az Azure Service Fabric állapot- és terhelésjelentése

Service Fabric támogatási naplók

Teljesítmény mérése

Következő lépések

Visszajelzés

További források