Az Azure Service Fabric által felügyelt fürt (SFMC) csomópont automatikus javítása

A Service Fabric által felügyelt fürt (SFMC) hozzáadott egy képességet a fürt automatikus állapotának megőrzéséhez a csomópontok automatikus javításával, ami tovább csökkenti a szükséges üzemeltetési felügyeletet. Ez az új képesség észleli, ha a csomópontok leállnak egy fürtben, és megpróbálják kijavítani őket az ügyfél beavatkozása nélkül. Ebben a dokumentumban megtudhatja, hogyan működik az automatikus csomópontjavítás a Service Fabric által felügyelt fürtcsomópontok esetében.

Hogyan ellenőrzi az SFMC, ha a csomópontok leállnak

A Service Fabric által felügyelt fürt folyamatosan figyeli a csomópontok állapotát, és rögzíti a csomópontok fel-le állásának idejét. Ha egy csomópont egy előre meghatározott időszakra leállását észleli, az SFMC automatikus javítási műveleteket kezdeményez a csomóponton. Ez az előre meghatározott időszak jelenleg 24 óra indításkor van konfigurálva, és a jövőben optimalizálható.

Az automatikus javítás működése

Az SFMC a következő javítási műveleteket hajtja végre a mögöttes virtuális gépen (VM), ha a Service Fabric-csomópontot 24 órán keresztül észleli a rendszer:

  1. Indítsa újra a csomópont mögöttes virtuális gépét.
  2. Ha az újraindítás nem hozza létre a csomópontot, telepítse újra a csomópontot.
  3. Ha az újbóli üzembe helyezés sikertelen a csomópont felhozása érdekében, felszabadíthatja és újra elindíthatja a virtuális gépet.
  4. Ha a felszabadítás nem hozza létre a csomópontot, állítsa újra a csomópontot.

Az SFMC megvárja, amíg a csomópontok minden művelet után biztonsági másolatot készítnek, és ha egy csomópont nem jön létre, az SFMC továbblép a következő műveletre. A csomópont automatikus javítási műveletei általában körülbelül 30 percet vesznek igénybe a kezdés után, de akár három órát is igénybe vehet, amíg átlátják és végrehajtják a leírt műveletek teljes készletét. Nem történik további újrapróbálkozás, ha a csomópont továbbra is leáll, miután az SFMC minden fenti javítási műveletet kipróbált. Az SF mérnökei alternatív szervizeléseket fognak vizsgálni, ha az automatikus javítás nem hozza létre a csomópontot.

Ha az SFMC úgy találja, hogy egy állapot-ellenőrzés során több csomópont is leáll, az egyes csomópontok egyenként lesznek javítva, mielőtt egy másik javítás elkezdődne. Az SFMC a le észlelt sorrendben próbálja helyreállítani a csomópontokat.

Bár a csomópont automatikus javítása a fenti forgatókönyvet ismerteti, az ügyfeleknek továbbra is figyelniük kell fürtjük és erőforrásaik állapotát. Ennek a funkciónak az a célja, hogy a fürtkezelés és -üzemeltetés egyes terheit levegye.

Jövőbeli ütemterv

Ez az indítás a csomópontok automatikus javítási funkciójának első iterációja, és az SFMC a jövőben is továbbfejleszti és kibővíti a hatókört.

Következő lépések