Azure SRE Aracısı'nda olay yanıtını otomatikleştirme

Ajanınız siz uyurken olayları izler, araştırır ve çözümler. Zaman içinde daha akıllı olmak için her düzeltmeden öğrenir. Bağlam değiştirmeyi 03:00'te durdurun.

Tip

  • Temsilciniz olayları kaydeder ve saniyeler içinde araştırmaya başlar.
  • Günlükler, ölçümler, dağıtımlar ve geçmiş olaylar arasında otomatik olarak bağıntı oluşturur.
  • Çalıştırma modunuz temelinde otonom olarak düzeltmeler önerir veya çözümler.
  • Bellekte yakalanan bilgiler, gelecekteki olay işlemeyi geliştirir.
  • Derin bağlantılar aracılığıyla inceleme konularını ekip arkadaşlarınızla paylaşır.

Sorun: Saat 03:00, beş tane sekme ve tükenmiş bir mühendis

Uyarı 03:00'da tetiklendiğinde, yalnızca uyanmazsınız, bağlamı değiştirirsiniz. Neyin yanlış olduğunu görmek için PagerDuty'yi, ölçümler için Grafana'yı, ardından hatalar için Log Analytics'i, başka birinin bir şey bilip bilmediğini görmek için Slack'i ve ardından en son altı ay önce güncelleştirilmiş bir runbook'u açarsınız.

Bu arada, saat ortalama çözümleme sürenizi (MTTR) işaret ediyor. Bu sorunun nasıl düzeltileceğine dair bilgi, geçmiş bir olayda, bir ekip arkadaşının kafasında veya kimsenin okumadığı bir runbook'ta bulunabilir. Ama saat 3'te bulamıyorsun.

Temsilciniz bu sorunu nasıl çözer?

Bir olay meydana geldiğinde ajanınız saniyeler içinde çalışmaya başlar.

Olay yanıt akışını gösteren diyagram: uyarı tetikler, aracı onaylar, bağlam toplar, hipotez oluşturur, doğrular ve çözümler veya yükseltir.

Temsilci bu adımları izler.

  1. Olay platformunuzda (PagerDuty, ServiceNow veya Azure İzleyici) uyarıyı kabul eder.
  2. Gözlemlenebilirlik araçlarınızı sorgular : Azure İzleyici, Application Insights ve MCP aracılığıyla Kusto veya Microsoft dışı araçlar gibi bağlı kaynaklar .
  3. Kaynak denetimine bağlandıysanız veya dağıtıma duyarlı bir özel aracı derlediyseniz dağıtım geçmişiyle bağıntılı olur.
  4. Benzer sorunlar için belleği denetler - "Bu hatayı üç hafta önce gördük. Bunu düzeltenler şunlardır."
  5. Neyin yanlış gittiğiyle ilgili hipotezler oluşturur ve her birini kanıtla doğrular.
  6. Bir düzeltme önerir veya çalıştırma modunuzu temel alarak otonom olarak çözümler.

Uyandığınızda, olay tam bir akıl yürütme iziyle çözülür veya onayınızı bekleyen net bir öneriniz olur.

Bu yaklaşımı farklı kılan nedir?

Ajanınız çeşitli kilit yollarla geleneksel yaklaşımları geliştirir.

Runbook'lardan farklı olarak, ajanınız her olaydan öğrenir. Bir düzeltme işe yaradığında, bunu hatırlar. Bilgi bankasına bir runbook eklediğinizde, temsilciniz buna otomatik olarak başvurur. Runbook'lar eskir; temsilcinizin belleği giderek daha akıllı hale gelir.

Betiklerden farklı olarak, aracınız uyarlanabilir. Betik, bağlamdan bağımsız olarak aynı adımları çalıştırır. Aracınız belirli bir durumla ilgili nedenler oluşturur ve neyin yanlış olduğunu anlamak için tüm bağlı kaynaklar arasında kanıt ilişkilendirmek için çalışır.

Panolardan farklı olarak, temsilciniz eylem gerçekleştirir. Gösterge Panelleri, yorumlamanız için verileri görünür hale getirir. Aracınız verileri yorumlar, hipotezler oluşturur ve çözümler önerir. Bu çalışma tamamlandıktan sonra ham ölçümleri değil sonuçları gözden geçirirsiniz.

Önce ve sonra

Aşağıdaki tabloda, el ile olay yanıtı aracı destekli olay yanıtıyla karşılaştırılır.

Alan Önce Sonra
Teşekkür İnsanların uyanmasını bekleyin Aracı hemen onay verir
Açılan araçlar 5'den fazla sekme 0 (temsilci bunu halleder)
Araştırma Araçlar arasında elle ilişkilendirme Aracı tüm kaynakları otomatik olarak sorgular
Yakalanan bilgi Mühendisin kafasında Belleğe kaydedildi
Uyku kesintiye uğradı Evet Hayır
Bulguları paylaşma Gezinti yolunu ekran görüntüsü veya açıklama Bağlantıyı kopyala, Teams'e yapıştır

Soruşturma konularını paylaşma

Etkin bir olay sırasında ekibinizin, yazılım aracının bulduklarını bildiğinden emin olmanız gerekir. Her inceleme başlığında, paylaşılabilir bir derin bağlantı oluşturan İş parçacığına bağlantıyı kopyala seçeneği vardır. Teams veya Slack'e yapıştırın.

Konu bağlantısını kopyalamak için:

  1. Herhangi bir olay araştırma konusunu açın.
  2. İş parçacığı başlığının yanındaki (diğer seçenekler) düğmesini seçin.
  3. İş parçacığına bağlantıyı kopyala'yı seçin.

Kopyalanan URL, erişim yöntemleri arasında çalışır. Ajanınıza erişimi olan alıcılar bağlantıyı seçer ve doğrudan araştırma konusuna yönlendirilir.

İş parçacığı bağlantıları ne zaman paylaşılır:

  • Olay köprüsü toplantısı sırasında temsilcinin kök neden analizini ekiple paylaşın.
  • Olay sonrası incelemelerde doğrudan soruşturma konusuna kanıt olarak bağlantı kurun.
  • İkinci bir görüş için ekip arkadaşınıza belirli bir bulgu gönderin.

Başlayın

Kaynak Ne öğreneceksiniz?
Olay yanıtlarını otomatikleştirme Olay platformunuzu bağlayın, yanıt planları oluşturun ve temsilcinizin gerçek bir olayı işlemesini izleyin

Sonraki adım