Gözlemlenebilirlik ile işlemleri geliştirme
- 15 dakika
|
|
|---|
İş yüklerini izleyerek ve Azure Well-Architected Framework'ün tüm yapılarını göz önünde bulundurarak ekibin her zaman kaliteyi artırmayı aradığı bir kültür oluşturun. Ekip ve paydaşlara ihtiyaç duydukları verileri (istatistikler, eğilimler ve içgörüler gibi) verin; böylece hızlı düzeltmeler veya uzun vadeli planlama için akıllı kararlar alabilirler. Daha iyi olmaya devam etmek için verilerden öğrendiklerini kullanın.
Gözlemlenebilirlik için tasarlanan operasyonlar sorunlardan önde kalmanıza, kalite ve güvenliği korumanıza, büyüme planı oluşturmanıza ve ürünü daha etkili bir şekilde yönetmenize yardımcı olur.
İzlemenin önemli bir parçası, müşterileri etkileyen büyük olaylara dönüşmeden önce sorunları bulmanıza yardımcı olan sistem durumu modellemedir. Verimli izleme, sorunlara tepki vermek için daha az zaman ve deneyimi geliştirmek için daha fazla zaman anlamına gelir.
Örnek senaryo
Contoso, yeni işe alım yapanlara ve yeniden yer alan çalışanlara yardımcı olmak için Contoso Real Estate adlı bir iç web uygulaması oluşturmş. İnsanların taşımaları sırasında kısa süreli konut aramalarına ve rezervasyonlarına olanak tanır. İk ekibi, yeniden konumlandırma işlemine yardımcı olmak için uygulamayı da kullanır.
Uygulama canlı ve tamamen Azure'da barındırılır. Azure Container Apps kullanılarak mikro hizmetler üzerine derlenir ve ayrıca Azure İşlevleri, PostgreSQL için Azure Veritabanı, Azure Blob Depolama ve Azure İzleyici'yi kullanır.
Telemetri aracılığıyla iş yükünüzü görüntüleme
Yüksek düzey eğilimlerden ayrıntılı eylemlere kadar tüm resmi görebilmeniz için, çalışma şekliyle ilgili temel adımları bağlayan uygulama kodundan telemetriyi yakalayın.
Sorunun ne kadar ciddi olduğuna göre eylemlerin önceliğini belirleyin ve bağlamı anlamak için ayrıntıları anlayın. Bu bilgiler sorun giderme amacıyla çok önemlidir.
Contoso'nun sınaması
Contoso Real Estate uygulamasında yapılan son güncelleştirmeden sonra, kullanıcılar arama sayfasının bazen boş bir ekran veya genel bir hata iletisi göstermesiyle ilgili bir sorun olduğunu bildiriyor. Bu her seferinde gerçekleşmez ve genellikle sayfayı yenilemek veya aramayı yeniden denemek bunu düzeltir.
Ekip, arama mikro hizmeti için günlükleri denetlediğinde daha fazla hata, özellikle PostgreSQL için Azure Veritabanı'na bağlanmaya çalışırken zaman aşımları fark etti. Ancak, bu hataların ön uçta kullanıcıların gördüğü sorunlara neden olan hatalarla aynı olup olmadığını anlayamazlar.
Yaklaşımı ve sonuçları uygulama
Geliştirme ekibi, neyin yanlış gittiğini bulmak için hem web uygulamasında hem de temel mikro hizmetlerde günlüğe kaydetmeyi genişletmeye karar verdi. Özellikle arama özelliği için arama terimlerini, isteğin saatini, istemci IP adresini ve aramaya bağlı kullanıcı adını günlüğe kaydeder. Bu ek bilgiler, noktaları sistemin farklı bölümlerine bağlamalarına yardımcı olmalıdır.
Bu değişiklik, ekibin kullanıcı sorunlarının kök nedeninin en son uygulama güncelleştirmesinde düzgün işlenmemiş veritabanı sorgusu zaman aşımları olduğunu onaylamasına yardımcı oldu. Bunu fark ettikten sonra, düzeltmek oldukça basitti.
Ekip, tüm çözüm katmanlarını kapsayan daha eksiksiz bir dağıtılmış izleme çözümü oluşturmak için OpenTelemetry kullanarak yeni bir yaklaşım tasarlıyor.
Panolarda izleme verilerini görselleştirme
Hedef kitlenize özgü izleme verilerini göstermek ve büyük resmi göz önünde bulundurmak için panolardaki verileri toplayın ve görselleştirin. Önemli bilgileri vurgulamak ve paydaşlara içgörü sağlamak için durumsal panoları kullanın. Olay yanıtı gibi işleç etkinlikleri için detaya gitme özelliklerine sahip operasyonel panoları ve çalışma kitaplarını kullanın. Panoları sık sık yenileyin ve ayrıntılı bilgiler sağlayın.
Eğilimleri analiz etmek, iş hedeflerine göre izlemek ve olayları yönetmek için görselleştirmeleri kullanabilirsiniz.
Müşterinin ilgi alanına göre uyarlanmış panoları anlamak ve ekiplerin sorunları yakalamasına ve daha hızlı harekete geçmelerine yardımcı olmak daha kolaydır.
Contoso'nun sınaması
- İş yükü ekibi, tüm çözüm katmanlarından telemetri verilerini geliştirme ve operasyon ekipleri ve diğer paydaşlar da dahil olmak üzere herkesin erişebileceği tek bir Log Analytics çalışma alanında toplar. Ancak bu verilerle çalışmak kolay değildir. Karmaşık ve hantaldır, bu da arka plan gürültüsünü eyleme dönüştürülebilir verilerden ayırmaya çalışan ekip üyeleri için can sıkıcıdır.
Yaklaşımı ve sonuçları uygulama
Ekip, panoları kullanarak verileri toplamak ve görselleştirmek için çaba sarf eder. Her pano belirli bir hedef kitleye göre uyarlanmıştır:
Paydaşlar için panolar genel çözüm durumu, kullanıcı sayısı, aramalar ve rezervasyonlar gibi büyük resme daha fazla odaklanır. Çözümün iş açısından nasıl performans sergilediğinden net bir görünüm sağlar.
operasyon ekibi için panolar ve çalışma kitapları daha ayrıntılı veriler ve belirli alanlarda detaya gitme özelliğiyle daha derine iner. Bu panolar sorun giderme, olay yanıtı ve günlük izleme konusunda yardımcı olur.
Panolar kullanıcıların eğilimleri analiz etmelerine, iş hedeflerini izlemelerine ve olayları daha etkili bir şekilde yönetmelerine olanak tanır. Her panoda hedeflenen hedef kitleyle daha ilgili olan ve ilgi alanlarına ve ihtiyaçlarına göre yönlendiren veriler bulunur.
Sağlam bir uyarı stratejisi tasarlama
Uyarıları net açıklamalar ve önem derecesi düzeyleriyle doğru kişilere göndererek eyleme dönüştürülebilir hale getirin. Her şeyin tek bir yerde olması için farklı kaynaklardan bilgiler ekleyin ve iş hedefleriyle uyumlu olmayan her şeyi izleyin.
Yalnızca eylem gerektiren olaylar için uyarıları tetikleyin ve sorunları tam bir hata haline gelmeden önce düzeltmenize yardımcı olacak proaktif uyarıları hedefleyin. İyi bir uyarı sistemi size neyin yanlış olduğunu, ne kadar ciddi olduğunu söylemeli ve her şeyi net ve eyleme dönüştürülebilir hale getirmek için yeterli bilgiyi vermelidir. Böylece ekip, zaman kaybetmeden sorunları çözmek için doğrudan atlayabilir.
Contoso'nun sınaması
Contoso, bir sorun olduğunda operasyon ekibine uyarı göndermek için Azure İzleyici'yi kullanır. Ancak ekip şu anda ilgisiz, belirsiz veya yedekli çok fazla uyarı alıyor. Bu, uyarı yorgunluğuna neden olur. Ekipte önemli uyarılar eksik ve üretkenlik yavaşlar.
Ayrıca, uyarının herkese haber vermesinin önüne geçebilecek veya en aza indirilmiş olabilecek bazı kesinti durumları da olmuştur. Örneğin, veritabanı sorgu işleme süresindeki yavaşlamaların kesintilere neden olduğu durumlar olmuştur. Ekibin bu yavaşlamalara daha önce bayrak ekleyen daha akıllı uyarıları olsaydı, sistem başarısız olmadan önce içeri adım atabilirdi.
Yaklaşımı ve sonuçları uygulama
İşlem ekibi, yalnızca kirlilik ekleyen düşük öncelikli tüm uyarılardan kurtulmak için bir temizleme çalışması başlatır. Yalnızca kritik ve eyleme dönüştürülebilir uyarıların etkin kalmasına izin verilir. Ekibin daha fazla bilgiye gerek kalmadan sorunu çözebilmesi için yeterli bağlam sağladıklarından emin olmak için kalan uyarıları da gözden geçiriyorlar.
Bir hata gerçekleşmeden önce eyleme geçmelerini sağlayacak yeni proaktif, eyleme dönüştürülebilir uyarılar ayarlama fırsatına sahip olurlar. Örneğin, veritabanı sorgu performansında kararlı bir yavaşlama göründüğünde veritabanı yöneticilerine bildirim göndermek için yeni bir uyarı eklediler.
Bir sonraki adımda veritabanı yavaşlaması gibi yaygın uyarılara verilen yanıtları otomatikleştirmenin yollarını keşfediyorlar.
Bilgilerinizi kontrol edin
Geri Bildirim
Bu sayfayı yararlı buldunuz mu?
No
Bu konu hakkında yardıma mı ihtiyacınız var?
Bu konuyu açıklığa kavuşturmak veya bu konuda size yol göstermek için Ask Learn'ü kullanmayı denemek ister misiniz?