İş yükleri için sistem durumu modellemesi

Bulut uygulamaları yüksek hacimli işletimsel veriler oluşturur ve bu da sorunları hızla belirlemeyi ve çözmeyi zorlaştırır. Bu zorluğun yaygın nedenlerinden biri, iş yükünün işlevselliğine göre özelleştirilmiş bir sistem durumu temelinin olmaması ve bu temelden kaymayı algılayamamadır.

Sistem durumu modellemesi, iş yükünün genel durumunu belirlemek için iş bağlamını ham izleme verileriyle birleştiren bir gözlemlenebilirlik alıştırmasıdır. İş yükünü izleyebildiğiniz bir temel ayarlamanıza yardımcı olur. Altyapı ve uygulama bileşenlerinden alınan telemetri gibi verileri dikkate almanız gerekir. Sistem durumu modellemesi, iş yükünün kalite hedeflerine ulaşmak için gereken diğer bilgileri de içerebilir.

Performans sorunları veya işletimsel düşüş beklenen operasyonel durumdan kaymaya neden olabilir. Bir iş yükünün durumunu modelleyerek kaymayı belirleyebilir ve iş etkisini dikkate alan bilinçli operasyonel kararlar alabilirsiniz.

Sağlık modellemesi, aşiret operasyonel bilgisi ile eyleme dönüştürülebilir içgörüler arasındaki boşluğu kapatır. Kritik sorunları etkili bir şekilde yönetmenize yardımcı olur. Bu kavram, güvenilirliği ve operasyonel verimliliği en üst düzeye çıkarmak için gereklidir.

Bu kılavuz, bir iş yükünün ve tüm alt sistemlerinin çalışma zamanı durumunu değerlendiren bir model oluşturma dahil olmak üzere sistem durumu modellemesi hakkında pratik rehberlik sağlar.

Terminoloji Tanım
Sistem durumu modelleme İzleme verilerini sistem durumu olarak yorumlamak için iş bağlamı kullanan bir gözlemlenebilirlik alıştırması.
Sistem durumu modeli Belirli bir kapsam için mantıksal varlıkların ve bunların ilişkilerinin grafik gösterimi. Her düğümün model genelinde izleme verilerini rasyonalize etmek için bir sistem durumu tanımı vardır.
Sistem durumu varlığı Bir sistemin tek bir birimini, birden çok ilgili varlığın mantıksal bir birleşimini veya sistemin genelini temsil eden mantıksal bileşen.
Sistem durumu Bir varlığın durumu hakkında anlamlı operasyonel içgörüler sağlayan tanımlı ve ölçülebilir durum.
Sistem durumu sinyali Bir varlığın işletimsel davranışıyla ilgili içgörüler sağlayan tek tek veri akışları.
Model modeli Varlıkların bileşen sistemleri için farklı sistem durumu modellerini temsil ettiği bir toplu modelleme kapsamı.

Sağlık modellemesi hakkında üst düzey bir anlayış elde etmek için bu videoya watch öneririz.

Sağlık, sağlık modelleme ve sağlık modeli nedir?

Sistem durumu terimi, bir varlığın işletimsel durumunu ve bağımlılıklarını ifade eder. Bu varlık bir sistemin tek bir birimi, birden çok ilgili varlığın mantıksal bir birleşimi veya genel sistem olabilir.

Sistem durumunu üç durumdan birinde temsil ettiğinizi öneririz:

  • Sağlıklı: En iyi şekilde çalışır ve kalite beklentilerini karşılar

  • Düzeyi düşürülmüş: Olası sorunları gösteren iyi durumdan daha az davranış sergiler

  • İyi durumda değil: Kritik bir durumda ve hemen ilgilenilmesi gerekiyor

Not

Daha fazla veri ayrıntı düzeyi sağlamak için durum yerine bir puanla sistem durumunu temsil edebilirsiniz.

Sistem durumu, izleme verileri etki alanı bilgileriyle birleştirilerek türetilir. Her durum tanımlanmalı ve ölçülebilir olmalıdır. Sistem durumu durumları, bir varlığın çalışma davranışıyla ilgili içgörüler sağlayan bireysel veri akışları olan sistem durumu sinyalleri kullanılarak hesaplanır. Sinyaller ölçümler, günlükler, izlemeler veya diğer kalite özelliklerini içerebilir. Örneğin, bir sanal makine (VM) varlığı için sistem durumu sinyali CPU kullanım ölçümünü izleyebilir. Bu varlığın diğer sinyalleri bellek kullanımı, ağ gecikme süresi veya hata oranlarını içerebilir.

Sistem durumu sinyallerini tanımlarken iş yükü için işlevsel olmayan gereksinimleri dikkate alırsınız. CPU kullanımı örneğine her sistem durumu için beklenen eşikleri ekleyin. kullanım, iş yükü gereksinimlerine uygun olarak tolere edilen eşiği aşarsa sistem , İyi DurumdanDüzeyi Düşürülmüş veya İyi Durumda Olmayan durumuna geçer. Bu durum değişiklikleri uygun uyarıları veya eylemleri tetikler.

Sistem durumu modellemesi, varlıkların birden çok sistem durumu sinyalinden türetilmiş ve iş yükü için bağlamsallaştırılmış iyi tanımlanmış durumlara sahip olmasını gerektirir. Örneğin, bir VM'nin sistem durumu tanımı şu olabilir:

  • sağlıklı: Yanıt süresi, kaynak kullanımı ve genel sistem performansı gibi önemli işlevsiz gereksinimler ve hedefler tam olarak karşılanmıştır. Örneğin, isteklerin %95'i 500 milisaniye içinde işlenir. İş yükü CPU, bellek ve depolama gibi VM kaynaklarını en iyi şekilde kullanır ve iş yükü talepleri ile kullanılabilir kapasite arasında bir denge sağlar. Kullanıcı deneyimi beklenen düzeylerdedir.

  • Düzeyi düşürüldü: Kaynaklar en iyi performansı göstermiyor ancak çalışmaya devam ediyor. Örneğin, depolama diskinde azaltma sorunları yaşanıyor. Kullanıcılar yavaş yanıtlarla karşılaşabilir.

  • İyi durumda değil: Bozulma, tolere edilen sınırların ötesindedir. Kaynaklar artık yanıt vermiyor veya kullanılamıyor ve sistem artık kabul edilebilir performans düzeylerine uygun değil. Kullanıcı deneyimi ciddi şekilde etkilenir.

Sistem durumu modellemesinin sonucu, bir iş yükü mimarisi için mantıksal varlıkların ve bunların ilişkilerinin bir modeli veya grafik gösterimidir. Her düğümün bir sistem durumu tanımı vardır.

Önemli

Sistem durumu modellemesi , iş senaryolarını iyi anladığınızda farklı kapsamlarda uygulayabileceğiniz ve uygulayabileceğiniz soyut bir kavramdır.

Sistem durumu modeli tanımını gösteren diyagram.

Görüntüde:

  • Varlıklar , sistemin yönlerini temsil eden iş yükünün mantıksal bileşenleridir. Bunlar sunucular, veritabanları ve ağlar gibi altyapı bileşenleri olabilir. Bunlar belirli uygulama modülleri, podlar, hizmetler veya mikro hizmetler de olabilir. Ya da varlıklar, iş yükü içindeki kullanıcı etkileşimlerini ve sistem akışlarını yakalayabilir.

    Not

    Kullanıcı ve sistem akışları, uygulama ve altyapı bileşenlerini içeren iş senaryolarında işlevsel olmayan gereksinimleri özetler. Bu özet, uygulamanın iş değerini yansıtır.

  • Varlıklar arasındaki ilişkiler, sistem içindeki bağımlılık zincirlerini yansıtır. Örneğin, bir uygulama modülü ilişki oluşturan belirli altyapı bileşenlerini çağırabilir.

Bir e-ticaret iş yükünün Azure Service Bus kuyruğunda başarısız iletilerde ani bir artış yaşadığı ve bu da ödemelerin başarısız olmasına neden olduğu bir senaryo düşünün. Bu sorun, örtülü gelir kaybı nedeniyle kuruluş için kritik öneme sahiptir. Bir uygulama geliştiricisi bu ölçüm artışının ödemeler üzerindeki etkisini anlayabilse de, bu kabile bilgisi genellikle operasyon ekibi arasında paylaşılmayabilir.

Sistem durumu modeli, operatörlere sorunun ve etkilerinin hemen görünürlüğünü sağlayabilir. Ödeme akışı, iş yükü bileşenlerinden biri olan Service Bus'a bağlıdır. Görsel gösterim, Service Bus örneğinin düşürülmüş durumunu ve ödeme akışı üzerindeki etkisini gösterir. Operatörler sorunun önemini anlayabilir ve düzeltme çalışmalarını söz konusu bileşene odaklayabilir.

Sistem durumu modellemesi önceki senaryoda aşağıdaki yollarla önemliydi:

  • Sorunların ve olası düzeltmelerin daha hızlı algılanmasına yol açan daha hızlı sorun yalıtımı sağlayarak algılama süresini (TTD) ve azaltma süresini (TTM) geliştirdi.

  • Operatörler, gereksiz gürültüyü azaltan sistem durumlarına göre uyarılar aldı. Operatörler, işletmenin ödemeler üzerindeki etkisi hakkında belirli bir bağlam sağlayan bildirimler aldı.

  • Bağımlılık zincirleri, operatörlerin operasyonel sorunların kapsamını tam olarak anlamasına yardımcı oldu. Bu bilgi, etki değerlendirmelerini hızlandırdı ve önceliklendirilmiş yanıtlara yol açtı. İşleçler ayrıca basamaklı veya bağıntılı sorunları kolayca tanımlar.

  • Sistem durumu modeli anomalilerin kök nedenleri ve söz konusu olan belirli sistem durumu sinyalleri hakkında içgörüler sağladığından operatörler olay sonrası etkinlikleri doğrulukla yürüttü.

  • İzleme verilerini tüm ekip üyeleri için anlamlı hale getirdi. Aşiret bilgisi ile paylaşılan içgörüler arasındaki boşluğu kapattı.

  • Kuruluş, akıllı içgörüler elde etmek için yapay zeka odaklı operasyonlara gelecekteki yatırımlar için temel olarak sistem durumu modelini kullandı.

Sistem durumu modeli şeması

Sistem durumu modelleri, gözlemlenebilirlik kullanım örnekleri için iyileştirilmiş ayrı bir veri şeması sağlar. Bu şema, soyut bir kavramdan ölçülebilir bir çözüme sistem durumu modellemesini alır. Özel gereksinimlerinizi, hedeflerinizi ve mimari bağlamınızı modelleyerek sistem durumu verilerini benzersiz senaryonuza göre uyarlayabilirsiniz.

Sistem durumu tanımını gösteren diyagram.

Sistem durumu, göreli bir veri kavramıdır. Her model, aynı varlık kümesini kullansa bile bağlamsal kapsamı için benzersiz ve önceliklendirilmiş sistem durumu verilerini temsil eder. Belirli bir senaryoda sağlıklıyı oluşturanlar, diğer bağlamlarda önemli ölçüde farklılık gösterebilir.

Örneğin, iş yükünüz içinde aynı türdeki Azure kaynaklarını göz önünde bulundurun.

  • VM A, CPU'ya duyarlı bir uygulama çalıştırır.
  • VM B yoğun bellek kullanan bir hizmeti işler.

Bu makinelerin sistem durumu tanımları farklıdır. CPU kullanım ölçümleri büyük olasılıkla VM A'nın sistem durumunu etkiler ve VM B bellekle ilgili ölçümlerin önceliğini belirleyebilir.

Önemli

Sistem durumu modeli tüm hataları aynı şekilde ele almamalıdır. Beklenen veya geçici ancak kurtarılabilir hatalar ile gerçek bir olağanüstü durum arasında net bir şekilde ayrım yapmalıdır.

Sistem durumu modeli oluşturma

Sistem durumu modeli oluşturmanın ilk adımı, genellikle aşağıdaki bölümlerde açıklanan etkinlikleri içeren mantıksal bir tasarım alıştırmasıdır.

Sistem durumu modelleme etkinliklerini gösteren diyagram.

İş yükü tasarımınızı değerlendirme

İş yükü tasarımınızın aşağıdaki bileşenlerini değerlendirerek bu mantıksal tasarım alıştırmasını başlatın.

  • İşlem kümeleri ve veritabanları gibi altyapı bileşenleri

  • İşlem üzerinde çalışan uygulama bileşenleri ve ilgili bileşenleri

  • Bileşenler arasındaki mantıksal veya fiziksel bağımlılıklar

  • Kullanıcı ve sistem akışları

Örneğin, bir e-ticaret uygulamasının sistem durumu modeli, kullanıcı oturum açma, ödeme ve ödemeler gibi kritik işlemlerin geçerli durumunu temsil etmelidir.

İş gereksinimlerini kullanarak bağlamsallaştırma

Her akışın kuruluşunuz üzerindeki göreli önemini ve genel etkisini değerlendirin. Kullanıcı deneyimi, güvenlik ve operasyonel verimlilik gibi faktörleri göz önünde bulundurun. Örneğin, çoğu senaryoda ödeme işleminin başarısız olması büyük olasılıkla raporlama işleminin başarısızlığından daha önemlidir.

Her akışla ilgili sorunları işlemek için yükseltme yollarını belirleyin. Daha fazla bilgi için bkz. Akışları kullanarak iş yükü tasarımını iyileştirme.

Not

Sağlık modellemesinin değerini yalnızca iş senaryolarınızı ve bağlamınızı birleştirdiğinizde fark edebilirsiniz. Daha sonra işletmenin operasyonel sorunlardan etkilenmesini rasyonalize edebilirsiniz.

Güvenilirlik ölçümleriyle eşleme

Uygulama tasarımında ilgili güvenilirlik ölçümlerini arayın.

Uygulamanın tamamı ve tek tek iş süreçleri için hizmet düzeyi göstergeleri (SLI) ve hizmet düzeyi hedefleri (SLO) tanımlamayı göz önünde bulundurun. Bu SLI'ler ve SLO'lar, sistem durumu modeliniz için göz önünde bulundurulan belirli sistem durumu sinyalleriyle uyumlu olmalıdır. Bunu yaparak, uygulama için kabul edilebilir bir hizmet düzeyinin başarısını doğru bir şekilde yansıtan kapsamlı bir sistem durumu tanımı oluşturursunuz.

Önemli

SLI'ler ve SLO'lar kritik sistem durumu sinyalleridir. Diğer kalite öznitelikleriyle birlikte istediğiniz hizmet düzeyini yansıtan anlamlı bir sistem durumu tanımı oluştururlar. Ayrıca, toplu bir zaman aralığında elde etmek istediğiniz sistem durumunu yakalamak için hizmet durumu hedeflerini (SPO'lar) tanımlayabilirsiniz.

Sistem durumu sinyallerini belirleme

Kapsamlı bir sistem durumu modeli oluşturmak için ölçümler, günlükler ve izlemeler dahil olmak üzere çeşitli izleme verisi türlerini ilişkilendirin. Bunu yaparak, sistem durumu kavramının belirli bir varlığın veya iş yükünün tamamının çalışma zamanı durumunu doğru yansıtdığından emin olursunuz.

Platform ölçümlerini ve günlüklerini kullanma

Sistem durumu modellemesi bağlamında, temel Alınan Azure kaynaklarından platform düzeyinde ölçümleri ve günlükleri toplamak önemlidir. Bu ölçümler CPU yüzdesi, ağ içinde ve ağ çıkışı ve saniye başına disk işlemlerini içerir. Bu verileri sistem durumu modelinizde kullanarak güvenilir bir ortam sürdürürken olası sorunları algılayabilir ve tahmin edebilirsiniz.

Ayrıca, bu yaklaşım geçici hatalar veya geçici kesintiler ile geçici olmayan hatalar veya kalıcı sorunlar arasında ayrım yapmanıza yardımcı olur.

Not

En iyi uygulama olarak, tüm uygulama kaynaklarını tanılama günlüklerini ve ölçümlerini seçilen günlük toplama teknolojisine yönlendirecek şekilde yapılandırmanız gerekir. Uygulama genelinde tutarlı tanılama ayarları sağlamak ve her Azure hizmeti için seçilen yapılandırmayı zorunlu kılmak için Azure İlkesi kullanarak korumalar oluşturun.

Uygulama günlükleri ekleme

Uygulama günlükleri, sistem durumu modeliniz için tanılama verilerinin önemli bir kaynağıdır. Uygulama günlüğü için en iyi uygulamalardan bazıları şunlardır:

  • Anlamsal veya yapılandırılmış günlüğe kaydetmeyi kullanın. Yapılandırılmış günlükler, günlük verilerinin büyük ölçekte otomatik olarak tüketilip analiz edilmesine olanak sağlar.

    Azure kaynak ölçümlerini ve tanılama verilerini depolama hesabı yerine Azure İzleyici Günlükleri çalışma alanında depolamayı göz önünde bulundurun. Bu yöntemi kullanarak, verimli değerlendirme için Kusto sorgularını kullanarak sistem durumu sinyalleri oluşturabilirsiniz.

  • Üretim ortamındaki günlük verileri. Uygulama üretim ortamında çalışırken kapsamlı verileri yakalayın. Sistem durumu değerlendirmesi ve algılanan üretim sorunlarını tanılamak için yeterli bilgi gereklidir.

  • Olayları hizmet sınırlarında günlüğe kaydedin. Hizmet sınırlarını geçen bir bağıntı kimliği ekleyin. Bir işlem birden çok hizmet içeriyorsa ve bunlardan biri başarısız olursa, bağıntı kimliği tüm uygulamanızdaki istekleri izlemenize ve hatanın nedenini saptamanıza yardımcı olur.

  • Zaman uyumsuz günlüğe kaydetmeyi kullanın. Uygulama kodunu engelleyebilecek zaman uyumlu günlüğe kaydetme işlemlerinden kaçının. Zaman uyumsuz günlük, günlük yazma işlemleri sırasında istek kapsamlarını engelleyerek kullanılabilirliği güvence altına alır.

  • Uygulama günlüğünü denetimden ayırın. Denetim günlüklerini tanılama günlüklerinden ayrı olarak koruyun. Denetim kayıtları uyumluluk veya mevzuat gereksinimlerine hizmet etse de, bunların ayrı tutulması bırakılan işlemleri engeller.

Dağıtılmış izleme uygulama

Telemetri verilerini kritik sistem akışları arasında ilişkilendirerek dağıtılmış izleme uygulayın. Bağıntılı telemetri uçtan uca işlemler hakkında içgörüler sağlar ve hatalar oluştuğunda etkili kök neden analizi (RCA) için gereklidir.

Sistem durumu yoklamalarını kullanma

Uygulamanızın sistem durumunu ve yanıt hızını açıkça denetlemek için uygulama dışında sistem durumu yoklamaları uygulayın ve çalıştırın. Yoklama yanıtlarını sistem durumu modelinizde sinyal olarak kullanın.

Uygulamadan gelen yanıt süresini bir bütün olarak veya tek tek bileşenlerinden ölçerek sistem durumu yoklamaları uygulayabilirsiniz. Araştırmalar gecikme süresini ölçmek ve kullanılabilirliği denetlemek veya uygulamadan bilgi ayıklamak için işlemler çalıştırabilir. Daha fazla bilgi için bkz. Sistem Durumu Uç Noktası İzleme düzeni.

Yük dengeleyicilerin çoğu, uygulama uç noktalarına yapılandırılmış aralıklarla ping işlemi yapabilen sistem durumu yoklamalarının çalıştırılmasını destekler. Alternatif olarak, bir dış izleme hizmeti kullanabilirsiniz. İzleme hizmeti, iş yükündeki birden çok bileşenden sistem durumu denetimlerini toplar. Watchdogs, bilinen sistem durumu koşulları için anında düzeltmeler yapacak kodu da barındırabilir.

Yapısal ve işlevsel izleme tekniklerini benimseme

Yapısal izleme, uygulamanın anlamsal günlükler ve ölçümlerle donatılmasını içerir. Uygulama, geçerli bellek tüketimi, istek gecikme süresi ve diğer ilgili uygulama düzeyi verileri içeren bu ölçümleri doğrudan toplar.

İşlevsel izleme kullanarak izleme süreçlerinizi güçlendirin. Bu yaklaşım, platform hizmetlerinin ölçülmesi ve bunların genel kullanıcı deneyimi üzerindeki etkisine odaklanır. Yapısal izlemeden farklı olarak işlevsel izleme, sistem hakkında ayrıntılı bilgi gerektirmez. Uygulamanın dışarıdan görünen davranışını test eder. Bu yaklaşım, SLO'ları ve SLI'leri değerlendirmek için yararlıdır.

Tasarımı modelleme

Tanımlanan uygulama tasarımını varlıklar ve ilişkiler olarak temsil eder. Varlık düzeyinde sistem durumu durumlarını ölçmek için sistem durumu sinyallerini belirli bileşenlerle eşleyin. Sistem durumu durumlarının model aracılığıyla nasıl yayılması gerektiğini belirlemek için bileşenlerin kritikliğini göz önünde bulundurun. Örneğin, raporlama bileşenleri diğer bileşenler kadar kritik olmayabilir ve bu da genel iş yükü durumu üzerinde farklı etkilere neden olabilir.

Eyleme dönüştürülebilir uyarılar ayarlama

Uyarıları ve otomatik eylemi tetikleme amacıyla değerlendirilen sistem durumu durumlarını kullanın. Sistem durumu, temel gözlemlenebilirlik veri ağı olarak mevcut operasyonel runbook'larla tümleştirilmelidir.

Genellikle, izleme verileriyle uyarı kuralları arasında bire bir eşleme yapılır ve bu da uyarı fırtınaları ve ortam uyarısı gürültüsü gibi istenmeyen sonuçlara yol açabilir. Örneğin, bir işlem kümesinde CPU kullanımına ve hata sayısına dayalı yüksek hacimli VM düzeyinde uyarılar, hatalar sırasında işleçleri zorlayabilir ve çözümde gecikmelere neden olabilir. Benzer şekilde, çok sayıda yapılandırılmış uyarı olduğunda ortam uyarısı gürültüsü genellikle göz ardı edilen veya yoksayılan uyarılarla sonuçlanır.

Sistem durumu modeli, izleme verileriyle uyarı kuralları arasında ayrım sağlar. Sistem durumu tanımı, birçok sinyali tek bir sistem durumu durumunda toplar ve bu da operatörlerin yalnızca kuruluş için kritik öneme sahip yüksek değerli uyarılara odaklanmasını sağlayan uyarı sayısını azaltır. E-ticaret senaryolarını göz önünde bulundurun. Service Bus kuyruğu gibi temel kaynaklardaki değişiklikler yerine süreç ödeme akışı sistem durumundaki değişiklikler hakkında bildirim göndermek için bir uyarı ayarlayabilirsiniz.

Not

Sistem durumu modelinin tüm katmanları arasında uyarı verme özelliği, farklı iş yükü kişilikleri için esneklik sağlar. Uygulama sahipleri ve ürün yöneticileri, önemli iş senaryolarındaki veya iş yükünün tamamında sistem durumu değişiklikleri konusunda uyarılabilir. Operatörler, altyapı veya uygulama bileşenlerinin durumuna bağlı olarak uyarılabilir.

Modeli görselleştirme

Sistem durumu modelinin geçerli durumunu ve geçmişini etkili bir şekilde iletmek için tablolar veya grafikler gibi görsel gösterimler oluşturun. Görselleştirmenin iş bağlamıyla uyumlu olduğundan ve eyleme dönüştürülebilir içgörüler sağladığından emin olun.

Sağlık modelinizi görselleştirdiğinizde, sağlık durumlarının bağımlılık zincirleri arasında hemen içgörüye sahip olmasını sağlamak için trafik ışığı yaklaşımını benimsemeyi göz önünde bulundurun.

Sağlıklı için yeşil, düzeyi düşürülmüş için kehribar ve iyi durumda olmayanlar için kırmızı atayın. Renk kodlu durumları hızla tanımlayarak, herhangi bir uygulama düşüşünün kök nedenini verimli bir şekilde bulabilirsiniz.

Diyagramda trafik ışığı yaklaşımı kullanan bir sistem durumu modeli gösterilmektedir.

Not

Sağlık modeliniz için bir pano oluştururken görme engelli kişiler için erişilebilirlik gereksinimlerini göz önünde bulundurmanızı öneririz. En iyi diyagram oluşturma yöntemleri için bkz . Mimari tasarım diyagramları.

Sağlık modelinizi benimseme

Bir sistem durumu modeli derledikten sonra, hataların veya işletimsel sorunların algılanmasını ve yorumlanmasını sağlamak için aşağıdaki kullanım örneklerini göz önünde bulundurun.

Çeşitli rollere uygulanabilirlik

Sistem durumu modellemesi, iş işlevlerine veya iş yükünün aynı bağlamındaki rollere özgü bilgiler sağlayabilir. Örneğin, bir DevOps rolünün işletimsel sistem durumu bilgilerine ihtiyacı olabilir. Bir güvenlik görevlisi izinsiz giriş sinyalleri ve güvenlik açığa çıkarma konusunda daha endişeli olabilir. Veritabanı yöneticisi büyük olasılıkla veritabanı kaynakları aracılığıyla uygulama modelinin yalnızca bir alt kümesiyle ilgilenir.

Farklı paydaşlar için sistem durumu içgörülerini uyarlayın. Çakışan veri kümelerinden ayrı modeller oluşturmayı göz önünde bulundurun.

Sürekli doğrulama

Yük testi ve kaos testi gibi test ve doğrulama işlemlerini iyileştirmek için sistem durumu modelinizi kullanın. Test sırasında çalışma zamanı işletim durumunu doğrulayabilir ve sistem durumu modellerini mühendislik yaşam döngünüze ekleyerek modelinizin ölçek ve hata senaryolarındaki etkinliğini değerlendirebilirsiniz.

Kuruluş durumu

Sistem durumu modellemesi genellikle tek tek uygulamalar için durum durumlarını sınıflandırmayla ilişkili olsa da, uygulanabilirliği bu kapsamın ötesine uzanır.

Tek bir iş yükü düzeyinde sistem durumu modelleri, uygulama gözlemlenebilirliği ve operasyonel içgörüler için bir temel sağlar. Her uygulamanın kendi bağlamında her sistem durumu ne anlama geldiğini yakalayan kendi sistem durumu modeli olabilir.

Bir model modeli oluşturarak birden çok sistem durumu modelini üst düzey bir yapıda birleştirebilirsiniz. Örneğin, sistem durumu modellerini daha büyük bir modelde bileşen olarak kullanarak bir iş biriminin veya bulut varlığının tamamının gözlemlenebilirlik ayak izini oluşturabilirsiniz. Sistem durumu modelleri, varlık içindeki iş yüklerini en üst düzey grafın içindeki düğümler olarak temsil eder. Veri akışları, hizmet etkileşimleri ve paylaşılan altyapı dahil olmak üzere uygulamalar arası bağımlılıkları yakalamak için bu modeldeki ilişkileri kullanın.

E-ticaret, ödemeler ve sipariş işleme için çeşitli uygulamaları olan bir perakende şirketi düşünün. Bu uygulamaların her birini bağımsız bir sistem durumu modeli olarak tanımlayıp bu iş yükü için sistem durumunun ne anlama geldiğini belirleyebilirsiniz. Daha sonra bu bileşen durumu modellerinin tümünü varlık olarak eşlemek ve bağımlılık zincirleri aracılığıyla uygulamalar arası operasyonel etkiyi yakalamak için bir üst model kullanabilirsiniz. Örneğin, e-ticaret uygulaması iyi durumda değilse, ödeme uygulaması üzerinde basamaklı bir etkisi olur.

Sistem durumu modellemesi, belirli bir iş bağlamı için ayarlanmış, nicel bir işlem temeli sağlar. BT operasyonları için yapay zeka (AIOps), operasyonel verimliliği artırmanın popüler bir yoludur. Sistem durumu verileri, sistem durumu eğilimlerini analiz etmek için makine öğrenmesi modellerine yönelik temel bir giriştir. Örneğin makine öğrenmesi modelleri şunları yapabilir:

  • Durum değişikliklerinden daha fazla içgörü ayıklayın ve eylemler önerin.

  • Sorun tahmini ve model iyileştirmesini yönlendirmek için zaman içindeki sistem durumu eğilimlerini analiz edin.

Sağlık modelinizi koruyun

Heath modelinin bakımı, uygulamanızın geliştirme ve işlemleriyle uyumlu olan sürekli bir mühendislik etkinliğidir. Uygulamanız geliştikçe sağlık modelinizin paralel olarak evrildiğine emin olun.

Ayrıca, sistem durumu modellerini geliştirme yaşam döngünüzle tümleştirilmesi gereken iş yükü yapıtları gibi değerlendirin. Sistem durumu modelinizin tutarlı, sürüm denetimli yönetimi için kod olarak altyapıyı (IaC) benimseyin. İş yüküne altyapı ve uygulama bileşenleri eklediğinizde veya kaldırdığınızda modelin güncel kalması için otomasyonu kullanın.

Sistem durumu verileri zaman içinde değerde yavaş yavaş soluk görünür. Operasyonel verimliliği iyileştirmek ve maliyetleri en aza indirmek için sistem durumu verilerini 30 günden fazla tutmaktan kaçının. Gerekirse, denetim gereksinimlerini karşılamak için veya BT işlemleri için yapay zekada uzun vadeli desen analizi içeren senaryolarda verileri arşivleyebilirsiniz.

Not

Sistem durumu verilerini arşivlerken modelin yapılandırma durumuyla eşleştiğinden emin olun. Durum değişikliklerini yorumlamak bu bağlam olmadan zor olabilir.

Sonraki adım