Not
Bu sayfaya erişim yetkilendirme gerektiriyor. Oturum açmayı veya dizinleri değiştirmeyi deneyebilirsiniz.
Bu sayfaya erişim yetkilendirme gerektiriyor. Dizinleri değiştirmeyi deneyebilirsiniz.
Microsoft olarak, ihtiyaç duyduğunuzda hizmetlerimizin her zaman kullanılabilir olduğundan emin olmak için çok çalışıyoruz. Ancak planlanmamış hizmet kesintileri oluşur. Bu makale, bunu yaptıklarında neler olduğunu açıklar.
Microsoft, çalışma süresi ve bağlantı taahhüdü olarak birçok hizmeti için bir Hizmet Düzeyi Sözleşmesi (SLA) sağlar. Tek tek Azure hizmetlerinin SLA'sı Azure Hizmet Düzeyi Sözleşmeleri'nde bulunabilir.
Olay kapsamını anlama
Bir olay olduğunda, bu olayın kapsamını anlarsanız, en iyi eylem seyrini belirleyebilirsiniz.
Bir olayın kapsamını anlamak için şu adımları izleyin:
Azure Hizmet Durumu'na gidin. Bu hizmet, şunları sağlar:
Hizmetlerinizi etkileyebilecek sorunlar veya olaylarla ilgili bilgiler.
Otomatik olay güncelleştirme uyarıları, böylece tüm olay durumu güncelleştirmeleri otomatik olarak size bildirilebilir. Microsoft bir olayın kapsamını anladığında, olay durumunu güncelleştiririz. Bu durum güncelleştirmelerini, e-posta adresi gibi çeşitli yerlere veya kendi olay yönetim sisteminize uyarı gönderebilen bir Azure İzleyici eylem grubuna gidecek şekilde yapılandırabilirsiniz.
Azure portalına erişirken sorun yaşıyorsanız Azure durumu'na gidin.
Uyarı
Azure durumu yalnızca belirli ölçütleri karşılayan yaygın sorunları gösterir. Azure Durumu sayfası hangi abonelikleri ve kiracıları yönettiğinizi bilmediğinden, hizmetlerinizi etkileyebilecek daha küçük sorunların doğru bir görünümünü sağlayamaz.
Durum sayfasıyla ilgili sorunlar varsa, sosyal platform X'te @AzureSupport gönderileri olup olmadığını denetleyin.
Kullanılabilirlik alanı ve veri merkezi olayları
Birçok sorun tek bir kullanılabilirlik alanıyla sınırlıdır. Kullanılabilirlik alanları, aynı bölgedeki diğer kullanılabilirlik alanlarından yalıtılmış veri merkezlerini veya veri merkezi gruplarını temsil eder. Kullanılabilirlik alanında bir sorun olduğunda, gördüğünüz etki bir hizmetin dağıtılma şekline bağlıdır:
- Etkilenen kullanılabilirlik alanına sabitlenen bölgesel hizmetler etkilenebilir.
- Alanlar arası yedekli hizmetlerin etkilenme olasılığı düşüktür. Alanlar arası yedekli kaynaklar için herhangi bir düzeltme eylemi gerçekleştirmeniz gerekmez.
- Bölgesel (bölgesel olmayan) hizmetler , etkilenen kullanılabilirlik bölgesini kullanabileceğinden etkilenebilir.
Azure hizmetlerinde kullanılabilirlik alanı desteği ve bölgesel, alanlar arası yedekli ve bölgesel (bölgesel olmayan) hizmetler arasındaki farklar hakkında daha fazla bilgi edinmek için bkz. Kullanılabilirlik alanı desteğine sahip Azure hizmetleri.
Etkilenen kullanılabilirlik alanına dağıtılan bölgesel veya bölgesel kaynaklarla ilgili endişeleriniz varsa , iş sürekliliği ve olağanüstü durum kurtarma (BC/DR) planlarınızı başlatmayı göz önünde bulundurun.
Mantıksal ve fiziksel kullanılabilirlik alanları karşılaştırması
Her Azure aboneliği farklı bir kullanılabilirlik alanı listesi görür. Her abonelik tarafından kullanılan mantıksal bölgeler farklı fiziksel bölgelere karşılık gelebilir. Etkilenen fiziksel kullanılabilirlik alanında hangi kaynakların çalıştığını onaylamak için mantıksal bölgelerinizle fiziksel bölgeleriniz arasında eşleme yapabilirsiniz. Daha fazla bilgi için bkz. fiziksel ve mantıksal kullanılabilirlik alanları.
Bölge genelinde olaylar
Bazen sorunlar tüm bölgeyi etkiler. Bölgede kullanılabilirlik alanları olmadığında bölge genelinde sorunlar oluşabilir. Bölge genelinde bir olay oluştuğunda olağanüstü durum kurtarma planınızı başlatmayı düşünmeniz gerekebilir. Planınıza başka bir bölgeye yedekleme yapmayı dahil edebilirsiniz.
İş sürekliliğini önceliklendirme
Bir olayla karşılaştığınızda en önemli öncelik, iş operasyonlarınızı çalışır durumda tutmaktır. Bir sorunun nedenini yalıtmaya veya düzeltmeye çok fazla odaklanmak, dikkatinizi çözümünüzün operasyonlarını geri yüklemekten ve iş sürekliliğini korumaktan uzaklaştırabilir.
Aşağıdaki faktörler, iş sürekliliğini korumak için hiçbir şey yapmanız gerekmeyen durumlar sunar:
Sorunun üretim kaynaklarınız ve kullanıcılarınız veya iş yükleriniz üzerindeki gerçek etkisi. Örneğin, standart iş saatleri dışında oluşan bir sorun, hemen bir şey yapmanızı gerektirmeyebilir.
Olayın kapsamı. Tek bir kullanılabilirlik alanına yalıtılmış sorunlar için, alanlar arası yedekli kaynaklar kullanıyorsanız veya kullandığınız kaynaklar etkilenmemiş bir fiziksel kullanılabilirlik alanındaysa hiçbir şey yapmanız gerekmeyebilir.
Varsa tahmini çözünürlük süresi. Microsoft, en kısa sürede kurtarma için net zaman çizelgeleri sağlamaya çalışır. Kurtarma prosedürlerinizin çalışması uzun bir zaman alıyorsa, sorunun tamamlandığında çözülmesinin beklenip beklenmediğini göz önünde bulundurun.
Etkilenmiş iş yükünüzün kullanıcıları (varsa) ile oluşturulan hizmet düzeyi hedefleri (SLO'lar). SLO'lar bu tür durumlarda karar alma sürecine rehberlik etmek için vardır. Örneğin, bazı durumlarda hizmetleriniz iyi duruma gelene kadar el ile işlemlere geçebilirsiniz ve bu karar sistem için SLO'nuza yansıtılabilir. SLO'lar ve bunların nasıl tanımlanacağı hakkında daha fazla bilgi edinmek için bkz. Azure Well-Architected Framework'te güvenilirlik hedeflerini tanımlama önerileri .
Ancak, iş sürekliliği bir tür eylem gerektiriyorsa ve bir olağanüstü durum kurtarma planınız varsa, sonraki adımınız bu planı başlatıp başlatmamayı göz önünde bulundurmaktır.
Olağanüstü durum kurtarma planınızı göz önünde bulundurun
Olağanüstü durum kurtarma planı, büyük bir olay durumunda ne yapmayı beklediğinizi açıklar. Olağanüstü durum kurtarma planları genellikle aşağıdaki gibi eylemleri içerir:
- Erişilebilirlik bölgesi içinde yalıtılmış bir kesinti için, eğer mümkünse kaynağı ölçeklendirin.
- Bölgesel hizmetleri kullanırken kullanılabilirlik alanı kesintisi için başka bir kullanılabilirlik alanına dağıtın ve başka bir kullanılabilirlik alanına yük devretme gerçekleştirin.
- Alanlar arası yedekli hizmetleri kullanırken kullanılabilirlik alanı kesintisi için herhangi bir işlem yapmanız gerekmeyebilir. Performans sorunları gözlemlerseniz, kalan bölgelerdeki örneklerin aldıkları trafik akışını işleyebilmesi için kaynağınızın ölçeğini genişletmeyi göz önünde bulundurun.
- Bölgesel bir kesinti durumunda, başka bir bölgeye hizmetleri dağıtın ve yük devrini gerçekleştirin.
Önemli
Onları düşünmeden hiçbir eylemde bulunma. Acele kararlar bazen işleri daha da kötüleştirebilir. Senaryoyu kapsayan bir olağanüstü durum kurtarma planı geliştirdiyseniz, şu anda bir plan oluşturmak yerine bunu kullanmak genellikle daha iyidir.
Hata durumunda devreye girme karmaşık bir işlem olabilir. Failover'u ancak maliyetleri ve riskleri gerekçelendirebildiğinizde tetiklemelisiniz. Bazı durumlarda veri kaybına neden olabilir. Örneğin, yakın zamanda yapılan değişiklikler herhangi bir kapalı kalma süresi başlatılmadan önce bölgeler arasında çoğaltılmamış olabilir. Ayrıca, özellikle trafiği farklı bir bölgedeki bir dağıtıma yeniden yönlendirmeniz gerekiyorsa hizmet kesintisi süresiyle karşılaşabilirsiniz. Çözümünüzün tasarım şekline bağlı olarak, DNS kayıtlarını güncelleştirmeniz ve yayılmalarını beklemeniz gerekebilir.
Microsoft tarafından tetiklenen yük devretme
Bazı Azure hizmetleri, olaylar sırasında otomatik olarak alternatif bölgelere yük devreder. Bu hizmetler için yük devretme işlemini Microsoft yönetir. Ancak, Microsoft tarafından başlatılan yük devretme genellikle son çare olarak ve kurtarma girişimleri için önemli zaman harcandıktan sonra gerçekleştirilir. Genel olarak Microsoft'un ilkesi, daha uzun bir kurtarma süresi anlamına gelse bile veri kaybını en aza indirmektir. Özellikle kurtarma sürenizi en aza indirmeniz gerekiyorsa, kendi çözümleriniz için yalnızca Microsoft tarafından başlatılan yük devretmeye güvenmemelisiniz. Bunu yapabilirseniz Azure Depolama gibi hizmetler için müşteri tarafından başlatılan yük devretmeyi kullanın.
Azure desteği
Hizmet olayı Azure Hizmet Durumu'nda zaten iletiliyorsa, en son bilgilerin tümü orada sağlanır ve bir destek isteği açmanız gerekmez.
Ancak, aşağıdaki durumlarda bir destek olayı açmayı düşünebilirsiniz:
Azure Hizmet Durumu'ndaki olay açıklamasında yer almayan sorunlar görüyorsunuz.
Kurtarma çalışmalarınızın bir parçası olarak Microsoft'tan yardım almanız gerekir.
Tavsiye
Hizmet kesintisi sizi etkiliyorsa, kurtarma için uygulamanız gerekebilecek tüm adımlarda yardımcı olmak üzere sorun giderildikten sonra 72 saate kadar ücretsiz destek bileti gönderebilirsiniz.
Bir destek olayı açarken, etkilenen kaynakları ve sorunun etkisini açıkça açıklayın. Azure abonelik kimliğini ve sorunla karşılaşan bölgeyi belirtin. destek olayının önem derecesini işletmenizin etkisine göre ayarlayın. Bu ana hatlarıyla belirtilen koşulların dışında bir Azure hizmeti kesintisi sırasında birçok müşterinin Azure desteğine reaktif olarak başvurabileceğini unutmayın. Azure destek kaynaklarına eklenen bu yük, ne yazık ki destek gereksinimlerinizin karşılanmasında gecikmeye neden olabilir.
Olaydan sonra
Microsoft'un olaydan ne öğrendiğini anlamak için Azure Hizmet Durumu'nun Sistem Durumu geçmişi bölmesinden veya müşteri tarafından yapılandırılan Hizmet Durumu uyarıları aracılığıyla Olay Sonrası Gözden Geçirme (PIR) makalesini okuyun. Farklı olaylar farklı türde PIR'ler alabilir. Ön PIR'ler genellikle bir olaydan birkaç gün sonra yayımlanır ve birkaç hafta sonra daha kapsamlı PIR'ler takip edilir.
Genel durum sayfamızda listelenen önemli olaylar için, sorularınıza yanıt almak için Azure Olay Geriye Dönük canlı akışına katılın veya kaydı izleyin.
SLA kredisi için uygun olabileceğinizi düşünüyorsanız sorun türü "Para İadesi İsteği" olan yeni bir destek isteği oluşturun ve olay izleme kimliğini ekleyin.
Kendi dayanıklılığınızı ve süreçlerinizi geliştirmek için olaydan neler öğrenebileceğinizi düşünün. Aşağıdaki gibi soruları göz önünde bulundurun:
Olağanüstü durum kurtarma planınız ne kadar iyi çalıştı? Yapabileceğiniz herhangi bir geliştirme var mı? Daha fazla bilgi için bkz. Olağanüstü durum kurtarma stratejileriyle ilgili Azure Well-Architected Framework kılavuzu.
Olaya yanıtınız önem derecesine uygun mu? Aksi takdirde, daha iyi bilgi sahibi olmanın ve ne yapmanız gerektiğini daha iyi kararlar almanın yolları var mı?
Kullandığınız hizmetler için Azure hizmet güvenilirliği kılavuzları var mı? Güvenilirlik kılavuzları, dayanıklılık gereksinimlerinizi karşılamak için kaç Azure hizmetinin yapılandırılabildiği hakkında bilgi sağlar.
Bu tür bir sorunla ilgili gelecekte dayanıklılığınızı artırmak için yapabileceğiniz bir tasarım tavizi var mı? Daha fazla bilgi için bkz. Azure Well-Architected Framework'ün güvenilirlik sütunu.
Kullanıcılarınıza sunulan SLO veya SLA, bu planlanmamış kesintiyle karşılaştığınıza göre hala uygun mu? Şimdi, beklentileri bu olaydan öğrendiklerinizle uyumlu hale getirmek için kullanıcı tabanınıza yaptığınız taahhütleri yeniden ziyaret etmek için iyi bir zaman.
Azure Hizmet Durumu uyarılarını gelecekteki olaylar hakkında otomatik olarak bilgilendirilecek şekilde yapılandırmanız gerekir mi?
Olay yanıtımızı nasıl geliştirebileceğimiz hakkında geri bildiriminiz varsa lütfen atanan Microsoft temsilciniz aracılığıyla veya Azure geri bildirim sitesi aracılığıyla bize bildirin.