Azure'da iş sürekliliği yönetimi

Azure, sektördeki en olgun ve saygın iş sürekliliği yönetim programlarından birini sürdürür. Azure'da iş sürekliliğinin amacı, bir hizmetin müşteriye yönelik (Azure teklifinin parçası) veya bir iç destekleyici platform hizmeti olması fark etmeksizin bağımsız olarak kurtarılabilir tüm hizmetler için kurtarılabilirlik ve dayanıklılık oluşturmak ve ilerlemektir.

İş sürekliliğini anlamak için birçok teklifin birden çok hizmetten kaynaklandığını unutmayın. Azure'da her hizmet, araçlar aracılığıyla statik olarak tanımlanır ve gizlilik, güvenlik, envanter, risk iş sürekliliği yönetimi ve diğer işlevler için kullanılan ölçü birimidir. Bir hizmetin özelliklerini düzgün bir şekilde ölçmek için, hizmet türü ne olursa olsun her hizmet için üç kişi, süreç ve teknoloji öğesi dahil edilir.

An image describing how elements such as people (those who work on the service and are required to support it), process (any process to do tasks that support the service), and technology (the technology used to deliver the service or the technology provided as the service itself) combine to create a service that benefits a cloud user.

Örneğin:

  • Yardım masası veya ekip gibi kişileri temel alan bir iş süreci varsa, hizmet teslimi onların işidir. İnsanlar hizmeti gerçekleştirmek için süreçleri ve teknolojiyi kullanır.
  • Azure Sanal Makineler gibi bir hizmet olarak teknoloji varsa hizmet teslimi, çalışmasını destekleyen kişiler ve süreçlerle birlikte teknolojidir.

Paylaşılan sorumluluk modeli

Azure'ın sağladığı tekliflerin çoğu, birden çok bölgede olağanüstü durum kurtarmayı ayarlamanızı gerektirir ve Microsoft'un sorumluluğunda değildir. Tüm Azure hizmetleri verileri otomatik olarak çoğaltmaz veya başka bir etkin bölgeye çapraz çoğaltma yapmak için başarısız olan bir bölgeden otomatik olarak geri dönmez. Bu durumlarda, kurtarma ve çoğaltmayı yapılandırmak sizin sorumluluğundadır.

Microsoft, temel altyapı ve platform hizmetlerinin kullanılabilir olmasını sağlar. Ancak bazı senaryolarda kullanım, tercih ederseniz dağıtımlarınızı ve depolama alanınızı çok bölgeli bir kapasitede çoğaltmanızı talep eder. Bu örneklerde paylaşılan sorumluluk modeli gösterilmektedir. İş sürekliliği ve olağanüstü durum kurtarma stratejinizde temel bir yapı taşıdır.

Sorumluluk bölümü

Herhangi bir şirket içi veri merkezinde yığının tamamı size aittir. Varlıkları buluta taşırken bazı sorumluluklar Microsoft'a aktarılır. Aşağıdaki diyagramda, dağıtım türüne göre sizinle Microsoft arasındaki sorumluluk alanları ve bölüm gösterilmektedir.

A visual showing what responsibilities belong to the cloud customer versus the cloud provider.

Paylaşılan sorumluluk modelinin iyi bir örneği, sanal makinelerin dağıtımıdır. Bölge hatası varsa dayanıklılık için bölgeler arası çoğaltma ayarlamak istiyorsanız, alternatif etkin bir bölgede yinelenen bir sanal makine kümesi dağıtmanız gerekir. Azure, bir hata olduğunda bu hizmetleri otomatik olarak çoğaltmaz. Gerekli varlıkları dağıtmak sizin sorumluluğunuzdadır. Birincil bölgeleri el ile değiştirme işlemine sahip olmanız veya otomatik olarak yük devretme algılamak ve yük devretmek için bir trafik yöneticisi kullanmanız gerekir.

Müşteri tarafından etkinleştirilen olağanüstü durum kurtarma hizmetlerinin tümü, size yol gösterecek genel kullanıma yönelik belgelere sahiptir. Müşteri tarafından etkinleştirilen olağanüstü durum kurtarma için genel kullanıma yönelik belgelere örnek için bkz . Azure Data Lake Analytics.

Paylaşılan sorumluluk modeli hakkında daha fazla bilgi için bkz . Microsoft Güven Merkezi.

İş sürekliliği uyumluluğu: Hizmet düzeyinde sorumluluk

Azure İş Sürekliliği Yöneticisi Aracı'nda İş Sürekliliği Olağanüstü Durum Kurtarma kayıtlarını tamamlamak için her hizmet gereklidir. Hizmet sahipleri, aşağıdakileri içeren gereksinimleri tamamlamak ve birleştirmek için aracı kullanarak federasyon modeli içinde çalışabilir:

  • Hizmet özellikleri: Hizmeti ve olağanüstü durum kurtarma ile dayanıklılığın nasıl başarıldığını tanımlar ve olağanüstü durum kurtarmadan sorumlu tarafı (teknoloji için) tanımlar. Kurtarma sahipliği hakkında ayrıntılı bilgi için önceki bölümde ve diyagramda paylaşılan sorumluluk modeliyle ilgili tartışmaya bakın.

  • İş etkisi analizi: Bu analiz, hizmet sahibinin bir etki tablosunda hizmetin kritikliğine bağlı olarak kurtarma süresi hedefini (RTO) ve kurtarma noktası hedefini (RPO) tanımlamalarına yardımcı olur. Kurtarma için hedef hedefler olarak operasyonel, yasal, mevzuat, marka imajı ve finansal etkiler kullanılır.

    Dekont

    Bu veriler yalnızca iç ölçüler için olduğundan Microsoft hizmetler için RTO veya RTO yayımlamaz. Tüm müşteri vaatleri ve ölçüleri SLA tabanlıdır, çünkü yalnızca yıkıcı kayıplarda geçerli olan RTO veya RPO'ya karşı daha geniş bir aralığı kapsar.

  • Bağımlılıklar: Her hizmet, ne kadar kritik olursa olsun çalışması gereken bağımlılıkları (diğer hizmetler) eşler ve çalışma zamanıyla eşlenir, yalnızca kurtarma için gereklidir veya her ikisi için de geçerlidir. Depolama bağımlılıkları varsa, depolananları tanımlayan başka bir veri eşlenir ve örneğin belirli bir noktaya anlık görüntüler gerekip gerekmediğini belirler.

  • İş gücü: Bir hizmetin tanımında belirtildiği gibi, hizmeti destekleyebilecek iş gücünün konumunu ve miktarını bilmek, tek bir hata noktası olmamasını sağlamak ve kritik çalışanların tek bir konumda birlikte yaşanarak hataları önlemek için dağılıp dağılmadığını bilmek önemlidir.

  • Dış tedarikçiler: Microsoft, dış tedarikçilerin kapsamlı bir listesini tutar ve kritik olduğu düşünülen tedarikçiler özellikler için ölçülür. Bir hizmet tarafından bağımlılık olarak tanımlanırsa, üçüncü taraf bir kesintinin Azure hizmetlerini kesintiye uğratmadığından emin olmak için sağlayıcı özellikleri hizmetin gereksinimleriyle karşılaştırılır.

  • Kurtarma derecelendirmesi: Bu derecelendirme, Azure İş Sürekliliği Yönetimi programına özgüdür. Bu derecelendirme, dayanıklılık puanı oluşturmak için birkaç temel öğeyi ölçer:

    • Yük devretme isteği: Bir süreç olsa da, kısa süreli kesintiler için ilk seçenek olmayabilir.
    • Yük devretme otomasyonu.
    • Yük devretme kararının otomasyonu.

    Yük devretme için en güvenilir ve en kısa süre, otomatikleştirilmiş ve insan kararı gerektirmeyen bir hizmettir. Otomatikleştirilmiş hizmet, bir hizmetin devre dışı olduğunu belirlemek ve hemen düzeltme başlatmak için sinyal izleme veya yapay işlemler kullanır.

  • Kurtarma planı ve test: Azure, her hizmetin ayrıntılı bir kurtarma planına sahip olmasını ve bu planı olağanüstü kesinti nedeniyle başarısız olmuş gibi test etmelerini gerektirir. Benzer becerilere ve erişime sahip birinin görevleri tamamlayabilmesi için kurtarma planlarının yazılması gerekir. Yazılı bir plan, konu uzmanlarına güvenmeyi önler.

    Test, üretim ortamında veya yakın üretim ortamında kendi kendine test etme ve kanarya bölge kümelerindeki Azure tam bölge detaylandırmalarının bir parçası olarak çeşitli yollarla gerçekleştirilir. Bu etkin bölgeler üretim bölgeleriyle aynıdır, ancak hizmetlerinizi etkilemeden devre dışı bırakılabilir. Tüm hizmetler aynı anda etkilendiğinden test tümleşik olarak kabul edilir.

  • Müşteri etkinleştirmesi: Olağanüstü durum kurtarmayı ayarlamak sizin sorumluluğunuzda olduğunda Azure'ın genel kullanıma yönelik belgelere yönelik yönergelere sahip olması gerekir. Bu tür hizmetlerin tümü için belgelere ve süreçle ilgili ayrıntılara bağlantılar sağlanır.

İş sürekliliği uyumluluğunuzu doğrulama

Bir hizmet iş sürekliliği yönetim kaydını tamamladığında onay için göndermeniz gerekir. Tüm kaydı eksiksizlik ve kalite açısından gözden geçiren deneyimli bir iş sürekliliği yönetimi uygulayıcısına atanır. Kayıt tüm gereksinimleri karşılıyorsa onaylanmıştır. Aksi takdirde, yeniden çalışma isteğiyle reddedilir. Bu süreç, her iki tarafın da iş sürekliliği uyumluluğunun karşılandığını ve çalışmanın yalnızca hizmet sahibi tarafından onaylandığını kabul etmesini sağlar. Azure iç denetim ve uyumluluk ekipleri, en iyi verilerin gönderildiğinden emin olmak için düzenli aralıklarla rastgele örnekleme de yapar.

Hizmetlerin test edilmesi

Microsoft ve Azure hem olağanüstü durum kurtarma hem de kullanılabilirlik alanı hazırlığı için kapsamlı testler yapar. Hizmetler, büyük platform yük devretmelerine bağımlı olmayan hizmetler için bağımsız kurtarılabilirlik göstermek için üretim ortamında veya üretim öncesi ortamda kendi kendine test edilir.

Hizmetlerin gerçek bir bölge aşağı doğru senaryosunda benzer şekilde kurtarılabilmesini sağlamak için, "pull-the-plug" türündeki testler, üretimle eşleşen tam olarak dağıtılan bölgelerdeki kanarya ortamlarında gerçekleştirilir. Örneğin kümeler, raflar ve güç birimleri tam anlamıyla kapatılarak toplam bölge hatası benzetimi yapılır.

Bu testler sırasında Azure algılama, bildirim, yanıt ve kurtarma için aynı üretim sürecini kullanır. Hiçbir kişi tatbikat beklemiyor ve kurtarma için güvenilir mühendisler normal arama rotasyonu kaynaklarıdır. Bu zamanlama, gerçek bir etkinlik sırasında kullanılamayabilecek konu uzmanlarına bağlı olarak önler.

Bu testlere Microsoft genel kullanıma yönelik belgeleri izleyerek olağanüstü durum kurtarmayı ayarlamakla sorumlu olduğunuz hizmetler dahildir. Hizmet ekipleri, müşteri tarafından etkinleştirilen olağanüstü durum kurtarmanın beklendiği gibi çalıştığını ve sağlanan yönergelerin doğru olduğunu göstermek için müşteri benzeri örnekler oluşturur.

Sertifikalar hakkında daha fazla bilgi için Microsoft Güven Merkezi'ne ve uyumluluk bölümüne bakın.

Sonraki adımlar