Share via


Bulut yönetiminde koruma ve kurtarma

Olası bir iş yükü kesintisine hazırlanmadan önce bulut yönetimi ekiplerinin aşağıdaki gereksinimleri karşıladığından emin olmaları gerekir:

Ekipler planlarken, olağanüstü durum olduğunda bir şeyin başarısız olacağı varsayımıyla başlamalıdır. Kesintiye hazırlık, ekiplerin hataları daha erken algılamasını ve daha hızlı kurtarmasını sağlar. Bu disiplinin odağı, bir sistem başarısız olduktan hemen sonra gelen adımlara odaklanır. Bir kesinti oluştuğunda hızla kurtarılabilmesi için iş yüklerini nasıl korursunuz?

Hiçbir teknik çözüm sürekli olarak yüzde 100 çalışma süresi garanti eden bir SLA sunmaz. En fazla yedekli mimariye sahip çözümler ,"altı 9s" veya yüzde 99,9999 çalışma süresi sağlamayı talep eder. Ancak bir "altı 9s" çözümü bile herhangi bir yılda 31,6 saniyeliğine düşer. Bir çözümün çalışma süresinin "altı 9 sn"ye ulaşması gereken büyük ve devam eden bir operasyonel yatırım garantisine sahip olması nadirdir.

Koruma ve kurtarma konuşmalarını çevirme

İş operasyonlarını destekleyen iş yükleri şunlardan oluşur:

  • Uygulamalar
  • Veri
  • Sanal makineler (VM)
  • Diğer varlıklar

Her varlık, koruma ve kurtarma için kendi yaklaşımını gerektirebilir. Bu uzmanlık alanının önemli hedefi, yönetim temeli içinde tutarlı bir taahhüt oluşturmaktır ve bu da iş tartışmaları için bir başlangıç noktası sağlayabilir.

Bulut yönetimi ekiplerinin en azından her varlık için hızlı kurtarma ve en az veri kaybı konusunda net bir taahhütle temel bir yaklaşım oluşturması gerekir.

Kurtarma süresi hedefleri (RTO)

Kurtarma süresi hedefi, olağanüstü durumdan önce herhangi bir sistemi kurtarmak için gereken süredir. Bu, aşağıdakiler için gereken süreyi içerir:

  • VM'lere ve uygulamalara en düşük işlevselliği geri yükleme
  • Uygulamalar için gereken verileri geri yükleme.

İş açısından RTO, iş süreçlerinin hizmet dışı olduğu süreyi temsil eder. Görev açısından kritik iş yükleri için bu değişkenin nispeten düşük olması ve iş süreçlerinin hızlı bir şekilde sürdürülmesi sağlanmalıdır. Düşük öncelikli iş yükleri için standart bir RTO düzeyi, şirket performansı üzerinde belirgin bir etkiye sahip olmayabilir.

İşletmeler, görev açısından kritik olmayan iş yükleri için standart bir RTO oluşturan bir yönetim temeli oluşturmalıdır. Daha sonra işletme, kurtarma sürelerinde ek yatırımları gerekçelendirmek için bu temeli kullanabilir.

Kurtarma noktası hedefleri (RPO)

Çoğu bulut yönetim sisteminde, bir tür veri koruması düzenli aralıklarla verileri yakalar ve depolar. Kurtarma noktası, verilerin en son ne zaman yakalandığını ifade eder. Sistem başarısız olduğunda, yalnızca en son kurtarma noktasına geri yüklenebilir.

Kurtarma noktası hedefi, en son kurtarma noktasından kesintiye kadar ölçülür. RPO saat cinsinden ölçülürse sistem hatası, son kurtarma noktası ile kesinti arasındaki saatler için veri kaybına neden olur. RPO gün cinsinden ölçülürse, sistem hatası son kurtarma noktası ile kesinti arasındaki günler için veri kaybına neden olur. Bir günlük RPO teorik olarak başarısızlığa yol açan gün içindeki tüm işlemlerin kaybolmasına neden olabilir.

Görev açısından kritik sistemlerde RPO'nun dakikalar veya saniyeler içinde ölçülmesi gelir veya kar kaybından kaçınmaya yardımcı olabilir. Ancak daha kısa bir RPO genellikle yönetim maliyetlerinin artmasına neden olur. Bu maliyetleri en aza indirmeye yardımcı olmak için, işletmenin kabul edilebilir en uzun RPO'ya odaklanan bir yönetim temeli oluşturması gerekir. Daha sonra işletme, daha fazla yatırım gerektiren belirli platformların veya iş yüklerinin RPO'sunu azaltabilir.

İş yüklerini koruma ve kurtarma

BT'deki iş yüklerinin çoğu belirli bir iş veya teknik süreç Çevre desteği. İş operasyonları üzerinde sistemik bir etkisi olmayan sistemler genellikle sistemleri hızlı bir şekilde kurtarmak veya veri kaybını en aza indirmek için gereken artan yatırımı garanti etmemektedir. Bir işletme, temel oluşturarak tutarlı bir şekilde yönetebilecekleri bir fiyat noktasında hangi düzeyde kurtarma desteğine ihtiyaç duyabileceğini anlayabilir. Bunu anlamak, iş paydaşlarının kurtarmada artan yatırımın değerini değerlendirmesine yardımcı olur.

Bulut yönetimi ekiplerinin çoğu için, çeşitli varlıklar için belirli RPO/RTO taahhütlerine sahip gelişmiş bir temel, karşılıklı iş taahhütlerine en uygun yolu sağlar. Aşağıdaki bölümlerde, bir işletmeyi tekrarlanabilir bir işlemle kolayca koruma ve kurtarma işlevselliği eklemeye teşvik eden birkaç yaygın gelişmiş temel özetlenmiştir.

Verileri koruma ve kurtarma

Veriler muhtemelen dijital ekonomideki en değerli varlıktır. Üretim iş yükünü destekleyen verilerin kaybı gelir veya kar kaybına neden olur. En yaygın gelişmiş temel, verileri etkili bir şekilde koruyup kurtarabilmektir. Bulut yönetimi ekiplerinin ortak veri platformlarını destekleyen gelişmiş bir yönetim temeli düzeyi sunmalarını öneririz.

Bulut yönetimi ekipleri platform işlemlerini uygulamadan önce, hizmet olarak platform (PaaS) veri platformu için geliştirilmiş işlemleri desteklemeleri yaygın olarak görülür. Örneğin, bulut yönetimi ekibinin Azure SQL Veritabanı veya Azure Cosmos DB çözümleri için daha yüksek bir yedekleme veya çok bölgeli çoğaltma sıklığını zorlaması kolaydır. Bunun yapılması, geliştirme ekibinin veri platformlarını modernleştirerek RPO'yu kolayca geliştirmesine olanak tanır.

Bu düşünce süreci hakkında daha fazla bilgi edinmek için bkz . Platform operasyonları uzmanlık alanı.

VM'leri koruma ve kurtarma

Çoğu iş yükü, çözümün çeşitli yönlerini barındıran sanal makinelere bağlıdır. Bir işletmenin, bir sistem hatasından sonra iş yükünün işlemlerini desteklemesi için bazı sanal makineleri hızla kurtarması gerekir.

Bu sanal makinelerde kapalı kalma süresinin her dakikası gelir kaybına veya kârın azalmasına neden olabilir. VM kapalı kalma süresinin işletmenin mali performansı üzerinde doğrudan bir etkisi olduğunda, RTO çok önemlidir. Bulut yönetimi ekipleri, sanal makineleri ikincil bir siteye çoğaltarak ve sıcak-sıcak kurtarma modeli olarak adlandırılan bir model olan otomatik kurtarmayı kullanarak hızla kurtarabilir. Ekipler ayrıca sanal makineleri sık erişimli veya yüksek kullanılabilirlik modeli olarak bilinen bir yaklaşımla işlevsel, ikincil bir siteye çoğaltabilir. Sık erişimli yaklaşım daha pahalıdır, ancak en yüksek kurtarma durumunu sunar.

Bu modellerin her biri, işletmelerin iş yeteneklerini daha hızlı geri yüklemelerine yardımcı olan RTO'yu azaltır. Ancak her model, bulut yönetimi maliyetlerinin önemli ölçüde artmasına da neden olur.

Ayrıca, yüksek kullanılabilirlik için çoğaltmanın dışında aşağıdaki gibi senaryolar için yedeklemenin etkinleştirilmesi gerektiğini unutmayın:

  • Yanlışlıkla silme
  • Veri bozulması
  • Fidye yazılımı saldırıları

Bu düşünce süreci hakkında daha fazla bilgi için bkz . İş yükü işlemleri uzmanlık alanı.

Sonraki adımlar

Bu yönetim temeli bileşeni karşılandığında, ekip platform operasyonlarında ve iş yükü işlemlerinde kesintileri önlemek için ileriye bakabilir.