SRE nedir ve neden önemlidir?
İşe başlamak için en iyi nokta çoğunlukla başlangıç noktasıdır. Şimdi temel soruyu sorarak başlayalım: “Site Güvenilirliği Mühendisliği nedir?” Bu soruya, terimi yapan kişi tarafından sıklıkla alıntılanan (Google'da Ben Treynor Sloss) dahil olmak üzere, bu sorunun birçok yanıtı vardır, ancak sunabildiğimiz en pratik yanıt:
Site Güvenilirliği Mühendisliği kuruluşun sistemlerinde, hizmetlerinde ve ürünlerinde uygun güvenilirlik düzeyine sürdürülebilir bir şekilde ulaşmasına yardımcı olmaya adanmış bir mühendislik disiplinidir.
Daha sonra başka tanımları da gündeme getirebiliriz ama şimdi bu noktadan devam edelim. Bu tanımın açmamız gereken üç önemli parçası vardır ve bu da bizi doğrudan "Neden önemli?" sorusuna yönlendirir. vardır.
Güvenilirlik
Tanımın merkezinde (ve "SRE" adının ortasındaki R harfinin açılımı olan) Güvenilirlik (Reliability) sözcüğü vardır. Tanımda “uygun performans düzeyi”, “uygun verimlilik düzeyi”, “uygun kararlılık düzeyi”, hatta “uygun gelir düzeyine ulaşma” bile kullanılmamıştır. "Uygun güvenilirlik düzeyi" kullanılmıştır. Neden?
Hızla bir tanıtıma göz atalım. Burada bir ekran görüntüsü var. Sence ne gösteriyor? Bir fikir edinene veya pes edene kadar ilerlememeyi deneyin. Not: Bu resimdeki çok fazla ayrıntıyı algılamak zorsa iyiyse, tarayıcınızda mükemmel bir şekilde işlenir.
Bu resim bir PHP uygulamasının (başka hata ayıklama desteği eklenmeden) başarısız olduğunda nasıl göründüğüne gösteren bir ekran görüntüsüdür. Java uygulaması için şöyle bir şey görebilirsiniz:
Bu örneklere neden bakıyoruz? Her biri, bir işletmenin oluşturmak için potansiyel olarak muazzam zaman, enerji ve kaynak ayırdığı bir uygulamayı temsil ediyor. Ama uygulama çalışmazsa, müşteri erişmek istediğinde işler durumda değilse yani güvenilir değilse, hiç kimseye özellikle de işletmeye hiçbir faydası olmaz. Aslında, güvenilirlik eksikliği işletmeye gerçek anlamda zarar verebilir (saygınlık, ekonomi, sözleşme, moral, vb. açılarından).
Bu önem, SRE'nin hizmetin, sistemin veya ürünün belki de temel özelliği olan temel bir özellik olarak güvenilirliğe odaklanmayı seçmesinin nedenidir. Güvenilirlik birçok şeyi kapsayabilir (daha sonra ele aldığımız gibi), ancak tanımın ikinci önemli bölümüne geçelim.
Uygun güvenilirlik düzeyi
Tanımı ilk okuyuşunuzda yakalayamamış olabilirsiniz ama burada bir diğer önemli sözcüğü vurgulayalım:
Site Güvenilirliği Mühendisliği kuruluşun sistemlerinde, hizmetlerinde ve ürünlerinde uygun güvenilirlik düzeyine sürdürülebilir bir şekilde ulaşmasına yardımcı olmaya adanmış bir mühendislik disiplinidir.
Bu sözcük neden bu kadar önemli?
SRE dünyasında yapılan önemli bir gözlem, %100 güvenilir olması gereken çok az sistem ve hizmet olduğudur. Havacılık ve tıbbi cihazlar gibi yaşamla ölüm arasındaki çizgiyi belirleyen durumlar, dikkat çeken istisnalardır.
Aslında, bunun arzu edildiği birkaç durum vardır. Daha yüksek güvenilirlik oranları hedeflendikçe, bu yüksek güvenilirliğe ulaşmak için gereken çaba ve kaynaklar (dolayısıyla maliyet) katlanarak artar. Başka bir ifadeyle, ihtiyacınız olmayan güvenilirliğin peşinden koşmak zaman ve para kaybıdır. Sisteminizde, hizmetlerinizde ve ürünlerinizde uygun güvenilirlik düzeyini tutturmak istersiniz.
Bu düzey, işletmenin ihtiyaçlarıyla eşleşmeli ve pragmatik olmalıdır. Örneğin müşterilerimiz size %100 güvenilir olmayan bir ağ üzerinden bağlanabilir (%90 oranında arttı diyelim). Hizmetinizin %95 güvenilir olduğundan emin olmak için harcanan çabayı ve parayı harcamak, zaman ve para israfı tanımına göredir. Sisteminizde, hizmetlerinizde ve ürünlerinizde uygun güvenilirlik düzeyini tutturmak istersiniz.
SRE bu pragmatizmi bir adım ileri götürür. Şimdi istenen bir güvenilirlik düzeyi olduğunu düşünebiliyorsak, toplantıda başarılı olursak veya bu düzeyi aşıyorsak yapmamız gereken bir şey var mı? Benzer biçimde, bu düzeye ulaşamazsak ne olur? Bu soruları modülün ilerleyen bölümlerinde yanıtlayacağız.
Sürdürülebilir bir şekilde ulaşma
Devam etmeden önce tanımımızın vurgulamamız gereken son bölümü, sürdürülebilir bir şekilde ifadesidir. Sürdürülebilir, insanların rolünü ifade eder. Sürdürülebilir bir operasyon uygulaması oluşturmak çok önemlidir. Kişiler güvenilir sistemler, hizmetler ve ürünler oluşturun. Çalışmalarımızın sürdürülebilir olduğundan emin olmak için bir şeyler yapmazsak. Her gece saat 03:00'te insanlarımızı bir sayfayla uyandırırsak ve aileleriyle birlikte onlara zaman tanımazsak. Eğer kendilerine bakmak için zaman harcama fırsatı yoksa. O zaman güvenilir sistemler oluşturmalarının imkanı yok. SRE, zaman içinde sürdürülebilir bir operasyon uygulaması gerçekleştirmemizin önemli olduğunu düşünüyor, böylece halkımız işe en iyi şekilde ulaşabiliyor.