Site güvenilirlik mühendisliği belgeleri
Site güvenilirliği mühendisliği kuruluşun sistemlerinde, hizmetlerinde ve ürünlerinde uygun güvenilirlik düzeyine sürdürülebilir bir şekilde ulaşmasına yardımcı olmaya adanmış bir mühendislik disiplinidir.
Modern İşlem Uygulamaları ile Güvenilirliği iyileştirme
Azure üzerinde SRE
SRE belgeleri
Mimari
Sağlama ve Teslim
Microsoft’tan SRE sohbetleri
Kültür
- The Evolution of Site Reliability Engineering (Site Güvenilirlik Mühendisliğinin Evrimi)
- SRE Oluşturma: Dışarıdan Gelen Kültür
- Cultural Nuance and Effective Collaboration for Multicultural Teams (Çok Kültürlü Ekiplerde Kültürel Farklar ve Etkin İşbirliği)
- Evolution of SRE and Rising Need of SRE Catalyzers (SRE’nin Evrimi ve SRE Katalizörlerine Olan İhtiyaçtaki Artış)
- Geri Bildirim Döngüleri: SRE'ler Nasıl Yarar Sağlar ve Potansiyellerini Gerçekleştirmek için Gerekenler
- Understanding Business Metrics Can Make You a Better SRE (İş Ölçümlerini Anlamak Sizi Daha İyi Bir SRE Haline Getirir)
- The Never-Ending Story of Site Reliability (Site Güvenilirliğinin Asla Bitmeyen Hikayesi)
- Every Day Is Monday in Operations (Operasyon Departmanlarında Her Gün Pazartesidir)
Incident Response and Post-Incident Reviews (Olay Yanıtı ve Olay Sonrası İncelemeleri)
Monitoring and Observability (İzleme ve Gözlemlenebilirlik)
- 600 Milyondan Fazla Üye ve Yüzlerce Mikro Hizmet: İzleme Sistemimizi Ayak Uydurmak için Nasıl Ölçeklendirdik?
- Dayak Yolu Dışında: Gözlemlenebilirlik Odağını Hizmetinizden Müşterinize Taşıma
- You Get What You Measure—Why Metrics Are Important (Ne Ölçersen Onu Biçersin: Ölçümler Neden Önemlidir?)
- Fırtınayı Havadan Geçirme: Erken Uyarılar Çiftliği Nasıl Kurtarır?
- Capturing and Analyzing Millions of Queries without Any Overhead (Milyonlarca Sorguyu Ek Yük Çıkarmadan Yakalayıp Analiz Etme)
- Olay Bağıntısı: MTTR'yi Azaltmaya Yönelik Yeni Bir Yaklaşım
- How Robust Monitoring Powers High Availability for LinkedIn Feed (Güçlü İzleme Özellikleri LinkedIn Akışı için Yüksek Kullanılabilirliği Nasıl Sağlamlaştırır?)
- MTTR ve Yanlış Yükseltmeleri Azaltma: Linkedin'de Olay Bağıntısı
Practices and Principles (Uygulamalar ve İlkeler)
- Availability—Thinking beyond 9s (Kullanılabilirlik: 9’ların Ötesini Düşünme)
- Mental Models for SREs (SRE’ler için Düşünce Modelleri)
- Prioritizing Trust While Creating Applications (Uygulama Oluştururken Güveni Önceliklendirme)
- Java Hates Linux. Deal with It. (Java, Linux’tan Nefret Ediyor. Kabullenin.)
- Characterizing and Understanding Phases of SRE Practices (SRE Uygulamalarına İlişkin Aşamaların Karakter Özelliklerini Belirleme ve Bunları Anlama)
- Güvenlik ve SRE: Doğal Güç Çarpanları
- Üretim İyileştirme İncelemesi: Onarım Borcundan Bir ısırık Alma
- Ensuring Reliability of High-Performance Applications (Yüksek Performanslı Uygulamaların Güvenilirliğinden Emin Olma)
- The Service Score Card—Gamifying Operational Excellence (Hizmet Puanı Kartı: Operasyonel Mükemmelliği Oyunlaştırma)
- How to Improve a Service by Roasting It (Kızartarak Hizmet İyileştirme)
Teams and Management (Ekipler ve Yönetim)
- Kod-Sarı: Üst-Ağır Takımlara Akıllı Yoldan Operasyonlara Yardımcı Olma
- Yönetmeden Liderlik: SRE Teknik Lideri Olma
- Differences in SRE Implementations across Companies (Şirketlerin SRE Uygulamaları Arasındaki Farklar)
- 100 Teams, 100 Ways to Fail (100 Ekip, Başarısız Olmanın 100 Yolu)
- The Why, What, and How of Starting an SRE Engagement (SRE Katılımı Başlatmanın Neden, Ne ve Nasılları)
- Building and Running SRE Teams (SRE Ekiplerini Oluşturma ve Çalıştırma)
- SRE'ye Üniversite Öğrencisi: Giriş Düzeyi Yeteneğinizi Ekleme
- LinkedIn SRE: Inception'dan Genel Ölçeğe
- Splicing SRE DNA Sequences in the Biggest Software Company on the Planet (Dünyanın En Büyük Yazılım Şirketinde SRE DNA Dizilimini Birbirine Ekleme)
- Transforming Tier 1 Caterpillars to Butterflies (1. Katmandaki Tırtılları Kelebeklere Dönüştürme)
Tools and Technologies (Araçlar ve Teknolojiler)
- Azure SREBot: Chatbot'tan Fazlası— Azaltma Süresini Azaltmak için Akıllı Bir Bot
- TrafficShift: Büyük Ölçekte Olağanüstü Durumlardan Kaçınma
- Let's Build a Distributed File System (Dağıtılmış Bir Dosya Sistemi Oluşturalım)
- TCP—Architecture, Enhancements, and Tuning (TCP: Mimari, Geliştirme ve Ayarlama)
- BGP—The Backbone of the Internet (BGP: İnternetin Omurgası)
- The Ops in Serverless (Sunucusuz Ortamlarda Operasyon)
- How We Used Kafka to Scale Database Infrastructure (Veritabanı Altyapısını Ölçeklendirmek için Kafka’yı Nasıl Kullandık?)
- SRE'ler için Ağlar: Sorun Giderme Uygulamaları için Bilmem Gerekenler
- Ambry—LinkedIn’s Distributed Immutable Object Store (Ambry: LinkedIn’in Dağıtılmış Sabit Nesne Deposu)
- BPerf—Bing.com Cloud Profiling on Production (BPerf: Üretimde Bing.com Bulut Profili Oluşturma)
- DNS: Modern Sorunlar için Eski Çözüm
- Traffic Steering using Rum DNS @ LinkedIn (LinkedIn’de Rum DNS Kullanarak Trafiği Yönlendirme)
Ölçeklendirme
- Traffic Forecasting and Stress Testing Infrastructure (Trafik Tahmini ve Stres Testi Altyapısı)
- Learning at Scale Is Hard! (Uygun Ölçekte Öğrenmek Zordur!) Outage Pattern Analysis and Dirty Data (Kesinti Düzeni Analizi ve Kirli Veriler)
- Dağıtılmış Durum Bilgisi Olan Bir Sistemi Ölçeklendirme: LinkedIn Örnek Olay İncelemesi
- Debugging at Scale—Going from Single Box to Production (Uygun Ölçekte Hata Ayıklama: Tek Bir Kutudan Üretime Yolculuk)
- Building Centralized Caching Infrastructure at Scale (Uygun Ölçekte Merkezileştirilmiş Önbelleğe Alma Altyapısı Oluşturma)
- Scalable Coding—Find the Error (Ölçeklenebilir Kodlama: Hatayı Bulun)
- Managing Capacity @ LinkedIn (LinkedIn’de Kapasiteyi Yönetme)
- InStream: BitTorrent, Python, Salt ve Kafka kullanan Büyük Ölçekli Dağıtım
- Avoiding and Breaking Out of Capacity Prison (Kapasite Hapishanesinden Kaçınma ve Kaçma)
- The Evolution of Global Traffic Routing and Failover (Küresel Trafik Yönlendirme ve Yük Devretmenin Evrimi)