Daftar periksa ulasan desain untuk Keunggulan Operasional

Daftar periksa ini menyajikan serangkaian rekomendasi untuk membantu Anda membangun budaya keunggulan operasional. Mulailah dengan pendekatan DevOps untuk mengintegrasikan spesialisasi dari beberapa disiplin ilmu. Pendekatan ini menciptakan desain dan praktik pengembangan yang ketat. Pendekatan ini mengarah pada penyebaran infrastruktur dan kode yang dapat diulang, andal, dan aman.

Prioritaskan intervensi manusia di area yang mendapat manfaat darinya, dan menggabungkan otomatisasi di area lain. Observabilitas melayani keunggulan operasional dengan memantau peristiwa kesehatan dan juga untuk memvalidasi desain dan implementasi beban kerja saat ini untuk menginformasikan pengembangan produk di masa depan.

Jika Anda tidak mempertimbangkan tradeoff dan rekomendasi untuk keunggulan operasional, beban kerja Anda mungkin berisiko. Pertimbangkan dengan cermat poin yang tercakup dalam daftar periksa berikut untuk menanamkan keyakinan pada kesuksesan desain Anda.

Daftar periksa

  Kode Rekomendasi
OE:01 Tentukan spesialisasi anggota tim beban kerja, dan integrasikan ke dalam serangkaian praktik yang kuat untuk merancang, mengembangkan, menyebarkan, dan mengoperasikan beban kerja Anda dengan spesifikasi. Anggota tim harus memiliki kejelasan dalam pengambilan keputusan dan tanggung jawab, menghargai peningkatan dan pengoptimalan berkelanjutan, dan mengadopsi budaya tanpa cela yang menggabungkan pembelajaran berkelanjutan.
OE:02 Formalisasi cara Anda menjalankan tugas operasional rutin, sesuai kebutuhan, dan darurat dengan menggunakan dokumentasi, daftar periksa, atau otomatisasi. Berusahalah untuk konsistensi dan prediktabilitas untuk proses dan hasil kerja tim dengan mengadopsi praktik dan pendekatan terkemuka di industri, seperti pendekatan shift left .
OE:03 Formalisasi ideasi perangkat lunak dan proses perencanaan. Ambil dari standar industri dan organisasi yang mapan. Gunakan backlog umum yang diprioritaskan dan spesifikasi yang cukup rinci. Berdasarkan hasil, dorong peningkatan berkelanjutan dalam proses perencanaan Anda.
OE:04
OE:04
OE:04
Optimalkan pengembangan perangkat lunak dan proses jaminan kualitas dengan mengikuti praktik pengembangan dan pengujian yang terbukti di industri. Untuk penentuan peran yang tidak ambigu, standarisasi praktik di seluruh komponen seperti alat, kontrol sumber, pola desain aplikasi, dokumentasi, dan panduan gaya.
OE:05 Siapkan sumber daya dan konfigurasinya dengan menggunakan pendekatan infrastruktur sebagai kode (IaC) standar. Seperti kode lain, rancang IaC dengan gaya yang konsisten, modularisasi yang sesuai, dan jaminan kualitas. Lebih suka pendekatan deklaratif jika memungkinkan.
OE:06 Bangun rantai pasokan beban kerja yang mendorong perubahan yang diusulkan melalui alur otomatis yang dapat diprediksi. Alur menguji dan mempromosikan perubahan tersebut di seluruh lingkungan. Optimalkan rantai pasokan untuk membuat beban kerja Anda dapat diandalkan, aman, hemat biaya, dan berkinerja.
OE:07
OE:07
Merancang dan menerapkan sistem pemantauan untuk memvalidasi pilihan desain dan menginformasikan desain dan keputusan bisnis di masa mendatang. Sistem ini menangkap dan mengekspos telemetri operasional, metrik, dan log yang dikeluarkan dari infrastruktur dan kode beban kerja.
OE:08 Mengembangkan praktik operasi darurat yang efektif. Pastikan beban kerja Anda memancarkan sinyal kesehatan yang bermakna di seluruh infrastruktur dan kode. Kumpulkan data yang dihasilkan dan gunakan untuk menghasilkan pemberitahuan yang dapat ditindakkan yang memberlakukan respons darurat melalui dasbor dan kueri. Tentukan tanggung jawab manusia dengan jelas, seperti rotasi saat panggilan, manajemen insiden, akses sumber daya darurat, dan postmortem yang berjalan.
OE:09 Mengotomatiskan semua tugas yang tidak mendapat manfaat dari wawasan dan kemampuan beradaptasi intervensi manusia, sangat prosedural, dan memiliki umur simpan yang menghasilkan pengembalian investasi otomatisasi. Jika memungkinkan, pilih perangkat lunak off-the-shelf untuk otomatisasi versus implementasi kustom. Perlakukan semua otomatisasi sama dengan komponen beban kerja, dan terapkan pilar Well-Architected Framework ke desain dan implementasinya.
OE:10 Merancang dan menerapkan otomatisasi di muka untuk operasi seperti masalah siklus hidup, bootstrapping, dan penerapan pagar pembatas tata kelola dan kepatuhan. Jangan coba retrofit otomatisasi nanti. Pilih fitur otomatisasi yang disediakan platform Anda.
OE:11 Tentukan dengan jelas praktik penyebaran aman beban kerja Anda. Tekankan cita-cita dari metode rilis kecil, bertahap, dan terjaga kualitasnya. Gunakan pola penyebaran modern dan teknik paparan progresif untuk mengontrol risiko. Akun untuk penyebaran rutin dan darurat, atau perbaikan, penyebaran.
OE:12 Terapkan strategi mitigasi kegagalan penyebaran yang mengatasi masalah pertengahan peluncuran yang tidak terduga dengan pemulihan yang cepat. Gabungkan beberapa pendekatan, seperti putar kembali, penonaktifan fitur, atau menggunakan kemampuan asli pola penyebaran Anda.

Langkah berikutnya

Kami menyarankan agar Anda meninjau tradeoff Keunggulan Operasional untuk mengeksplorasi konsep lain.