Dasar-dasar respons insiden

Selesai

Saat ini, organisasi mendapat keuntungan dari aksesibilitas, efisiensi, dan kenyamanan cloud, tetapi mereka menghadapi banyak tantangan saat menjalani transformasi digital yang melibatkan pemindahan sebagian bisnis mereka ke layanan cloud.

Beberapa tantangan umum yang mungkin Anda hadapi di organisasi Anda meliputi:

  • Peningkatan jumlah gangguan layanan
  • Tidak ada metode yang efektif untuk melacak dan merespons insiden (semuanya bersifat ad hoc dan reaksioner)
  • Waktu untuk resolusi yang tidak dapat diterima
  • Waktu untuk resolusi tidak membaik atau semakin buruk
  • Informasi dan status sulit ditemukan
  • Pengulangan masalah dan kesalahan yang sama

Untuk memenuhi tantangan ini, Anda memerlukan rencana respons insiden yang terdefinisi dengan baik yang dibangun di atas fondasi yang kuat.

Dasar-dasar dan pilar

Tujuan dari dasar-dasar adalah untuk mendukung dan menahan struktur di atasnya. Dalam modul pengantar yang terpisah dari jalur pembelajaran ini, kami membahas gagasan bahwa pekerjaan keandalan dibangun di atas tingkat pemantauan dasar dan bahwa dalam hierarki, respons insiden berada tepat di atas dasar ini.

Respons insiden juga memiliki dasar sendiri. Ada tiga pilar yang mendukung rencana respons insiden yang baik:

  • Daftar nama
  • Peran
  • Rotasi

Dalam unit ini, Anda akan mengetahui apa masing-masing pilar ini dan bagian apa yang mereka mainkan dalam merancang strategi respons insiden yang menggerakkan Anda lebih jauh di sepanjang jalur menuju tujuan keandalan Anda.

Daftar nama

Sangat penting untuk memiliki rencana yang baik, tetapi rencana tidak berguna tanpa orang untuk mengeksekusinya. Dengan demikian, tempat terbaik untuk memulai adalah dengan menentukan siapa yang diharapkan untuk menanggapi masalah dan cara memberi tahu mereka kapan respons mereka diperlukan.

Cara terbaik untuk mengatasi tantangan ini adalah dengan merancang daftar nama. Daftar nama adalah daftar orang-orang yang ditetapkan ke tim yang sedang bertugas. Tim ini harus terdiri dari beberapa teknisi. Anggota tim ini harus memiliki pengetahuan dan keterampilan untuk mengatasi jenis masalah yang dapat terjadi di lingkungan Anda, serta pelatihan dalam respons insiden.

Namun, daftar nama saja tidak cukup. Anda perlu membangun kerangka kerja di sekitar siapa yang sedang menelepon pada titik tertentu, dan apa yang harus dilakukan setiap orang. Di situlah peran masuk.

Peran

Peran mengurutkan apa yang akan menjadi kacau —atau paling baik ad hoc—respons. Ini dilakukan dengan menentukan fungsi tertentu yang akan diasumsikan oleh setiap orang dalam situasi tertentu, dan tempat masing-masing dalam "rantai perintah." Peran dapat bervariasi menurut organisasi atau bahkan berdasarkan jenis insiden, tetapi peran berikut umumnya harus menjadi bagian dari tim respons insiden yang terorganisir:

  • Responden utama: Ini adalah "orang titik" yang biasanya menjadi orang pertama di tempat kejadian; yaitu, teknisi panggilan pertama yang dipanggil ketika insiden terjadi.
  • Responden sekunder: Ini adalah seseorang yang bertindak sebagai cadangan dan dapat masuk jika responden utama tidak tersedia atau jika sepasang mata kedua diperlukan.
  • Pakar subjek (UKM): Mereka adalah orang-orang yang memiliki pengetahuan mendalam tentang faset tertentu dari operasi Anda. Mereka ada di sana jika responden utama dan sekunder perlu meningkatkan masalah kepada seseorang dengan lebih banyak keahlian. Mereka tidak dihubungi sepanjang waktu, tetapi tersedia ketika keterampilan khusus mereka diperlukan. Anda harus mempertahankan daftar UKM dalam berbagai subjek (misalnya, database, front-end, infrastruktur jaringan, aplikasi web, keamanan cyber, dan sebagainya).
  • Komandan insiden: Ini adalah peran penting dalam insiden atau pemadaman skala besar yang berdampak pada banyak komponen dan/atau yang berbeda memerlukan koordinasi di berbagai tim dan sistem. Seorang komandan insiden akan menjadi orang yang mengoordinasikan banyak percakapan dan upaya mengenai aktivitas respons dan remediasi. Komandan insiden mengawasi "gambaran besar"; mereka terus mengawasi apa yang terjadi dan siapa yang melakukan apa. Komandan insiden sangat bagus untuk memastikan bahwa insinyur tetap fokus dan bahwa mereka bekerja pada upaya remediasi mereka sendiri tanpa menginjak atau membatalkan pekerjaan satu sama lain.
  • Scribe: Peran jubir adalah mendokumentasikan percakapan sekeliling insiden sedetail mungkin. Tim biasanya menggunakan penghubung telepon, panggilan konferensi, atau obrolan video untuk mengumpulkan semua orang dan mencoba memahami apa yang terjadi, yang tentunya dapat membantu menciptakan ruang untuk percakapan. Namun, sulit bagi kami untuk melalui dan memahami secara rinci apa yang dikatakan dan dilakukan teknisi kecuali ditranskripsikan. Akibatnya, seorang jubir adalah orang yang dapat membantu kami mendokumentasikan sebanyak mungkin untuk ditinjau nanti. Jubir mengambil semua data yang mungkin; bukan hanya apa yang dilakukan anggota tim, tetapi juga apa yang mereka katakan dan bahkan apa yang mereka rasakan atau alami.
  • Koordinator komunikasi: Anggap orang ini sebagai "manajer hubungan masyarakat" untuk insiden tersebut. Koordinator komunikasi bekerja bersama dengan komandan insiden untuk berbagi informasi tentang insiden dengan mereka yang tidak terlibat dalam bekerja secara aktif untuk mengatasi dan memulihkan dari insiden tersebut. Ini dapat mencakup pelanggan, tim penjualan dan pemasaran, dukungan pelanggan, dan pemangku kepentingan lain di dalam atau di luar organisasi yang perlu mengetahui apa yang terjadi dan status bagaimana respons dan remediasi berkembang.

Rotasi

Sekarang Anda memiliki daftar personel tim respons dan telah menetapkan peran yang sesuai. Langkah selanjutnya dan terakhir adalah membuat rotasi, yaitu jadwal yang menetapkan shift untuk setiap orang yang sedang bertugas.

Ada banyak cara berbeda untuk membagi shift. Penjadwalan shift dapat menjadi proses strategis yang kompleks. Shift tidak boleh ditetapkan secara acak; Anda harus memikirkan penjadwalan untuk membuatnya seefektif—dan senyaman mungkin bagi anggota tim—sedapat mungkin.

Beberapa metode penjadwalan shift antara lain:

  • 24 x 7: Ini adalah rotasi di mana anggota tim dipanggil selama beberapa hari berturut-turut. Ini adalah cara sederhana untuk mengalokasikan cakupan shift, tetapi Anda harus berhati-hati untuk membatasi durasinya. Pergeseran rotasi lebih dari tiga hingga empat hari dapat merugikan kesehatan keseluruhan staf teknik, dan dengan demikian mengurangi keandalan seluruh sistem.
  • Ikuti pergeseran matahari: Ini adalah model shift di mana teknisi menjadwalkan shift panggilan mereka hanya selama jam kerja normal mereka dan kemudian menyerahkan tanggung jawab on-call mereka di akhir hari kerja mereka ke kolega lain yang terletak di zona waktu yang berbeda.

Ini hanya beberapa contoh cara pembagian shift. Poin pentingnya adalah membagi shift dengan cara yang paling sesuai untuk individu di tim respons Anda. Ada banyak cara untuk menyesuaikan shift, terutama untuk akhir pekan, ketika teknisi membutuhkan lebih banyak fleksibilitas. Teknisi harus dapat dengan mudah menyerahkan peran kepada orang lain ketika konflik yang tidak terkait dengan pekerjaan muncul.

Uji pengetahuan Anda

1.

Manakah dari hal-hal berikut yang merupakan pilar respons insiden?

2.

Apa yang dilakukan peran scribe sebagai bagian dari respons insiden?

3.

Apakah Anda memerlukan semua peran yang disebutkan dalam unit ini agar berhasil melakukan respons insiden?