Bagikan melalui


Pengamatan dalam pemantauan cloud

Artikel ini adalah bagian dari seri dalam panduan pemantauan cloud.

Bagian di bawah ini bertujuan untuk mendorong kematangan operasional dengan menjadi jeli dan terus berulang untuk meningkatkan cara Anda memantau layanan Anda. Pelajari cara organisasi menerapkan strategi pemantauan yang konsisten lebih cepat dengan menetapkan pengamatan untuk setiap solusi pemantauan.

Menentukan pengamatan

Meskipun pengamatan dan pemantauan saling melengkapi, ada perbedaan penting:

  • Pemantauan: Mengumpulkan informasi dan memberi tahu Anda bahwa itu mendeteksi masalah berdasarkan Anda mengonfigurasinya untuk memantau kondisi tersebut. Anda memantau kegagalan yang diketahui atau dapat diprediksi.
  • Pengamatan: Kemampuan untuk memahami apa yang terjadi di dalam sistem dengan melihat data output. Solusi pengamatan membantu Anda menganalisis data ini untuk menilai kesehatan sistem dan menemukan cara untuk memperbaiki masalah dalam infrastruktur TI Anda.

Pengamatan pertama-tama mendorong konsumen pemantauan untuk memahami apa yang dianggap sebagai operasi normal layanan. Dengan kata lain, Anda mencari visibilitas total sesegera mungkin.

Setelah mencapai pengamatan awal, Anda membangun tingkat visibilitas awal tersebut untuk mengembangkan pemberitahuan yang dapat ditindaklanjuti, membuat dasbor yang berguna, dan mengevaluasi solusi AIOps. Wawasan ini memungkinkan Anda nyaman dengan metrik yang mendasar dan data pemantauan log.

Catatan

Ini adalah kebalikan dari pendekatan yang digunakan di masa lalu ketika tim bekerja untuk menentukan semua persyaratan pemantauan terlebih dahulu di atas kertas sebelum membangun, menguji, dan menyebarkan.

Apakah rencana pemantauan Anda menargetkan aplikasi, infrastruktur cloud, atau Platform Azure, langkah pertama adalah membangun pengamatan.

Pendekatan ini juga menyederhanakan rencana Anda. Dalam semua kasus, visibilitas total berarti mencapai dan mempertahankan visibilitas yang memadai di tiga dimensi atau aspek:

  1. Pantau secara mendalam: Kumpulkan sinyal yang bermakna dan relevan.
  2. Pantau end-to-end atau luas: Dari lapisan terendah tumpukan ke aplikasi.
  3. Pantau di seluruh model kesehatan: Fokus pada aspek kesehatan, seperti ketersediaan, performa, keamanan, dan kelangsungan.

Three-sided cube example

Pengamatan lebih dari sekadar fokus untuk tim TI Anda. Tujuan pentingnya adalah memastikan pengguna akhir dapat menggunakan sistem dan Tujuan Tingkat Layanan (SLO) Anda terpenuhi.

Solusi pemantauan dan pengamatan

Pemantauan infrastruktur dan aplikasi dapat menjadi rumit. Transformasi bisnis menerapkan teknologi untuk mencapai dan membantu membentuk strateginya. Cloud semakin memengaruhi sifat pemantauan yang rumit.

Ini ditunjukkan dengan cara-cara berikut:

  • Pergeseran transformasi digital: Upaya transformasi digital bisnis beralih ke hiper-eksploitasi teknologi cloud.
  • Pemantauan bawaan: Pemantauan menjadi disematkan ke dalam sumber daya Azure dan grup sumber daya versus alat terpisah yang Anda kelola di tempat.
  • Arsitektur cloud-native pemantauan ekspansif seperti Azure Monitor mirip dengan alat insiden keamanan dan manajemen peristiwa (SIEM). Azure Monitor berukuran ekspansif, berbasis log, dan urutan besarnya lebih fleksibel daripada alat lokal tradisional.

Arsitek harus, seperti operator, memahami informasi diagnostik apa yang dikeluarkan komponen infrastruktur atau aplikasi.

Menggabungkan aliran log multivariat, dinamis, rangkaian waktu, eventful, stateful, dan telemetrik ke kecerdasan yang berharga tergantung pada hal-hal berikut:

  • Pengetahuan tim: Pengetahuan dan pengalaman pengembang atau insinyur sistem yang sangat memahami target pemantauan.
  • Pengalaman pemecahan masalah: Pengalaman dukungan dan pemecahan masalah dalam menggunakan data untuk menemukan atau menemukan penyebab masalah.
  • Pembelajaran dari riwayat: Tinjau insiden sebelumnya untuk menemukan alasan non-teknologi yang dapat diperbaiki secara otomatis nanti.
  • Dokumentasi: Panduan dalam dokumentasi, perangkat lunak, pelatihan, atau konsultasi oleh vendor perangkat lunak atau perangkat keras.

Microsoft dan mitranya menyediakan paket manajemen untuk System Center Operations Manager. Paket manajemen khusus teknologi; misalnya, jika Anda mengimpor paket manajemen SQL, Operations Manager secara otomatis menemukan dan menargetkan server yang menghosting SQL Server dan mulai memantaunya. Di sini, pengamatan kurang lebih ditentukan sebelumnya. Manajer Operasi terutama dirancang untuk infrastruktur lokal, yang cenderung diperbaiki dalam komponen dan pola desain arsitektur relatif terhadap layanan cloud.

Di cloud, Anda memiliki fleksibilitas yang sangat besar dalam jenis layanan yang dapat dipilih. Pemantauan mencakup bagaimana layanan berubah dari waktu ke waktu, dan dapat bersifat dinamis, global, dan tangguh. Dengan Azure Monitor, Anda dapat memanfaatkan buku kerja yang ada yang disertakan dalam Azure Monitor Insights yang menyediakan fungsionalitas yang mirip dengan paket manajemen di Operations Manager.

Seni menjadi pengamat

Pengamatan bergantung pada apa dan bagaimana sesuatu sedang dipantau.

Di Azure, ada beberapa sumber data pemantauan, masing-masing memberikan perspektif yang berbeda tentang bagaimana sesuatu berperilaku. Azure menyertakan banyak alat untuk membantu menganalisis berbagai aspek data ini.

Amati platform

Di Azure, Microsoft menyediakan perspektif penyedia layanan melalui log platform yang berbeda.

Layanan di Azure dapat berubah dengan cara yang berbeda dan tidak dapat diprediksi dari waktu ke waktu. Kami menyebut perilaku ini sebagai dinamis. Manajer layanan cloud yang mengamati layanan dari waktu ke waktu juga perlu memperhitungkan hal-hal berikut:

  • Relokasi sumber daya: Sumber daya dapat memigrasikan atau berpindah di seluruh lokasi atau geografi.
  • Perubahan sumber daya: Sumber daya ditambahkan, dihapus, atau dimodifikasi.
  • Konsumsi: Konsumsi bervariasi untuk layanan dan implementasi yang berbeda. Berhati-hatilah untuk memantau biaya, konsumsi, dan proyeksi pengeluaran.

Berikut adalah beberapa contoh alat yang memungkinkan pengamatan platform Anda:

Sumber log Deskripsi
Kesehatan layanan Insiden layanan dan pemeliharaan terencana yang dilaporkan oleh Microsoft.
Azure Resource Health Laporan tentang kesehatan sumber daya Anda saat ini dan sebelumnya.
Log aktivitas Azure Monitor Melaporkan peristiwa tingkat langganan di semua sumber daya yang disebarkan dalam langganan.
Analisis Perubahan Azure Monitor Laporan tentang perubahan pada aplikasi Azure Anda dan mengurangi rata-rata waktu untuk memperbaiki (MTTR).
Log sumber daya Azure Sebelumnya dikenal sebagai log diagnostik, log sumber daya melaporkan operasi yang dilakukan dalam sumber daya Azure, pada bidang data.
Log laporan Microsoft Entra (AzureAD) Laporan tentang riwayat aktivitas masuk dan jejak audit perubahan di ID Microsoft Entra untuk penyewa tertentu.
Azure Advisor Gunakan Azure Advisor untuk menerima solusi yang direkomendasikan berdasarkan praktik terbaik untuk mengoptimalkan penyebaran Azure Anda.
Log transparansi Microsoft Cloud for Sovereignty Laporan tentang kapan sumber daya diakses dan teknisi Microsoft mana yang mengakses sumber daya. Log transparansi memberikan detail akses ke sumber daya pelanggan. Log juga memberi tahu Anda ketika belum ada akses, yang umum.

Observabilitas berkembang secara bertahap, dimulai dengan rencana pemantauan minimal yang layak, dan upaya untuk mengintegrasikan alat dan proses sedang berlangsung. Saat Anda nyaman dengan data (metrik, log, dan transaksi), Anda dapat memahami perilaku dan tanda-tanda gejala atau masalah dari sumber daya atau aplikasi tersebut. Dengan membiasakan diri dengan data, Anda membangun kepercayaan dalam bekerja dengan Azure Monitor dan data.

Mendapatkan keyakinan dari pengamatan

Dengan pengamatan yang tepat, Anda mendapatkan kepercayaan diri, dan Anda dapat menyadari penyebabnya dan menemukan jawaban yang dapat membantu. Semakin banyak Anda mempelajari tentang data Anda, semakin berkembang proses Anda dan tim Anda mendapatkan wawasan.

Untuk mengatur adegan, berikut adalah beberapa cara untuk mendapatkan kepercayaan diri dari pengamatan:

  • Meningkatkan prediksi: Pemantauan sumber daya dan layanan yang ditingkatkan membantu mengidentifikasi masalah secara proaktif, membuatnya dapat diprediksi dan dikelola di masa mendatang.

  • Deteksi dini anomali: Pengamatan memungkinkan deteksi kelainan atau penyimpangan tepat waktu dari perilaku yang diharapkan, mengurangi dampak potensi masalah.

  • Identifikasi akar penyebab: Data observabilitas terperinci membantu mengidentifikasi akar penyebab masalah, memungkinkan resolusi yang lebih cepat dan mencegah pengulangan.

  • Tingkatkan efisiensi pemecahan masalah: Dengan pengamatan, tim dapat dengan cepat mendiagnosis dan memecahkan masalah kompleks dengan menganalisis data yang relevan dan menghubungkan peristiwa.

  • Meningkatkan keandalan sistem: Dengan mengidentifikasi hambatan, masalah performa, dan titik kegagalan potensial, pengamatan membantu mengoptimalkan performa sistem dan meningkatkan keandalan keseluruhan.

  • Meningkatkan pengalaman pelanggan: Pengamatan memungkinkan pemahaman yang lebih baik tentang bagaimana performa sistem memengaruhi pengguna akhir, memungkinkan langkah-langkah proaktif untuk meningkatkan kepuasan pelanggan.

  • Memfasilitasi kolaborasi: Platform observabilitas memberikan visibilitas dan akses data bersama, mempromosikan kerja sama antara tim yang berbeda, seperti pengembang, operasi, dan dukungan.

  • Kepatuhan terhadap peraturan: Pengamatan membantu memenuhi persyaratan peraturan dengan memberikan keterlacakan, log audit, dan memastikan kepatuhan terhadap standar keamanan dan privasi.

  • Waktu penyelesaian yang lebih cepat: Dengan memberikan data dan wawasan yang kaya, pengamatan mempercepat waktu untuk mendiagnosis dan menyelesaikan masalah, meminimalkan gangguan waktu henti dan layanan.

  • Manajemen kapasitas proaktif: Data observabilitas membantu memprediksi permintaan sumber daya, mengidentifikasi kesenjangan kapasitas, dan secara proaktif menyesuaikan sumber daya untuk mempertahankan performa optimal.

  • Mitigasi risiko: Dengan pengamatan, Anda dapat mengidentifikasi potensi risiko lebih awal, memungkinkan langkah-langkah mitigasi proaktif dan mengurangi kemungkinan dampak yang parah.

  • Pemantauan dan pembelajaran berkelanjutan: Pengamatan memungkinkan pemantauan dan pembelajaran yang sedang berlangsung, membantu tim beradaptasi dengan perubahan lingkungan, persyaratan, dan perilaku pengguna.

  • Pengoptimalan performa: Dengan menganalisis data observabilitas, tim dapat mengidentifikasi dan mengoptimalkan penyempitan performa, meningkatkan efisiensi sistem.

  • Prioritas upaya: Wawasan observabilitas memungkinkan tim untuk memprioritaskan tugas dan mengalokasikan sumber daya berdasarkan kekritisan dan dampak masalah yang diidentifikasi.

  • Keyakinan dalam manajemen perubahan: Pengamatan memberikan visibilitas ke dalam dampak perubahan, memastikan bahwa penyebaran atau pembaruan baru tidak menimbulkan masalah yang tidak terduga.

  • Respons insiden yang ditingkatkan: Dengan pengamatan, tim respons insiden dapat dengan cepat mengumpulkan informasi yang relevan, memahami konteks, dan memulai tindakan yang sesuai.

Rencana pemantauan

Anda membuat rencana pemantauan untuk menjelaskan tujuan dan tujuan, persyaratan, dan detail penting lainnya. Kemudian bekerja untuk meminta kesepakatan antara semua pemangku kepentingan yang relevan dalam organisasi.

Rencana pemantauan harus menjelaskan cara mengembangkan dan mengoperasikan satu atau lebih solusi pemantauan. Mulai buat rencana pemantauan Anda lebih awal selama fase strategi dan perencanaan proyek.

Saat membuat rencana, penting untuk mengingat lima disiplin pemantauan modern, seperti yang diuraikan dalam dokumentasi strategi pemantauan cloud: memantau, mengukur, merespons, belajar, dan meningkatkan.

Berikut ini menyediakan kerangka awal yang direkomendasikan untuk rencana pemantauan, dan dianggap sebagai pertimbangan utama untuk paket individual untuk layanan atau saat menstandarkan fitur layanan cloud seperti jenis sumber daya Azure atau layanan Microsoft 365.

Inti dari rencana ini adalah untuk menentukan garis visibilitas antara penyedia layanan (siapa yang akan medan solusi) dan konsumen (yang akan beroperasi atau memperoleh nilai).

Perspektif bisnis

Rencana pemantauan komprehensif harus mempertimbangkan apa yang dibutuhkan bisnis dengan dan dari pemantauan, termasuk fokus yang berfokus pada pengguna. Saat menentukan rencana, penting untuk mendokumentasikan dan berbagi persyaratan bisnis, dan yang berikut menunjukkan cakupan bagian rencana ini.

  • Pemangku kepentingan dan konsumen
  • Aliran dan proses nilai bisnis
  • Perspektif dan utilitas pengguna akhir
  • Persyaratan pengukuran dan pelaporan
  • Risiko yang teridentifikasi dan kerangka kerja kontrol kepatuhan
  • Persyaratan akses dan kontrol
  • Risiko terhadap bisnis

Perspektif layanan

Rencana pemantauan komprehensif harus mempertimbangkan apa yang dibutuhkan pemilik layanan dengan dan dari pemantauan. Saat menentukan rencana, penting untuk mendokumentasikan dan membagikan persyaratan mereka, dan yang berikut menunjukkan cakupan bagian rencana ini.

  • Pemangku kepentingan dan konsumen
  • Peran dan akuntabilitas
  • Definisi layanan
  • Persyaratan akses dan kontrol
  • Pertimbangan arsitektur?
  • Kontrak pendukung pemasok dan mitra
  • Perjanjian layanan (SLA, OLA)
  • Identifikasi cakupan garansi layanan
  • Persyaratan pengukuran dan pelaporan
  • Risiko

Perspektif teknologi

Bagian rencana ini mewakili solusi pemantauan menggunakan informasi dari perspektif bisnis dan layanan. Berikut ini menunjukkan cakupan bagian rencana ini.

  • Cerita dan skenario pengguna
  • Target teknis (misalnya, jaringan)
  • Pemetaan dependensi komponen
  • Jenis (misalnya, cloud-native, hibrid, lokal)
  • Observasional
  • Responsif
  • Pengukuran
  • Penyetelan dan pengoptimalan

Pertimbangan

Buat ringkasan rencana untuk memastikannya berkomunikasi dan memberi tahu semua konsumen, pemangku kepentingan, dan tingkat manajemen yang relevan. Untuk rencana pemantauan yang berhasil, pertimbangkan poin-poin ini:

Pertimbangan kunci

  • Tahap produksi: Solusi pemantauan harus siap ketika layanan ditayangkan. Perencanaan dapat mencakup konfigurasi pengujian atau praproduksi dalam langganan lain yang didedikasikan untuk membantu bereksperimen dan menguji asumsi Anda.

  • Strategi: Rencana juga dapat memetakan kembali ke pemantauan dan strategi IT untuk melacak tujuan pemantauan ke misi atau bisnis.

  • Target: Dalam rencana tersebut, jelaskan dan analisis aset atau layanan target yang sedang dalam pertimbangan. Jika diperlukan, petakan semua komponen untuk dipantau, termasuk dependensi layanan. Identifikasi kesenjangan cakupan dan tentukan pemilik dari setiap bagian layanan.

  • Solusi: Untuk solusi pemantauan, identifikasi konsumen, pemangku kepentingan, pemasok, mitra, akses, dan instrumentasi. Selain itu, memantau aspek, cakupan, respons, laporan, dan dasbor (ketersediaan, keamanan, pengalaman pengguna, dan banyak lagi).

Pertimbangan umum

Selain pertimbangan utama, cari untuk lebih memahami bagaimana poin-poin ini dapat memengaruhi rencana pemantauan Anda untuk organisasi Anda.

  • Produk layak minimum (MVP): Biarkan rencana menentukan seperti apa keberhasilan untuk produk layak minimum. Dengan kata lain, apa yang awalnya diperlukan untuk ditayangkan, dan dapatkah kita mengukur keberhasilan dalam hal ini? Setelah ditayangkan, Anda terus mengembangkan solusi pemantauan untuk memaksimalkan nilai.

  • Amankan data pemantauan Anda: Keamanan adalah aspek penting bagi setiap organisasi dan tim saat ini. Pastikan Anda berpendidikan dan mengetahui pagar pembatas, atau biarkan para ahli memandu Anda sehingga Anda tidak menambahkan risiko ke solusi pemantauan Anda, misalnya, dengan mengekspos data pemantauan sensitif dalam log.

  • Pertimbangkan Microsoft 365: Paket apa pun yang baik menganggap penyewa Azure Anda dengan Microsoft 365 sebagai komponen yang signifikan. Microsoft 365 bergantung pada ID Microsoft Entra, dan Azure Monitor menyediakan integrasi Microsoft 365 dengan manajemen titik akhir.

  • Pengamatan menang: Fokus pada visibilitas total sebelum berfokus pada peringatan, karena memperingatkan keduanya adalah biaya, dan dapat dengan cepat menyebabkan kelelahan pemberitahuan.

  • Pemantauan aktivitas: Log audit, rincian masuk, dan aktivitas sekarang mudah bagi pemilik layanan dan keamanan untuk menggoreng dan dadu. Pastikan rencana pemantauan Anda mempertimbangkan pemantauan aktivitas, termasuk wawasan dan dasbor yang perlu Anda buat untuk pemangku kepentingan yang relevan.

Langkah berikutnya