Pemantauan tumpukan penuh di Azure

Selesai

Organisasi Anda memindahkan semua sistemnya dari lokasi lokal ke Azure, dan ingin Anda merancang strategi pemantauan. Unit ini menjelaskan bagaimana strategi pemantauan tumpukan penuh dapat meningkatkan pengalaman pelanggan dengan memberikan kemampuan untuk mengidentifikasi dan mengurangi masalah di semua lapisan aplikasi dan infrastruktur Anda.

Menggunakan pemantauan tumpukan penuh

Pemantauan tumpukan penuh adalah pendekatan lengkap untuk memantau, melakukan triaging, dan mendiagnosis masalah aplikasi, infrastruktur, dan keamanan. Pemantauan tumpukan penuh mencakup pengumpulan telemetri, melacak indikator performa utama, mengisolasi masalah, dan menganalisis akar penyebabnya.

Aplikasi dan infrastruktur Anda mungkin menghadapi berbagai jenis masalah yang berpotensi merusak, seperti waktu respons yang buruk, mengubah tingkat penggunaan, pengecualian, dan risiko keamanan. Respons Anda harus sesuai dengan jenis masalah. Anda dapat merespons dengan meningkatkan kapasitas untuk memenuhi peningkatan beban, atau dengan mengubah aplikasi atau infrastruktur Anda untuk meningkatkan performa dan mengurangi kesalahan.

Dengan alat yang tepat, Anda dapat:

  • Pantau infrastruktur dan performa aplikasi Anda.
  • Pantau risiko keamanan dan aktivitas yang mencurigakan.
  • Kumpulkan informasi tentang masalah segera setelah muncul.
  • Analisis dan tanggapi informasi yang Anda kumpulkan.

Dengan memantau aplikasi dan infrastruktur Anda dengan pendekatan tumpukan penuh, Anda merespons perubahan dan masalah dengan cepat dan tepat. Strategi ini dapat membantu organisasi Anda menjadi lebih produktif, hemat biaya, aman, dan kompetitif.

Memantau aplikasi Anda

Pantau aplikasi Anda untuk masalah saat Anda mengembangkannya untuk mencegah kesalahan dan pengecualian nanti dalam produksi. Untuk meningkatkan siklus hidup pengembangan Anda, pastikan kode Anda didorong ke tahap berikutnya dari siklus pengembangan hanya jika berhasil melewati pemeriksaan yang diperlukan.

Pantau juga aplikasi Anda saat ditayangkan dan digunakan. Anda mungkin dihadapkan dengan permintaan yang gagal, waktu respons server tinggi, atau masalah ketersediaan. Dengan memantau masalah langsung, Anda segera mengidentifikasi jenis masalah dan risiko ini, dan dapat merespons secara efektif untuk menjaga aplikasi Anda tetap sehat.

Screenshot of Application Key Performance Indicators (KPIs).

Untuk meningkatkan kesehatan aplikasi Anda dan membangun aplikasi yang lebih baik di masa mendatang, konfigurasikan pemberitahuan dan respons otomatis untuk membantu Anda menangani masalah aplikasi.

Memantau infrastruktur Anda

Berbagai jenis masalah bisa memengaruhi infrastruktur Anda. Anda mungkin harus menangani masalah performa atau masalah yang dapat membuat layanan Anda tidak dapat dijangkau atau seluruh infrastruktur tidak tersedia. Salah satu masalah ini bisa mengakibatkan penurunan produktivitas, kerugian finansial, atau kerusakan reputasi organisasi Anda.

Untuk menangani masalah apa pun yang muncul secara tepat waktu dan efektif, Anda dapat mengonfigurasi pemberitahuan untuk memantau infrastruktur Anda untuk berbagai masalah. Misalnya, Anda dapat mengonfigurasi pemberitahuan untuk:

  • Pemanfaatan sumber daya infrastruktur Anda.
  • Ketersediaan dan kesehatan infrastruktur Anda.
  • Peristiwa tertentu yang terjadi di tingkat sistem operasi.

Anda dapat mengonfigurasi pemberitahuan untuk memulai proses yang memberi tahu seseorang atau tim untuk mengambil tindakan yang sesuai. Anda juga bisa memicu respons otomatis terhadap peringatan dengan playbook dan webhook.

Anda juga dapat menggunakan data pemantauan infrastruktur untuk analisis operasional dan perencanaan kapasitas. Anda dapat mengumpulkan data performa dari sistem operasi tamu komputer virtual (VM) ke dalam bagan untuk tujuan perbandingan dan tren untuk menginformasikan pengambilan keputusan.

Screenshot of VM KPIs.

Memantau sumber daya platform Azure

Selain memantau aplikasi dan infrastruktur yang disebarkan, Anda dapat menggunakan kemampuan bawaan Azure untuk memantau sumber daya platform Azure Lainnya. Sumber daya Azure seperti Akun Penyimpanan, Key Vault, dan database Azure Cosmos DB memiliki metrik performa dan log sumber daya yang dapat Anda lihat dan analisis untuk melacak performa dan ketersediaan.

Jenis sumber daya Azure ini dan lainnya menawarkan wawasan khusus yang memberikan pengalaman pemantauan yang telah ditentukan sebelumnya di seluruh langganan, grup sumber daya, dan sumber daya lainnya. Cuplikan layar berikut menunjukkan wawasan penyimpanan Azure Monitor yang menampilkan penggunaan dan latensi untuk beberapa akun penyimpanan di dua langganan.

Screenshot of Azure Storage KPIs.

Anda juga dapat melihat dan mengumpulkan log yang terkait dengan Active Directory untuk penyewa Azure Anda, serta Service Health dan log aktivitas untuk langganan Azure. Solusi pemantauan tumpukan penuh mencakup visibilitas ke sumber daya platform Azure yang bergantung pada aplikasi dan infrastruktur Anda.

Pantau keamanan

Penting juga untuk memantau keamanan aplikasi dan infrastruktur Anda untuk memastikan bahwa aplikasi dan infrastruktur selalu tetap terlindungi dan tersedia. Anda harus memantau dan memberi tahu tentang penyelundupan data dan risiko apa pun terhadap keamanan infrastruktur Anda, seperti akun pengguna yang mencurigakan atau alamat IP berbahaya. Solusi pemantauan keamanan Anda harus mencakup deteksi anomali otomatis yang kuat dan manajemen peristiwa untuk menggabungkan beberapa peristiwa terkait ke dalam satu pemberitahuan yang dapat ditindaklanjuti.

Ringkasan

Mengambil pendekatan tumpukan penuh untuk memantau aplikasi dan infrastruktur Membantu Anda merespons masalah dengan tepat dan lebih efektif. Anda dapat memperkuat perlindungan Anda serta membangun aplikasi dan infrastruktur yang ditingkatkan. Pendekatan tumpukan penuh juga membantu Anda mendapatkan kesadaran situasi, dan Anda belajar dari masalah yang memengaruhi lingkungan Anda.

Uji pengetahuan Anda

1.

Pada titik apa tim DevOps harus menerapkan pemantauan aplikasi untuk kesehatan dan performa aplikasi yang optimal?

2.

Apa istilah untuk strategi pemantauan yang mengambil pendekatan lengkap untuk memantau, melakukan triaging, dan mendiagnosis masalah aplikasi, infrastruktur, dan keamanan?