Siapkan operasi cloud Azure Anda

Mengelola lingkungan Azure Anda bukan hanya tentang menjaga lampu tetap menyala. Ini tentang menjaga tata kelola dan keamanan sambil memastikan cloud Anda tetap selaras dengan tujuan bisnis dari waktu ke waktu. Seiring pertumbuhan lingkungan, Anda perlu mencegah penyimpangan konfigurasi, meningkatkan penyebaran melalui infrastruktur sebagai kode, dan mengelola perubahan secara efektif.

Metodologi Cloud Adoption Framework (CAF) Manage memperkenalkan pendekatan RAMP (Siap, Mengatur, Memantau, Melindungi) untuk membantu Anda membangun kemampuan ini. RAMP menyediakan cara terstruktur untuk mengatur tim, menentukan tanggung jawab, dan menerapkan proses dan alat yang menjaga operasi Azure Anda tetap aman, patuh, dan tangguh. Dari administrasi sehari-hari hingga memantau kesehatan dan melindungi dari gangguan, RAMP membantu Anda membangun fondasi operasional yang kuat untuk keberhasilan jangka panjang.

Diagram yang menunjukkan proses Pengelolaan CAF: siap, mengelola, memantau, dan melindungi (RAMP).

Mengidentifikasi tanggung jawab manajemen Anda

Manajemen Azure efektif mencakup dua lapisan akuntabilitas: tanggung jawab pusat (platform) dan tanggung jawab workload. Tanggung jawab terpusat berlaku di seluruh infrastruktur cloud. Tanggung jawab beban kerja berfokus pada aplikasi atau layanan individual. Gunakan Tabel 1 untuk memastikan model operasi Anda mencakup area penting manajemen cloud

Tabel 1. Tanggung jawab manajemen cloud utama

Area manajemen cloud Tanggung jawab pusat (platform) Tanggung jawab beban kerja
Compliance ▪ Tentukan prosedur operasional.
▪ Menerapkan kebijakan tata kelola.
Pantau kepatuhan dan remediasi atau eskalasi sesuai kebutuhan.
▪ Ikuti prosedur operasional.
▪ Menyelaraskan desain dengan kebijakan tata kelola.
Keamanan ▪ Mengelola operasi keamanan di seluruh organisasi.
▪ Mengelola identitas di Microsoft Entra ID.
▪ Berikan access ke langganan Azure.
▪ Tentukan dan pertahankan garis besar keamanan melalui Azure Policy dan Microsoft Defender untuk Cloud.
▪ Mengawasi perlindungan ancaman dan integrasi respons insiden dengan Microsoft Sentinel.
Terapkan desain beban kerja yang aman.
▪ Menanggapi pemberitahuan dan insiden keamanan khusus beban kerja.
▪ Terus menilai kerentanan dalam beban kerja.
Manajemen sumber daya ▪ Tentukan dan pertahankan hierarki sumber daya.
▪ Buat langganan beban kerja seperti yang diminta.
▪ Tentukan strategi penamaan dan pemberian tag.
▪ Tentukan topologi jaringan.
▪ Mengonfigurasi jaringan bersama (peering jaringan virtual, konektivitas lokal).
▪ Mengelola beban kerja silang atau sumber daya/layanan bersama.
▪ Pantau batas langganan dan tangani permintaan penambahan kuota.
▪ Mengelola langganan khusus beban kerja (jika didelegasikan).
▪ Mengelola grup sumber daya dan sumber daya untuk setiap beban kerja.
▪ Patuhi dan terapkan standar penamaan dan pemberian tag.
▪ Mengelola pemanfaatan sumber daya tingkat aplikasi, memastikan sumber daya tetap berada dalam kuota langganan.
Penyebaran ▪ Menstandarkan dan mengatur alur dan alat CI/CD (Azure DevOps, GitHub Actions).
▪ Tentukan templat infrastruktur sebagai kode referensi (Bicep, Terraform, templat ARM).
▪ Berikan praktik terbaik pusat untuk keamanan alur (pemindaian kode, manajemen rahasia).
▪ Gunakan kerangka kerja CI/CD pusat dan templat IaC untuk penyebaran beban kerja.
▪ Menerapkan tugas penyebaran khusus beban kerja (mengonfigurasi pengaturan aplikasi, database).
▪ Sesuaikan templat referensi dengan kebutuhan beban kerja sambil mematuhi pedoman pusat.
Pengembangan ▪ Menyediakan dan menerapkan toolchain dan kerangka kerja pengembangan standar untuk mempercepat konsistensi (standar pengkodean, praktik terbaik DevOps).
▪ Pertahankan repositori internal atau umpan paket untuk pustaka atau modul bersama.
▪ Mengadopsi dan mengadaptasi toolchain standar untuk pengembangan beban kerja.
▪ Miliki siklus hidup aplikasi dan masukkan praktik terbaik (pengujian unit, pengujian integrasi).
▪ Kelola peningkatan berkelanjutan untuk basis kode beban kerja.
Pemantauan Rencanakan strategi pemantauan.
Peringatan tentang tanggung jawab terpusat.
▪ Menyediakan dasbor untuk metrik operasional umum di seluruh lingkungan.
▪ Memantau beban kerja
▪ Perluas atau sesuaikan pemberitahuan pusat untuk menangkap kondisi khusus beban kerja.
▪ Menyelidiki dan memulihkan insiden tingkat beban kerja berdasarkan pemberitahuan dan log.
Biaya ▪ Mengalokasikan anggaran cloud tingkat global atau langganan
▪ Pantau pengeluaran cloud di seluruh organisasi dan buat laporan biaya.
▪ Mengalokasikan biaya ke unit bisnis atau produk, biasanya menggunakan tag atau model alokasi biaya kustom.
▪ Terapkan strategi pemberian tag untuk alokasi biaya.
▪ Desain beban kerja yang mengoptimalkan biaya
▪ Menghormati batasan anggaran.
Reliability ▪ Tentukan persyaratan keandalan (SLO, RPO, RTO) per prioritas beban kerja.
▪ Memberikan panduan tentang kelangsungan bisnis dan pemulihan bencana (BCDR).
▪ Mengelola solusi pemulihan bencana terpusat.
▪ Mendukung manajemen insiden utama di semua beban kerja.
▪ Mendesain beban kerja untuk memenuhi persyaratan keandalan.
Performance ▪ Pantau dan pertahankan performa pada komponen terpusat (jaringan hub, layanan bersama).
▪ Berikan panduan untuk pengoptimalan performa dan perencanaan kapasitas.
▪ Pantau penggunaan kuota.
▪ Merancang beban kerja untuk efisiensi performa.

Mulai operasi cloud Anda

Gunakan tanggung jawab yang diuraikan dalam Tabel 1 untuk membangun fondasi operasional yang efektif. Tentukan tim, standar, dan proses dengan jelas dengan mengikuti langkah-langkah berikut:

  1. Tentukan model operasi cloud Anda. Pilih model operasi cloud terpusat, manajemen bersama, atau terdesentralisasi berdasarkan ukuran dan kematangan organisasi Anda. Untuk panduan, lihat Memilih model operasi cloud

  2. Tetapkan tanggung jawab platform pusat. Bentuk tim khusus untuk menangani tugas manajemen pusat. Kembangkan matriks keterampilan dari Tabel 1 untuk mengidentifikasi keahlian yang diperlukan.

  3. Tetapkan tanggung jawab beban kerja. Siapkan tim khusus untuk tugas khusus beban kerja. Identifikasi tanggung jawab menggunakan Tabel 1 lalu rekrut yang sesuai. Gunakan Azure Well-Architected Framework dan pilar Operational excellence untuk memandu tanggung jawab manajemen beban kerja Anda.

  4. Tetapkan tanggung jawab. Beri nama pemilik tertentu untuk semua tanggung jawab manajemen cloud. Dalam model manajemen bersama, tim beban kerja harus memiliki otonomi untuk mengelola langganan mereka.

Mendokumen operasi cloud Anda

Dokumentasikan operasi cloud Anda dengan jelas untuk memungkinkan respons krisis yang efisien dan implementasi perubahan yang lancar. Buat prosedur menyeluruh dan buat panduan terperinci untuk tugas yang sering dan spesifik.

Dokumentasi prosedur operasional

Tentukan prosedur operasional untuk mengelola perubahan, pemulihan bencana, dan tugas pemeliharaan rutin yang tidak dapat ditangani otomatisasi. Ikuti langkah-langkah ini:

  1. Tentukan prosedur manajemen perubahan. Perubahan adalah penyebab utama kegagalan di cloud. Kembangkan proses standar untuk mengelola perubahan untuk menghindari kegagalan di lingkungan cloud Anda. Lihat Mengelola perubahan.

  2. Tentukan prosedur penyebaran (manajemen rilis). Untuk mempertahankan konfigurasi yang konsisten, standarkan penyebaran, rilis, dan promosi lingkungan Anda. Lihat Pengelolaan penyebaran.

  3. Tentukan pemulihan bencana dan prosedur kelangsungan bisnis. Untuk menangani potensi kegagalan, siapkan rencana respons standar. Lihat Mengelola pemulihan bencana dan kelangsungan bisnis.

  4. Tentukan prosedur tambahan. Proses dokumen untuk mengelola permintaan layanan, patching, dan manajemen konfigurasi. Dokumentasikan proses ini dengan jelas untuk memastikan pemangku kepentingan tahu cara memulai atau menyelesaikan setiap tugas.

Panduan operasional dokumen

Buat panduan langkah demi langkah terperinci (runbook atau playbook) untuk tugas operasional utama. Persiapan ini memastikan eksekusi yang konsisten, meningkatkan efisiensi, dan mempersingkat waktu resolusi selama peristiwa penting.

  1. Tentukan tugas harian. Siapkan manual yang mencakup tanggung jawab harian, seperti permintaan eskalasi hak istimewa dan ulasan log. Menetapkan prosedur operasi standar (SOP) untuk memantau metrik, ambang pemberitahuan, dan dasbor untuk setiap sistem.

  2. Buat pustaka runbook yang berfokus pada Azure. Buat runbook khusus Azure yang menangani skenario seperti:

    Scenario Example
    Penggunaan CPU tinggi Kelola peningkatan skala dalam Azure App Service
    Pemulihan sistem otomatis dan pengembalian sistem Failover dan failback di Azure Site Recovery
    Penyebaran biru/hijau Penerapan Blue/green di Azure Front Door
    Pemulihan cadangan Pemulihan cadangan di Azure Blob Storage dan Azure Cosmos DB
  3. Simpan buku panduan ini di repositori pusat. Pertahankan buku panduan di repositori pusat yang dapat diakses oleh teknisi yang sedang bertugas untuk segera digunakan saat insiden terjadi.

  4. Menerapkan operasi secara terprogram. Integrasikan infrastruktur sebagai kode ke dalam runbook Anda untuk menyebarkan sumber daya umum secara konsisten dan akurat setiap kali.

  5. Tinjau dan perbarui. Tinjau dan revisi dokumentasi secara berkala untuk mencerminkan penyesuaian operasional dan pembaruan layanan cloud.

Alat dan solusi dokumen

Dokumentasi yang jelas memastikan konsistensi, mengurangi risiko operasional, dan meningkatkan efisiensi tim. Buat dan pertahankan dokumentasi komprehensif untuk alat cloud. Perbarui dokumentasi secara teratur untuk mencerminkan praktik saat ini dan memastikan aksesibilitas yang mudah bagi semua anggota tim.

Area Contoh manfaat
Integration Standardisasi menyederhanakan integrasi dengan mengonsolidasikan log dan repositori kode.
automasi Gunakan kembali templat IaC di seluruh tim, skrip otomatisasi, dan praktik terbaik di seluruh proyek.
Manajemen insiden Tangkap masalah dan hasilkan tindakan remediasi yang terintegrasi ke dalam siklus rilis.

Mengelola operasi cloud Anda

Manajemen cloud yang efektif mengoptimalkan efisiensi operasional, mengurangi waktu henti, dan mengklarifikasi peran dan tanggung jawab. Standarkan operasi cloud Anda melalui otomatisasi dan proses dukungan terstruktur. Ikuti panduan operasional berikut:

  • Berikan dukungan cloud berkelanjutan. Sediakan cakupan dukungan 24/7 melalui tim global yang mengadopsi model kerja mengikuti zona waktu atau melalui rotasi jaga terstruktur. Tentukan tanggung jawab dengan jelas untuk memastikan respons dan penyelesaian insiden penting secara tepat waktu. Konfigurasikan pemberitahuan otomatis untuk segera memberi tahu personel dukungan yang ditunjuk.

  • Otomatisasi pekerjaan berulang. Gunakan kemampuan otomatisasi Azure untuk meminimalkan proses manual dan mengurangi overhead operasional. Otomatiskan aktivitas rutin untuk menghilangkan kesalahan, menyederhanakan alur kerja, dan memungkinkan tim berkonsentrasi pada prioritas strategis.

    Kasus Penggunaan Examples
    automasi Mengotomatiskan alur kerja dalam sistem Azure Boards atau ITSM. Template untuk item kerja "Permintaan Perubahan" dan "Insiden".
    Respons kejadian Untuk membuat tiket insiden secara otomatis dengan bidang standar yang diisi, integrasikan Azure Monitor dan Azure Service Health dengan sistem tiket.
    Manajemen perubahan Gunakan Azure Logic Apps untuk menyetujui perubahan berisiko rendah secara otomatis atau meremediasi otomatis insiden tertentu.
    Compliance Gunakan Azure Policy untuk menerapkan dan memantau kepatuhan cloud.
    Keamanan Gunakan Microsoft Defender untuk Cloud dan Microsoft Sentinel untuk mengotomatiskan deteksi dan respons ancaman keamanan. Gunakan Tata Kelola Microsoft Entra ID untuk meninjau izin dan mengotomatiskan manajemen izin.

Meningkatkan operasi

Optimalkan lingkungan cloud Azure Anda dengan mempromosikan peningkatan berkelanjutan. Evaluasi operasi secara teratur dan prioritaskan pembelajaran dan umpan balik yang sedang berlangsung. Ikuti langkah-langkah ini:

  1. Tinjau operasi untuk ditingkatkan. Ikuti praktik terbaik untuk memantau kesehatan, kepatuhan, keamanan, biaya, data, dan sumber daya cloud. Lakukan tinjauan operasional mingguan untuk membahas metrik utama, insiden terbaru, perubahan yang disebarkan, dan risiko yang diantisipasi. Secara aktif mengatasi penyebaran sumber daya dan utang teknis.

  2. Berlatih untuk operasi. Mendorong pengembangan keterampilan yang sedang berlangsung dengan memprioritaskan sumber daya pembelajaran penting. Pertahankan operasi cloud dinamis melalui lingkungan pelatihan praktis. Tabel berikut ini menyediakan sumber daya untuk pelatihan operasi.

    Pelatihan operasi Description
    Mendapatkan kredensial Tetapkan tujuan untuk kredensial Microsoft, seperti keterampilan terapan dan Sertifikasi Microsoft untuk membangun keahlian.
    Menggunakan sumber daya operasional Lihat sumber daya manajemen Azure.
    Menggunakan dokumentasi produk Gunakan Microsoft Learn untuk menemukan panduan tentang layanan Azure.
    Dapatkan praktik langsung Dorong praktik langsung di lingkungan kotak pasir nonproduksi.

sumber daya manajemen Azure

Kategori Sumber daya manajemen Description
Compliance Tata Kelola CAF kerangka kerja tata kelola cloud Microsoft
Keamanan Mengelola operasi keamanan Panduan untuk mengelola operasi keamanan
Keamanan alat keamanan Microsoft Daftar alat keamanan Microsoft dan Azure
Keamanan Keamanan beban kerja Panduan beban kerja untuk keamanan
Manajemen sumber daya Strategi penamaan dan pemberian tag Rekomendasi penamaan dan pemberian tag untuk mengelola sumber daya
Manajemen sumber daya singkatan Azure Daftar singkatan untuk sumber daya Azure
Manajemen sumber daya Azure Advisor Asisten digital untuk selaras dengan praktik terbaik Azure.
Manajemen sumber daya aturan penamaan Azure Aturan penamaan untuk semua sumber daya Azure
Manajemen sumber daya panduan layanan Azure Panduan untuk keputusan konfigurasi layanan
Pengembangan Pengembangan perangkat lunak beban kerja Panduan beban kerja untuk pengembangan perangkat lunak
Pengembangan Azure Architecture Center Arsitektur dan panduan untuk kasus penggunaan yang berbeda
Pengembangan Hub sumber daya pengembang Hub untuk alat dan sumber daya pengembang
Penyebaran Bicep, Terraform, dan templat ARM Templat IaC untuk setiap sumber daya Azure
Penyebaran pasangan wilayah Azure Daftar wilayah berpasangan Azure
Penyebaran Direktori Layanan Azure Cloud Direktori semua layanan Azure
Penyebaran Penyebaran beban kerja Panduan beban kerja untuk integrasi berkelanjutan
Pemantauan Monitor infrastruktur cloud Azure Anda Panduan pemantauan Azure komprehensif
Pemantauan Pemantauan beban kerja Panduan beban kerja untuk pemantauan
Biaya Mengelola biaya Panduan manajemen biaya
Biaya Pengoptimalan biaya beban kerja Panduan beban kerja untuk pengoptimalan biaya
Reliability Mengelola keandalan data Panduan untuk mempertahankan keandalan data
Reliability Mengelola keandalan sumber daya cloud Panduan untuk mempertahankan keandalan sumber daya
Reliability Mengelola insiden keamanan Rekomendasi untuk menanggapi insiden keamanan
Performance Efisiensi performa beban kerja Panduan beban kerja untuk efisiensi performa

Langkah selanjutnya