Siapkan operasi cloud Azure Anda

Mengelola lingkungan Azure Anda bukan hanya tentang menjaga lampu tetap menyala. Ini tentang menjaga tata kelola dan keamanan sambil memastikan cloud Anda tetap selaras dengan tujuan bisnis dari waktu ke waktu. Seiring pertumbuhan lingkungan, Anda perlu mencegah penyimpangan konfigurasi, meningkatkan penyebaran melalui infrastruktur sebagai kode, dan mengelola perubahan secara efektif.

Metodologi Cloud Adoption Framework (CAF) Manage memperkenalkan pendekatan RAMP (Siap, Mengatur, Memantau, Melindungi) untuk membantu Anda membangun kemampuan ini. RAMP menyediakan cara terstruktur untuk mengatur tim, menentukan tanggung jawab, dan menerapkan proses dan alat yang menjaga operasi Azure Anda tetap aman, patuh, dan tangguh. Dari administrasi sehari-hari hingga memantau kesehatan dan melindungi dari gangguan, RAMP membantu Anda membangun fondasi operasional yang kuat untuk keberhasilan jangka panjang.

Mengidentifikasi tanggung jawab manajemen Anda

Manajemen Azure efektif mencakup dua lapisan akuntabilitas: tanggung jawab pusat (platform) dan tanggung jawab workload. Tanggung jawab terpusat berlaku di seluruh infrastruktur cloud. Tanggung jawab beban kerja berfokus pada aplikasi atau layanan individual. Gunakan Tabel 1 untuk memastikan model operasi Anda mencakup area penting manajemen cloud

Tabel 1. Tanggung jawab manajemen cloud utama

Area manajemen cloud	Tanggung jawab pusat (platform)	Tanggung jawab beban kerja
Compliance	▪ Tentukan prosedur operasional. ▪ Menerapkan kebijakan tata kelola. ▪ Pantau kepatuhan dan remediasi atau eskalasi sesuai kebutuhan.	▪ Ikuti prosedur operasional. ▪ Menyelaraskan desain dengan kebijakan tata kelola.
Keamanan	▪ Mengelola operasi keamanan di seluruh organisasi. ▪ Mengelola identitas di Microsoft Entra ID. ▪ Berikan access ke langganan Azure. ▪ Tentukan dan pertahankan garis besar keamanan melalui Azure Policy dan Microsoft Defender untuk Cloud. ▪ Mengawasi perlindungan ancaman dan integrasi respons insiden dengan Microsoft Sentinel.	▪ Terapkan desain beban kerja yang aman. ▪ Menanggapi pemberitahuan dan insiden keamanan khusus beban kerja. ▪ Terus menilai kerentanan dalam beban kerja.
Manajemen sumber daya	▪ Tentukan dan pertahankan hierarki sumber daya. ▪ Buat langganan beban kerja seperti yang diminta. ▪ Tentukan strategi penamaan dan pemberian tag. ▪ Tentukan topologi jaringan. ▪ Mengonfigurasi jaringan bersama (peering jaringan virtual, konektivitas lokal). ▪ Mengelola beban kerja silang atau sumber daya/layanan bersama. ▪ Pantau batas langganan dan tangani permintaan penambahan kuota.	▪ Mengelola langganan khusus beban kerja (jika didelegasikan). ▪ Mengelola grup sumber daya dan sumber daya untuk setiap beban kerja. ▪ Patuhi dan terapkan standar penamaan dan pemberian tag. ▪ Mengelola pemanfaatan sumber daya tingkat aplikasi, memastikan sumber daya tetap berada dalam kuota langganan.
Penyebaran	▪ Menstandarkan dan mengatur alur dan alat CI/CD (Azure DevOps, GitHub Actions). ▪ Tentukan templat infrastruktur sebagai kode referensi (Bicep, Terraform, templat ARM). ▪ Berikan praktik terbaik pusat untuk keamanan alur (pemindaian kode, manajemen rahasia).	▪ Gunakan kerangka kerja CI/CD pusat dan templat IaC untuk penyebaran beban kerja. ▪ Menerapkan tugas penyebaran khusus beban kerja (mengonfigurasi pengaturan aplikasi, database). ▪ Sesuaikan templat referensi dengan kebutuhan beban kerja sambil mematuhi pedoman pusat.
Pengembangan	▪ Menyediakan dan menerapkan toolchain dan kerangka kerja pengembangan standar untuk mempercepat konsistensi (standar pengkodean, praktik terbaik DevOps). ▪ Pertahankan repositori internal atau umpan paket untuk pustaka atau modul bersama.	▪ Mengadopsi dan mengadaptasi toolchain standar untuk pengembangan beban kerja. ▪ Miliki siklus hidup aplikasi dan masukkan praktik terbaik (pengujian unit, pengujian integrasi). ▪ Kelola peningkatan berkelanjutan untuk basis kode beban kerja.
Pemantauan	▪ Rencanakan strategi pemantauan. ▪ Peringatan tentang tanggung jawab terpusat. ▪ Menyediakan dasbor untuk metrik operasional umum di seluruh lingkungan.	▪ Memantau beban kerja ▪ Perluas atau sesuaikan pemberitahuan pusat untuk menangkap kondisi khusus beban kerja. ▪ Menyelidiki dan memulihkan insiden tingkat beban kerja berdasarkan pemberitahuan dan log.
Biaya	▪ Mengalokasikan anggaran cloud tingkat global atau langganan ▪ Pantau pengeluaran cloud di seluruh organisasi dan buat laporan biaya. ▪ Mengalokasikan biaya ke unit bisnis atau produk, biasanya menggunakan tag atau model alokasi biaya kustom. ▪ Terapkan strategi pemberian tag untuk alokasi biaya.	▪ Desain beban kerja yang mengoptimalkan biaya ▪ Menghormati batasan anggaran.
Reliability	▪ Tentukan persyaratan keandalan (SLO, RPO, RTO) per prioritas beban kerja. ▪ Memberikan panduan tentang kelangsungan bisnis dan pemulihan bencana (BCDR). ▪ Mengelola solusi pemulihan bencana terpusat. ▪ Mendukung manajemen insiden utama di semua beban kerja.	▪ Mendesain beban kerja untuk memenuhi persyaratan keandalan.
Performance	▪ Pantau dan pertahankan performa pada komponen terpusat (jaringan hub, layanan bersama). ▪ Berikan panduan untuk pengoptimalan performa dan perencanaan kapasitas. ▪ Pantau penggunaan kuota.	▪ Merancang beban kerja untuk efisiensi performa.

Mulai operasi cloud Anda

Gunakan tanggung jawab yang diuraikan dalam Tabel 1 untuk membangun fondasi operasional yang efektif. Tentukan tim, standar, dan proses dengan jelas dengan mengikuti langkah-langkah berikut:

Tentukan model operasi cloud Anda. Pilih model operasi cloud terpusat, manajemen bersama, atau terdesentralisasi berdasarkan ukuran dan kematangan organisasi Anda. Untuk panduan, lihat Memilih model operasi cloud
Tetapkan tanggung jawab platform pusat. Bentuk tim khusus untuk menangani tugas manajemen pusat. Kembangkan matriks keterampilan dari Tabel 1 untuk mengidentifikasi keahlian yang diperlukan.
Tetapkan tanggung jawab beban kerja. Siapkan tim khusus untuk tugas khusus beban kerja. Identifikasi tanggung jawab menggunakan Tabel 1 lalu rekrut yang sesuai. Gunakan Azure Well-Architected Framework dan pilar Operational excellence untuk memandu tanggung jawab manajemen beban kerja Anda.
Tetapkan tanggung jawab. Beri nama pemilik tertentu untuk semua tanggung jawab manajemen cloud. Dalam model manajemen bersama, tim beban kerja harus memiliki otonomi untuk mengelola langganan mereka.

Mendokumen operasi cloud Anda

Dokumentasikan operasi cloud Anda dengan jelas untuk memungkinkan respons krisis yang efisien dan implementasi perubahan yang lancar. Buat prosedur menyeluruh dan buat panduan terperinci untuk tugas yang sering dan spesifik.

Dokumentasi prosedur operasional

Tentukan prosedur operasional untuk mengelola perubahan, pemulihan bencana, dan tugas pemeliharaan rutin yang tidak dapat ditangani otomatisasi. Ikuti langkah-langkah ini:

Tentukan prosedur manajemen perubahan. Perubahan adalah penyebab utama kegagalan di cloud. Kembangkan proses standar untuk mengelola perubahan untuk menghindari kegagalan di lingkungan cloud Anda. Lihat Mengelola perubahan.
Tentukan prosedur penyebaran (manajemen rilis). Untuk mempertahankan konfigurasi yang konsisten, standarkan penyebaran, rilis, dan promosi lingkungan Anda. Lihat Pengelolaan penyebaran.
Tentukan pemulihan bencana dan prosedur kelangsungan bisnis. Untuk menangani potensi kegagalan, siapkan rencana respons standar. Lihat Mengelola pemulihan bencana dan kelangsungan bisnis.
Tentukan prosedur tambahan. Proses dokumen untuk mengelola permintaan layanan, patching, dan manajemen konfigurasi. Dokumentasikan proses ini dengan jelas untuk memastikan pemangku kepentingan tahu cara memulai atau menyelesaikan setiap tugas.

Panduan operasional dokumen

Buat panduan langkah demi langkah terperinci (runbook atau playbook) untuk tugas operasional utama. Persiapan ini memastikan eksekusi yang konsisten, meningkatkan efisiensi, dan mempersingkat waktu resolusi selama peristiwa penting.

Tentukan tugas harian. Siapkan manual yang mencakup tanggung jawab harian, seperti permintaan eskalasi hak istimewa dan ulasan log. Menetapkan prosedur operasi standar (SOP) untuk memantau metrik, ambang pemberitahuan, dan dasbor untuk setiap sistem.

Buat pustaka runbook yang berfokus pada Azure. Buat runbook khusus Azure yang menangani skenario seperti:

Scenario	Example
Penggunaan CPU tinggi	Kelola peningkatan skala dalam Azure App Service
Pemulihan sistem otomatis dan pengembalian sistem	Failover dan failback di Azure Site Recovery
Penyebaran biru/hijau	Penerapan Blue/green di Azure Front Door
Pemulihan cadangan	Pemulihan cadangan di Azure Blob Storage dan Azure Cosmos DB

Simpan buku panduan ini di repositori pusat. Pertahankan buku panduan di repositori pusat yang dapat diakses oleh teknisi yang sedang bertugas untuk segera digunakan saat insiden terjadi.
Menerapkan operasi secara terprogram. Integrasikan infrastruktur sebagai kode ke dalam runbook Anda untuk menyebarkan sumber daya umum secara konsisten dan akurat setiap kali.
Tinjau dan perbarui. Tinjau dan revisi dokumentasi secara berkala untuk mencerminkan penyesuaian operasional dan pembaruan layanan cloud.

Alat dan solusi dokumen

Dokumentasi yang jelas memastikan konsistensi, mengurangi risiko operasional, dan meningkatkan efisiensi tim. Buat dan pertahankan dokumentasi komprehensif untuk alat cloud. Perbarui dokumentasi secara teratur untuk mencerminkan praktik saat ini dan memastikan aksesibilitas yang mudah bagi semua anggota tim.

Area	Contoh manfaat
Integration	Standardisasi menyederhanakan integrasi dengan mengonsolidasikan log dan repositori kode.
automasi	Gunakan kembali templat IaC di seluruh tim, skrip otomatisasi, dan praktik terbaik di seluruh proyek.
Manajemen insiden	Tangkap masalah dan hasilkan tindakan remediasi yang terintegrasi ke dalam siklus rilis.

Mengelola operasi cloud Anda

Manajemen cloud yang efektif mengoptimalkan efisiensi operasional, mengurangi waktu henti, dan mengklarifikasi peran dan tanggung jawab. Standarkan operasi cloud Anda melalui otomatisasi dan proses dukungan terstruktur. Ikuti panduan operasional berikut:

Berikan dukungan cloud berkelanjutan. Sediakan cakupan dukungan 24/7 melalui tim global yang mengadopsi model kerja mengikuti zona waktu atau melalui rotasi jaga terstruktur. Tentukan tanggung jawab dengan jelas untuk memastikan respons dan penyelesaian insiden penting secara tepat waktu. Konfigurasikan pemberitahuan otomatis untuk segera memberi tahu personel dukungan yang ditunjuk.

Otomatisasi pekerjaan berulang. Gunakan kemampuan otomatisasi Azure untuk meminimalkan proses manual dan mengurangi overhead operasional. Otomatiskan aktivitas rutin untuk menghilangkan kesalahan, menyederhanakan alur kerja, dan memungkinkan tim berkonsentrasi pada prioritas strategis.

Kasus Penggunaan	Examples
automasi	Mengotomatiskan alur kerja dalam sistem Azure Boards atau ITSM. Template untuk item kerja "Permintaan Perubahan" dan "Insiden".
Respons kejadian	Untuk membuat tiket insiden secara otomatis dengan bidang standar yang diisi, integrasikan Azure Monitor dan Azure Service Health dengan sistem tiket.
Manajemen perubahan	Gunakan Azure Logic Apps untuk menyetujui perubahan berisiko rendah secara otomatis atau meremediasi otomatis insiden tertentu.
Compliance	Gunakan Azure Policy untuk menerapkan dan memantau kepatuhan cloud.
Keamanan	Gunakan Microsoft Defender untuk Cloud dan Microsoft Sentinel untuk mengotomatiskan deteksi dan respons ancaman keamanan. Gunakan Tata Kelola Microsoft Entra ID untuk meninjau izin dan mengotomatiskan manajemen izin.

Meningkatkan operasi

Optimalkan lingkungan cloud Azure Anda dengan mempromosikan peningkatan berkelanjutan. Evaluasi operasi secara teratur dan prioritaskan pembelajaran dan umpan balik yang sedang berlangsung. Ikuti langkah-langkah ini:

Tinjau operasi untuk ditingkatkan. Ikuti praktik terbaik untuk memantau kesehatan, kepatuhan, keamanan, biaya, data, dan sumber daya cloud. Lakukan tinjauan operasional mingguan untuk membahas metrik utama, insiden terbaru, perubahan yang disebarkan, dan risiko yang diantisipasi. Secara aktif mengatasi penyebaran sumber daya dan utang teknis.

Berlatih untuk operasi. Mendorong pengembangan keterampilan yang sedang berlangsung dengan memprioritaskan sumber daya pembelajaran penting. Pertahankan operasi cloud dinamis melalui lingkungan pelatihan praktis. Tabel berikut ini menyediakan sumber daya untuk pelatihan operasi.

Pelatihan operasi	Description
Mendapatkan kredensial	Tetapkan tujuan untuk kredensial Microsoft, seperti keterampilan terapan dan Sertifikasi Microsoft untuk membangun keahlian.
Menggunakan sumber daya operasional	Lihat sumber daya manajemen Azure.
Menggunakan dokumentasi produk	Gunakan Microsoft Learn untuk menemukan panduan tentang layanan Azure.
Dapatkan praktik langsung	Dorong praktik langsung di lingkungan kotak pasir nonproduksi.

sumber daya manajemen Azure

Kategori	Sumber daya manajemen	Description
Compliance	Tata Kelola CAF	kerangka kerja tata kelola cloud Microsoft
Keamanan	Mengelola operasi keamanan	Panduan untuk mengelola operasi keamanan
Keamanan	alat keamanan Microsoft	Daftar alat keamanan Microsoft dan Azure
Keamanan	Keamanan beban kerja	Panduan beban kerja untuk keamanan
Manajemen sumber daya	Strategi penamaan dan pemberian tag	Rekomendasi penamaan dan pemberian tag untuk mengelola sumber daya
Manajemen sumber daya	singkatan Azure	Daftar singkatan untuk sumber daya Azure
Manajemen sumber daya	Azure Advisor	Asisten digital untuk selaras dengan praktik terbaik Azure.
Manajemen sumber daya	aturan penamaan Azure	Aturan penamaan untuk semua sumber daya Azure
Manajemen sumber daya	panduan layanan Azure	Panduan untuk keputusan konfigurasi layanan
Pengembangan	Pengembangan perangkat lunak beban kerja	Panduan beban kerja untuk pengembangan perangkat lunak
Pengembangan	Azure Architecture Center	Arsitektur dan panduan untuk kasus penggunaan yang berbeda
Pengembangan	Hub sumber daya pengembang	Hub untuk alat dan sumber daya pengembang
Penyebaran	Bicep, Terraform, dan templat ARM	Templat IaC untuk setiap sumber daya Azure
Penyebaran	pasangan wilayah Azure	Daftar wilayah berpasangan Azure
Penyebaran	Direktori Layanan Azure Cloud	Direktori semua layanan Azure
Penyebaran	Penyebaran beban kerja	Panduan beban kerja untuk integrasi berkelanjutan
Pemantauan	Monitor infrastruktur cloud Azure Anda	Panduan pemantauan Azure komprehensif
Pemantauan	Pemantauan beban kerja	Panduan beban kerja untuk pemantauan
Biaya	Mengelola biaya	Panduan manajemen biaya
Biaya	Pengoptimalan biaya beban kerja	Panduan beban kerja untuk pengoptimalan biaya
Reliability	Mengelola keandalan data	Panduan untuk mempertahankan keandalan data
Reliability	Mengelola keandalan sumber daya cloud	Panduan untuk mempertahankan keandalan sumber daya
Reliability	Mengelola insiden keamanan	Rekomendasi untuk menanggapi insiden keamanan
Performance	Efisiensi performa beban kerja	Panduan beban kerja untuk efisiensi performa

Langkah selanjutnya

Kelola aset cloud Azure Anda

Saran dan Komentar

Apakah halaman ini membantu?

Last updated on 2026-04-07