Catatan
Akses ke halaman ini memerlukan otorisasi. Anda dapat mencoba masuk atau mengubah direktori.
Akses ke halaman ini memerlukan otorisasi. Anda dapat mencoba mengubah direktori.
Mengelola lingkungan Azure Anda bukan hanya tentang menjaga lampu tetap menyala. Ini tentang menjaga tata kelola dan keamanan sambil memastikan cloud Anda tetap selaras dengan tujuan bisnis dari waktu ke waktu. Seiring pertumbuhan lingkungan, Anda perlu mencegah penyimpangan konfigurasi, meningkatkan penyebaran melalui infrastruktur sebagai kode, dan mengelola perubahan secara efektif.
Metodologi Cloud Adoption Framework (CAF) Manage memperkenalkan pendekatan RAMP (Siap, Mengatur, Memantau, Melindungi) untuk membantu Anda membangun kemampuan ini. RAMP menyediakan cara terstruktur untuk mengatur tim, menentukan tanggung jawab, dan menerapkan proses dan alat yang menjaga operasi Azure Anda tetap aman, patuh, dan tangguh. Dari administrasi sehari-hari hingga memantau kesehatan dan melindungi dari gangguan, RAMP membantu Anda membangun fondasi operasional yang kuat untuk keberhasilan jangka panjang.
Mengidentifikasi tanggung jawab manajemen Anda
Manajemen Azure efektif mencakup dua lapisan akuntabilitas: tanggung jawab pusat (platform) dan tanggung jawab workload. Tanggung jawab terpusat berlaku di seluruh infrastruktur cloud. Tanggung jawab beban kerja berfokus pada aplikasi atau layanan individual. Gunakan Tabel 1 untuk memastikan model operasi Anda mencakup area penting manajemen cloud
Tabel 1. Tanggung jawab manajemen cloud utama
| Area manajemen cloud | Tanggung jawab pusat (platform) | Tanggung jawab beban kerja |
|---|---|---|
| Compliance | ▪ Tentukan prosedur operasional. ▪ Menerapkan kebijakan tata kelola. ▪ Pantau kepatuhan dan remediasi atau eskalasi sesuai kebutuhan. |
▪ Ikuti prosedur operasional. ▪ Menyelaraskan desain dengan kebijakan tata kelola. |
| Keamanan | ▪ Mengelola operasi keamanan di seluruh organisasi. ▪ Mengelola identitas di Microsoft Entra ID. ▪ Berikan access ke langganan Azure. ▪ Tentukan dan pertahankan garis besar keamanan melalui Azure Policy dan Microsoft Defender untuk Cloud. ▪ Mengawasi perlindungan ancaman dan integrasi respons insiden dengan Microsoft Sentinel. |
▪ Terapkan desain beban kerja yang aman. ▪ Menanggapi pemberitahuan dan insiden keamanan khusus beban kerja. ▪ Terus menilai kerentanan dalam beban kerja. |
| Manajemen sumber daya | ▪ Tentukan dan pertahankan hierarki sumber daya. ▪ Buat langganan beban kerja seperti yang diminta. ▪ Tentukan strategi penamaan dan pemberian tag. ▪ Tentukan topologi jaringan. ▪ Mengonfigurasi jaringan bersama (peering jaringan virtual, konektivitas lokal). ▪ Mengelola beban kerja silang atau sumber daya/layanan bersama. ▪ Pantau batas langganan dan tangani permintaan penambahan kuota. |
▪ Mengelola langganan khusus beban kerja (jika didelegasikan). ▪ Mengelola grup sumber daya dan sumber daya untuk setiap beban kerja. ▪ Patuhi dan terapkan standar penamaan dan pemberian tag. ▪ Mengelola pemanfaatan sumber daya tingkat aplikasi, memastikan sumber daya tetap berada dalam kuota langganan. |
| Penyebaran | ▪ Menstandarkan dan mengatur alur dan alat CI/CD (Azure DevOps, GitHub Actions). ▪ Tentukan templat infrastruktur sebagai kode referensi (Bicep, Terraform, templat ARM). ▪ Berikan praktik terbaik pusat untuk keamanan alur (pemindaian kode, manajemen rahasia). |
▪ Gunakan kerangka kerja CI/CD pusat dan templat IaC untuk penyebaran beban kerja. ▪ Menerapkan tugas penyebaran khusus beban kerja (mengonfigurasi pengaturan aplikasi, database). ▪ Sesuaikan templat referensi dengan kebutuhan beban kerja sambil mematuhi pedoman pusat. |
| Pengembangan | ▪ Menyediakan dan menerapkan toolchain dan kerangka kerja pengembangan standar untuk mempercepat konsistensi (standar pengkodean, praktik terbaik DevOps). ▪ Pertahankan repositori internal atau umpan paket untuk pustaka atau modul bersama. |
▪ Mengadopsi dan mengadaptasi toolchain standar untuk pengembangan beban kerja. ▪ Miliki siklus hidup aplikasi dan masukkan praktik terbaik (pengujian unit, pengujian integrasi). ▪ Kelola peningkatan berkelanjutan untuk basis kode beban kerja. |
| Pemantauan | ▪ Rencanakan strategi pemantauan. ▪ Peringatan tentang tanggung jawab terpusat. ▪ Menyediakan dasbor untuk metrik operasional umum di seluruh lingkungan. |
▪ Memantau beban kerja ▪ Perluas atau sesuaikan pemberitahuan pusat untuk menangkap kondisi khusus beban kerja. ▪ Menyelidiki dan memulihkan insiden tingkat beban kerja berdasarkan pemberitahuan dan log. |
| Biaya | ▪ Mengalokasikan anggaran cloud tingkat global atau langganan ▪ Pantau pengeluaran cloud di seluruh organisasi dan buat laporan biaya. ▪ Mengalokasikan biaya ke unit bisnis atau produk, biasanya menggunakan tag atau model alokasi biaya kustom. ▪ Terapkan strategi pemberian tag untuk alokasi biaya. |
▪ Desain beban kerja yang mengoptimalkan biaya ▪ Menghormati batasan anggaran. |
| Reliability | ▪ Tentukan persyaratan keandalan (SLO, RPO, RTO) per prioritas beban kerja. ▪ Memberikan panduan tentang kelangsungan bisnis dan pemulihan bencana (BCDR). ▪ Mengelola solusi pemulihan bencana terpusat. ▪ Mendukung manajemen insiden utama di semua beban kerja. |
▪ Mendesain beban kerja untuk memenuhi persyaratan keandalan. |
| Performance | ▪ Pantau dan pertahankan performa pada komponen terpusat (jaringan hub, layanan bersama). ▪ Berikan panduan untuk pengoptimalan performa dan perencanaan kapasitas. ▪ Pantau penggunaan kuota. |
▪ Merancang beban kerja untuk efisiensi performa. |
Mulai operasi cloud Anda
Gunakan tanggung jawab yang diuraikan dalam Tabel 1 untuk membangun fondasi operasional yang efektif. Tentukan tim, standar, dan proses dengan jelas dengan mengikuti langkah-langkah berikut:
Tentukan model operasi cloud Anda. Pilih model operasi cloud terpusat, manajemen bersama, atau terdesentralisasi berdasarkan ukuran dan kematangan organisasi Anda. Untuk panduan, lihat Memilih model operasi cloud
Tetapkan tanggung jawab platform pusat. Bentuk tim khusus untuk menangani tugas manajemen pusat. Kembangkan matriks keterampilan dari Tabel 1 untuk mengidentifikasi keahlian yang diperlukan.
Tetapkan tanggung jawab beban kerja. Siapkan tim khusus untuk tugas khusus beban kerja. Identifikasi tanggung jawab menggunakan Tabel 1 lalu rekrut yang sesuai. Gunakan Azure Well-Architected Framework dan pilar Operational excellence untuk memandu tanggung jawab manajemen beban kerja Anda.
Tetapkan tanggung jawab. Beri nama pemilik tertentu untuk semua tanggung jawab manajemen cloud. Dalam model manajemen bersama, tim beban kerja harus memiliki otonomi untuk mengelola langganan mereka.
Mendokumen operasi cloud Anda
Dokumentasikan operasi cloud Anda dengan jelas untuk memungkinkan respons krisis yang efisien dan implementasi perubahan yang lancar. Buat prosedur menyeluruh dan buat panduan terperinci untuk tugas yang sering dan spesifik.
Dokumentasi prosedur operasional
Tentukan prosedur operasional untuk mengelola perubahan, pemulihan bencana, dan tugas pemeliharaan rutin yang tidak dapat ditangani otomatisasi. Ikuti langkah-langkah ini:
Tentukan prosedur manajemen perubahan. Perubahan adalah penyebab utama kegagalan di cloud. Kembangkan proses standar untuk mengelola perubahan untuk menghindari kegagalan di lingkungan cloud Anda. Lihat Mengelola perubahan.
Tentukan prosedur penyebaran (manajemen rilis). Untuk mempertahankan konfigurasi yang konsisten, standarkan penyebaran, rilis, dan promosi lingkungan Anda. Lihat Pengelolaan penyebaran.
Tentukan pemulihan bencana dan prosedur kelangsungan bisnis. Untuk menangani potensi kegagalan, siapkan rencana respons standar. Lihat Mengelola pemulihan bencana dan kelangsungan bisnis.
Tentukan prosedur tambahan. Proses dokumen untuk mengelola permintaan layanan, patching, dan manajemen konfigurasi. Dokumentasikan proses ini dengan jelas untuk memastikan pemangku kepentingan tahu cara memulai atau menyelesaikan setiap tugas.
Panduan operasional dokumen
Buat panduan langkah demi langkah terperinci (runbook atau playbook) untuk tugas operasional utama. Persiapan ini memastikan eksekusi yang konsisten, meningkatkan efisiensi, dan mempersingkat waktu resolusi selama peristiwa penting.
Tentukan tugas harian. Siapkan manual yang mencakup tanggung jawab harian, seperti permintaan eskalasi hak istimewa dan ulasan log. Menetapkan prosedur operasi standar (SOP) untuk memantau metrik, ambang pemberitahuan, dan dasbor untuk setiap sistem.
Buat pustaka runbook yang berfokus pada Azure. Buat runbook khusus Azure yang menangani skenario seperti:
Scenario Example Penggunaan CPU tinggi Kelola peningkatan skala dalam Azure App Service Pemulihan sistem otomatis dan pengembalian sistem Failover dan failback di Azure Site Recovery Penyebaran biru/hijau Penerapan Blue/green di Azure Front Door Pemulihan cadangan Pemulihan cadangan di Azure Blob Storage dan Azure Cosmos DB Simpan buku panduan ini di repositori pusat. Pertahankan buku panduan di repositori pusat yang dapat diakses oleh teknisi yang sedang bertugas untuk segera digunakan saat insiden terjadi.
Menerapkan operasi secara terprogram. Integrasikan infrastruktur sebagai kode ke dalam runbook Anda untuk menyebarkan sumber daya umum secara konsisten dan akurat setiap kali.
Tinjau dan perbarui. Tinjau dan revisi dokumentasi secara berkala untuk mencerminkan penyesuaian operasional dan pembaruan layanan cloud.
Alat dan solusi dokumen
Dokumentasi yang jelas memastikan konsistensi, mengurangi risiko operasional, dan meningkatkan efisiensi tim. Buat dan pertahankan dokumentasi komprehensif untuk alat cloud. Perbarui dokumentasi secara teratur untuk mencerminkan praktik saat ini dan memastikan aksesibilitas yang mudah bagi semua anggota tim.
| Area | Contoh manfaat |
|---|---|
| Integration | Standardisasi menyederhanakan integrasi dengan mengonsolidasikan log dan repositori kode. |
| automasi | Gunakan kembali templat IaC di seluruh tim, skrip otomatisasi, dan praktik terbaik di seluruh proyek. |
| Manajemen insiden | Tangkap masalah dan hasilkan tindakan remediasi yang terintegrasi ke dalam siklus rilis. |
Mengelola operasi cloud Anda
Manajemen cloud yang efektif mengoptimalkan efisiensi operasional, mengurangi waktu henti, dan mengklarifikasi peran dan tanggung jawab. Standarkan operasi cloud Anda melalui otomatisasi dan proses dukungan terstruktur. Ikuti panduan operasional berikut:
Berikan dukungan cloud berkelanjutan. Sediakan cakupan dukungan 24/7 melalui tim global yang mengadopsi model kerja mengikuti zona waktu atau melalui rotasi jaga terstruktur. Tentukan tanggung jawab dengan jelas untuk memastikan respons dan penyelesaian insiden penting secara tepat waktu. Konfigurasikan pemberitahuan otomatis untuk segera memberi tahu personel dukungan yang ditunjuk.
Otomatisasi pekerjaan berulang. Gunakan kemampuan otomatisasi Azure untuk meminimalkan proses manual dan mengurangi overhead operasional. Otomatiskan aktivitas rutin untuk menghilangkan kesalahan, menyederhanakan alur kerja, dan memungkinkan tim berkonsentrasi pada prioritas strategis.
Kasus Penggunaan Examples automasi Mengotomatiskan alur kerja dalam sistem Azure Boards atau ITSM. Template untuk item kerja "Permintaan Perubahan" dan "Insiden". Respons kejadian Untuk membuat tiket insiden secara otomatis dengan bidang standar yang diisi, integrasikan Azure Monitor dan Azure Service Health dengan sistem tiket. Manajemen perubahan Gunakan Azure Logic Apps untuk menyetujui perubahan berisiko rendah secara otomatis atau meremediasi otomatis insiden tertentu. Compliance Gunakan Azure Policy untuk menerapkan dan memantau kepatuhan cloud. Keamanan Gunakan Microsoft Defender untuk Cloud dan Microsoft Sentinel untuk mengotomatiskan deteksi dan respons ancaman keamanan. Gunakan Tata Kelola Microsoft Entra ID untuk meninjau izin dan mengotomatiskan manajemen izin.
Meningkatkan operasi
Optimalkan lingkungan cloud Azure Anda dengan mempromosikan peningkatan berkelanjutan. Evaluasi operasi secara teratur dan prioritaskan pembelajaran dan umpan balik yang sedang berlangsung. Ikuti langkah-langkah ini:
Tinjau operasi untuk ditingkatkan. Ikuti praktik terbaik untuk memantau kesehatan, kepatuhan, keamanan, biaya, data, dan sumber daya cloud. Lakukan tinjauan operasional mingguan untuk membahas metrik utama, insiden terbaru, perubahan yang disebarkan, dan risiko yang diantisipasi. Secara aktif mengatasi penyebaran sumber daya dan utang teknis.
Berlatih untuk operasi. Mendorong pengembangan keterampilan yang sedang berlangsung dengan memprioritaskan sumber daya pembelajaran penting. Pertahankan operasi cloud dinamis melalui lingkungan pelatihan praktis. Tabel berikut ini menyediakan sumber daya untuk pelatihan operasi.
Pelatihan operasi Description Mendapatkan kredensial Tetapkan tujuan untuk kredensial Microsoft, seperti keterampilan terapan dan Sertifikasi Microsoft untuk membangun keahlian. Menggunakan sumber daya operasional Lihat sumber daya manajemen Azure. Menggunakan dokumentasi produk Gunakan Microsoft Learn untuk menemukan panduan tentang layanan Azure. Dapatkan praktik langsung Dorong praktik langsung di lingkungan kotak pasir nonproduksi.
sumber daya manajemen Azure
| Kategori | Sumber daya manajemen | Description |
|---|---|---|
| Compliance | Tata Kelola CAF | kerangka kerja tata kelola cloud Microsoft |
| Keamanan | Mengelola operasi keamanan | Panduan untuk mengelola operasi keamanan |
| Keamanan | alat keamanan Microsoft | Daftar alat keamanan Microsoft dan Azure |
| Keamanan | Keamanan beban kerja | Panduan beban kerja untuk keamanan |
| Manajemen sumber daya | Strategi penamaan dan pemberian tag | Rekomendasi penamaan dan pemberian tag untuk mengelola sumber daya |
| Manajemen sumber daya | singkatan Azure | Daftar singkatan untuk sumber daya Azure |
| Manajemen sumber daya | Azure Advisor | Asisten digital untuk selaras dengan praktik terbaik Azure. |
| Manajemen sumber daya | aturan penamaan Azure | Aturan penamaan untuk semua sumber daya Azure |
| Manajemen sumber daya | panduan layanan Azure | Panduan untuk keputusan konfigurasi layanan |
| Pengembangan | Pengembangan perangkat lunak beban kerja | Panduan beban kerja untuk pengembangan perangkat lunak |
| Pengembangan | Azure Architecture Center | Arsitektur dan panduan untuk kasus penggunaan yang berbeda |
| Pengembangan | Hub sumber daya pengembang | Hub untuk alat dan sumber daya pengembang |
| Penyebaran | Bicep, Terraform, dan templat ARM | Templat IaC untuk setiap sumber daya Azure |
| Penyebaran | pasangan wilayah Azure | Daftar wilayah berpasangan Azure |
| Penyebaran | Direktori Layanan Azure Cloud | Direktori semua layanan Azure |
| Penyebaran | Penyebaran beban kerja | Panduan beban kerja untuk integrasi berkelanjutan |
| Pemantauan | Monitor infrastruktur cloud Azure Anda | Panduan pemantauan Azure komprehensif |
| Pemantauan | Pemantauan beban kerja | Panduan beban kerja untuk pemantauan |
| Biaya | Mengelola biaya | Panduan manajemen biaya |
| Biaya | Pengoptimalan biaya beban kerja | Panduan beban kerja untuk pengoptimalan biaya |
| Reliability | Mengelola keandalan data | Panduan untuk mempertahankan keandalan data |
| Reliability | Mengelola keandalan sumber daya cloud | Panduan untuk mempertahankan keandalan sumber daya |
| Reliability | Mengelola insiden keamanan | Rekomendasi untuk menanggapi insiden keamanan |
| Performance | Efisiensi performa beban kerja | Panduan beban kerja untuk efisiensi performa |