Bagikan melalui


Siapkan operasi cloud Azure Anda

Artikel ini membantu Anda membangun dan memelihara operasi yang efektif untuk mengelola properti cloud Azure Anda. Operasi cloud yang berhasil memerlukan tanggung jawab dan proses yang ditentukan dengan jelas untuk setiap area manajemen cloud.

Diagram memperlihatkan proses pengelolaan CAF: siap, kelola, pantau, dan lindungi (RAMP).

Mengidentifikasi tanggung jawab manajemen Anda

Mengelola lingkungan Azure Anda secara efektif melibatkan tanggung jawab pusat (seluruh platform) dan tanggung jawab beban kerja. Tanggung jawab pusat mendukung seluruh estat cloud Azure Anda. Tanggung jawab beban kerja berfokus pada beban kerja individual. Gunakan Tabel 1 untuk memastikan operasi Anda mencakup tanggung jawab penting dalam operasi cloud.

Tabel 1. Tanggung jawab manajemen cloud utama

Area manajemen cloud Tanggung jawab pusat Tanggung jawab beban kerja
Kepatuhan ▪ Tentukan prosedur operasional .
▪ Menerapkan kebijakan tata kelola .
Memantau kepatuhan dan memperbaiki atau mengeskalasikan sesuai kebutuhan.
▪ Ikuti prosedur operasional.
▪ Menyelaraskan desain dengan kebijakan tata kelola.
Keamanan ▪ Mengelola operasi keamanan di seluruh organisasi.
▪ Kelola identitas di ID Microsoft Entra.
▪ Berikan akses ke langganan Azure.
▪ Tentukan dan pertahankan garis besar keamanan melalui Azure Policy dan Microsoft Defender for Cloud.
▪ Mengawasi perlindungan ancaman dan integrasi respons insiden dengan Microsoft Sentinel.
▪ Terapkan desain beban kerja yang aman.
▪ Menanggapi pemberitahuan dan insiden keamanan khusus beban kerja.
▪ Terus menilai kerentanan dalam beban kerja.
Manajemen sumber daya ▪ Tentukan dan pertahankan hierarki sumber daya .
▪ Buat langganan beban kerja sesuai permintaan.
▪ Tentukan strategi penamaan dan pemberian tag .
▪ Tentukan topologi jaringan .
▪ Mengonfigurasi jaringan bersama (peering jaringan virtual, konektivitas lokal).
▪ Mengelola beban kerja silang atau sumber daya/layanan bersama.
▪ Pantau batas langganan dan tangani permintaan penambahan kuota.
▪ Mengelola langganan khusus beban kerja (jika didelegasikan).
▪ Mengelola grup dan sumber daya untuk setiap beban kerja.
▪ Patuhi dan terapkan standar penamaan dan pemberian tag.
▪ Mengelola pemanfaatan sumber daya tingkat aplikasi, memastikan sumber daya tetap berada dalam kuota langganan.
Penyebaran ▪ Menstandarkan dan mengatur alur dan alat CI/CD (Azure DevOps, GitHub Actions).
▪ Tentukan templat infrastruktur sebagai kode referensi (Bicep, Terraform, templat ARM).
▪ Berikan praktik terbaik pusat untuk keamanan alur (pemindaian kode, manajemen rahasia).
▪ Gunakan kerangka kerja CI/CD pusat dan templat IaC untuk penyebaran beban kerja .
▪ Menerapkan tugas penyebaran khusus beban kerja (mengonfigurasi pengaturan aplikasi, database).
▪ Sesuaikan templat referensi dengan kebutuhan beban kerja sambil mematuhi pedoman pusat.
Pengembangan ▪ Menyediakan dan menerapkan toolchain dan kerangka kerja pengembangan standar untuk mempercepat konsistensi (standar pengkodean, praktik terbaik DevOps).
▪ Pertahankan repositori internal atau umpan paket untuk pustaka atau modul bersama.
▪ Mengadopsi dan mengadaptasi toolchain standar untuk pengembangan tugas .
▪ Miliki siklus hidup aplikasi dan masukkan praktik terbaik (pengujian unit, pengujian integrasi).
▪ Kelola peningkatan berkelanjutan untuk basis kode beban kerja.
Pemantauan ▪ Rencanakan strategi pemantauan .
Peringatan tentang tanggung jawab terpusat.
▪ Menyediakan dasbor untuk metrik operasional umum di seluruh lingkungan.
▪ Memantau beban kerja
▪ Perluas atau sesuaikan pemberitahuan pusat untuk menangkap kondisi khusus beban kerja.
▪ Menyelidiki dan memulihkan insiden tingkat beban kerja berdasarkan pemberitahuan dan log.
Biaya ▪ Mengalokasikan anggaran cloud tingkat global atau langganan
▪ Pantau pengeluaran cloud di seluruh organisasi dan buat laporan biaya.
▪ Mengalokasikan biaya ke unit bisnis atau produk, biasanya menggunakan tag atau model alokasi biaya kustom.
▪ Terapkan strategi penandaan untuk alokasi biaya.
Optimalkan biaya desain beban kerja
▪ Menghormati batasan anggaran.
Keandalan ▪ Tentukan persyaratan keandalan (SLO, RPO, RTO) per prioritas beban kerja.
▪ Memberikan panduan tentang kelangsungan bisnis dan pemulihan bencana (BCDR).
▪ Mengelola solusi pemulihan bencana terpusat.
▪ Mendukung manajemen insiden utama di semua beban kerja.
▪ Desain beban kerja untuk memenuhi persyaratan keandalan .
Penampilan ▪ Pantau dan pertahankan performa pada komponen terpusat (jaringan hub, layanan bersama).
▪ Berikan panduan untuk pengoptimalan performa dan perencanaan kapasitas.
▪ Memantau kuota
▪ Desain beban kerja untuk efisiensi kinerja .

Membangun operasi cloud Anda

Gunakan tanggung jawab yang diuraikan dalam Tabel 1 untuk membangun fondasi operasional yang efektif. Tentukan tim, standar, dan proses dengan jelas dengan mengikuti langkah-langkah berikut:

  1. Tentukan model operasi cloud Anda. Pilih model manajemen terpusat atau bersama berdasarkan ukuran dan kematangan organisasi Anda, yang diuraikan dalam tabel berikut:

    Pendekatan operasi Tanggung jawab dan cakupan Terbaik untuk Kelebihan Kekurangan
    Terpusat Satu tim mengelola semua tugas. Startup atau bisnis dengan penggunaan penyimpanan cloud yang kecil. Menyederhanakan manajemen cloud. Risiko menciptakan hambatan.
    Manajemen bersama Pisahkan tim pusat (platform) dan beban kerja Organisasi dengan beban kerja yang beragam. Menyeimbangkan tata kelola dan kelincahan. Membutuhkan penugasan tanggung jawab yang jelas
  2. Menetapkan tanggung jawab pusat. Membentuk tim khusus untuk menangani tugas manajemen pusat. Kembangkan matriks keterampilan dari Tabel 1 untuk mengidentifikasi keahlian yang diperlukan.

  3. Menetapkan tanggung jawab beban kerja. Siapkan tim khusus untuk tugas khusus beban kerja. Identifikasi tanggung jawab menggunakan Tabel 1 lalu rekrut sesuai kebutuhan.

    • Melakukan Tinjauan Well-Architected Azure. Gunakan alat penilaian Well-Architected untuk menilai kembali setiap beban kerja sambil mengembangkan dan menguji perubahan desain.

    • Gunakan Azure Well-Architected Framework. Gunakan pilar keunggulan Operasional untuk memandu tanggung jawab manajemen beban kerja Anda.

  4. Tetapkan tanggung jawab. Beri nama pemilik tertentu untuk semua tanggung jawab manajemen cloud. Dalam model manajemen bersama, tim beban kerja harus memiliki otonomi untuk mengelola langganan mereka.

Mendokumen operasi cloud Anda

Dokumentasikan operasi cloud Anda dengan jelas untuk memungkinkan respons krisis yang efisien dan implementasi perubahan yang lancar. Buat prosedur menyeluruh dan buat panduan terperinci untuk tugas yang sering dan spesifik.

Dokumentasikan prosedur operasional

Tentukan prosedur operasional untuk mengelola perubahan, pemulihan bencana, dan tugas pemeliharaan rutin yang tidak dapat ditangani otomatisasi. Ikuti langkah-langkah ini:

  1. Tentukan prosedur manajemen perubahan. Perubahan adalah penyebab utama kegagalan di cloud. Kembangkan proses standar untuk mengelola perubahan untuk menghindari kegagalan di lingkungan cloud Anda. Lihat Mengelola perubahan.

  2. Tentukan prosedur penyebaran (manajemen rilis). Untuk mempertahankan konfigurasi yang konsisten, standarkan penyebaran, rilis, dan promosi lingkungan Anda. Lihat Manajemen Penyebaran.

  3. Tentukan pemulihan bencana dan prosedur kelangsungan bisnis. Untuk menangani potensi kegagalan, siapkan rencana respons standar. Lihat Mengelola pemulihan bencana dankelangsungan bisnis .

  4. Tentukan prosedur tambahan. Proses dokumen untuk mengelola permintaan layanan, patching, dan manajemen konfigurasi. Dokumentasikan proses ini dengan jelas untuk memastikan pemangku kepentingan tahu cara memulai atau menyelesaikan setiap tugas.

Dokumen panduan operasional

Buat panduan langkah demi langkah terperinci (runbook atau playbook) untuk tugas operasional utama. Persiapan ini memastikan eksekusi yang konsisten, meningkatkan efisiensi, dan mempersingkat waktu resolusi selama peristiwa penting.

  1. Tentukan tugas harian. Menyiapkan manual yang mencakup tanggung jawab harian, seperti permintaan eskalasi hak istimewa dan ulasan log. Menetapkan prosedur operasi standar (SOP) untuk memantau metrik, ambang pemberitahuan, dan dasbor untuk setiap sistem.

  2. Membuat pustaka runbook yang berpusat pada Azure. Membuat runbook khusus Azure untuk menangani skenario seperti:

    Skenario Contoh
    Penggunaan CPU tinggi Mengelola peningkatan skala di Azure App Service
    Pemulihan sistem otomatis dan pengembalian sistem Failover dan failback di Azure Site Recovery
    Penyebaran biru/hijau Penyebaran biru/hijau di Azure Front Door
    Pemulihan cadangan Pemulihan cadangan di Azure Blob Storage dan Azure Cosmos DB
  3. Simpan runbook-runbook ini di repositori pusat. Pertahankan runbook-runbook di repositori pusat yang dapat diakses oleh teknisi yang bertugas untuk segera digunakan selama kejadian.

  4. Menerapkan operasi secara terprogram. Mengintegrasikan infrastruktur sebagai kode ke dalam runbook Anda untuk menyebarkan sumber daya umum secara konsisten dan akurat setiap kali.

  5. Tinjau dan perbarui. Meninjau dan merevisi dokumentasi secara berkala untuk mencerminkan penyesuaian operasional dan pembaruan layanan cloud.

Alat dan solusi dokumen

Dokumentasi yang jelas memastikan konsistensi, mengurangi risiko operasional, dan meningkatkan efisiensi tim. Buat dan pertahankan dokumentasi komprehensif untuk alat cloud. Perbarui dokumentasi secara teratur untuk mencerminkan praktik saat ini dan memastikan aksesibilitas yang mudah bagi semua anggota tim.

Wilayah Contoh manfaat
Integrasi Standardisasi menyederhanakan integrasi dengan mengonsolidasikan log dan repositori kode.
Otomatisasi Gunakan kembali templat IaC di seluruh tim, skrip otomatisasi, dan praktik terbaik di seluruh proyek.
Manajemen insiden Tangkap masalah dan hasilkan tindakan remediasi yang terintegrasi ke dalam siklus rilis.

Mengelola operasi cloud Anda

Manajemen cloud yang efektif mengoptimalkan efisiensi operasional, mengurangi waktu henti, dan mengklarifikasi peran dan tanggung jawab. Standarkan operasi cloud Anda melalui otomatisasi dan proses dukungan terstruktur. Ikuti panduan operasional berikut:

  • Berikan dukungan cloud berkelanjutan. Tetapkan cakupan dukungan 24/7 melalui tim global yang mengadopsi model kerja bergantian sesuai zona waktu atau rotasi tugas siaga yang terstruktur. Tentukan tanggung jawab dengan jelas untuk memastikan respons dan penyelesaian insiden penting secara tepat waktu. Konfigurasikan pemberitahuan otomatis untuk segera memberi tahu personel dukungan yang ditunjuk.

  • Mengotomatiskan pekerjaan berulang. Gunakan kemampuan otomatisasi Azure untuk meminimalkan proses manual dan mengurangi overhead operasional. Otomatiskan aktivitas rutin untuk menghilangkan kesalahan, menyederhanakan alur kerja, dan memungkinkan tim berkonsentrasi pada prioritas strategis.

    Kasus Penggunaan Contoh
    Otomatisasi Mengotomatiskan alur kerja di Azure Boards atau sistem ITSM. Template untuk item kerja "Perubahan Permintaan" dan "Insiden".
    Tanggapan Insiden Untuk membuat tiket insiden secara otomatis dengan bidang standar yang diisi, integrasikan Azure Monitor dan Azure Service Health dengan sistem tiket.
    Mengubah manajemen Gunakan Azure Logic Apps untuk menyetujui perubahan berisiko rendah secara otomatis atau meremediasi otomatis insiden tertentu.
    Kepatuhan Gunakan Azure Policy untuk menerapkan dan memantau kepatuhan cloud.
    Keamanan Gunakan Pertahanan Microsoft untuk Cloud dan Microsoft Sentinel untuk mengotomatiskan deteksi dan respons ancaman keamanan. Gunakan Tata Kelola ID Microsoft Entra untuk meninjau izin dan mengotomatiskan manajemen izin.

Meningkatkan operasi

Optimalkan lingkungan cloud Azure Anda dengan mempromosikan peningkatan berkelanjutan. Evaluasi operasi secara teratur dan prioritaskan pembelajaran dan umpan balik yang sedang berlangsung. Ikuti langkah-langkah ini:

  1. Tinjau operasi untuk perbaikan. Ikuti praktik terbaik untuk memantau kesehatan, kepatuhan, keamanan, biaya, data, dan sumber daya cloud. Lakukan tinjauan operasional mingguan untuk membahas metrik utama, insiden terbaru, perubahan yang disebarkan, dan risiko yang diantisipasi. Aktif menangani penyebaran sumber daya yang tidak efisien dan hutang teknis.

  2. Mempersiapkan untuk operasi. Dorong pengembangan keterampilan yang berkelanjutan dengan mengutamakan sumber daya pembelajaran penting. Pertahankan operasi cloud dinamis melalui lingkungan pelatihan praktis. Tabel berikut ini menyediakan sumber daya untuk pelatihan operasi.

    Pelatihan operasi Deskripsi
    Mendapatkan kredensial Tentukan tujuan untuk kredensial Microsoft, seperti keterampilan terapan dan sertifikasi Microsoft untuk mengembangkan keahlian.
    Menggunakan sumber daya operasional Lihat sumber daya manajemen Azure.
    Menggunakan dokumentasi produk Gunakan Microsoft Learn untuk menemukan panduan tentang layanan Azure.
    Dapatkan praktik langsung Mendorong melakukan praktik langsung di lingkungan kotak pasir nonproduksi.

Sumber daya manajemen Azure

Kategori Sumber daya manajemen Deskripsi
Kepatuhan CAF Govern Kerangka kerja tata kelola cloud Microsoft
Keamanan Mengelola operasi keamanan Panduan untuk mengelola operasi keamanan
Keamanan alat keamanan Microsoft Daftar alat keamanan Microsoft dan Azure
Keamanan Keamanan beban kerja Panduan beban kerja untuk keamanan
Manajemen sumber daya Strategi Penamaan dan Pemberian Tag Rekomendasi penamaan dan pemberian tag untuk mengelola sumber daya
Manajemen sumber daya singkatan Azure Daftar singkatan untuk sumber daya Azure
Manajemen sumber daya Azure Advisor Asisten digital yang selaras dengan praktik terbaik Azure.
Manajemen sumber daya aturan penamaan Azure Aturan penamaan untuk semua sumber daya Azure
Manajemen sumber daya panduan layanan Azure Panduan untuk keputusan konfigurasi layanan
Pengembangan beban kerja pengembangan perangkat lunak Panduan beban kerja untuk pengembangan perangkat lunak
Pengembangan Azure Architecture Center Arsitektur dan panduan untuk kasus penggunaan yang berbeda
Pengembangan pusat sumber daya pengembang Hub untuk alat dan sumber daya pengembang
Penyebaran Bicep, Terraform, dan templat ARM Templat IaC untuk setiap sumber daya Azure
Penyebaran pasangan wilayah Azure Daftar wilayah berpasangan Azure
Penyebaran Direktori Layanan Cloud Azure Direktori semua layanan Azure
Penyebaran penyebaran beban kerja Panduan beban kerja untuk integrasi berkelanjutan
Pemantauan Memantau kawasan cloud Azure Anda Panduan pemantauan Azure yang komprehensif
Pemantauan pemantauan beban kerja Panduan beban kerja untuk pemantauan
Biaya Kelola biaya Panduan manajemen biaya
Biaya pengoptimalan biaya beban kerja Panduan beban kerja untuk pengoptimalan biaya
Keandalan Mengelola keandalan data Panduan untuk mempertahankan keandalan data
Keandalan Mengelola keandalan sumber daya cloud Panduan untuk mempertahankan keandalan sumber daya
Keandalan Mengelola insiden keamanan Rekomendasi untuk menanggapi insiden keamanan
Penampilan efisiensi performa beban kerja Panduan beban kerja untuk efisiensi performa

Langkah berikutnya

Mengelola kawasan cloud Azure Anda