Pertimbangan operasi untuk beban kerja Azure VMware Solution

Artikel ini membahas area desain operasi untuk Azure VMware Solution. Tujuan dari artikel ini adalah untuk membangun model operasi untuk Azure VMware Solution dan aplikasi dalam pusat data yang ditentukan perangkat lunak VMware (SDDC). Prosedur operasi standar (SOP) adalah proses yang didokumentasikan untuk mengelola beban kerja. Setiap beban kerja Azure VMware Solution harus memiliki SOP untuk mengatur operasi. Agar tetap selaras dengan tujuan bisnis dan membantu mencegah penyimpangan dari praktik terbaik, gunakan SOP dalam siklus penilaian dan pemeriksaan kesehatan berkelanjutan yang Anda jalankan pada beban kerja Azure VMware Solution Anda.

Melacak dependensi aplikasi

Dampak: Keunggulan operasional

Tim TI terus berusaha mengoptimalkan penyebaran, manajemen, dan pemeliharaan aplikasi, situs, dan layanan. Praktik ini membantu memastikan performa, keandalan, skalabilitas, dan keamanan yang tinggi. Pengoptimalan melibatkan pemahaman bagaimana aplikasi mengalir di dalam platform Azure VMware Solution. Ini juga melibatkan pemeriksaan dependensi eksternal dan hubungan yang berada di luar cloud privat. Peta dependensi adalah alat berharga untuk pengembang, arsitek aplikasi, dan tim TI saat mereka berusaha memahami struktur dan perilaku aplikasi. Memiliki wawasan tentang komponen aplikasi seperti perangkat lunak dan infrastruktur, layanan, dan dependensi eksternal menyediakan cara visual untuk memahami aliran data, fungsionalitas, dan panggilan API.

Rekomendasi
  • Gunakan Application Insights untuk melacak dependensi seperti database, panggilan API, dan layanan eksternal.
  • Gunakan fitur peta layanan Azure Monitor untuk menemukan dan memvisualisasikan komponen aplikasi dan infrastruktur yang berbeda secara otomatis.
  • Gunakan alat pihak ketiga seperti New Relic dan Datadog untuk menemukan dan memetakan dependensi.
  • Gunakan skrip kustom atau alat manajemen konfigurasi pihak ketiga yang melacak otomatisasi dan penyebaran dependensi.

Menggunakan otomatisasi, sistem kontrol versi, dan penyebaran biru-hijau

Dampak: Keunggulan operasional

Organisasi dapat mengurangi waktu ke pasar dan mendapat manfaat dari peningkatan kolaborasi dan kualitas perangkat lunak dengan mengadopsi praktik DevOps. Misalnya, otomatisasi dapat mempercepat penyebaran dan pemeliharaan aplikasi.

Saat Anda menggunakan infrastruktur sebagai kode (IaC) untuk mengatur penyebaran infrastruktur, Anda dapat memperoleh manfaat dari peningkatan efisiensi dalam provisi infrastruktur Anda. IaC juga dapat memfasilitasi adopsi prinsip DevOps dalam manajemen infrastruktur.

  • Anda dapat menggunakan IaC untuk membuat beberapa sumber daya di Azure VMware Solution. Contohnya termasuk seluruh cloud privat atau komponen individual seperti kluster, appliance jaringan, dan penyimpanan. Alat seperti Azure Resource Manager, Bicep, Terraform, Azure CLI, dan PowerShell mengotomatiskan provisi dan konfigurasi sumber daya di Azure VMware Solution.
  • Saat menggunakan IaC, Anda dapat memperbarui infrastruktur dengan memodifikasi kode. Pendekatan ini mengurangi waktu dan upaya yang diperlukan untuk konfigurasi dan provisi manual.
  • Output yang dikembalikan dari penyebaran IaC dapat berfungsi sebagai dokumentasi untuk membantu memelihara dan memberikan visibilitas ekstra ke dalam status dan konfigurasi sumber daya yang disediakan.

Sistem kontrol versi menyediakan cara bagi Anda untuk mengelola kode dan menggunakan penerapan versi untuk melacak dan mengembalikan perubahan sesuai kebutuhan.

Ketika Anda perlu memperbarui kode aplikasi di seluruh server, penyebaran biru-hijau dapat membantu dalam banyak hal:

  • Mereka membantu dalam mengelola siklus hidup aplikasi dari pengembangan hingga produksi.
  • Mereka membantu memberi pelanggan pengalaman web yang konsisten ketika pembaruan dan patch sedang diterapkan.
  • Mereka menggunakan algoritma tertimbang untuk mendistribusikan lalu lintas hanya ke server yang sehat selama pemeliharaan.

Azure VMware Solution tidak menawarkan metode yang ditawarkan aplikasi cloud-native untuk mencapai penyebaran biru-hijau. Tetapi penyebaran ini masih dimungkinkan dalam Azure VMware Solution:

  • Sebelum Anda membuat perubahan pada konfigurasi aplikasi, ambil rekam jepret lingkungan Anda.
  • Gunakan kontrol versi untuk memastikan bahwa Anda dapat kembali ke status baik yang terakhir diketahui.
  • Pertimbangkan untuk membuat lingkungan penahapan yang mencerminkan produksi dan menyebarkan pembaruan sebelum Anda melakukan siaran langsung.
  • Dari lingkungan penahapan, lakukan pembaruan bergulir ke subset server dan uji aplikasi Anda.

Anda dapat mengurangi upaya manual, meminimalkan kesalahan, dan meningkatkan penggunaan sumber daya dengan mengotomatiskan tugas rutin seperti provisi, penskalaan, dan patching. Metodologi DevOps adalah elemen penting dari solusi yang dirancang dengan baik untuk menyederhanakan operasi, menghemat waktu, dan membantu tim fokus pada aktivitas bernilai tambah.

Rekomendasi
  • Gunakan IaC untuk menyebarkan dan menyediakan infrastruktur dengan cara yang dapat diulang, dapat diaudit, dan konsisten.
  • Mengotomatiskan ekspansi dan kontraksi dengan menggunakan IaC.
  • Gunakan sistem kontrol versi untuk melacak perubahan, berkolaborasi, dan mengembalikan kode ke versi sebelumnya sesuai kebutuhan.
  • Manfaatkan konsep biru-hijau dengan menciptakan lingkungan penahapan yang mencerminkan lingkungan produksi dan pengujian sebelum Anda ditayangkan.
  • Pertahankan status baik terakhir aplikasi Anda dengan menggunakan rekam jepret, mengkloning disk Anda, dan memiliki kode yang dikontrol versi.

Menentukan peran dan proses

Dampak: Keunggulan operasional

Peran dan tanggung jawab yang terdefinisi dengan baik membantu memastikan kejelasan, akuntabilitas, dan manajemen efektif dari beban kerja Azure VMware Solution yang dirancang dengan baik. Memiliki serangkaian standar dan proses terstruktur yang ditentukan dan mengetahui siapa yang menjalankannya mengarah pada operasi yang efisien dan membantu organisasi TI menyelaraskan penawaran teknis mereka dengan tujuan dan strategi bisnis. Ketika lingkungan Azure VMware Solution tumbuh dan berkembang, peran dan tanggung jawab yang terdefinisi dengan baik menyebabkan delegasi tugas yang lebih mudah dan potensi untuk menskalakan solusi tanpa gangguan. Hasilnya adalah pengalaman yang lebih baik bagi pengguna aplikasi.

Penting untuk memiliki budaya peningkatan berkelanjutan yang berfokus pada operasi sehari-hari yang efisien untuk aplikasi di cloud privat. Contoh operasi termasuk mempertahankan perjanjian tingkat layanan (SLA), menjaga ketersediaan, memiliki kapasitas untuk meminimalkan gangguan layanan, dan memiliki pengiriman yang lancar. Misalnya, Azure VMware Solution memungkinkan untuk memperluas lingkungan dengan input pengguna minimal. Jika Anda memperluas kontrak secara manual, Anda harus mendokumen siapa yang melakukan aktivitas terkait dan cara melaksanakannya. Azure VMware Solution operator harus memastikan reservasi simpul tersedia untuk memperluas lingkungan sesuai kebutuhan. Misalnya, menunjuk individu yang bertanggung jawab untuk mengidentifikasi sumber daya yang kurang digunakan atau menganggur. Berikan kepada individu tersebut proses untuk komputer virtual (VM) ukuran yang tepat untuk mengurangi biaya yang tidak perlu.

Tim aplikasi dan pengembang harus menentukan panduan pengkodean untuk struktur kode, pengecualian, dan penanganan kesalahan. Anda juga harus memiliki metode untuk melacak perubahan, seperti ulasan kode reguler, dokumentasi API, dan refaktor kode reguler. Saat Anda menggunakan kontrol versi, terapkan praktik terbaik seperti alur kerja percabangan, penerapan pesan, dan persetujuan. Praktik ini dapat membantu membuat kode Anda konsisten, mudah di-debug, dan dapat dipertahankan.

Rekomendasi
  • Bekerja sama dengan tim pusat keunggulan cloud (CCoE) untuk memahami standar dan panduan kepatuhan, keamanan, arsitektur aplikasi, dan proses operasional.
  • Memiliki tim keamanan dan kepatuhan yang berfokus pada kebijakan keamanan yang khusus untuk Azure VMware Solution. Juga minta tim melakukan penilaian risiko dan memastikan kepatuhan terhadap persyaratan peraturan.
  • Mengadopsi kerangka kerja seperti Pustaka Infrastruktur Teknologi Informasi (ITIL). Atau gunakan praktik Organisasi Internasional untuk Standardisasi (ISO) untuk memetakan operasi, proses, dan aktivitas sehari-hari. Praktik ini dapat menghasilkan transfer pengetahuan yang lebih cepat, peningkatan berkelanjutan, dan manajemen perubahan yang ditingkatkan.
  • Tentukan standar pengkodean dan terapkan praktik keamanan selama pengembangan aplikasi.

Menggunakan strategi pemberian tag dan praktik terbaik

Dampak: Keunggulan operasional

Anda dapat menggunakan strategi penandaan untuk penagihan balik dan pelacakan sumber daya. Tag adalah nilai pasangan kunci yang Anda tentukan di tingkat sumber daya dan berlaku selama provisi. Anda dapat menggunakan IaC untuk membuat, memperbarui, dan menghancurkan VM tamu. Tag dan IaC bekerja sama dengan alat manajemen konfigurasi. Anda bisa menggunakan tag di area berikut:

  • Lingkungan. Anda dapat menerapkan tag seperti produksi, QA, atau pengujian dev untuk mengidentifikasi sumber daya.
  • Pusat biaya, untuk melacak biaya dan pengeluaran sumber daya.
  • SLA, untuk memprioritaskan persyaratan sumber daya SLA.
  • Siklus hidup. Anda dapat memberi label aplikasi sebagai aktif, diarsipkan, atau dihentikan.
  • Kekritisan, dengan melabeli sumber daya berdasarkan dampak dan signifikansi bisnisnya.

Sebagai bagian dari strategi tata kelola dan kepatuhan Anda, grup harus bertanggung jawab untuk mengidentifikasi sumber daya tanpa tag. Grup tersebut dapat menggabungkan otomatisasi, audit, dan proses untuk membantu mengidentifikasi dan memulihkan sumber daya yang tidak memenuhi kebijakan kepatuhan pemberian tag.

Pertimbangan pemberian tag ini bersifat umum. Penting bahwa strategi pemberian tag Anda mendukung kategorisasi sumber daya yang efektif, manajemen siklus hidup sumber daya, dan pelaporan dalam Azure VMware Solution.

Rekomendasi
  • Terapkan tag untuk manajemen sumber daya dengan menggunakan taksonomi organisasi untuk mengidentifikasi beban kerja dan infrastruktur. Taksonomi harus mencakup host, bisnis, pemilik, dan lingkungan.
  • Gunakan alat yang sesuai untuk memelihara dan menerapkan tag secara terprogram selama provisi.
  • Gunakan tag yang selaras dengan inisiatif kepatuhan dan tata kelola organisasi Anda, seperti SLA, kebijakan penagihan balik, dan praktik manajemen siklus hidup.
  • Memiliki proses untuk mengidentifikasi dan memperbaiki sumber daya yang tidak mematuhi persyaratan pemberian tag.

Membentuk tim respons insiden

Dampak: Keunggulan operasional

Untuk melacak status beban kerja di cloud privat, penting untuk memantau metrik seperti penggunaan CPU, log sistem operasi, dan pemberitahuan keamanan. Untuk memastikan efektivitas sistem peringatan Anda, Anda perlu mengevaluasi beberapa aspek operasional utama. Secara khusus, periksa apakah:

  • Semua komponen penting diidentifikasi, seperti database, perangkat jaringan, dan penyimpanan.
  • Ambang diatur dengan tepat.
  • Pemberitahuan bersifat spesifik dan dapat ditindakkan.
  • Orang yang tepat menerima pemberitahuan.
  • Tidak ada sejumlah besar kebisingan dan positif palsu.
  • Prosedur eskalasi yang memadai sudah ada.

Sebelum insiden atau pemadaman, sangat penting untuk membangun proses pemberitahuan yang terdefinisi dengan baik untuk memastikan komunikasi yang tepat waktu. Mengidentifikasi personel yang relevan yang bertanggung jawab atas resolusi sangat penting. Tim remediasi khusus dapat mencakup personel operasi, pemilik aplikasi, dan pakar DevOps yang memiliki keahlian yang diperlukan untuk menyelesaikan masalah dengan cepat. Tim operasi harus menyadari individu yang sesuai untuk terlibat dalam triaging setiap masalah.

Tim respons insiden dapat secara efektif mengoordinasikan respons dengan mempertahankan daftar distribusi yang komprehensif. Daftar ini harus mencakup pemangku kepentingan utama dari departemen penting bisnis dan kontak eskalasi yang ditunjuk. Pemangku kepentingan bisnis harus diberitahu tentang dampak potensial pada operasi yang diakibatkan oleh insiden. Kontak eskalasi yang ditetapkan harus individu yang mampu membuat keputusan atau meningkatkan masalah ke tingkat yang lebih tinggi untuk panduan.

Meninjau daftar distribusi secara teratur sangat penting untuk memastikan akurasi dan keselarasannya dengan peran dan tanggung jawab saat ini. Ulasan memastikan bahwa pemangku kepentingan utama segera diberi tahu tentang peristiwa signifikan yang terjadi di Azure VMware Solution.

Solusi manajemen layanan IT (ITSM) dapat memetakan peristiwa ke tugas. Misalnya, ITSM asli Azure mungkin menggunakan Azure DevOps untuk mengelola tugas. Ini mungkin menggunakan Azure Automation untuk mengotomatiskan proses TI dan Azure Logic Apps untuk membangun alur kerja. Hasilnya adalah solusi yang disesuaikan untuk manajemen masalah di Azure VMware Solution.

Rekomendasi
  • Tentukan penerima yang sesuai untuk pemberitahuan dan insiden Azure VMware Solution.
  • Tentukan kontak eskalasi dengan jelas yang harus dapat dijangkau dan diberi wewenang untuk membuat keputusan atau meningkatkan masalah.
  • Identifikasi pemangku kepentingan atau perwakilan bisnis utama untuk memastikan visibilitas ke dalam dampak potensial dan untuk memberikan panduan.
  • Siapkan tim remediasi yang terdiri dari administrator, insinyur infrastruktur, dan personel yang memiliki keahlian yang diperlukan untuk mengatasi dan menyelesaikan masalah.
  • Integrasikan pemberitahuan dengan ITSM seperti Azure DevOps, JIRA, atau ServiceNow.

Prosedur dokumen

Dampak: Keandalan

Penting untuk memiliki pemahaman yang jelas tentang infrastruktur pencadangan dan pemulihan yang ada di lingkungan Anda. Untuk mengonfigurasi solusi pencadangan, Pertama-tama Anda perlu menentukan target pencadangan untuk infrastruktur Anda. Anda harus mencadangkan aplikasi, database, dan aset Anda dalam penyimpanan blob atau brankas cadangan Azure. Anda juga harus menunjuk pemilik yang bertanggung jawab untuk mencadangkan dan memulihkan aplikasi Anda.

Rekomendasi
  • Dokumentasikan infrastruktur pencadangan dan pemulihan Anda dengan jelas.
  • Dokumentasikan prosedur pencadangan dan pemulihan Anda dengan jelas.

Menerapkan solusi pencadangan dan pemulihan

Dampak: Keandalan

Cloud privat harus melindungi dari kehilangan data, meminimalkan waktu henti, dan menjaga kelangsungan operasi ketika ada gangguan atau bencana yang tidak terduga.

Untuk kelangsungan bisnis, Anda perlu menerapkan perlindungan data yang kuat untuk membantu memastikan ketersediaan, integritas, dan pemulihan VM Anda dan data penting dalam lingkungan Azure VMware Solution. Alat pencadangan harus diberlakukan, dan Anda juga harus mengonfirmasi bahwa alat tersebut berfungsi. Prinsip utama Azure VMware Solution adalah menyediakan dukungan teknologi vendor perangkat lunak independen (ISV) yang divalidasi dengan Azure VMware Solution. Memahami mitra dan opsi yang tersedia untuk Anda sangat penting untuk keberhasilan pencadangan Anda.

Rekomendasi
  • Gunakan solusi cadangan yang didukung Microsoft, seperti Microsoft Azure Backup Server, atau vendor pihak ketiga yang disetujui.

Menggunakan Azure Site Recovery

Dampak: Keandalan

Azure Site Recovery adalah solusi pemulihan bencana yang dirancang untuk meminimalkan waktu henti VM di lingkungan Azure VMware Solution saat terjadi bencana. Azure Site Recovery mengotomatiskan dan mengatur failover dan failback. Pengujian nondisruptif bawaan membantu memastikan tujuan waktu pemulihan (RTO) Anda terpenuhi. Azure Site Recovery menyederhanakan manajemen melalui otomatisasi dan membantu memastikan waktu pemulihan yang cepat dan sangat dapat diprediksi.

Rekomendasi
  • Dalam pemadaman regional yang berkepanjangan, lindungi beban kerja Anda dengan mereplikasinya ke wilayah Azure alternatif.
  • Konfigurasikan Azure Site Recovery untuk mengirim cadangan ke wilayah alternatif.

Memutar rahasia

Dampak: Keamanan

Lebih menantang bagi penyerang untuk mengakses atau menyalahgunakan data terenkripsi jika mereka tidak memiliki akses ke kunci enkripsi. Anda harus menyimpan kunci, rahasia, dan sertifikat dengan aman, dan Anda harus sering memutarnya. Langkah-langkah komprehensif untuk mengamankan dan memelihara integritas data meliputi:

  • Mengenkripsi data.
  • Menyimpan kunci dengan aman.
  • Mengenkripsi data di tingkat aplikasi sebelum Anda mengirimkan data.
Rekomendasi
  • Gunakan Azure Key Vault untuk menyimpan kunci enkripsi.

Langkah berikutnya

Sekarang setelah Anda melihat prosedur manajemen operasional, lihat cara mengintegrasikan beban kerja Azure VMware Solution dengan zona pendaratan Azure.

Gunakan alat penilaian untuk mengevaluasi pilihan desain Anda.