Operasi manajemen di Azure Managed Instance for Apache Cassandra

Azure Managed Instance for Apache Cassandra adalah layanan terkelola penuh untuk kluster Apache Cassandra sumber terbuka murni. Layanan ini juga memungkinkan konfigurasi untuk ditimpa, tergantung pada kebutuhan spesifik setiap beban kerja, memungkinkan fleksibilitas dan kontrol maksimum jika diperlukan. Artikel ini mendefinisikan operasi manajemen dan fitur yang disediakan oleh layanan. Ini juga menjelaskan pemisahan tanggung jawab antara tim dukungan Azure dan pelanggan saat memelihara kluster hibrid .

Pemadatan Log

  • Ada berbagai jenis pemadatan. Saat ini kami melakukan pemadatan kecil melalui perbaikan (lihat Pemeliharaan). Ini melakukan pemadatan pohon Merkle, yang merupakan jenis pemadatan khusus.
  • Bergantung pada strategi pemadatan yang diatur pada tabel menggunakan CQL (misalnya WITH compaction = { 'class' : 'LeveledCompactionStrategy' }), Cassandra secara otomatis memadatkan ketika tabel mencapai ukuran tertentu. Kami menyarankan agar Anda memilih strategi pemadatan dengan hati-hati untuk beban kerja Anda, dan jangan melakukan pemadatan manual di luar strategi.

Patching

  • Patch tingkat Sistem Operasi dilakukan secara otomatis pada sekitar 2 minggu irama.

  • Patch tingkat perangkat lunak Apache Cassandra dilakukan ketika kerentanan keamanan diidentifikasi. Irama patching dapat bervariasi.

  • Selama patching, mesin di-reboot satu rak pada satu waktu. Anda tidak boleh mengalami degradasi di sisi aplikasi selama pengaturan kuorum ALL tidak digunakan, dan faktor replikasi adalah 3 atau lebih tinggi.

  • Versi di Apache Cassandra ada dalam format X.Y.Z. Anda dapat mengontrol penyebaran versi utama (X) dan minor (Y) secara manual melalui alat layanan. Sedangkan, patch Cassandra (Z) yang mungkin diperlukan untuk kombinasi versi mayor/minor dilakukan secara otomatis.

Catatan

Layanan saat ini mendukung Cassandra versi 3.11 dan 4.0. Kedua versi tersebut adalah GA. Lihat Mulai Cepat Azure CLI kami (langkah 5) untuk menentukan versi Cassandra selama penyebaran kluster.

Pemeliharaan

  • Perbaikan Nodetool secara otomatis dijalankan oleh layanan menggunakan reaper. Alat ini dijalankan setiap minggu sekali. Anda mungkin ingin menonaktifkannya jika menggunakan layanan Anda sendiri untuk penyebaran hibrida.

  • Pemantauan kesehatan node terdiri dari:

    • Secara aktif memantau keanggotaan masing-masing node di ring Cassandra.
    • Autodetecting, dan automitigasi masalah infrastruktur seperti komputer virtual, jaringan, penyimpanan, Linux, dan mendukung kegagalan perangkat lunak.
    • Memantau CPU, disk, kehilangan kuorum, dan masalah sumber daya lainnya secara proaktif.
    • Secara otomatis memunculkan node yang gagal jika memungkinkan, dan secara manual memunculkan simpul sebagai respons terhadap peringatan yang dihasilkan secara otomatis.

Dukungan

Azure Managed Instance for Apache Cassandra menyediakan SLA untuk ketersediaan pusat data dalam kluster terkelola. Jika Anda mengalami masalah saat menggunakan layanan, ajukan permintaan dukungan di portal Azure.

Manfaat dukungan kami meliputi:

  • Titik kontak tunggal untuk masalah infrastruktur Cassandra - tidak perlu meningkatkan kasus dukungan dengan tim IaaS (disk, komputasi, jaringan) secara terpisah.
  • Saran pro-aktif melalui email tentang leher botol performa, ukuran, dan masalah batasan sumber daya lainnya.
  • Cakupan dukungan 24x7, termasuk insiden yang dibuat secara otomatis untuk masalah pemadaman yang parah.
  • Dukungan patch yang disetujui komunitas (lihat Patching).
  • Dukungan tim teknik Java JDK/JVM internal.
  • Dukungan Sistem Operasi Linux dengan keamanan rantai pasokan perangkat lunak.

Penting

Kami akan menyelidiki dan mendiagnosis masalah apa pun yang dilaporkan melalui kasus dukungan, dan menyelesaikan atau mengurangi jika memungkinkan. Namun, Anda pada akhirnya bertanggung jawab atas penggunaan tingkat konfigurasi Apache Cassandra yang menyebabkan masalah CPU, disk, atau jaringan.

Contoh masalah tersebut meliputi:

  • Operasi kueri yang tidak efisien.
  • Throughput yang melebihi kapasitas.
  • Menelan data yang melebihi kapasitas penyimpanan.
  • Pengaturan konfigurasi keyspace yang salah.
  • Model data yang buruk atau strategi kunci partisi.

Jika kami menyelidiki kasus dukungan dan menemukan bahwa akar penyebab masalah ada di tingkat konfigurasi Apache Cassandra (dan bukan aspek tingkat platform yang mendasar yang kami pertahankan), kami masih akan memberikan rekomendasi dan panduan tentang remediasi, atau mitigasi (jika memungkinkan), sebelum menutup kasus.

Sebaiknya Aktifkan metrik dan/atau terbiasa dengan integrasi monitor Azure kami untuk mencegah masalah tingkat aplikasi/konfigurasi umum di Apache Cassandra, seperti di atas.

Peringatan

Azure Managed Instance for Apache Cassandra juga memungkinkan Anda menjalankan nodetool perintah dan sstable untuk administrasi DBA rutin - lihat artikel di sini. Beberapa perintah ini dapat menstabilkan kluster cassandra dan hanya boleh dijalankan dengan hati-hati dan setelah diuji di lingkungan non-produksi. Jika memungkinkan, --dry-run opsi harus disebarkan terlebih dahulu. Microsoft tidak dapat menawarkan SLA atau dukungan apa pun tentang masalah dengan menjalankan perintah yang mengubah konfigurasi database default dan/atau tabel.

Pencadangan dan pemulihan

Pencadangan rekam jepret diaktifkan secara default dan diambil setiap 24 jam. Cadangan disimpan di akun Azure Blob Storage internal dan dipertahankan hingga 2 hari (48 jam). Tidak ada biaya untuk 2 cadangan awal. Cadangan tambahan dikenakan biaya, lihat harga. Untuk mengubah interval cadangan atau periode retensi, Anda dapat mengedit kebijakan di portal:

Screenshot of backup schedule configuration page.

Untuk memulihkan dari cadangan yang ada, ajukan permintaan dukungan di portal Azure. Saat mengajukan kasus dukungan, Anda perlu:

  1. Berikan ID cadangan dari portal untuk cadangan yang ingin Anda pulihkan. Ini dapat ditemukan di portal:

    Screenshot of backup schedule configuration page highlighting backup ID.

  2. Jika pemulihan seluruh kluster tidak diperlukan, berikan ruang kunci dan tabel (jika berlaku) yang perlu dipulihkan.

  3. Sarankan apakah Anda ingin cadangan dipulihkan di kluster yang ada, atau di kluster baru.

  4. Jika Anda ingin memulihkan ke kluster baru, Anda perlu membuat kluster baru terlebih dahulu. Pastikan bahwa kluster target cocok dengan kluster sumber dalam hal jumlah pusat data, dan pusat data yang sesuai memiliki jumlah node yang sama. Anda juga dapat memutuskan apakah akan menyimpan kredensial (nama pengguna/kata sandi) di kluster target baru, atau mengizinkan pemulihan untuk mengganti nama pengguna/kata sandi dengan apa yang awalnya dibuat.

  5. Anda juga dapat memutuskan apakah akan menyimpan system_auth keyspace di kluster target baru atau mengizinkan pemulihan untuk menimpanya dengan data dari cadangan. Ruang system_auth kunci di Cassandra berisi data otorisasi dan autentikasi internal, termasuk peran, izin peran, dan kata sandi. Perhatikan bahwa proses pemulihan default kami menimpa system_auth keyspace.

Catatan

Waktu yang diperlukan untuk menanggapi permintaan pemulihan dari cadangan akan bergantung pada tingkat keparahan kasus dukungan yang Anda ajukan (dan SLA terkait untuk waktu respons), dan jumlah data yang akan dipulihkan. Namun, kami tidak menyediakan SLA untuk waktu untuk menyelesaikan pemulihan, karena ini sangat tergantung pada volume data yang dipulihkan.

Peringatan

Pencadangan ditujukan untuk skenario penghapusan yang tidak disengaja, dan tidak berlebihan secara geografis. Oleh karena itu, mereka tidak direkomendasikan untuk digunakan sebagai strategi pemulihan bencana (DR) jika terjadi pemadaman regional total. Untuk melindungi dari pemadaman di seluruh wilayah, kami merekomendasikan penyebaran multi-wilayah. Lihat mulai cepat kami untuk penyebaran multi-wilayah.

Keamanan

Azure Managed Instance for Apache Cassandra menyediakan banyak kontrol dan fitur keamanan eksplisit bawaan:

  • Gambar Mesin Virtual Linux yang mengeras dengan rantai pasokan yang terkontrol.
  • Pemantauan Common Vulnerability & Exposure (CVE) pada tingkat Sistem Operasi.
  • Rotasi sertifikat untuk perangkat lunak Apache Cassandra dan Prometheus yang dihosting di Virtual Machines yang dikelola.
  • Pemindaian kerentanan aktif.
  • Pemindaian virus aktif.
  • Praktik pengodean yang aman.

Untuk informasi selengkapnya tentang fitur keamanan, lihat artikel kami di sini.

Dukungan hibrida

Ketika kluster hibrid dikonfigurasi, operasi reaper otomatis yang berjalan dalam layanan menguntungkan seluruh kluster. Ini termasuk pusat data yang tidak disediakan oleh layanan. Di luar ini, Anda bertanggung jawab untuk mempertahankan pusat data lokal atau yang dihosting secara eksternal.

Langkah berikutnya

Mulai dengan salah satu mulai cepat kami: