適用於 Apache Cassandra 的 Azure 受控執行個體 管理作業

適用於 Apache Cassandra 的 Azure 受控執行個體 是純開放原始碼 Apache Cassandra 叢集的完整受控服務。 此服務也允許根據每個工作負載的特定需求來覆寫組態,允許視需要的最大彈性和控制。 本文定義服務所提供的管理作業和功能。 它也說明維護混合式叢集時,Azure 支援 小組與客戶之間的責任區隔。

壓 實

  • 有不同類型的 壓縮。 我們目前透過維修執行輕微壓縮(請參閱 維護)。 這會執行默克爾樹壓縮,這是一種特殊的壓縮。
  • 根據 使用 CQL 在數據表上設定的壓縮策略 (例如 WITH compaction = { 'class' : 'LeveledCompactionStrategy' }),Cassandra 會在數據表達到特定大小時自動壓縮。 我們建議您仔細選取工作負載的壓縮策略,不要在策略之外執行任何手動壓縮。

修補

  • 操作系統層級修補程式會自動以大約 2 周的步調完成。

  • 識別安全性弱點時,會完成Apache Cassandra軟體層級修補程式。 修補頻率可能會有所不同。

  • 在修補期間,機器會一次重新啟動一個機架。 只要 未使用仲裁 ALL 設定,而且復寫因數為 3 或更高,就不應該在應用程式端遇到任何降級。

  • Apache Cassandra 中的版本格式 X.Y.Z為 。 您可以透過服務工具手動控制主要 (X) 和次要 (Y) 版本的部署。 而 Cassandra 修補程式 (Z) 則會自動完成該主要/次要版本組合所需的修補程式。

注意

此服務目前支援 Cassandra 3.11 和 4.0 版。 這兩個版本都是 GA。 請參閱我們的 Azure CLI 快速入門 (步驟 5),以在叢集部署期間指定 Cassandra 版本。

維護

  • Nodetool 修復會自動由服務使用重新執行。 此工具每周執行一次。 如果您想要在混合式部署中使用自己的服務來停用它。

  • 節點健康情況監視包含:

    • 主動監視 Cassandra 通道中每個節點的成員資格。
    • 自動偵測及自動匯入虛擬機、網路、記憶體、Linux 和支援軟體失敗等基礎結構問題。
    • 主動監視 CPU、磁碟、仲裁遺失和其他資源問題。
    • 盡可能自動啟動失敗的節點,並手動啟動節點以響應自動產生的警告。

支援

適用於 Apache Cassandra 的 Azure 受控執行個體 提供 SLA,以取得受控叢集中數據中心的可用性。 如果您在使用服務時遇到問題,請在 Azure 入口網站 中提出支援要求

我們的支援權益包括:

  • Cassandra 基礎結構問題的單一連絡點 - 不需要個別向 IaaS 小組提出支援案例(磁碟、計算、網路功能)。
  • 透過電子郵件提供效能瓶口、重設大小和其他資源限制性問題的建議。
  • 24x7 支援涵蓋範圍,包括針對任何嚴重中斷問題自動產生的事件。
  • 社群核准的修補程序支援(請參閱 修補)。
  • 內部 Java JDK/JVM 工程小組支援。
  • 具有軟體供應鏈安全性的Linux作業系統支援。

重要

我們將調查並診斷透過支援案例回報的任何問題,並盡可能解決或減輕問題。 不過,您最終會負責任何導致 CPU、磁碟或網路問題的 Apache Cassandra 設定層級使用量。

這類問題的範例包括:

  • 沒有效率的查詢作業。
  • 超過容量的輸送量。
  • 擷取超過記憶體容量的數據。
  • Keyspace 組態設定不正確。
  • 數據模型或分割區索引鍵策略不佳。

如果我們調查支援案例,並發現問題的根本原因是在 Apache Cassandra 設定層級(而不是我們維護的任何基礎平臺層級層面),我們仍會在關閉案例之前提供補救或風險降低的建議和指引。

建議您 啟用計量 和/或熟悉 Azure 監視器整合 ,以避免 Apache Cassandra 中的常見應用程式/組態層級問題,例如上述。

警告

適用於 Apache Cassandra 的 Azure 受控執行個體 也可讓您執行 nodetoolsstable 命令來進行例行 DBA 管理 - 請參閱這裡的文章。 其中一些命令可能會破壞 cassandra 叢集的不穩定,而且應該只在非生產環境中測試之後小心執行。 可能的話, --dry-run 應該先部署選項。 Microsoft 無法在改變預設資料庫組態和/或數據表的執行命令上提供任何 SLA 或支援。

備份和還原

默認會啟用快照集備份,並每隔 24 小時進行一次。 備份會儲存在內部 Azure Blob 儲存體 帳戶中,並保留最多 2 天(48 小時)。 初始 2 個備份不需要任何費用。 額外的備份會收取費用,請參閱 定價。 若要變更備份間隔或保留期間,您可以在入口網站中編輯原則:

Screenshot of backup schedule configuration page.

若要從現有的備份還原,請在 Azure 入口網站 中提出支援要求。 提出支援案例時,您需要:

  1. 從入口網站提供您想要還原之備份的備份標識碼。 您可以在入口網站中找到:

    Screenshot of backup schedule configuration page highlighting backup ID.

  2. 如果不需要還原整個叢集,請提供需要還原的keyspace和數據表(如果適用)。

  3. 建議您在現有叢集中或新的叢集中還原備份。

  4. 如果您想要還原至新的叢集,您必須先建立新的叢集。 確定目標叢集在數據中心數目方面符合來源叢集,且對應的數據中心有相同的節點數目。 您也可以決定是否要在新的目標叢集中保留認證(使用者名稱/密碼),或允許還原以原先建立的內容覆寫使用者名稱/密碼。

  5. 您也可以決定是否要將keyspace保留在 system_auth 新的目標叢集中,或允許還原以備份中的數據覆寫它。 system_auth Cassandra 中的keyspace包含授權和內部驗證數據,包括角色、角色許可權和密碼。 請注意,我們的預設還原程式會覆寫 system_auth keyspace。

注意

回應從備份還原要求所需的時間取決於您引發的支援案例嚴重性(以及回應時間對應的 SLA),以及要還原的數據量。 不過,我們沒有提供 SLA 來完成還原的時間,因為這會非常相依於所要還原的數據量。

警告

備份適用於意外刪除案例,而不是異地備援。 因此,在發生區域完全中斷時,不建議使用它們作為災害復原(DR)策略。 若要防範全區域中斷,建議使用多區域部署。 請查看我們的 多區域部署快速入門。

安全性

適用於 Apache Cassandra 的 Azure 受控執行個體 提供許多內建的明確安全性控制與功能:

  • 使用受控供應鏈強化的Linux虛擬機映像。
  • 操作系統層級的常見弱點和暴露程度 (CVE) 監視。
  • 受控 虛擬機器 上裝載的 Apache Cassandra 和 Prometheus 軟體的憑證輪替。
  • 主動式弱點掃描。
  • 主動式病毒掃描。
  • 安全編碼作法。

如需安全性功能的詳細資訊,請參閱這裡的文章

混合式支援

設定混合式叢集時,自動重新執行於服務中的作業會讓整個叢集受益。 這包括服務未布建的數據中心。 在此以外,您有責任維護內部部署或外部裝載的數據中心。

下一步

開始使用我們的其中一個快速入門: