適用於 Apache Cassandra 的 Azure 受控執行個體 管理作業
適用於 Apache Cassandra 的 Azure 受控執行個體 是純開放原始碼 Apache Cassandra 叢集的完整受控服務。 此服務也允許根據每個工作負載的特定需求來覆寫組態,允許視需要的最大彈性和控制。 本文定義服務所提供的管理作業和功能。 它也說明維護混合式叢集時,Azure 支援 小組與客戶之間的責任區隔。
壓 實
- 有不同類型的 壓縮。 我們目前透過維修執行輕微壓縮(請參閱 維護)。 這會執行默克爾樹壓縮,這是一種特殊的壓縮。
- 根據 使用 CQL 在數據表上設定的壓縮策略 (例如
WITH compaction = { 'class' : 'LeveledCompactionStrategy' }
),Cassandra 會在數據表達到特定大小時自動壓縮。 我們建議您仔細選取工作負載的壓縮策略,不要在策略之外執行任何手動壓縮。
修補
操作系統層級修補程式會自動以大約 2 周的步調完成。
識別安全性弱點時,會完成Apache Cassandra軟體層級修補程式。 修補頻率可能會有所不同。
在修補期間,機器會一次重新啟動一個機架。 只要 未使用仲裁 ALL 設定,而且復寫因數為 3 或更高,就不應該在應用程式端遇到任何降級。
Apache Cassandra 中的版本格式
X.Y.Z
為 。 您可以透過服務工具手動控制主要 (X) 和次要 (Y) 版本的部署。 而 Cassandra 修補程式 (Z) 則會自動完成該主要/次要版本組合所需的修補程式。
注意
此服務目前支援 Cassandra 3.11 和 4.0 版。 這兩個版本都是 GA。 請參閱我們的 Azure CLI 快速入門 (步驟 5),以在叢集部署期間指定 Cassandra 版本。
維護
Nodetool 修復會自動由服務使用重新執行。 此工具每周執行一次。 如果您想要在混合式部署中使用自己的服務來停用它。
節點健康情況監視包含:
- 主動監視 Cassandra 通道中每個節點的成員資格。
- 自動偵測及自動匯入虛擬機、網路、記憶體、Linux 和支援軟體失敗等基礎結構問題。
- 主動監視 CPU、磁碟、仲裁遺失和其他資源問題。
- 盡可能自動啟動失敗的節點,並手動啟動節點以響應自動產生的警告。
支援
適用於 Apache Cassandra 的 Azure 受控執行個體 提供 SLA,以取得受控叢集中數據中心的可用性。 如果您在使用服務時遇到問題,請在 Azure 入口網站 中提出支援要求。
我們的支援權益包括:
- Cassandra 基礎結構問題的單一連絡點 - 不需要個別向 IaaS 小組提出支援案例(磁碟、計算、網路功能)。
- 透過電子郵件提供效能瓶口、重設大小和其他資源限制性問題的建議。
- 24x7 支援涵蓋範圍,包括針對任何嚴重中斷問題自動產生的事件。
- 社群核准的修補程序支援(請參閱 修補)。
- 內部 Java JDK/JVM 工程小組支援。
- 具有軟體供應鏈安全性的Linux作業系統支援。
重要
我們將調查並診斷透過支援案例回報的任何問題,並盡可能解決或減輕問題。 不過,您最終會負責任何導致 CPU、磁碟或網路問題的 Apache Cassandra 設定層級使用量。
這類問題的範例包括:
- 沒有效率的查詢作業。
- 超過容量的輸送量。
- 擷取超過記憶體容量的數據。
- Keyspace 組態設定不正確。
- 數據模型或分割區索引鍵策略不佳。
如果我們調查支援案例,並發現問題的根本原因是在 Apache Cassandra 設定層級(而不是我們維護的任何基礎平臺層級層面),我們仍會在關閉案例之前提供補救或風險降低的建議和指引。
建議您 啟用計量 和/或熟悉 Azure 監視器整合 ,以避免 Apache Cassandra 中的常見應用程式/組態層級問題,例如上述。
警告
適用於 Apache Cassandra 的 Azure 受控執行個體 也可讓您執行 nodetool
和 sstable
命令來進行例行 DBA 管理 - 請參閱這裡的文章。 其中一些命令可能會破壞 cassandra 叢集的不穩定,而且應該只在非生產環境中測試之後小心執行。 可能的話, --dry-run
應該先部署選項。 Microsoft 無法在改變預設資料庫組態和/或數據表的執行命令上提供任何 SLA 或支援。
備份和還原
默認會啟用快照集備份,並每隔 24 小時進行一次。 備份會儲存在內部 Azure Blob 儲存體 帳戶中,並保留最多 2 天(48 小時)。 初始 2 個備份不需要任何費用。 額外的備份會收取費用,請參閱 定價。 若要變更備份間隔或保留期間,您可以在入口網站中編輯原則:
若要從現有的備份還原,請在 Azure 入口網站 中提出支援要求。 提出支援案例時,您需要:
從入口網站提供您想要還原之備份的備份標識碼。 您可以在入口網站中找到:
如果不需要還原整個叢集,請提供需要還原的keyspace和數據表(如果適用)。
建議您在現有叢集中或新的叢集中還原備份。
如果您想要還原至新的叢集,您必須先建立新的叢集。 確定目標叢集在數據中心數目方面符合來源叢集,且對應的數據中心有相同的節點數目。 您也可以決定是否要在新的目標叢集中保留認證(使用者名稱/密碼),或允許還原以原先建立的內容覆寫使用者名稱/密碼。
您也可以決定是否要將keyspace保留在
system_auth
新的目標叢集中,或允許還原以備份中的數據覆寫它。system_auth
Cassandra 中的keyspace包含授權和內部驗證數據,包括角色、角色許可權和密碼。 請注意,我們的預設還原程式會覆寫system_auth
keyspace。
注意
回應從備份還原要求所需的時間取決於您引發的支援案例嚴重性(以及回應時間對應的 SLA),以及要還原的數據量。 不過,我們沒有提供 SLA 來完成還原的時間,因為這會非常相依於所要還原的數據量。
警告
備份適用於意外刪除案例,而不是異地備援。 因此,在發生區域完全中斷時,不建議使用它們作為災害復原(DR)策略。 若要防範全區域中斷,建議使用多區域部署。 請查看我們的 多區域部署快速入門。
安全性
適用於 Apache Cassandra 的 Azure 受控執行個體 提供許多內建的明確安全性控制與功能:
- 使用受控供應鏈強化的Linux虛擬機映像。
- 操作系統層級的常見弱點和暴露程度 (CVE) 監視。
- 受控 虛擬機器 上裝載的 Apache Cassandra 和 Prometheus 軟體的憑證輪替。
- 主動式弱點掃描。
- 主動式病毒掃描。
- 安全編碼作法。
如需安全性功能的詳細資訊,請參閱這裡的文章。
混合式支援
設定混合式叢集時,自動重新執行於服務中的作業會讓整個叢集受益。 這包括服務未布建的數據中心。 在此以外,您有責任維護內部部署或外部裝載的數據中心。
下一步
開始使用我們的其中一個快速入門: