Operace správy ve službě Azure Managed Instance for Apache Cassandra

Článek
10/18/2023

Azure Managed Instance for Apache Cassandra je plně spravovaná služba pro čistě opensourcové clustery Apache Cassandra. Služba také umožňuje přepsání konfigurací v závislosti na konkrétních potřebách jednotlivých úloh, což umožňuje maximální flexibilitu a kontrolu tam, kde je to potřeba. Tento článek definuje operace správy a funkce poskytované službou. Vysvětluje také oddělení zodpovědností mezi týmem podpora Azure a zákazníky při údržbě hybridních clusterů.

Komprese

Existují různé typy komprimace. V současné době provádíme menší komprimace prostřednictvím opravy (viz Údržba). To provádí Merkle strom komprimace, což je zvláštní druh komprimace.
V závislosti na strategii komprimace, která byla nastavena v tabulce pomocí jazyka CQL (například WITH compaction = { 'class' : 'LeveledCompactionStrategy' }), Cassandra se automaticky zkomprimuje, když tabulka dosáhne konkrétní velikosti. Doporučujeme pečlivě vybrat strategii komprimace pro vaši úlohu a neprodávejte žádné ruční komprimace mimo strategii.

Záplatování

Opravy na úrovni operačního systému se provádějí automaticky přibližně za 2 týdny.
Opravy na úrovni softwaru Apache Cassandra se provádějí při identifikaci ohrožení zabezpečení. Četnost oprav se může lišit.
Během oprav se počítače restartují po jednom racku. Neměli byste zaznamenat žádné snížení výkonu na straně aplikace, pokud se nepoužívá nastavení kvora ALL a faktor replikace je 3 nebo vyšší.
Verze v Apache Cassandra je ve formátu X.Y.Z. Nasazení hlavních verzí (X) a podverzí (Y) můžete řídit ručně pomocí nástrojů služeb. Zatímco opravy Cassandra (Z), které mohou být vyžadovány pro danou kombinaci hlavní/podverze, se provádějí automaticky.

Poznámka:

Služba aktuálně podporuje Cassandra verze 3.11 a 4.0. Obě verze jsou obecně dostupné. Informace o zadání verze Cassandra během nasazování clusteru najdete v našem rychlém startu Azure CLI (krok 5).

Údržba

Oprava Nodetool je automaticky spuštěna službou pomocí reaperu. Tento nástroj se spouští jednou týdně. Pokud pro hybridní nasazení používáte vlastní službu, můžete ji zakázat.
Monitorování stavu uzlu se skládá z:
- Aktivně monitoruje členství jednotlivých uzlů v okruhu Cassandra.
- Automatické rozpoznávání a automatické vytváření problémů s infrastrukturou, jako jsou selhání virtuálního počítače, sítě, úložiště, Linuxu a podpory.
- Aktivně monitoruje problémy s procesorem, diskem, ztrátou kvora a dalšími prostředky.
- Automatické vyvolání neúspěšných uzlů tam, kde je to možné, a ruční vyvolání uzlů v reakci na automaticky generovaná upozornění

Technická podpora

Azure Managed Instance for Apache Cassandra poskytuje smlouvu SLA pro dostupnost datových center ve spravovaném clusteru. Pokud narazíte na problémy s používáním služby, vytvořte žádost o podporu na webu Azure Portal.

Mezi naše výhody podpory patří:

Jediný kontaktní bod pro problémy s infrastrukturou Cassandra – nemusíte zvyšovat případy podpory u týmů IaaS (disk, výpočetní prostředky, sítě) samostatně.
Pro-aktivní rady prostřednictvím e-mailu o problémech s omezeními výkonu, velikosti a dalších omezení prostředků.
Pokrytí podpory 24x7, včetně automaticky generovaných incidentů pro všechny závažné problémy s výpadky
Podpora oprav schválená komunitou (viz Oprava).
Podpora technického týmu Java JDK/JVM v interním prostředí
Podpora operačního systému Linux se zabezpečením softwarového dodavatelského řetězce

Důležité

Prošetříme a diagnostikujeme všechny problémy nahlášené prostřednictvím případu podpory a v případě potřeby vyřešíme nebo zmírníme. V konečném důsledku ale zodpovídáte za veškeré využití na úrovni konfigurace Apache Cassandra, které způsobuje problémy s procesorem, diskem nebo sítí.

Mezi příklady takových problémů patří:

Neefektivní operace dotazů.
Propustnost, která překračuje kapacitu.
Ingestování dat, která překračují kapacitu úložiště
Nesprávné nastavení konfigurace prostoru klíčů.
Špatná strategie datového modelu nebo klíče oddílu

V případě, že prošetříme případ podpory a zjistíme, že původní příčina problému je na úrovni konfigurace Apache Cassandra (a ne na žádné aspekty základní úrovně platformy, které udržujeme), budeme vám ještě před uzavřením případu poskytovat doporučení a pokyny k nápravě nebo zmírnění rizik (pokud je to možné).

Doporučujeme povolit metriky nebo se seznámit s integrací služby Azure Monitor, abyste zabránili běžným problémům na úrovni aplikace a konfigurace v Apache Cassandře, jako je například výše uvedené.

Upozorňující

Spravovaná instance Azure pro Apache Cassandra vám také umožní spouštět nodetool a sstable příkazy pro rutinní správu DBA – viz článek zde. Některé z těchto příkazů mohou cluster Cassandra stabilizovat a měly by být spouštěny opatrně a po otestování v neprodukčním prostředí. Pokud je to možné, --dry-run měla by se nejprve nasadit možnost. Microsoft nemůže nabídnout žádnou smlouvu SLA ani podporu problémů se spouštěním příkazů, které mění výchozí konfiguraci databáze nebo tabulky.

Zálohování a obnovení

Zálohování snímků je ve výchozím nastavení povolené a probíhá každých 24 hodin. Zálohy se ukládají v interním účtu služby Azure Blob Storage a uchovávají se až 2 dny (48 hodin). U počátečních 2 záloh nejsou žádné náklady. Další zálohy se účtují, viz ceny. Pokud chcete změnit interval zálohování nebo dobu uchovávání, můžete zásadu upravit na portálu:

Pokud chcete provést obnovení z existující zálohy, vytvořte žádost o podporu na webu Azure Portal. Při vyplňování případu podpory potřebujete:

Zadejte ID zálohy z portálu pro zálohu, kterou chcete obnovit. Najdete ho na portálu:
Pokud se nevyžaduje obnovení celého clusteru, zadejte prostor klíčů a tabulku (pokud je k dispozici), které je potřeba obnovit.
Poradit, jestli chcete obnovit zálohu v existujícím clusteru nebo v novém clusteru.
Pokud chcete provést obnovení do nového clusteru, musíte nejprve vytvořit nový cluster. Ujistěte se, že cílový cluster odpovídá zdrojovému clusteru z hlediska počtu datových center a že odpovídající datové centrum má stejný počet uzlů. Můžete se také rozhodnout, jestli chcete zachovat přihlašovací údaje (uživatelské jméno nebo heslo) v novém cílovém clusteru, nebo povolit obnovení přepsání uživatelského jména a hesla původním vytvořením.
Můžete se také rozhodnout, jestli chcete zachovat system_auth prostor klíčů v novém cílovém clusteru, nebo povolit obnovení, aby ho přepsalo daty ze zálohy. system_auth Prostor klíčů v Cassandře obsahuje autorizační a interní ověřovací data, včetně rolí, oprávnění rolí a hesel. Všimněte si, že náš výchozí proces obnovení přepíše system_auth prostor klíčů.

Poznámka:

Doba odezvy na žádost o obnovení ze zálohy bude záviset na závažnosti případu podpory, kterou vyvoláte (a odpovídající smlouvu SLA pro dobu odezvy) a množství dat, která se mají obnovit. Neposkytujeme však smlouvu SLA pro dokončení obnovení, protože to je velmi závislé na objemu obnovovaných dat.

Upozorňující

Zálohy jsou určené pro scénáře náhodného odstranění a nejsou geograficky redundantní. Proto se nedoporučuje používat jako strategie zotavení po havárii (DR) v případě celkového regionálního výpadku. Pokud chcete zajistit ochranu před výpadky v celé oblasti, doporučujeme nasazení ve více oblastech. Podívejte se na náš rychlý start pro nasazení ve více oblastech.

Zabezpečení

Azure Managed Instance for Apache Cassandra poskytuje řadu předdefinovaných explicitních bezpečnostních prvků a funkcí:

Posílené image virtuálních počítačů s Linuxem s řízeným dodavatelským řetězcem
Běžné monitorování ohrožení zabezpečení a ohrožení zabezpečení (CVE) na úrovni operačního systému
Obměny certifikátů pro software Apache Cassandra i Prometheus hostovaný na spravovaných virtuálních počítačích.
Aktivní kontrola ohrožení zabezpečení
Aktivní kontrola virů.
Postupy zabezpečeného kódování

Další informace o funkcích zabezpečení najdete v tomto článku.

Hybridní podpora

Když je hybridní cluster nakonfigurovaný, automatizované operace reaperu spuštěné ve službě prospívá celému clusteru. To zahrnuje datová centra, která služba nezřídí. Mimo tuto možnost je vaší zodpovědností udržovat vaše místní nebo externě hostované datové centrum.

Další kroky

Začínáme s jedním z našich rychlých startů: