Unterschiede zwischen Azure Managed Instance for Apache Cassandra und Azure Cosmos DB for Apache Cassandra

Dieser Artikel enthält Informationen zu den Unterschieden zwischen Azure Managed Instance for Apache Cassandra und der RU-basierten Instanz von Azure Cosmos DB for Apache Cassandra. Der Artikel enthält Empfehlungen zur Wahl eines der beiden Dienste, und Sie erfahren, wann Sie eine eigene Apache Cassandra-Umgebung hosten sollten.

Wesentliche Unterschiede

Azure Managed Instance for Apache Cassandra ist ein vollständig verwalteter Service für reine Open-Source Apache Cassandra-Cluster. Der Dienst ermöglicht auch das Überschreiben von Konfigurationen, je nach den spezifischen Anforderungen der einzelnen Workloads, und bietet so ein Höchstmaß an Flexibilität und Kontrolle, wo dies erforderlich ist. Darüber hinaus lässt sich hiermit die Kapazität bereits vorhandener lokaler oder cloudbasierter selbstgehosteter Apache Cassandra-Cluster aufskalieren. Hierzu werden dem vorhandenen Clusterring verwaltete Cassandra-Rechenzentren hinzugefügt.

Bei der RU-basierten Instanz von Azure Cosmos DB for Apache Cassandra in Azure Cosmos DB handelt es sich um eine Kompatibilitätsebene über dem global verteilten cloudnativen Datenbankdienst Azure Cosmos DB von Microsoft.

Wofür soll ich mich entscheiden?

Die folgende Tabelle enthält die gängigen Szenarien, Workloadanforderungen und passenden Einsatzmöglichkeiten für die einzelnen Bereitstellungsansätze:

Selbstgehostete Azure Cassandra-Instanz (lokal oder in Azure) Azure Managed Instance for Apache Cassandra Azure Cosmos DB for Apache Cassandra
Bereitstellungstyp Sie verfügen über eine hochgradig angepasste Apache Cassandra-Bereitstellung mit benutzerdefinierten Patches oder Snitches. Sie verfügen über eine Open Source-basierte Apache Cassandra-Standardbereitstellung ohne benutzerdefinierten Code. Ihnen reicht eine Plattform, die nicht auf Apache Cassandra basiert, aber mit allen Open-Source-Clienttreibern auf Wire Protocol-Ebene kompatibel ist.
Operativer Mehraufwand Sie verfügen über Cassandra-Experten, die Ihre Cluster bereitstellen, konfigurieren und verwalten können. Sie möchten Betriebsaufwand vermeiden, indem Sie ein vollständig verwaltetes Database-as-a-Service-Angebot für Apache Cassandra (Open Source) verwenden, aber die Möglichkeit haben, Cassandra-spezifische Konfigurationen wie Replikation und Konsistenz bei Bedarf zu steuern. Sie möchten eine vollständig verwaltete PaaS-Datenbank (Platform-as-a-Service) in der Cloud verwenden und den operativen Mehraufwand beseitigen.
Produktionssupport Sie behandeln Live-Incidents und Ausfälle selbst und nehmen u. a. Kontakt mit den relevanten Infrastrukturteams für Compute, Netzwerk, Speicher usw. auf. Sie möchten einen verwalteten Erstanbieterdienst, der als zentrale Anlaufstelle für die Unterstützung bei Live-Incidents und Ausfällen fungiert. Sie möchten einen verwalteten Erstanbieterdienst, der als zentrale Anlaufstelle bei Live-Incidents und Ausfällen fungiert.
Softwaresupport Sie verarbeiten alle Patches und stellen sicher, dass die Software vor dem Ende der Lebensdauer aktualisiert wird. Sie möchten einen verwalteten Erstanbieterdienst erhalten, der Cassandra-Support auf Softwareebene über das Ende der Lebensdauer hinaus, automatisierte Patches und sofort einsatzfähige Upgrades für Hauptversionen bietet: Sie möchten einen verwalteten Erstanbieterdienst, bei dem der Support auf Softwareebene vollständig abstrahiert ist.
Betriebssystemanforderungen Sie müssen VM-Betriebssystemimages (benutzerdefiniert oder Gold-Version) verwalten. Sie können einfache Images verwenden, möchten aber Kontrolle über die Auswahl von SKUs, Arbeitsspeicher, Datenträgern und IOPS haben. Sie möchten, dass die Kapazitätsbereitstellung vereinfacht und als normalisierte Einzelmetrik mit direkter Beziehung zum Durchsatz ausgedrückt wird (beispielsweise in Form von Anforderungseinheiten in Azure Cosmos DB).
Preismodell Sie möchten Verwaltungssoftware wie Datastax-Tools verwenden und haben kein Problem mit Lizenzierungskosten. Sie bevorzugen eine reine Open-Source-Lizenzierung und Preise auf VM-Instanzbasis. Sie möchten cloudnative Preise verwenden – einschließlich Angebote für Autoskalierung und serverlos.
Analyse Sie möchten uneingeschränkte Kontrolle über die Bereitstellung von Analysepipelines, unabhängig vom Zusatzaufwand für die Erstellung und Wartung. Sie möchten cloudbasierte Analysedienste wie Azure Databricks verwenden. Sie möchten eine hybride, in die Plattform integrierte Transaktionsanalyse in Quasi-Echtzeit mit Azure Synapse Link für Azure Cosmos DB.
Arbeitsauslastungsmuster Ihre Arbeitsauslastung ist relativ konstant, und die Knoten im Cluster müssen nicht oft skaliert werden. Ihre Arbeitsauslastung schwankt, und Sie müssen mühelos Knoten in einem Rechenzentrum hoch- oder herunterskalieren oder Rechenzentren hinzufügen/entfernen können. Ihre Arbeitsauslastung schwankt häufig, und Sie müssen schnell und in großem Umfang hoch- oder herunterskalieren können.
SLAs Sie sind zufrieden mit Ihren Prozessen für die Erfüllung von SLAs in Bezug auf Konsistenz, Durchsatz, Verfügbarkeit und Notfallwiederherstellung. Sie sind zufrieden mit Ihren Prozessen für die Erfüllung von SLAs in Bezug auf Konsistenz und Durchsatz, benötigen aber eine SLA für Verfügbarkeit sowie Unterstützung bei Sicherungen. Sie benötigen vollumfängliche SLAs für Konsistenz, Durchsatz, Verfügbarkeit und Notfallwiederherstellung.
Replikation und Konsistenz Sie müssen in der Lage sein, das vollständige Array der optimierbaren Konsistenzeinstellungen zu konfigurieren, die in Apache Cassandra für den Lese- und Schreibpfad verfügbar sind. Sie müssen in der Lage sein, das vollständige Array der optimierbaren Konsistenzeinstellungen zu konfigurieren, die in Apache Cassandra für den Lese- und Schreibpfad verfügbar sind. Eine Lesepfadkonsistenz von EINS (möglich) oder ALLE (stark) ist für alle Ihre Anwendungen ausreichend (siehe auch Zuordnen von Cassandra-Konsistenzebenen).
Datenmodell Sie migrieren Workloads, die eine Mischung aus einheitlicher Verteilung von Daten und verzerrten Daten (in Bezug auf Speicher und Durchsatz über Partitionsschlüssel hinweg) aufweisen, die Flexibilität bei der vertikalen Skalierung von Knoten erfordern. Sie migrieren Workloads, die eine Mischung aus einheitlicher Verteilung von Daten und verzerrten Daten (in Bezug auf Speicher und Durchsatz über Partitionsschlüssel hinweg) aufweisen, die Flexibilität bei der vertikalen Skalierung von Knoten erfordern. Sie erstellen eine neue Anwendung, oder Ihre vorhandene Anwendung verfügt über eine relativ einheitliche Verteilung der Daten in Bezug auf Speicher und Durchsatz über Partitionsschlüssel hinweg.

Nächste Schritte