Partager via


Différences entre Azure Managed Instance pour Apache Cassandra et Azure Cosmos DB for Apache Cassandra

Dans cet article, vous apprenez les différences entre Azure Managed Instance pour Apache Cassandra et Azure Cosmos DB for Apache Cassandra basé sur les unités de requête. Cet article explique comment faire votre choix entre les deux services et quand héberger votre propre environnement Apache Cassandra.

Différences clés

Azure Managed Instance pour Apache Cassandra est un service complètement managé pour les clusters Apache Cassandra open source purs. Le service permet également de remplacer des configurations, en fonction des besoins spécifiques de chaque charge de travail, ce qui permet une flexibilité et un contrôle optimaux, le cas échéant. Cette solution offre également la possibilité d’effectuer un scale-out de la capacité des clusters Apache Cassandra existants, qu’ils soient locaux ou autohébergés dans le cloud. Le scale-out s’effectue par l’ajout de centres de données Cassandra managés à l’anneau de cluster existant.

Azure Cosmos DB for Apache Cassandra basé sur les unités de requête dans Azure Cosmos DB est une couche de compatibilité sur Azure Cosmos DB, le service de base de données cloud natif de Microsoft distribué dans le monde entier.

Comment choisir ?

Le tableau suivant présente les scénarios courants, les exigences de charge de travail et les attentes que peuvent remplir chacune de ces approches de déploiement :

Apache Cassandra autohébergé en local ou dans Azure Azure Managed Instance pour Apache Cassandra Azure Cosmos DB for Apache Cassandra
Type de déploiement Vous avez un déploiement d’Apache Cassandra hautement personnalisé avec des « snitch » ou des correctifs personnalisés. Vous avez un déploiement d’Apache Cassandra open source standard sans code personnalisé. Vous souhaitez une plateforme non dépendante d’Apache Cassandra, mais qui soit conforme à tous les pilotes clients open source au niveau du protocole filaire.
Surcharge opérationnelle Vous avez des experts Cassandra qui peuvent déployer, configurer et gérer vos clusters. Vous voulez éliminer la surcharge opérationnelle en utilisant une base de données en tant que service complètement managée pour Apache Cassandra open source, mais voulez avoir la possibilité de contrôler des configurations propres à Cassandra, comme la réplication et la cohérence, en fonction des besoins. Vous souhaitez éliminer la surcharge opérationnelle en utilisant une base de données PaaS (Platform as a Service) complètement managée dans le cloud.
Support de la production Vous gérez vous-même les incidents et les pannes en direct, notamment en contactant les équipes d’infrastructure appropriées pour le calcul, le réseau, le stockage, etc. Vous voulez une expérience de service managé interne faisant office de guichet unique pour la prise en charge des incidents et des pannes en direct. Vous voulez une expérience de service managé interne faisant office de guichet unique pour les incidents et les pannes en direct.
Support des logiciels Vous gérez tous les correctifs et vérifiez que les logiciels sont mis à niveau avant leur fin de vie. Vous voulez une expérience de service managé interne qui offre une prise en charge au niveau du logiciel Cassandra au-delà de la fin de vie, la mise à jour corrective automatisée et des mises à niveau clé en main pour les versions principales Vous voulez une expérience de service managé interne où la prise en charge au niveau du logiciel est complètement abstraite.
Système d'exploitation requis Vous devez conserver des images personnalisées ou finales (golden) du système d’exploitation des machines virtuelles. Vous pouvez utiliser des images standard (vanilla), mais vous voulez contrôler la sélection des références SKU, de la mémoire, des disques et des IOPS. Vous souhaitez simplifier le provisionnement de la capacité et l’exprimer sous la forme d’une métrique normalisée unique, avec une relation un-à-un avec le débit, comme les unités de requête dans Azure Cosmos DB.
Modèle de tarification Vous souhaitez utiliser une solution de gestion telle que les outils Datastax, et vous êtes satisfait des coûts de licences. Vous préférez des licences entièrement open source et un modèle tarifaire par instance de machine virtuelle. Vous souhaitez utiliser le modèle tarifaire du cloud natif, qui inclut les offres de mise à l’échelle automatique et serverless.
Analyse Vous souhaitez avoir un contrôle total du provisionnement des pipelines analytiques, quelle que soit la surcharge nécessaire pour les créer et les gérer. Vous souhaitez utiliser des services cloud d’analytique comme Azure Databricks. Vous souhaitez avoir une analytique transactionnelle hybride en quasi-temps réel intégrée à la plateforme avec Azure Synapse Link pour Azure Cosmos DB.
Modèle de charge de travail Votre charge de travail est relativement stable et vous n’avez pas souvent besoin de mettre à l’échelle les nœuds dans le cluster. Votre charge de travail est volatile et vous souhaitez pouvoir facilement effectuer un scale-up ou un scale-down des nœuds dans un centre de données ou bien ajouter ou supprimer des centres de données. Votre charge de travail est souvent volatile et vous souhaitez pouvoir effectuer un scale-up ou un scale-down rapidement et à grande échelle.
Contrats SLA Vous êtes satisfait de vos processus de gestion des contrats SLA en ce qui concerne la cohérence, le débit, la disponibilité et la reprise d’activité après sinistre. Vous êtes satisfait de vos processus de gestion des contrats SLA en ce qui concerne la cohérence et le débit, mais vous souhaitez un Contrat de niveau de service pour la disponibilité et avez besoin d’aide pour les sauvegardes. Vous souhaitez avoir des contrats SLA complets pour la cohérence, le débit, la disponibilité et la récupération d'urgence.
Réplication et cohérence Vous devez être en mesure de configurer le tableau complet des paramètres de cohérence ajustables disponibles dans Apache Cassandra pour le chemin d’accès en lecture et en écriture. Vous devez être en mesure de configurer le tableau complet des paramètres de cohérence ajustables disponibles dans Apache Cassandra pour le chemin d’accès en lecture et en écriture. Une cohérence du chemin de lecture de ONE (éventuelle) ou ALL (forte) est suffisante pour toutes vos applications (voir également mappage des niveaux de cohérence Cassandra)
Modèle de données Vous migrez des charges de travail qui présentent un mélange de distribution uniforme des données et de données asymétriques (en ce qui concerne à la fois le stockage et le débit entre les clés de partition), ce qui nécessite une certaine flexibilité sur l’échelle verticale des nœuds. Vous migrez des charges de travail qui présentent un mélange de distribution uniforme des données et de données asymétriques (en ce qui concerne à la fois le stockage et le débit entre les clés de partition), ce qui nécessite une certaine flexibilité sur l’échelle verticale des nœuds. Vous créez une nouvelle application ou votre application existante présente une distribution relativement uniforme des données en termes de stockage et de débit entre les clés de partition.

Étapes suivantes