Diferencias entre Azure Managed Instance for Apache Cassandra y Azure Cosmos DB for Apache Cassandra

En este artículo, aprenderá las diferencias entre Azure Managed Instance for Apache Cassandra y Azure Cosmos DB for Apache Cassandra basada en RU. En este artículo se proporcionan recomendaciones sobre cómo elegir entre los dos servicios o cuándo hospedar su propio entorno de Apache Cassandra.

Principales diferencias

Azure Managed Instance for Apache Cassandra es un servicio totalmente administrado para clústeres de Apache Cassandra de código abierto puros. El servicio también permite invalidar las configuraciones, en función de las necesidades específicas de cada carga de trabajo, lo que permite la máxima flexibilidad y control cuando sea necesario. También proporciona la funcionalidad de escalar horizontalmente la capacidad de los clústeres de Apache Cassandra existentes autohospedados en la nube o en el entorno local. Realiza el escalado horizontal mediante la adición de centros de datos administrados de Cassandra al anillo del clúster existente.

La instancia de Azure Cosmos DB for Apache Cassandra basada en RU de Azure Cosmos DB es una capa de compatibilidad en Azure Cosmos DB, el servicio de base de datos nativa de la nube distribuida globalmente de Microsoft.

¿Cómo elegir?

En la tabla siguiente se muestran los escenarios comunes, los requisitos de la carga de trabajo y las aspiraciones en las que se adaptan cada uno de estos enfoques de implementación:

Apache Cassandra autohospedado en el entorno local o en Azure Azure Managed Instance for Apache Cassandra Azure Cosmos DB for Apache Cassandra
Tipo de implementación Tiene una implementación de Apache Cassandra muy personalizada con revisiones personalizadas o adaptaciones propietarias. Tiene una implementación estándar de Apache Cassandra de código abierto sin código personalizado. Tiene su implementación en una plataforma que no tiene una capa de Apache Cassandra subyacente, pero que es compatible con todos los controladores de cliente de código abierto en un nivel de protocolo de conexión.
Sobrecarga operativa Ya dispone de expertos en Cassandra que pueden implementar, configurar y mantener los clústeres. Quiere eliminar la sobrecarga operativa mediante el uso de una base de datos como servicio totalmente administrada para Apache Cassandra de código abierto, pero tiene la opción de controlar configuraciones específicas de Cassandra, como la replicación y la coherencia cuando sea necesario. Quiere eliminar la sobrecarga operativa mediante una base de datos de plataforma como servicio totalmente administrada en la nube.
Soporte a la producción Los incidentes activos y las interrupciones las controla el propio usuario, incluido el contacto con los equipos de infraestructura pertinentes para el proceso, las redes, el almacenamiento, etc. Quiere una experiencia de servicio administrado propia de Microsoft que actúe como una tienda integral para admitir incidentes activos e interrupciones. Quiere una experiencia de servicio administrado propia de Microsoft que actúe como una tienda única para incidentes activos y interrupciones.
Soporte de software Quiere controlar todas las revisiones y asegurarse de que el software se actualice antes de que finalice el ciclo de vida. Quiere una experiencia de servicio administrado propia de Microsoft que ofrezca compatibilidad con el nivel de software de Cassandra más allá del final del ciclo de vida, revisiones automatizadas y actualizaciones llave en mano para las versiones principales. Quiere una experiencia de servicio administrado propia de Microsoft en la que la compatibilidad con el nivel de software se abstrae completamente.
Requisitos del sistema operativo Tiene un requisito para mantener imágenes del sistema operativo de máquinas virtuales personalizadas o para comercialización. Puede usar imágenes estándar pero desea tener control sobre la selección de SKU, memoria, discos e IOPS. Quiere que el aprovisionamiento de la capacidad se simplifique y se exprese como una única métrica normalizada, con una relación de uno a uno con el rendimiento, como las unidades de solicitud de Azure Cosmos DB.
Modelo de precios Quiere usar software de administración como las herramientas de Datastax y está satisfecho con los costos de las licencias. Prefiere licencias de código abierto puras y precios basados en instancias de máquina virtual. Quiere usar precios nativos de la nube, que incluyan ofertas de escalado automático y sin servidor.
Analytics Desea tener un control total sobre el aprovisionamiento de las canalizaciones analíticas, independientemente de la sobrecarga que conlleva crearlas y mantenerlas. Quiere usar servicios analíticos basados en la nube como Azure Databricks. Quiere que el análisis transaccional híbrido en tiempo real esté integrado en la plataforma con Azure Synapse Link para Azure Cosmos DB.
Patrón de la carga de trabajo La carga de trabajo es bastante estable y no es necesario escalar los nodos del clúster con frecuencia. La carga de trabajo es volátil y debe poder escalar o reducir verticalmente los nodos de un centro de datos o agregar o quitar centros de datos fácilmente. La carga de trabajo suele ser volátil y debe poder escalar o reducir verticalmente de forma rápida y en un volumen significativo.
SLA Está satisfecho con los procesos de mantenimiento de los SLA para la coherencia, el rendimiento, la disponibilidad y la recuperación ante desastres. Está satisfecho con los procesos de mantenimiento de los SLA para la coherencia, el rendimiento y la disponibilidad, pero quiere un SLA para la disponibilidad y necesita ayuda con las copias de seguridad. Quiere SLA completos para la coherencia, el rendimiento, la disponibilidad y la recuperación ante desastres.
Replicación y coherencia Debe poder configurar la matriz completa de opciones de coherencia ajustables disponible en Apache Cassandra para la ruta de acceso de lectura y escritura. Debe poder configurar la matriz completa de opciones de coherencia ajustables disponible en Apache Cassandra para la ruta de acceso de lectura y escritura. Una coherencia de ruta de acceso de lectura de UNO (eventual) o TODOS (fuerte) es suficiente para todas las aplicaciones (consulte también asignación de niveles de coherencia de Cassandra)
Modelo de datos Va a migrar cargas de trabajo que tienen una combinación de distribución uniforme de datos y datos sesgados (con respecto tanto al almacenamiento como al rendimiento entre claves de partición) que requieren flexibilidad en la escala vertical de los nodos. Va a migrar cargas de trabajo que tienen una combinación de distribución uniforme de datos y datos sesgados (con respecto tanto al almacenamiento como al rendimiento entre claves de partición) que requieren flexibilidad en la escala vertical de los nodos. Está compilando una nueva aplicación o la aplicación existente tiene una distribución relativamente uniforme de los datos con respecto al almacenamiento y el rendimiento entre claves de partición.

Pasos siguientes