Compartir vía


Configuración de alta disponibilidad

En esta página se describe cómo configurar una instancia de base de datos de Lakebase para alta disponibilidad habilitando instancias secundarias legibles.

Importante

Esta característica se encuentra en versión preliminar pública en las siguientes regiones: westus, westus2, eastuseastus2, centralussouthcentralusnortheuropewesteuropeaustraliaeastbrazilsouthcanadacentralcentralindia, , . southeastasiauksouth

Para habilitar la alta disponibilidad, especifique nodos adicionales como parte de una instancia de base de datos. Si el nodo de cómputo principal deja de estar en buen estado o no está disponible, se usa un nodo de alta disponibilidad para realizar la conmutación por error, y el nodo secundario se promueve a principal.

También puede habilitar réplicas secundarias legibles, donde los nodos de alta disponibilidad pueden servir cargas de trabajo de solo lectura mediante un punto de conexión DNS independiente (instance-ro-{uuid} en comparación con instance-{uuid}).

Habilitación de la instancia de base de datos para alta disponibilidad

Si establece el número de nodos de alta disponibilidad en uno, se deshabilitan las réplicas secundarias legibles y de alta disponibilidad. De lo contrario, tiene un nodo principal y el resto son nodos de alta disponibilidad. El número máximo de nodos de alta disponibilidad es tres por instancia de base de datos.

Especifique el número de nodos de alta disponibilidad al crear la instancia de base de datos. Consulte Creación de una instancia de base de datos.

Realice los pasos siguientes para modificar la instancia de base de datos mediante la interfaz de usuario o la API.

Interfaz de usuario

  1. Haga clic en Calcular en la barra lateral del área de trabajo.
  2. Haga clic en la pestaña Instancias de base de datos .
  3. Seleccione la instancia de base de datos que desea actualizar.
  4. Haga clic en Editar en la esquina superior derecha.
  5. Escriba el valor del tamaño del nodo del grupo HA (incluido el principal).
  6. Active Habilitar réplicas secundarias legibles.
  7. Haz clic en Guardar.

curl

curl -s -X PATCH --header "Authorization: Bearer ${DATABRICKS_TOKEN}" $DBR_URL/database/instances/my-instance -d '{ “node_count”: 3, “enable_readable_secondaries” : true}'

SDK de Python

from databricks.sdk import WorkspaceClient
from databricks.sdk.service.database import DatabaseInstance

# Initialize the Workspace client
w = WorkspaceClient()

# Create a database instance with high availability
instance = w.database.create_database_instance(
    DatabaseInstance(
        name="my-database-instance",
        capacity="CU_1",
        node_count=3,  # Set the number of high availability nodes (including primary)
    )
)

print(f"Created database instance: {instance.name}")
print(f"Connection endpoint: {instance.read_write_dns}")

Interfaz de línea de comandos (CLI)

# Create a database instance
databricks database create-database-instance my-database-instance \
  --capacity CU_1 \
  --node-count 3

Resistencia de proceso

Con los nodos de alta disponibilidad configurados, el nodo principal de la instancia de base de datos está protegido por alta disponibilidad. Si el nodo principal deja de estar disponible, la instancia de base de datos realiza automáticamente una conmutación a un nodo secundario, promocionándolo como el nuevo nodo principal. Como los nodos de cálculo son sin estado, los fallos no afectan a sus datos, y su cadena de conexión permanece sin cambios. La falta de disponibilidad se resuelve en segundos a minutos, en función del tipo de error. Durante una conmutación por error, se quitan las conexiones activas, por lo que la aplicación debe configurarse para controlar estas breves desconexiones y volver a conectarse automáticamente.

Los nodos secundarios de la instancia de base de datos también se recuperan automáticamente en minutos cuando se producen problemas. Si habilita réplicas secundarias de lectura, Databricks recomienda que tenga al menos tres nodos de alta disponibilidad, en caso de que el fallo del nodo principal afecte a la conexión de solo lectura. La aplicación todavía necesita un mecanismo de reconexión para controlar el breve tiempo de inactividad.

Ejecución de consultas de solo lectura desde el Editor de SQL de Azure Databricks

Para conectarse a los secundarios legibles y ejecutar consultas de solo lectura desde el editor de SQL de Azure Databricks, consulte Acceso a una instancia de base de datos desde el editor de SQL.

Limitaciones

  • El rendimiento tarda tiempo en recuperarse. Las consultas se pueden ejecutar inicialmente más lentamente hasta que se vuelven a generar porque el nuevo nodo principal no tiene datos específicos de sesión y una caché local para los datos a los que se accede con frecuencia.
  • No se admite la replicación entre regiones. En caso de una interrupción en toda la región, la disponibilidad depende del proveedor de nube que restaura el servicio a la región afectada.