Creación y administración de una instancia de base de datos

Importante

Lakebase Provisioned es la oferta original de Lakebase que utiliza recursos de cómputo aprovisionados que se ajustan manualmente. Para ver las regiones admitidas, consulte Disponibilidad de regiones. Para obtener la versión más reciente de Lakebase, con escalado automático, escalado a cero, bifurcación y restauración instantánea, consulte Lakebase Autoscaling.

Desde el 12 de marzo de 2026, se crean nuevas instancias de Lakebase como proyectos de escalado automático. Las instancias aprovisionadas existentes se actualizan automáticamente al escalado automático a partir de junio de 2026. Para obtener más información, consulte Actualización al escalado automático de Lakebase.

Para empezar a trabajar con cargas de trabajo OLTP, cree una instancia de base de datos aprovisionada de Lakebase mediante la interfaz de usuario de Azure Databricks, la llamada API, el SDK de Python o la CLI.

Creación de una instancia de base de datos

Cree una instancia de base de datos con los valores predeterminados recomendados. Debe proporcionar un nombre de instancia (letras y guiones, de 1 a 63 caracteres). Como creador, es el propietario de la base de datos con el rol databricks_superuser.

La mayoría de los usuarios del área de trabajo pueden crear instancias de base de datos de forma predeterminada. Si encuentra problemas de permisos, consulte permisos de instancia de base de datos.

Interfaz de usuario

  1. Haga clic en Icono de aplicación.Aplicaciones en la esquina superior derecha y seleccione Lakebase Postgres.
  2. Haga clic en Aprovisionado para abrir la página Instancias aprovisionadas .
  3. Haga clic en Crear instancia de base de datos.
  4. Configure la instancia:
    • Nombre: escriba un nombre de instancia de base de datos (de 1 a 63 caracteres, solo letras y guiones).
    • Capacidad: seleccione el tamaño de proceso (valor predeterminado: 2 CU). Consulte Tamaño de instancia.
    • Directiva de uso sin servidor: seleccione una directiva de uso para atribuir el uso y la facturación sin servidor (opcional). Consulte Directivas de uso sin servidor.
  5. (Opcional) Expanda Configuración avanzada para configurar:
    • Crear a partir del padre: crear un clon de copia por escritura desde una instancia existente, incluidos los datos hasta un momento específico. Consulte Crear desde el elemento primario.
    • Habilitar HA: Activar alta disponibilidad mediante nodos de conmutación por error, configurar secundarios accesibles para lectura y establecer el número de nodos de alta disponibilidad. Consulte Alta disponibilidad.
  6. Haga clic en Crear.

SDK de Python

from databricks.sdk import WorkspaceClient
from databricks.sdk.service.database import DatabaseInstance

# Initialize the Workspace client
w = WorkspaceClient()

# Create a database instance
instance = w.database.create_database_instance(
    DatabaseInstance(
        name="my-database-instance",
        capacity="CU_1"
    )
)

print(f"Created database instance: {instance.name}")
print(f"Connection endpoint: {instance.read_write_dns}")

Interfaz de línea de comandos (CLI)

# Create a database instance
databricks database create-database-instance my-database-instance \
  --capacity CU_1

# Create with advanced options (using JSON for more complex parameters)
databricks database create-database-instance \
  --json '{
    "name": "my-database-instance",
    "capacity": "CU_2",
    "retention_window_in_days": 14
  }'

curl

Cree una instancia de base de datos y especifique una ventana de retención.

export PAT=<YOUR_PAT>
export INSTANCE_NAME="instance_name"

> curl -X POST --header "Authorization: Bearer ${DATABRICKS_TOKEN}" https://[your databricks workspace]/api/2.0/database/instances \
--data-binary @- << EOF
{
  "name": "$INSTANCE_NAME",
  "capacity": "CU_1",
  "retention_window_in_days": 14
}
EOF

Configuración avanzada

También puede configurar estas características durante la creación o después de la creación editando la instancia:

Característica Description
Directiva de uso sin servidor Seleccione una directiva de uso para la instancia de base de datos para atribuir el uso sin servidor y la facturación a presupuestos específicos. También puede agregar etiquetas personalizadas.
Tamaño de instancia Escale los recursos de cálculo según los requisitos de rendimiento de la carga de trabajo (valor predeterminado: 2 CU).
Restaurar ventana Establezca la ventana de retención (2-35 días, por defecto 7 días) para la recuperación a un momento dado.
Alta disponibilidad Agregue nodos de conmutación por error para garantizar la continuidad empresarial de las cargas de trabajo de producción.
Crear desde el elemento primario Cree un clon usando el método de copia en escritura a partir de una instancia de base de datos existente.

Detener o iniciar una instancia

Para detener o iniciar una instancia de base de datos, debe tener permisos CAN MANAGE sobre ella. Para detener o iniciar una instancia, use la interfaz de usuario de Azure Databricks, la llamada API, el SDK de Python o la CLI.

Interfaz de usuario

  1. Haga clic en Icono de aplicación.Aplicaciones en la esquina superior derecha y seleccione Lakebase Postgres.
  2. Haga clic en Aprovisionado para abrir la página Instancias aprovisionadas .
  3. Haga clic en la instancia de base de datos que desea detener o iniciar.
  4. Haga clic en Detener o Iniciar en la esquina superior derecha de la página.

SDK de Python

from databricks.sdk import WorkspaceClient
from databricks.sdk.service.database import DatabaseInstance

# Initialize the Workspace client
w = WorkspaceClient()

# Stop a database instance
instance_name = "my-database-instance"
w.database.update_database_instance(
    name=instance_name,
    database_instance=DatabaseInstance(
        name=instance_name,
        stopped=True
    ),
    update_mask="*"
)
print(f"Stopped database instance: {instance_name}")

# Start a database instance
w.database.update_database_instance(
    name=instance_name,
    database_instance=DatabaseInstance(
        name=instance_name,
        stopped=False
    ),
    update_mask="*"
)
print(f"Started database instance: {instance_name}")

Interfaz de línea de comandos (CLI)

# Stop a database instance
databricks database update-database-instance my-database-instance '*' \
  --json '{
    "stopped": true
  }'

# Start a database instance
databricks database update-database-instance my-database-instance '*' \
  --json '{
    "stopped": false
  }'

curl

La siguiente llamada API detiene una instancia de base de datos.

-X PATCH --header "Authorization: Bearer ${DATABRICKS_TOKEN}" https://$WORKSPACE/api/2.0/database/instances/$INSTANCE_NAME \
--data-binary @- << EOF
{
  "stopped": true
}
EOF

La siguiente llamada API inicia una instancia de base de datos.

curl -X PATCH --header "Authorization: Bearer ${DATABRICKS_TOKEN}" https://$WORKSPACE/api/2.0/database/instances/$INSTANCE_NAME \
--data-binary @- << EOF
{
  "stopped": false
}
EOF

Comportamiento cuando se detiene

Comportamiento de la instancia de base de datos:

  • Se conservan los datos.
  • La instancia no se puede usar para las operaciones de lectura o escritura.
  • Las tablas sincronizadas no permiten lecturas.
  • Las canalizaciones declarativas de Spark (LDP) de Lakeflow no detectan instancias detenidas y pueden devolver errores.
  • Los catálogos registrados en instancias detenidas no muestran los detalles del esquema en la interfaz de usuario.

Limitaciones funcionales:

  • No puede crear ni eliminar DatabaseTables ni DatabaseCatalogs.
  • Puede eliminar o cambiar el tamaño de una instancia detenida. Los cambios de capacidad surten efecto cuando se reinicia la instancia.
  • Puede detener las canalizaciones.

Comportamiento cuando se inicia

  • La instancia entra en el estado STARTING y se vuelve AVAILABLE cuando está lista.

Limitaciones

  • LDP no detecta instancias detenidas y puede devolver errores.
  • Los catálogos registrados en instancias detenidas no muestran los detalles del esquema en la interfaz de usuario.

Eliminación de una instancia

Tenga cuidado al eliminar la instancia de base de datos, ya que, al hacerlo, se eliminarán todos los datos asociados.

Debe tener permisos de CAN MANAGE sobre la instancia de base de datos. Si no es el propietario de las tablas o catálogos, debe reasignarse la propiedad a usted mismo. Los administradores del área de trabajo pueden eliminar las instancias de base de datos que no poseen.

Databricks recomienda eliminar todos los catálogos de Catálogos de Unity asociados, tablas sincronizadas e instancias secundarias antes de eliminar la instancia de base de datos. De lo contrario, si intenta ver catálogos o ejecutar consultas SQL que hacen referencia a ellas, se producirán errores.

Interfaz de usuario

  1. Haga clic en Icono de aplicación.Aplicaciones en la esquina superior derecha y seleccione Lakebase Postgres.
  2. Haga clic en Aprovisionado para abrir la página Instancias aprovisionadas .
  3. Seleccione la instancia de base de datos que desea eliminar.
  4. Seleccione Catálogos en la barra lateral aplicación de Lakebae para ver la lista completa de catálogos de bases de datos asociados a la instancia de base de datos.
  5. Para cada catálogo de bases de datos, elimine todas las tablas sincronizadas, incluidas las que se encuentran en catálogos administrados y no se registran como catálogos de bases de datos.
  6. Haga clic en icono de menú Kebab.>Eliminar catálogo.

SDK de Python

from databricks.sdk import WorkspaceClient

# Initialize the Workspace client
w = WorkspaceClient()

# Delete a database instance
instance_name = "my-database-instance"
w.database.delete_database_instance(
    name=instance_name,
    purge=True  # Required to delete the instance
)
print(f"Deleted database instance: {instance_name}")

# Delete with force option (to delete child instances too)
w.database.delete_database_instance(
    name=instance_name,
    force=True,  # Delete child instances too
    purge=True
)

Interfaz de línea de comandos (CLI)

# Delete a database instance
databricks database delete-database-instance my-database-instance \
  --purge

# Delete with force option (to delete child instances too)
databricks database delete-database-instance my-database-instance \
  --json '{
    "force": true,
    "purge": true
  }'

curl

purge=true debe especificarse para eliminar una instancia de base de datos.

curl -X DELETE --header "Authorization: Bearer ${DATABRICKS_TOKEN}" https://$WORKSPACE/api/2.0/database/instances/$INSTANCE_NAME?purge=true

Actualización de una directiva de uso sin servidor de una instancia de base de datos

Las directivas de uso sin servidor constan de etiquetas que se aplican a cualquier actividad de proceso sin servidor que incurra un usuario asignado a la directiva. Al etiquetar una instancia de base de datos con una directiva de uso sin servidor, puede atribuir los costos de facturación y uso a determinadas directivas, lo que facilita el seguimiento, la administración y el control del gasto en los recursos sin servidor.

Use la interfaz de usuario para actualizar la directiva de uso de una instancia de base de datos:

  1. Haga clic en Icono de aplicación.Aplicaciones en la esquina superior derecha y seleccione Lakebase Postgres.
  2. Haga clic en Aprovisionado para abrir la página Instancias aprovisionadas .
  3. Seleccione la instancia de base de datos para la que desea actualizar la directiva de facturación.
  4. Haga clic en Editar en la esquina superior derecha.
  5. Seleccione una directiva de uso sin servidor.
  6. Haz clic en Guardar.

Administración de la capacidad de la instancia

Para cambiar el tamaño de una instancia, debe tener CAN MANAGE permisos. El cambio de tamaño puede tardar varios minutos y surte efecto cuando se reinicia la instancia.

Cada unidad de capacidad asigna aproximadamente 16 GB de RAM junto con los recursos de CPU y SSD locales asociados. Antes de escalar, probar y optimizar las consultas. El almacenamiento se escala automáticamente.

Interfaz de usuario

  1. Haga clic en Icono de aplicación.Aplicaciones en la esquina superior derecha y seleccione Lakebase Postgres.
  2. Haga clic en Aprovisionado para abrir la página Instancias aprovisionadas .
  3. Seleccione la instancia de base de datos que desea cambiar de tamaño.
  4. Haga clic en Editar en la esquina superior derecha.
  5. Use el menú desplegable Capacidad para seleccionar el nuevo tamaño de instancia.
  6. Haz clic en Guardar.

curl

curl -X PATCH --header "Authorization: Bearer ${DATABRICKS_TOKEN}" https://$WORKSPACE/api/2.0/database/instances/$INSTANCE_NAME \
--data-binary @- << EOF
{
  "capacity": "CU_4"
}
EOF

SDK de Python

from databricks.sdk import WorkspaceClient
from databricks.sdk.service.database import DatabaseInstance

w = WorkspaceClient()
instance_name = "my-database-instance"
w.database.update_database_instance(
    name=instance_name,
    database_instance=DatabaseInstance(name=instance_name, capacity="CU_4"),
    update_mask="*"
)

Interfaz de línea de comandos (CLI)

databricks database update-database-instance my-database-instance '*' --capacity CU_4

Supervisión de una instancia de base de datos

Acceda a las métricas desde la pestaña Supervisión de la página de detalles de la instancia.

  1. Haga clic en Icono de aplicación.Aplicaciones en la esquina superior derecha y seleccione Lakebase Postgres.
  2. Haga clic en Aprovisionado para abrir la página Instancias aprovisionadas .
  3. Seleccione la instancia de base de datos que desea supervisar.
  4. Seleccione Supervisión en la barra lateral aplicación de Lakebase.

Use las métricas siguientes para analizar las tendencias de rendimiento, identificar posibles cuellos de botella y evaluar si desea optimizar el uso de la aplicación o escalar la instancia:

  • Transacciones por segundo: Muestra el rendimiento de procesamiento de transacciones confirmadas. Úselo para comprender los patrones de carga de trabajo e identificar los períodos de transacción máximos. Si este valor es constantemente alto, considere la posibilidad de optimizar el comportamiento del cliente o aumentar el tamaño de la instancia.

  • Filas por segundo: Muestra el número de filas capturadas, devueltas, insertadas, actualizadas y eliminadas. Las filas extraídas hacen referencia al número de filas devueltas a los clientes. Las filas devueltas hacen referencia al número de filas leídas por las consultas. Ayuda a diagnosticar el tipo de carga de trabajo y su impacto en el sistema. Si el rendimiento está restringido, considere la posibilidad de agregar índices o optimizar los patrones de consulta.

  • Abrir conexiones: Muestra el número de conexiones activas abiertas. Las conexiones consumen recursos de instancia. Úselo para evaluar si se necesita la agrupación de conexiones del lado cliente. Consulte los límites del número máximo de conexiones permitidas.

  • Uso del almacenamiento: Indica el uso actual del almacenamiento para la instancia. Si el uso se aproxima a los límites aprovisionados de Lakebase, quite los datos o índices innecesarios. Como alternativa, póngase en contacto con el soporte técnico para solicitar un aumento de cuota.

  • Uso de CPU (%): Mide el uso de CPU para la instancia de base de datos. Un uso elevado de la CPU podría indicar una carga de trabajo con un cálculo intensivo. Considere la posibilidad de optimizar el lado de la aplicación o aumentar el tamaño de la instancia.

  • Rendimiento de lectura de página (%): Refleja la proximidad de la instancia a su capacidad de lectura de página, normalmente causada por errores de caché. Si el valor es alto, reduzca la carga de trabajo o el conjunto de trabajo, agregue índices, almacene en caché consultas en el lado cliente o optimice los datos.

  • Frecuencia de aciertos de caché del búfer (%): Indica el porcentaje de lecturas atendidas desde la memoria. Las cargas de trabajo de alto rendimiento deben ver valores superiores a 99%. Las tasas bajas sugieren que la carga de trabajo supera la capacidad de caché o podría beneficiarse de las optimizaciones.

  • Frecuencia de aciertos de caché de SSD local (%): Realiza un seguimiento del porcentaje de lecturas atendidas desde la memoria caché de SSD después de un fallo de caché de búfer. Un valor bajo puede aumentar el rendimiento de lectura de página. Use optimizaciones similares a las de la caché del búfer o considere una instancia mayor.

  • Interbloqueos por segundo: Mide la frecuencia con la que las transacciones encuentran interbloqueos. Normalmente ocurren cuando varias transacciones acceden a los mismos recursos en un orden que entra en conflicto. Investigue y refactorice las cargas de trabajo para evitar interbloqueos.

Pasos siguientes

Limitaciones y requisitos

En las secciones siguientes se describen los límites y los requisitos de configuración de las instancias de base de datos administradas.

  • Una área de trabajo permite un máximo de diez instancias.
  • Cada instancia admite hasta 1000 conexiones simultáneas.
  • El límite de tamaño lógico en todas las bases de datos de una instancia es de 2 TB.
  • Las instancias de base de datos se limitan a una sola área de trabajo.

Requisitos de nombre de instancia

  • Debe tener entre 1 y 63 caracteres.
  • Debe comenzar con una letra.
  • Solo puede contener caracteres alfanuméricos y guiones.
  • No puede incluir dos guiones consecutivos.