Erstellen und Verwalten einer Datenbankinstanz

Von Bedeutung

Lakebase Provisioned ist das ursprüngliche Lakebase-Angebot, das bereitgestellte Rechenleistung nutzt, die Sie manuell skalieren. Unterstützte Regionen finden Sie unter "Verfügbarkeit der Region". Die neueste Version von Lakebase mit automatischer Berechnung, Skalierung bis Null, Verzweigung und sofortige Wiederherstellung finden Sie unter Lakebase Autoscaling.

Seit dem 12. März 2026 werden neue Lakebase-Instanzen als Automatischen Skalierungsprojekte erstellt. Vorhandene bereitgestellte Instanzen werden ab Juni 2026 automatisch auf die automatische Skalierung aktualisiert. Details finden Sie unter Upgrade zu Lakebase Autoscaling.

Um mit OLTP-Workloads zu beginnen, erstellen Sie eine Lakebase Provisioned-Datenbankinstanz mithilfe der Azure Databricks UI, des API-Aufrufs, Python SDK oder der CLI.

Erstellen einer Datenbankinstanz

Erstellen Sie eine Datenbankinstanz mit empfohlenen Standardwerten. Sie müssen einen Instanznamen angeben (nur 1-63 Zeichen, Buchstaben und Bindestriche). Als Ersteller sind Sie der Datenbankbesitzer mit der databricks_superuser Rolle.

Die meisten Arbeitsbereichsbenutzer können standardmäßig Datenbankinstanzen erstellen. Wenn Berechtigungsprobleme auftreten, finden Sie Informationen zu Datenbankinstanzberechtigungen.

Benutzeroberfläche

  1. Klicken Sie auf das Symbol Apps in der oberen rechten Ecke und wählen Lakebase Postgres aus.
  2. Klicken Sie auf "Bereitgestellt" , um die Seite " Bereitgestellte Instanzen" zu öffnen.
  3. Klicken Sie auf "Datenbankinstanz erstellen".
  4. Konfigurieren Sie Ihre Instanz:
    • Name: Geben Sie einen Datenbankinstanznamen ein (nur 1-63 Zeichen, Buchstaben und Bindestriche).
    • Kapazität: Wählen Sie die Berechnungsgröße aus (Standard: 2 CU). Siehe Instanzgröße.
    • Serverlose Nutzungsrichtlinie: Wählen Sie eine Verwendungsrichtlinie aus, um serverlose Nutzung und Abrechnung (optional) zu attributieren. Siehe Serverlose Nutzungsrichtlinien.
  5. (Optional) Erweitern Sie die erweiterten Einstellungen , um folgendes zu konfigurieren:
    • Von übergeordnetem Element erstellen: Erstellen Sie einen Copy-on-Write-Klon aus einer vorhandenen Instanz, einschließlich Daten bis zu einem bestimmten Zeitpunkt. Siehe "Erstellen aus übergeordnetem Element".
    • Aktivieren Sie HA: Aktivieren Sie die hohe Verfügbarkeit mit Failover-Knoten, konfigurieren Sie lesbare Sekundärknoten, und legen Sie die Anzahl der HA-Knoten fest. Siehe Hohe Verfügbarkeit.
  6. Klicken Sie auf "Erstellen".

Python SDK

from databricks.sdk import WorkspaceClient
from databricks.sdk.service.database import DatabaseInstance

# Initialize the Workspace client
w = WorkspaceClient()

# Create a database instance
instance = w.database.create_database_instance(
    DatabaseInstance(
        name="my-database-instance",
        capacity="CU_1"
    )
)

print(f"Created database instance: {instance.name}")
print(f"Connection endpoint: {instance.read_write_dns}")

Befehlszeilenschnittstelle (CLI)

# Create a database instance
databricks database create-database-instance my-database-instance \
  --capacity CU_1

# Create with advanced options (using JSON for more complex parameters)
databricks database create-database-instance \
  --json '{
    "name": "my-database-instance",
    "capacity": "CU_2",
    "retention_window_in_days": 14
  }'

cURL

Erstellen Sie eine Datenbankinstanz, und geben Sie ein Aufbewahrungsfenster an.

export PAT=<YOUR_PAT>
export INSTANCE_NAME="instance_name"

> curl -X POST --header "Authorization: Bearer ${DATABRICKS_TOKEN}" https://[your databricks workspace]/api/2.0/database/instances \
--data-binary @- << EOF
{
  "name": "$INSTANCE_NAME",
  "capacity": "CU_1",
  "retention_window_in_days": 14
}
EOF

Erweiterte Einstellungen

Sie können diese Features auch während der Erstellung oder nach der Erstellung konfigurieren, indem Sie Ihre Instanz bearbeiten:

Merkmal Description
Serverlose Nutzungsrichtlinie Wählen Sie eine Verwendungsrichtlinie für Ihre Datenbankinstanz aus, um serverlose Nutzung und Abrechnung bestimmten Budgets zuzuordnen. Sie können auch benutzerdefinierte Tags hinzufügen.
Instanzgröße Skalieren Sie Rechnerressourcen entsprechend den Leistungsanforderungen Ihrer Arbeitslast (die Standardeinstellung ist 2 CU).
Fenster wiederherstellen Legen Sie das Aufbewahrungsfenster (2-35 Tage, Standard 7 Tage) für die Zeitwiederherstellung fest.
Hohe Verfügbarkeit Fügen Sie Failoverknoten hinzu, um die Geschäftskontinuität für Produktionsworkloads sicherzustellen.
Aus übergeordnetem Element erstellen Erstellen Sie eine Copy-on-Write-Kopie einer vorhandenen Datenbankinstanz.

Beenden oder Starten einer Instanz

Um eine Datenbankinstanz zu beenden oder zu starten, müssen Sie über die entsprechenden Berechtigungen CAN MANAGE verfügen. Um eine Instanz zu beenden oder zu starten, verwenden Sie die Azure Databricks UI, den API-Aufruf, Python SDK oder CLI.

Benutzeroberfläche

  1. Klicken Sie auf das Symbol Apps in der oberen rechten Ecke und wählen Lakebase Postgres aus.
  2. Klicken Sie auf "Bereitgestellt" , um die Seite " Bereitgestellte Instanzen" zu öffnen.
  3. Klicken Sie auf die Datenbankinstanz, die Sie beenden oder starten möchten.
  4. Klicken Sie in der oberen rechten Ecke der Seite auf "Beenden" oder " Start" .

Python SDK

from databricks.sdk import WorkspaceClient
from databricks.sdk.service.database import DatabaseInstance

# Initialize the Workspace client
w = WorkspaceClient()

# Stop a database instance
instance_name = "my-database-instance"
w.database.update_database_instance(
    name=instance_name,
    database_instance=DatabaseInstance(
        name=instance_name,
        stopped=True
    ),
    update_mask="*"
)
print(f"Stopped database instance: {instance_name}")

# Start a database instance
w.database.update_database_instance(
    name=instance_name,
    database_instance=DatabaseInstance(
        name=instance_name,
        stopped=False
    ),
    update_mask="*"
)
print(f"Started database instance: {instance_name}")

Befehlszeilenschnittstelle (CLI)

# Stop a database instance
databricks database update-database-instance my-database-instance '*' \
  --json '{
    "stopped": true
  }'

# Start a database instance
databricks database update-database-instance my-database-instance '*' \
  --json '{
    "stopped": false
  }'

cURL

Der folgende API-Aufruf stoppt eine Datenbankinstanz.

-X PATCH --header "Authorization: Bearer ${DATABRICKS_TOKEN}" https://$WORKSPACE/api/2.0/database/instances/$INSTANCE_NAME \
--data-binary @- << EOF
{
  "stopped": true
}
EOF

Der folgende API-Aufruf startet eine Datenbankinstanz.

curl -X PATCH --header "Authorization: Bearer ${DATABRICKS_TOKEN}" https://$WORKSPACE/api/2.0/database/instances/$INSTANCE_NAME \
--data-binary @- << EOF
{
  "stopped": false
}
EOF

Verhalten beim Anhalten

Verhalten der Datenbankinstanz:

  • Die Daten bleiben erhalten.
  • Die Instanz kann nicht für Lese- oder Schreibvorgänge verwendet werden.
  • Synchronisierte Tabellen unterstützen keine Lesevorgänge.
  • Lakeflow Spark Declarative Pipelines (LDP) erkennen keine beendeten Instanzen und geben möglicherweise Fehler zurück.
  • Registrierte Kataloge für beendete Instanzen zeigen keine Schemadetails in der Benutzeroberfläche an.

Funktionale Einschränkungen:

  • Sie können weder DatabaseTables noch DatabaseCatalogs erstellen oder löschen.
  • Sie können eine angehaltene Instanz löschen oder die Größe ändern. Kapazitätsänderungen werden wirksam, wenn die Instanz neu gestartet wird.
  • Sie können Pipelines anhalten.

Verhalten beim Starten

  • Die Instanz wechselt in den STARTING Zustand und wird zu AVAILABLE, wenn sie bereit ist.

Einschränkungen

  • LDP erkennt keine beendeten Instanzen und kann Fehler zurückgeben.
  • Registrierte Kataloge für beendete Instanzen zeigen keine Schemadetails in der Benutzeroberfläche an.

Löschen einer Instanz

Seien Sie beim Löschen der Datenbankinstanz vorsichtig, da dadurch alle zugehörigen Daten gelöscht werden.

Sie müssen über Berechtigungen für die Datenbankinstanz verfügen CAN MANAGE . Wenn Sie nicht der Besitzer der Tabellen oder Kataloge sind, müssen Sie den Besitz auf sich selbst übertragen. Arbeitsbereichsadministratoren können Datenbankinstanzen löschen, die sie nicht besitzen.

Databricks empfiehlt, alle zugeordneten Unity-Katalogkataloge, synchronisierte Tabellen und untergeordnete Instanzen zu löschen, bevor die Datenbankinstanz gelöscht wird. Andernfalls führt der Versuch, Kataloge anzuzeigen oder SQL-Abfragen auszuführen, die auf sie verweisen, zu Fehlern.

Benutzeroberfläche

  1. Klicken Sie auf das Symbol Apps in der oberen rechten Ecke und wählen Lakebase Postgres aus.
  2. Klicken Sie auf "Bereitgestellt" , um die Seite " Bereitgestellte Instanzen" zu öffnen.
  3. Wählen Sie die Datenbankinstanz aus, die Sie löschen möchten.
  4. Wählen Sie Kataloge in der Lakebae App-Randleiste aus, um die vollständige Liste der Datenbankkataloge anzuzeigen, die der Datenbankinstanz zugeordnet sind.
  5. Löschen Sie für jeden Datenbankkatalog alle synchronisierten Tabellen, einschließlich derjenigen, die sich in verwalteten Katalogen befinden und nicht als Datenbankkataloge registriert sind.
  6. Klicken Sie auf das Kebab-Menüsymbol.>Katalog löschen.

Python SDK

from databricks.sdk import WorkspaceClient

# Initialize the Workspace client
w = WorkspaceClient()

# Delete a database instance
instance_name = "my-database-instance"
w.database.delete_database_instance(
    name=instance_name,
    purge=True  # Required to delete the instance
)
print(f"Deleted database instance: {instance_name}")

# Delete with force option (to delete child instances too)
w.database.delete_database_instance(
    name=instance_name,
    force=True,  # Delete child instances too
    purge=True
)

Befehlszeilenschnittstelle (CLI)

# Delete a database instance
databricks database delete-database-instance my-database-instance \
  --purge

# Delete with force option (to delete child instances too)
databricks database delete-database-instance my-database-instance \
  --json '{
    "force": true,
    "purge": true
  }'

cURL

purge=true muss angegeben werden, um eine Datenbankinstanz zu löschen.

curl -X DELETE --header "Authorization: Bearer ${DATABRICKS_TOKEN}" https://$WORKSPACE/api/2.0/database/instances/$INSTANCE_NAME?purge=true

Aktualisieren einer serverlosen Nutzungsrichtlinie einer Datenbankinstanz

Serverlose Nutzungsrichtlinien bestehen aus Tags, die auf jede serverlose Computeaktivität angewendet werden, die von einem Benutzer verursacht wird, der der Richtlinie zugewiesen ist. Indem Sie eine Datenbankinstanz mit einer serverlosen Nutzungsrichtlinie kategorisieren, können Sie Abrechnungs- und Nutzungskosten bestimmten Richtlinien zuordnen, wodurch die Kosten für serverlose Ressourcen einfacher nachverfolgt, verwaltet und gesteuert werden können.

Verwenden Sie die Benutzeroberfläche, um die Verwendungsrichtlinie einer Datenbankinstanz zu aktualisieren:

  1. Klicken Sie auf das Symbol Apps in der oberen rechten Ecke und wählen Lakebase Postgres aus.
  2. Klicken Sie auf "Bereitgestellt" , um die Seite " Bereitgestellte Instanzen" zu öffnen.
  3. Wählen Sie die Datenbankinstanz aus, für die Sie die Abrechnungsrichtlinie aktualisieren möchten.
  4. Klicken Sie oben rechts auf "Bearbeiten ".
  5. Wählen Sie eine Serverless-Nutzungsrichtlinie aus.
  6. Klicken Sie auf "Speichern".

Verwalten der Instanzkapazität

Um die Größe einer Instanz zu ändern, müssen Sie über Berechtigungen verfügen CAN MANAGE . Das Ändern der Größe kann mehrere Minuten dauern und wird wirksam, wenn die Instanz neu gestartet wird.

Jede Kapazitätseinheit weist ca. 16 GB RAM zusammen mit zugeordneten CPU- und lokalen SSD-Ressourcen zu. Bevor Sie Abfragen skalieren, testen und optimieren. Der Speicher skaliert automatisch.

Benutzeroberfläche

  1. Klicken Sie auf das Symbol Apps in der oberen rechten Ecke und wählen Lakebase Postgres aus.
  2. Klicken Sie auf "Bereitgestellt" , um die Seite " Bereitgestellte Instanzen" zu öffnen.
  3. Wählen Sie die Datenbankinstanz aus, deren Größe Sie ändern möchten.
  4. Klicken Sie in der oberen rechten Ecke auf "Bearbeiten ".
  5. Verwenden Sie das Dropdownmenü "Kapazität ", um die neue Instanzgröße auszuwählen.
  6. Klicken Sie auf "Speichern".

cURL

curl -X PATCH --header "Authorization: Bearer ${DATABRICKS_TOKEN}" https://$WORKSPACE/api/2.0/database/instances/$INSTANCE_NAME \
--data-binary @- << EOF
{
  "capacity": "CU_4"
}
EOF

Python SDK

from databricks.sdk import WorkspaceClient
from databricks.sdk.service.database import DatabaseInstance

w = WorkspaceClient()
instance_name = "my-database-instance"
w.database.update_database_instance(
    name=instance_name,
    database_instance=DatabaseInstance(name=instance_name, capacity="CU_4"),
    update_mask="*"
)

Befehlszeilenschnittstelle (CLI)

databricks database update-database-instance my-database-instance '*' --capacity CU_4

Überwachen einer Datenbankinstanz

Greifen Sie auf der Seite "Instanzdetails" auf der Registerkarte " Überwachung " auf Metriken zu.

  1. Klicken Sie auf das Symbol Apps in der oberen rechten Ecke und wählen Lakebase Postgres aus.
  2. Klicken Sie auf "Bereitgestellt" , um die Seite " Bereitgestellte Instanzen" zu öffnen.
  3. Wählen Sie die Datenbankinstanz aus, die Sie überwachen möchten.
  4. Wählen Sie "Überwachung " in der Sideleiste der Lakebase-App aus.

Verwenden Sie die folgenden Metriken, um Leistungstrends zu analysieren, potenzielle Engpässe zu identifizieren und zu bewerten, ob die Anwendungsnutzung optimiert oder Ihre Instanz skaliert werden soll:

  • Transaktionen pro Sekunde: Zeigt den zugesicherten Transaktionsdurchsatz an. Verwenden Sie diese Informationen, um Arbeitsauslastungsmuster zu verstehen und Spitzentransaktionszeiträume zu identifizieren. Wenn dieser Wert konsistent hoch ist, sollten Sie das Clientverhalten optimieren oder die Größe der Instanz erhöhen.

  • Zeilen pro Sekunde: Zeigt die Anzahl der abgerufenen, zurückgegebenen, eingefügten, aktualisierten und gelöschten Zeilen an. Die Anzahl der abgerufenen Zeilen bezieht sich auf die Anzahl der Zeilen, die an die Clients zurückgegeben werden. Zurückgegebene Zeilen beziehen sich auf die Anzahl der zeilen, die von Abfragen gelesen werden. Hilft bei der Diagnose der Art der Arbeitsauslastung und deren Auswirkungen auf das System. Wenn die Leistung eingeschränkt ist, können Sie Indizes hinzufügen oder Abfragemuster optimieren.

  • Offene Verbindungen: Zeigt die Anzahl der geöffneten aktiven Verbindungen an. Verbindungen verbrauchen Instanzressourcen. Verwenden Sie dies, um zu bewerten, ob clientseitiges Verbindungspooling erforderlich ist. Verweisen Sie auf Grenzwerte für die maximale Anzahl zulässiger Verbindungen.

  • Speicherauslastung: Gibt die aktuelle Speichernutzung für die Instanz an. Wenn sich die Nutzung den Bereitstellungsgrenzen von Lakebase nähert, entfernen Sie unnötige Daten oder Indizes. Wenden Sie sich alternativ an den Support, um eine Kontingenterhöhung anzufordern.

  • CPU-Auslastung (%): Misst die CPU-Auslastung für die Datenbankinstanz. Eine hohe CPU-Auslastung kann auf eine rechenintensive Workload hinweisen. Erwägen Sie anwendungsseitige Optimierungen oder erhöhen Sie die Größe der Instanz.

  • Seitenlesedurchsatz (%): Gibt an, wie nah die Instanz an der Seitenlesekapazität ist, die in der Regel durch Cachefehler verursacht wird. Wenn der Wert hoch ist, reduzieren Sie die Arbeitsauslastung oder den Arbeitssatz, fügen Sie Indizes hinzu, speichern Sie Abfragen auf der Clientseite, oder optimieren Sie die Daten.

  • Puffercachetreffrate (%): Gibt den Prozentsatz der Lesevorgänge an, die aus dem Arbeitsspeicher bereitgestellt werden. Leistungsstarke Workloads sollten Werte über 99 % sehen. Niedrige Raten deuten darauf hin, dass die Workload die Cachekapazität überschreitet oder von Optimierungen profitieren könnte.

  • Lokale SSD-Cachetreffrate (%): Verfolgt den Prozentsatz der Lesevorgänge aus dem SSD-Cache nach einem Puffercachefehler nach. Ein niedriger Wert kann den Seitenlesedurchsatz erhöhen. Verwenden Sie ähnliche Optimierungen wie beim Puffercache, oder ziehen Sie eine größere Instanz in Betracht.

  • Deadlocks pro Sekunde: Misst, wie oft Deadlocks bei Transaktionen auftreten. Diese treten in der Regel auf, wenn mehrere Transaktionen auf die gleichen Ressourcen in konfliktierender Reihenfolge zugreifen. Untersuchen und umgestalten Sie Workloads, um Deadlocks zu verhindern.

Nächste Schritte

Einschränkungen und Anforderungen

In den folgenden Abschnitten werden Grenzwerte und Konfigurationsanforderungen für verwaltete Datenbankinstanzen beschrieben.

  • Ein Arbeitsbereich ermöglicht maximal zehn Instanzen.
  • Jede Instanz unterstützt bis zu 1000 gleichzeitige Verbindungen.
  • Der Grenzwert für die logische Größe in allen Datenbanken in einer Instanz beträgt 2 TB.
  • Datenbankinstanzen sind auf einen einzelnen Arbeitsbereich begrenzt.

Anforderungen an den Instanznamen

  • Muss 1 bis 63 Zeichen lang sein.
  • Muss mit einem Buchstaben beginnen.
  • Kann nur alphanumerische Zeichen und Bindestriche enthalten.
  • Darf nicht zwei aufeinanderfolgende Bindestriche enthalten.