Hinweis
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, sich anzumelden oder das Verzeichnis zu wechseln.
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, das Verzeichnis zu wechseln.
Von Bedeutung
Lakebase Provisioned ist das ursprüngliche Lakebase-Angebot, das bereitgestellte Rechenleistung nutzt, die Sie manuell skalieren. Unterstützte Regionen finden Sie unter "Verfügbarkeit der Region". Die neueste Version von Lakebase mit automatischer Berechnung, Skalierung bis Null, Verzweigung und sofortige Wiederherstellung finden Sie unter Lakebase Autoscaling.
Seit dem 12. März 2026 werden neue Lakebase-Instanzen als Automatischen Skalierungsprojekte erstellt. Vorhandene bereitgestellte Instanzen werden ab Juni 2026 automatisch auf die automatische Skalierung aktualisiert. Details finden Sie unter Upgrade zu Lakebase Autoscaling.
Um mit OLTP-Workloads zu beginnen, erstellen Sie eine Lakebase Provisioned-Datenbankinstanz mithilfe der Azure Databricks UI, des API-Aufrufs, Python SDK oder der CLI.
Erstellen einer Datenbankinstanz
Erstellen Sie eine Datenbankinstanz mit empfohlenen Standardwerten. Sie müssen einen Instanznamen angeben (nur 1-63 Zeichen, Buchstaben und Bindestriche). Als Ersteller sind Sie der Datenbankbesitzer mit der databricks_superuser Rolle.
Die meisten Arbeitsbereichsbenutzer können standardmäßig Datenbankinstanzen erstellen. Wenn Berechtigungsprobleme auftreten, finden Sie Informationen zu Datenbankinstanzberechtigungen.
Benutzeroberfläche
- Klicken Sie auf
Apps in der oberen rechten Ecke und wählen Lakebase Postgres aus.
- Klicken Sie auf "Bereitgestellt" , um die Seite " Bereitgestellte Instanzen" zu öffnen.
- Klicken Sie auf "Datenbankinstanz erstellen".
- Konfigurieren Sie Ihre Instanz:
- Name: Geben Sie einen Datenbankinstanznamen ein (nur 1-63 Zeichen, Buchstaben und Bindestriche).
- Kapazität: Wählen Sie die Berechnungsgröße aus (Standard: 2 CU). Siehe Instanzgröße.
- Serverlose Nutzungsrichtlinie: Wählen Sie eine Verwendungsrichtlinie aus, um serverlose Nutzung und Abrechnung (optional) zu attributieren. Siehe Serverlose Nutzungsrichtlinien.
- (Optional) Erweitern Sie die erweiterten Einstellungen , um folgendes zu konfigurieren:
- Von übergeordnetem Element erstellen: Erstellen Sie einen Copy-on-Write-Klon aus einer vorhandenen Instanz, einschließlich Daten bis zu einem bestimmten Zeitpunkt. Siehe "Erstellen aus übergeordnetem Element".
- Aktivieren Sie HA: Aktivieren Sie die hohe Verfügbarkeit mit Failover-Knoten, konfigurieren Sie lesbare Sekundärknoten, und legen Sie die Anzahl der HA-Knoten fest. Siehe Hohe Verfügbarkeit.
- Klicken Sie auf "Erstellen".
Python SDK
from databricks.sdk import WorkspaceClient
from databricks.sdk.service.database import DatabaseInstance
# Initialize the Workspace client
w = WorkspaceClient()
# Create a database instance
instance = w.database.create_database_instance(
DatabaseInstance(
name="my-database-instance",
capacity="CU_1"
)
)
print(f"Created database instance: {instance.name}")
print(f"Connection endpoint: {instance.read_write_dns}")
Befehlszeilenschnittstelle (CLI)
# Create a database instance
databricks database create-database-instance my-database-instance \
--capacity CU_1
# Create with advanced options (using JSON for more complex parameters)
databricks database create-database-instance \
--json '{
"name": "my-database-instance",
"capacity": "CU_2",
"retention_window_in_days": 14
}'
cURL
Erstellen Sie eine Datenbankinstanz, und geben Sie ein Aufbewahrungsfenster an.
export PAT=<YOUR_PAT>
export INSTANCE_NAME="instance_name"
> curl -X POST --header "Authorization: Bearer ${DATABRICKS_TOKEN}" https://[your databricks workspace]/api/2.0/database/instances \
--data-binary @- << EOF
{
"name": "$INSTANCE_NAME",
"capacity": "CU_1",
"retention_window_in_days": 14
}
EOF
Erweiterte Einstellungen
Sie können diese Features auch während der Erstellung oder nach der Erstellung konfigurieren, indem Sie Ihre Instanz bearbeiten:
| Merkmal | Description |
|---|---|
| Serverlose Nutzungsrichtlinie | Wählen Sie eine Verwendungsrichtlinie für Ihre Datenbankinstanz aus, um serverlose Nutzung und Abrechnung bestimmten Budgets zuzuordnen. Sie können auch benutzerdefinierte Tags hinzufügen. |
| Instanzgröße | Skalieren Sie Rechnerressourcen entsprechend den Leistungsanforderungen Ihrer Arbeitslast (die Standardeinstellung ist 2 CU). |
| Fenster wiederherstellen | Legen Sie das Aufbewahrungsfenster (2-35 Tage, Standard 7 Tage) für die Zeitwiederherstellung fest. |
| Hohe Verfügbarkeit | Fügen Sie Failoverknoten hinzu, um die Geschäftskontinuität für Produktionsworkloads sicherzustellen. |
| Aus übergeordnetem Element erstellen | Erstellen Sie eine Copy-on-Write-Kopie einer vorhandenen Datenbankinstanz. |
Beenden oder Starten einer Instanz
Um eine Datenbankinstanz zu beenden oder zu starten, müssen Sie über die entsprechenden Berechtigungen CAN MANAGE verfügen. Um eine Instanz zu beenden oder zu starten, verwenden Sie die Azure Databricks UI, den API-Aufruf, Python SDK oder CLI.
Benutzeroberfläche
- Klicken Sie auf
Apps in der oberen rechten Ecke und wählen Lakebase Postgres aus.
- Klicken Sie auf "Bereitgestellt" , um die Seite " Bereitgestellte Instanzen" zu öffnen.
- Klicken Sie auf die Datenbankinstanz, die Sie beenden oder starten möchten.
- Klicken Sie in der oberen rechten Ecke der Seite auf "Beenden" oder " Start" .
Python SDK
from databricks.sdk import WorkspaceClient
from databricks.sdk.service.database import DatabaseInstance
# Initialize the Workspace client
w = WorkspaceClient()
# Stop a database instance
instance_name = "my-database-instance"
w.database.update_database_instance(
name=instance_name,
database_instance=DatabaseInstance(
name=instance_name,
stopped=True
),
update_mask="*"
)
print(f"Stopped database instance: {instance_name}")
# Start a database instance
w.database.update_database_instance(
name=instance_name,
database_instance=DatabaseInstance(
name=instance_name,
stopped=False
),
update_mask="*"
)
print(f"Started database instance: {instance_name}")
Befehlszeilenschnittstelle (CLI)
# Stop a database instance
databricks database update-database-instance my-database-instance '*' \
--json '{
"stopped": true
}'
# Start a database instance
databricks database update-database-instance my-database-instance '*' \
--json '{
"stopped": false
}'
cURL
Der folgende API-Aufruf stoppt eine Datenbankinstanz.
-X PATCH --header "Authorization: Bearer ${DATABRICKS_TOKEN}" https://$WORKSPACE/api/2.0/database/instances/$INSTANCE_NAME \
--data-binary @- << EOF
{
"stopped": true
}
EOF
Der folgende API-Aufruf startet eine Datenbankinstanz.
curl -X PATCH --header "Authorization: Bearer ${DATABRICKS_TOKEN}" https://$WORKSPACE/api/2.0/database/instances/$INSTANCE_NAME \
--data-binary @- << EOF
{
"stopped": false
}
EOF
Verhalten beim Anhalten
Verhalten der Datenbankinstanz:
- Die Daten bleiben erhalten.
- Die Instanz kann nicht für Lese- oder Schreibvorgänge verwendet werden.
- Synchronisierte Tabellen unterstützen keine Lesevorgänge.
- Lakeflow Spark Declarative Pipelines (LDP) erkennen keine beendeten Instanzen und geben möglicherweise Fehler zurück.
- Registrierte Kataloge für beendete Instanzen zeigen keine Schemadetails in der Benutzeroberfläche an.
Funktionale Einschränkungen:
- Sie können weder
DatabaseTablesnochDatabaseCatalogserstellen oder löschen. - Sie können eine angehaltene Instanz löschen oder die Größe ändern. Kapazitätsänderungen werden wirksam, wenn die Instanz neu gestartet wird.
- Sie können Pipelines anhalten.
Verhalten beim Starten
- Die Instanz wechselt in den
STARTINGZustand und wird zuAVAILABLE, wenn sie bereit ist.
Einschränkungen
- LDP erkennt keine beendeten Instanzen und kann Fehler zurückgeben.
- Registrierte Kataloge für beendete Instanzen zeigen keine Schemadetails in der Benutzeroberfläche an.
Löschen einer Instanz
Seien Sie beim Löschen der Datenbankinstanz vorsichtig, da dadurch alle zugehörigen Daten gelöscht werden.
Sie müssen über Berechtigungen für die Datenbankinstanz verfügen CAN MANAGE . Wenn Sie nicht der Besitzer der Tabellen oder Kataloge sind, müssen Sie den Besitz auf sich selbst übertragen. Arbeitsbereichsadministratoren können Datenbankinstanzen löschen, die sie nicht besitzen.
Databricks empfiehlt, alle zugeordneten Unity-Katalogkataloge, synchronisierte Tabellen und untergeordnete Instanzen zu löschen, bevor die Datenbankinstanz gelöscht wird. Andernfalls führt der Versuch, Kataloge anzuzeigen oder SQL-Abfragen auszuführen, die auf sie verweisen, zu Fehlern.
Benutzeroberfläche
- Klicken Sie auf
Apps in der oberen rechten Ecke und wählen Lakebase Postgres aus.
- Klicken Sie auf "Bereitgestellt" , um die Seite " Bereitgestellte Instanzen" zu öffnen.
- Wählen Sie die Datenbankinstanz aus, die Sie löschen möchten.
- Wählen Sie Kataloge in der Lakebae App-Randleiste aus, um die vollständige Liste der Datenbankkataloge anzuzeigen, die der Datenbankinstanz zugeordnet sind.
- Löschen Sie für jeden Datenbankkatalog alle synchronisierten Tabellen, einschließlich derjenigen, die sich in verwalteten Katalogen befinden und nicht als Datenbankkataloge registriert sind.
- Klicken Sie auf
>Katalog löschen.
Python SDK
from databricks.sdk import WorkspaceClient
# Initialize the Workspace client
w = WorkspaceClient()
# Delete a database instance
instance_name = "my-database-instance"
w.database.delete_database_instance(
name=instance_name,
purge=True # Required to delete the instance
)
print(f"Deleted database instance: {instance_name}")
# Delete with force option (to delete child instances too)
w.database.delete_database_instance(
name=instance_name,
force=True, # Delete child instances too
purge=True
)
Befehlszeilenschnittstelle (CLI)
# Delete a database instance
databricks database delete-database-instance my-database-instance \
--purge
# Delete with force option (to delete child instances too)
databricks database delete-database-instance my-database-instance \
--json '{
"force": true,
"purge": true
}'
cURL
purge=true muss angegeben werden, um eine Datenbankinstanz zu löschen.
curl -X DELETE --header "Authorization: Bearer ${DATABRICKS_TOKEN}" https://$WORKSPACE/api/2.0/database/instances/$INSTANCE_NAME?purge=true
Aktualisieren einer serverlosen Nutzungsrichtlinie einer Datenbankinstanz
Serverlose Nutzungsrichtlinien bestehen aus Tags, die auf jede serverlose Computeaktivität angewendet werden, die von einem Benutzer verursacht wird, der der Richtlinie zugewiesen ist. Indem Sie eine Datenbankinstanz mit einer serverlosen Nutzungsrichtlinie kategorisieren, können Sie Abrechnungs- und Nutzungskosten bestimmten Richtlinien zuordnen, wodurch die Kosten für serverlose Ressourcen einfacher nachverfolgt, verwaltet und gesteuert werden können.
Verwenden Sie die Benutzeroberfläche, um die Verwendungsrichtlinie einer Datenbankinstanz zu aktualisieren:
- Klicken Sie auf
Apps in der oberen rechten Ecke und wählen Lakebase Postgres aus.
- Klicken Sie auf "Bereitgestellt" , um die Seite " Bereitgestellte Instanzen" zu öffnen.
- Wählen Sie die Datenbankinstanz aus, für die Sie die Abrechnungsrichtlinie aktualisieren möchten.
- Klicken Sie oben rechts auf "Bearbeiten ".
- Wählen Sie eine Serverless-Nutzungsrichtlinie aus.
- Klicken Sie auf "Speichern".
Verwalten der Instanzkapazität
Um die Größe einer Instanz zu ändern, müssen Sie über Berechtigungen verfügen CAN MANAGE . Das Ändern der Größe kann mehrere Minuten dauern und wird wirksam, wenn die Instanz neu gestartet wird.
Jede Kapazitätseinheit weist ca. 16 GB RAM zusammen mit zugeordneten CPU- und lokalen SSD-Ressourcen zu. Bevor Sie Abfragen skalieren, testen und optimieren. Der Speicher skaliert automatisch.
Benutzeroberfläche
- Klicken Sie auf
Apps in der oberen rechten Ecke und wählen Lakebase Postgres aus.
- Klicken Sie auf "Bereitgestellt" , um die Seite " Bereitgestellte Instanzen" zu öffnen.
- Wählen Sie die Datenbankinstanz aus, deren Größe Sie ändern möchten.
- Klicken Sie in der oberen rechten Ecke auf "Bearbeiten ".
- Verwenden Sie das Dropdownmenü "Kapazität ", um die neue Instanzgröße auszuwählen.
- Klicken Sie auf "Speichern".
cURL
curl -X PATCH --header "Authorization: Bearer ${DATABRICKS_TOKEN}" https://$WORKSPACE/api/2.0/database/instances/$INSTANCE_NAME \
--data-binary @- << EOF
{
"capacity": "CU_4"
}
EOF
Python SDK
from databricks.sdk import WorkspaceClient
from databricks.sdk.service.database import DatabaseInstance
w = WorkspaceClient()
instance_name = "my-database-instance"
w.database.update_database_instance(
name=instance_name,
database_instance=DatabaseInstance(name=instance_name, capacity="CU_4"),
update_mask="*"
)
Befehlszeilenschnittstelle (CLI)
databricks database update-database-instance my-database-instance '*' --capacity CU_4
Überwachen einer Datenbankinstanz
Greifen Sie auf der Seite "Instanzdetails" auf der Registerkarte " Überwachung " auf Metriken zu.
- Klicken Sie auf
Apps in der oberen rechten Ecke und wählen Lakebase Postgres aus.
- Klicken Sie auf "Bereitgestellt" , um die Seite " Bereitgestellte Instanzen" zu öffnen.
- Wählen Sie die Datenbankinstanz aus, die Sie überwachen möchten.
- Wählen Sie "Überwachung " in der Sideleiste der Lakebase-App aus.
Verwenden Sie die folgenden Metriken, um Leistungstrends zu analysieren, potenzielle Engpässe zu identifizieren und zu bewerten, ob die Anwendungsnutzung optimiert oder Ihre Instanz skaliert werden soll:
Transaktionen pro Sekunde: Zeigt den zugesicherten Transaktionsdurchsatz an. Verwenden Sie diese Informationen, um Arbeitsauslastungsmuster zu verstehen und Spitzentransaktionszeiträume zu identifizieren. Wenn dieser Wert konsistent hoch ist, sollten Sie das Clientverhalten optimieren oder die Größe der Instanz erhöhen.
Zeilen pro Sekunde: Zeigt die Anzahl der abgerufenen, zurückgegebenen, eingefügten, aktualisierten und gelöschten Zeilen an. Die Anzahl der abgerufenen Zeilen bezieht sich auf die Anzahl der Zeilen, die an die Clients zurückgegeben werden. Zurückgegebene Zeilen beziehen sich auf die Anzahl der zeilen, die von Abfragen gelesen werden. Hilft bei der Diagnose der Art der Arbeitsauslastung und deren Auswirkungen auf das System. Wenn die Leistung eingeschränkt ist, können Sie Indizes hinzufügen oder Abfragemuster optimieren.
Offene Verbindungen: Zeigt die Anzahl der geöffneten aktiven Verbindungen an. Verbindungen verbrauchen Instanzressourcen. Verwenden Sie dies, um zu bewerten, ob clientseitiges Verbindungspooling erforderlich ist. Verweisen Sie auf Grenzwerte für die maximale Anzahl zulässiger Verbindungen.
Speicherauslastung: Gibt die aktuelle Speichernutzung für die Instanz an. Wenn sich die Nutzung den Bereitstellungsgrenzen von Lakebase nähert, entfernen Sie unnötige Daten oder Indizes. Wenden Sie sich alternativ an den Support, um eine Kontingenterhöhung anzufordern.
CPU-Auslastung (%): Misst die CPU-Auslastung für die Datenbankinstanz. Eine hohe CPU-Auslastung kann auf eine rechenintensive Workload hinweisen. Erwägen Sie anwendungsseitige Optimierungen oder erhöhen Sie die Größe der Instanz.
Seitenlesedurchsatz (%): Gibt an, wie nah die Instanz an der Seitenlesekapazität ist, die in der Regel durch Cachefehler verursacht wird. Wenn der Wert hoch ist, reduzieren Sie die Arbeitsauslastung oder den Arbeitssatz, fügen Sie Indizes hinzu, speichern Sie Abfragen auf der Clientseite, oder optimieren Sie die Daten.
Puffercachetreffrate (%): Gibt den Prozentsatz der Lesevorgänge an, die aus dem Arbeitsspeicher bereitgestellt werden. Leistungsstarke Workloads sollten Werte über 99 % sehen. Niedrige Raten deuten darauf hin, dass die Workload die Cachekapazität überschreitet oder von Optimierungen profitieren könnte.
Lokale SSD-Cachetreffrate (%): Verfolgt den Prozentsatz der Lesevorgänge aus dem SSD-Cache nach einem Puffercachefehler nach. Ein niedriger Wert kann den Seitenlesedurchsatz erhöhen. Verwenden Sie ähnliche Optimierungen wie beim Puffercache, oder ziehen Sie eine größere Instanz in Betracht.
Deadlocks pro Sekunde: Misst, wie oft Deadlocks bei Transaktionen auftreten. Diese treten in der Regel auf, wenn mehrere Transaktionen auf die gleichen Ressourcen in konfliktierender Reihenfolge zugreifen. Untersuchen und umgestalten Sie Workloads, um Deadlocks zu verhindern.
Nächste Schritte
- Stellen Sie Lakehouse-Daten mit synchronisierten Tabellen bereit.
- Stellen Sie eine Verbindung her, und fragen Sie Ihre Datenbankinstanz ab.
- Registrieren sie die Datenbankinstanz im Unity-Katalog.
- Ermöglichen Sie anderen Benutzern den Zugriff auf die Datenbankinstanz aus Azure Databricks. Siehe Verwalten von Berechtigungen und Postgres-Rollen.
Einschränkungen und Anforderungen
In den folgenden Abschnitten werden Grenzwerte und Konfigurationsanforderungen für verwaltete Datenbankinstanzen beschrieben.
- Ein Arbeitsbereich ermöglicht maximal zehn Instanzen.
- Jede Instanz unterstützt bis zu 1000 gleichzeitige Verbindungen.
- Der Grenzwert für die logische Größe in allen Datenbanken in einer Instanz beträgt 2 TB.
- Datenbankinstanzen sind auf einen einzelnen Arbeitsbereich begrenzt.
Anforderungen an den Instanznamen
- Muss 1 bis 63 Zeichen lang sein.
- Muss mit einem Buchstaben beginnen.
- Kann nur alphanumerische Zeichen und Bindestriche enthalten.
- Darf nicht zwei aufeinanderfolgende Bindestriche enthalten.