Nota
L'accesso a questa pagina richiede l'autorizzazione. Puoi provare ad accedere o a cambiare directory.
L'accesso a questa pagina richiede l'autorizzazione. Puoi provare a cambiare directory.
Importante
Lakebase Provisioned è disponibile in anteprima pubblica nelle aree seguenti: westus, westus2, eastuseastus2, centralus, southcentralus, , northeuropewesteuropeaustraliaeastbrazilsouthcanadacentralcentralindiasoutheastasia. uksouth
Lakebase Provisioned usa il calcolo con provisioning ridimensionato manualmente. Per il confronto delle funzionalità con la nuova scalabilità automatica di Lakebase, vedere scelta tra le versioni.
Questa pagina illustra come registrare il database Lakebase come catalogo Unity Catalog di sola lettura. In questo modo è possibile usare i privilegi di Unity Catalog per gestire l'accesso ai dati e sfruttare le integrazioni come la sincronizzazione dei dati gestiti.
Proprietà e autorizzazioni
- Se il database non esiste, è possibile crearlo insieme al catalogo. In questo caso, la proprietà degli oggetti seguirà queste linee guida.
- L'autore del catalogo deve inoltre disporre dei privilegi
CREATE CATALOGsul metastore del catalogo Unity.
Creare un catalogo
Per registrare un database con Unity Catalog, usare l'interfaccia utente di Azure Databricks, la chiamata API, Python SDK o l'interfaccia della riga di comando.
INTERFACCIA UTENTE
- Fare clic
App nell'angolo in alto a destra e selezionare Lakebase Postgres.
- Fare clic su Provisioning per aprire la pagina Istanze di cui è stato effettuato il provisioning .
- Selezionare l'istanza del database.
- Selezionare la pagina Cataloghi nella barra laterale di Lakebase App.
- Fare clic su Aggiungi catalogo in alto a destra.
- Nella finestra di dialogo Aggiungi catalogo :
- Nome catalogo: immettere il nome del catalogo Unity desiderato.
-
Database Postgres: selezionare un database Postgres esistente dal menu a discesa ,ad esempio
databricks_postgres, oppure immettere un nuovo nome di database per crearlo insieme al catalogo.
- Clicca su Crea.
- Dopo la creazione, fare clic sul catalogo nell'elenco Cataloghi per visualizzare la visualizzazione Esplora cataloghi.
Python SDK
from databricks.sdk import WorkspaceClient
from databricks.sdk.service.database import DatabaseCatalog
# Initialize the Workspace client
w = WorkspaceClient()
# Register an existing database as a UC catalog
catalog = w.database.create_database_catalog(
DatabaseCatalog(
name="my_catalog", # Name of the UC catalog to create
database_instance_name="my-instance", # Name of the database instance
database_name="databricks_postgres", # Name of the existing Postgres database
)
)
print(f"Created database catalog: {catalog.name}")
# Create a new database and register it as a UC catalog
catalog = w.database.create_database_catalog(
DatabaseCatalog(
name="new_catalog", # Name of the UC catalog to create
database_instance_name="my-instance", # Name of the database instance
database_name="new_database", # Name of the Postgres database to register (and optionally create)
create_database_if_not_exists=True # Create the database if it doesn't exist
)
)
print(f"Created new database and catalog: {catalog.name}")
CLI
# Register an existing database as a UC catalog
databricks database create-database-catalog my_catalog my-instance databricks_postgres
# Create a new database and register it as a UC catalog
databricks database create-database-catalog new_catalog my-instance new_database \
--create-database-if-not-exists
curva
export PG_DATABASE_NAME="<name of the PG database to sync to UC>"
export CATLAOG_NAME="<name of UC catalog to create>"
// Optional
export CREATE_DATABASE_IF_NOT_EXISTS="<whether to create a new database>"
curl -X POST --header "Authorization: Bearer ${DATABRICKS_TOKEN}" https://$WORKSPACE/api/2.0/database/catalogs \
--data-binary @- << EOF
{
"name": "$CATALOG_NAME",
"database_name": "$PG_DATABASE_NAME",
"instance_name": "$INSTANCE_NAME",
"create_database_if_not_exists": "$CREATE_DATABASE_IF_NOT_EXISTS" // optional
}
Limitazioni
- I nomi di database devono contenere solo caratteri alfanumerici o di sottolineatura. Si noti che i nomi di database non possono includere trattini.
- Il catalogo creato in Unity Catalog basato sul database è di sola lettura.
- Le istanze del database hanno come ambito una singola area di lavoro e non supportano l'accesso tra aree di lavoro. Gli utenti possono visualizzare queste tabelle in Esplora cataloghi se dispongono delle autorizzazioni necessarie per il catalogo Unity da altre aree di lavoro collegate allo stesso metastore, ma non possono accedere al contenuto del sommario.
Esplorare gli oggetti Postgres nel catalogo Unity tramite un catalogo di database
Per visualizzare il catalogo, assicurati che sia collegato un serverless SQL warehouse in esecuzione.
- Fare clic su Catalogo nella barra laterale dell'area di lavoro.
- Nel browser Catalogo fare clic sul cluster e selezionare un'istanza di SQL Warehouse serverless in esecuzione come risorsa di calcolo.
- Fare clic su Start e chiudere.
Quando si apre il catalogo, gli schemi e le tabelle, le sincronizzazioni devono essere attivate automaticamente. Tuttavia, l'interfaccia utente può memorizzare nella cache i dati per ridurre il numero di richieste Postgres, quindi i nuovi oggetti potrebbero non essere visualizzati immediatamente.
Per attivare un aggiornamento completo, fare clic su
.
Eliminare un catalogo di database nel catalogo Unity
Per eliminarlo, è necessario essere il proprietario di un catalogo di database o di un amministratore del metastore.
Databricks consiglia di eliminare prima tutte le tabelle sincronizzate dal catalogo di database. Ogni tabella di origine può essere usata solo per creare 20 tabelle sincronizzate e può richiedere fino a tre giorni prima che le tabelle sincronizzate vengano pulite in Unity Catalog dopo l'eliminazione di un catalogo di database. Le tabelle sincronizzate in attesa di eliminazione nel catalogo Unity vengono conteggiate per il limite di 20 tabelle sincronizzate per tabella di origine.
Usare l'interfaccia utente di Azure Databricks, Python SDK, l'interfaccia della riga di comando o l'API per eliminare un catalogo di database.
INTERFACCIA UTENTE
- Fare clic
App nell'angolo in alto a destra e selezionare Lakebase Postgres.
- Fare clic su Provisioning per aprire la pagina Istanze di cui è stato effettuato il provisioning .
- Selezionare l'istanza del database.
- Selezionare la pagina Cataloghi nella barra laterale di Lakebase App.
- Per il catalogo che si desidera eliminare, fare clic
Sul lato destro della riga.
- Fai clic su Elimina.
Python SDK
from databricks.sdk import WorkspaceClient
# Initialize the Workspace client
w = WorkspaceClient()
# Delete a database catalog
catalog_name = "my_catalog"
w.database.delete_database_catalog(name=catalog_name)
print(f"Deleted database catalog: {catalog_name}")
CLI
# Delete a database catalog
databricks database delete-database-catalog my_catalog
curva
curl -X DELETE --header "Authorization: Bearer ${DATABRICKS_TOKEN}" https://$WORKSPACE/api/2.0/database/catalogs/$CATALOG_NAME
Dopo l'eliminazione del catalogo, è possibile rinominare o eliminare il database Postgres.