Condividi tramite


Che cos'è Lakehouse Federation?

Lakehouse Federation è la piattaforma di federazione di query per Databricks. Il termine federazione di query descrive una raccolta di funzionalità che consentono a utenti e sistemi di eseguire query su più origini dati senza dover eseguire la migrazione di tutti i dati a un sistema unificato.

Esistono due tipi di federazione: federazione di query e federazione del catalogo. Questa pagina illustra le differenze tra i tipi.

Federazione di query rispetto a federazione di cataloghi

La tabella seguente riepiloga le differenze principali tra la federazione delle query e la federazione del catalogo:

Attribute Federazione di query Federazione del catalogo
Percorso della query Le query del Catalogo Unity vengono inviate al database esterno usando JDBC. La query viene eseguita sia in Databricks che usando il calcolo remoto. Le query del Catalogo Unity accedono direttamente alla tabella esterna nell'archivio oggetti. La federazione del catalogo è disponibile per le piattaforme che supportano l'accesso diretto ai servizi di catalogo e archiviazione. La query viene eseguita solo nel calcolo di Databricks, ovvero la federazione del catalogo è più conveniente e ottimizzata per le prestazioni rispetto alla federazione delle query.
Caso d'uso
  • È necessario un accesso ad hoc per la reportistica o per una prova di concetto ai dati operativi archiviati in database esterni.
  • Si vuole ridurre al minimo lo spostamento dei dati e mantenere l'accesso in tempo reale ai sistemi esterni.

Quando l'origine supporta sia Lakehouse Federation che Lakeflow Connect, Databricks consiglia Lakeflow Connect se le prestazioni su volumi di dati più elevati e una latenza inferiore sono priorità.
  • Si sta facendo la migrazione a Unity Catalog, ma è necessario integrare gradualmente i dati gestiti da un catalogo esterno.
  • Si vuole un modello ibrido a lungo termine in cui alcuni dati rimangono in un catalogo esterno e alcuni dati vengono gestiti da Unity Catalog.
Panoramica dei passaggi
  • Creare una connessione nel catalogo unity con le credenziali di accesso e l'URL JDBC.
  • Creare un catalogo esterno usando la connessione.
  • Concedere privilegi agli utenti nelle tabelle nel catalogo esterno.
  • Esegui le query. Questi vengono trasferiti nel database esterno.
  • Creare una connessione in Unity Catalog per l'accesso al catalogo esterno.
  • Creare credenziali di archiviazione e un percorso esterno per i percorsi della tabella.
  • Creare un catalogo straniero usando la connessione e la posizione esterna.
  • Concedere privilegi agli utenti nelle tabelle nel catalogo esterno.
  • Esegui le query. Vengono eseguiti direttamente nell'archivio oggetti.

Origini dati supportate

Connettersi alle origini seguenti usando la federazione di query:

Connettersi alle origini seguenti usando la federazione del catalogo:

Risorse aggiuntive