Eseguire query federate su MySQL

Questa pagina descrive come configurare la federazione lakehouse per eseguire query federate sui dati MySQL non gestiti da Azure Databricks. Per altre informazioni sulla federazione lakehouse, vedere Che cos'è Lakehouse Federation?

Per connettersi al database MySQL utilizzando la federazione Lakehouse, è necessario creare quanto segue nel metastore di Unity Catalog di Azure Databricks (le aree di lavoro create dopo il 9 novembre 2023 hanno già un metastore di Unity Catalog con provisioning automatico):

Una connessione al database MySQL.
Un catalogo esterno che replica il tuo database MySQL nel Catalogo Unity in modo da poter usare la sintassi delle query di Unity Catalog e gli strumenti di governance dei dati per gestire l'accesso degli utenti di Azure Databricks al database.

Operazioni preliminari

Requisiti dell'area di lavoro:

Area di lavoro abilitata per il Catalogo Unity Le aree di lavoro create dopo il 9 novembre 2023 sono abilitate automaticamente per il catalogo Unity, compreso il provisioning automatico del metastore. Non è necessario creare manualmente un metastore a meno che l'area di lavoro non precedi l'abilitazione automatica e non sia stata abilitata per Unity Catalog. Consultare Abilitazione automatica di Unity Catalog.

Requisiti dell’ambiente di calcolo:

Connettività di rete dalla risorsa di calcolo ai sistemi di database di destinazione. Si veda Raccomandazioni di rete per Lakehouse Federation.
Il calcolo di Azure Databricks deve usare Databricks Runtime 13.3 LTS o versione successiva e standard o modalità di accesso dedicato .
I warehouse SQL devono essere pro o serverless e devono usare la versione 2023.40 o successiva.

Autorizzazioni necessarie:

Per creare una connessione, è necessario essere amministratore del metastore o un utente con il privilegio CREATE CONNECTION nel metastore Unity Catalog collegato all'area di lavoro. Nelle aree di lavoro abilitate automaticamente per Unity Catalog gli amministratori dell'area di lavoro hanno il CREATE CONNECTION privilegio per impostazione predefinita.
Per creare un catalogo straniero, è necessario avere il permesso CREATE CATALOG sul metastore ed essere il proprietario della connessione o avere il privilegio CREATE FOREIGN CATALOG sulla connessione. Nelle aree di lavoro abilitate automaticamente per Unity Catalog gli amministratori dell'area di lavoro hanno il CREATE CATALOG privilegio per impostazione predefinita.

In ogni sezione basata su attività che segue vengono specificati requisiti di autorizzazione aggiuntivi.

SSL è necessario per creare una connessione.

Crea una connessione

Una connessione specifica un percorso e le credenziali per l'accesso a un sistema di database esterno. Per creare una connessione, è possibile usare Catalog Explorer o il comando SQL CREATE CONNECTION all'interno di un notebook di Azure Databricks o nell'editor di query SQL di Databricks.

Nota

È anche possibile usare l'API REST di Databricks o l'interfaccia della riga di comando di Databricks per creare una connessione. Vedere POST /api/2.1/unity-catalog/connections e i comandi del Unity Catalog.

Autorizzazioni necessarie: amministratore o utente del metastore con il specifico privilegio CREATE CONNECTION.

Esploratore di cataloghi

Nell'area di lavoro di Azure Databricks fare clic Catalogo.
Nella parte superiore del riquadro Catalogo fare clic Aggiungi e selezionare Crea una connessione dal menu.
Nella pagina Elementi di base della connessione della Procedura guidata di configurazione della connessione, inserisci un nome di connessione facile da usare.
Selezionare un tipo di connessione di MySQL.
(Facoltativo) Aggiungere un commento.
Fare clic su Avanti.
Nella pagina Autenticazione immettere le proprietà di connessione seguenti per l'istanza di MySQL:
- Host: ad esempio, mysql-demo.lb123.us-west-2.rds.amazonaws.com
- Porta: ad esempio 3306
- Utente: ad esempio mysql_user
- Password: ad esempio, password123
(Facoltativo): selezionare certificato Trust del server. Questa opzione è deselezionata per impostazione predefinita. Se selezionata, il livello di trasporto usa SSL per crittografare il canale e ignora la catena di certificati per convalidare l'attendibilità. Lasciare questo valore impostato sul valore predefinito, a meno che non sia necessario ignorare la convalida dell'attendibilità.
Fare clic su Crea connessione.
Nella pagina Nozioni di base del catalogo immettere un nome per il catalogo esterno. Un catalogo esterno esegue il mirroring di un database in un sistema di dati esterno in modo da poter eseguire query e gestire l'accesso ai dati in tale database usando Azure Databricks e Unity Catalog.
(Facoltativo) Fare clic su Test connessione per verificare che funzioni.
Fare clic su Crea Catalogo.
Nella pagina Accesso selezionare le aree di lavoro in cui gli utenti possono accedere al catalogo creato. È possibile selezionare l'opzione Tutte le aree di lavoro hanno accesso, oppure fare clic su Assegna alle aree di lavoro, selezionare le aree di lavoro e quindi fare clic su Assegna.
Modifica il Proprietario che potrà gestire l'accesso a tutti gli oggetti del catalogo. Iniziare a digitare un principale nella casella di testo e quindi fare clic sul principale nei risultati restituiti.
Concedi privilegi sul catalogo. Fare clic su Concedi:
1. Specificare i Principals che avranno accesso agli oggetti nel catalogo. Iniziare a digitare un principale nella casella di testo e quindi fare clic sul principale nei risultati restituiti.
2. Selezionare i privilegi preimpostati da concedere a ciascun soggetto. Agli utenti dell'account viene concesso BROWSE per impostazione predefinita.
  - Selezionare Lettore dati dal menu a discesa per concedere read privilegi agli oggetti nel catalogo.
  - Selezionare Editor dati dal menu a discesa per concedere a read e modify privilegi sugli oggetti nel catalogo.
  - Selezionare manualmente i privilegi da concedere.
3. Fare clic su "Concedi".
Fare clic su Avanti.
Nella pagina metadati, specificare le coppie chiave-valore dei tag. Per ulteriori informazioni, vedere Applicare tag a oggetti proteggibili del catalogo Unity.
(Facoltativo) Aggiungere un commento.
Fare clic su Salva.

SQL

Eseguire il seguente comando in un notebook o nell'editor di query SQL di Databricks.

CREATE CONNECTION <connection-name> TYPE mysql
OPTIONS (
  host '<hostname>',
  port '<port>',
  user '<user>',
  password '<password>'
);

È consigliabile usare segreti di Azure Databricks anziché stringhe di testo non crittografato per valori sensibili come le credenziali. Ad esempio:

CREATE CONNECTION <connection-name> TYPE mysql
OPTIONS (
  host '<hostname>',
  port '<port>',
  user secret ('<secret-scope>','<secret-key-user>'),
  password secret ('<secret-scope>','<secret-key-password>')
)

Se è necessario usare stringhe di testo non crittografato nei comandi SQL del notebook, evitare di troncare la stringa eliminando caratteri speciali come $ con \. Ad esempio: \$.

Per informazioni sulla configurazione dei segreti, vedere Gestione dei segreti.

Creare un catalogo straniero

Nota

Se si usa l'interfaccia utente per creare una connessione all'origine dati, la creazione del catalogo esterno è inclusa ed è possibile ignorare questo passaggio.

Un catalogo esterno esegue il mirroring di un database in un sistema di dati esterno in modo da poter eseguire query e gestire l'accesso ai dati in tale database usando Azure Databricks e Unity Catalog. Per creare un catalogo esterno, si utilizza una connessione all'origine dati già definita.

Per creare un catalogo esterno, è possibile usare Esplora cataloghi o il comando SQL CREATE FOREIGN CATALOG in un notebook di Azure Databricks o nell'editor di query SQL di Databricks. È anche possibile usare l'API REST di Databricks o l'interfaccia della riga di comando di Databricks per creare un catalogo. Vedi POST /api/2.1/unity-catalog/catalogs e comandi di Unity Catalog.

Autorizzazioni necessarie: autorizzazione CREATE CATALOG per il metastore e la proprietà della connessione o il privilegio CREATE FOREIGN CATALOG per la connessione.

Esploratore di cataloghi

Nell'area di lavoro di Azure Databricks fare clic Catalogo per aprire Esplora cataloghi.
Nella parte superiore del riquadro Catalogo fare clic Aggiungi e selezionare Aggiungi un catalogo dal menu.

In alternativa, nella pagina accesso rapido fare clic sul pulsante Cataloghi e quindi sul pulsante Crea catalogo.
Seguire le istruzioni per la creazione di cataloghi stranieri in Creare cataloghi.
È anche possibile specificare l'opzione di catalogo seguente:
- TINYINT(1) is bit: opzione di catalogo facoltativa che specifica il mapping delle colonne MySQL tinyint(1) ai tipi di dati Spark. Per altre informazioni, vedere Mapping dei tipi di dati .

SQL

Eseguire il comando SQL seguente in un notebook o in un editor SQL di Databricks. Gli elementi tra parentesi sono facoltativi. Sostituisci i valori segnaposto:

<catalog-name>: Nome per il catalogo in Azure Databricks.
<connection-name>: oggetto connessione che specifica l'origine dati, il percorso e le credenziali di accesso.
tinyInt1isBit: opzione di catalogo facoltativa che specifica il mapping delle colonne MySQL tinyint(1) ai tipi di dati Spark. Per altre informazioni, vedere Mapping dei tipi di dati .

CREATE FOREIGN CATALOG [IF NOT EXISTS] <catalog-name> USING CONNECTION <connection-name>
[OPTIONS (tinyInt1isBit {'true'|'false'})];

Supporti pushdown

Nella tabella seguente sono elencate le operazioni di pushdown supportate per MySQL, insieme alle risorse di calcolo necessarie per ognuna.

Pushdown	Calcolo supportato
Funzioni Date, Time e Timestamp (solo espressioni parziali, di filtro)	Tutto il calcolo
Filtri	Tutte le risorse di calcolo
Limite	Tutti i calcoli
Funzioni matematiche (solo espressioni parziali, di filtro)	Tutti i calcoli
Funzioni varie (ad esempio Alias, Cast, SortOrder; solo espressioni di filtro parziali)	Tutte le risorse computazionali
Proiezioni	Tutte le risorse di calcolo
Funzioni di stringa (solo espressioni parziali, di filtro)	Tutto il calcolo
Aggregazioni	Databricks Runtime 13.3 LTS e versioni successive e magazzini SQL
Operatori aritmetici (ad esempio +, -, *, %, /; non supportato se ANSI è disabilitato)	Databricks Runtime 13.3 LTS e versioni successive e magazzini SQL
Operatori booleani (ad esempio =, <, <, =>, >=, <=>)	Databricks Runtime 13.3 LTS e versioni successive e SQL Warehouse
Ordinamento, quando utilizzato con limitazione	Databricks Runtime 13.3 LTS e versioni successive e magazzini SQL
Operazioni di join	Databricks Runtime 17.2 e versioni successive e SQL Warehouse 2025.30 e versioni successive
Funzioni finestra	Non supportato

Mapping di tipi di dati

Quando si legge da MySQL a Spark, i tipi di dati vengono mappati nel modo seguente:

Tipo MySQL	Tipo Spark
bigint (se senza segno), decimale	Tipo Decimale
int, integer, mediumint, smallint	TipoInteger
tinyint(1)	BooleanType/ByteType*
tinyint(>1)	ByteType
bigint (se firmato)	LongType
galleggiare	Tipo Float
doppio	DoppioTipo
char, enum, set	Tipo di Carattere
varchar	TipoVarchar
json, longtext, mediumtext, text, tinytext	TipoStringa
binario, blob, varbinario, varchar binario	TipoBinario
bit, booleano	Tipo Booleano
data, anno	Tipo di Data
data e ora, orario, marca temporale	TimestampType/TimestampNTZType

* MySQL tinyint(1) signed/unsigned è mappato a Spark BooleanType se l'opzione tinyInt1isBit = true di catalogo (impostazione predefinita). Se l'opzione tinyInt1isBit = false del catalogo è mappata a ByteType.

** Quando si legge da MySQL, MySQL Timestamp viene mappato a Spark TimestampType se preferTimestampNTZ = false (di default). MySQL Timestamp è mappato a TimestampNTZType se preferTimestampNTZ = true.

Risorse aggiuntive

Partecipare al pushdown in Lakehouse Federation
Raccomandazioni di rete per Lakehouse Federation
Eseguire query su database esterni con la funzione remote_query

Commenti e suggerimenti

Questa pagina è stata utile?

Last updated on 2026-04-04

Condividi tramite

Eseguire query federate su MySQL

Operazioni preliminari

Crea una connessione

Esploratore di cataloghi

SQL

Creare un catalogo straniero

Esploratore di cataloghi

SQL

Supporti pushdown

Mapping di tipi di dati

Risorse aggiuntive

Commenti e suggerimenti

Risorse aggiuntive