Condividi tramite


Configurare Microsoft SQL Server per l'inserimento in Azure Databricks

Visualizzare in anteprima l'acquisizione delle attività di configurazione della sorgente da SQL Server ad Azure Databricks utilizzando Lakeflow Connect.

Rilevamento modifiche vs. Change Data Capture

Il rilevamento delle modifiche e il Change Data Capture (CDC) consentono a Databricks di monitorare le modifiche nelle tabelle di origine. Databricks consiglia di usare il rilevamento delle modifiche per qualsiasi tabella con una chiave primaria per ridurre al minimo il carico nel database di origine. Se il rilevamento delle modifiche e CDC sono entrambi abilitati, il connettore SQL Server usa il rilevamento delle modifiche.

Metodo Description
Tracciamento delle modifiche Acquisisce il fatto che le righe di una tabella siano state modificate, ma non acquisisce le operazioni effettive. Il rilevamento delle modifiche richiede che una tabella abbia una chiave primaria, ma si tratta di un processo leggero che non ha un impatto significativo sul database di origine.
Cattura delle modifiche ai dati Cattura ogni operazione su una tabella e contiene una vista cronologica delle modifiche apportate nel tempo. CDC non richiede che una tabella abbia una chiave primaria, ma può avere un impatto maggiore sulle prestazioni del database di origine.

Per altre informazioni su queste opzioni, vedere Tenere traccia delle modifiche ai dati (SQL Server) nella documentazione di SQL Server.

Panoramica delle attività di configurazione della fonte

Prima di inserire dati in Azure Databricks, è necessario completare le attività seguenti in SQL Server:

  1. Verificare di soddisfare i requisiti di versione di SQL Server:

    • Per usare il rilevamento delle modifiche, è necessario disporre di SQL Server 2012 o versione successiva.
    • Per usare CDC, è necessario disporre del pacchetto di aggiornamento cumulativo di SQL Server 2012 Service Pack 1 (SP1) 3 (CU3) o versione successiva. Per le versioni precedenti a SQL Server 2016, è necessaria anche Enterprise Edition.
  2. Configurare le impostazioni del firewall, se necessario.

  3. Creare un utente di database in SQL Server dedicato all'inserimento di Databricks e che soddisfa i requisiti di privilegio.

  4. Configurare il database di origine, inclusa la gestione delle autorizzazioni, l'abilitazione del rilevamento delle modifiche e l'abilitazione del Change Data Capture (CDC). Vedere Preparare SQL Server per l'inserimento usando lo script degli oggetti di utilità.