Esercitazione: eseguire una query in Oracle da un cluster Big Data di SQL Server

Si applica a: SQL Server 2019 (15.x)

Importante

Il componente aggiuntivo per i cluster Big Data di Microsoft SQL Server 2019 verrà ritirato. Il supporto per i cluster Big Data di SQL Server 2019 terminerà il 28 febbraio 2025. Tutti gli utenti esistenti di SQL Server 2019 con Software Assurance saranno completamente supportati nella piattaforma e fino a quel momento il software continuerà a ricevere aggiornamenti cumulativi di SQL Server. Per altre informazioni, vedere il post di blog relativo all'annuncio e Opzioni per i Big Data nella piattaforma Microsoft SQL Server.

Questa esercitazione illustra come eseguire una query su dati Oracle da un cluster Big Data di SQL Server 2019. Per eseguire questa esercitazione, è necessario avere accesso a un server Oracle. È necessario un account utente Oracle con privilegi di lettura sull'oggetto esterno. L'autenticazione utente proxy Oracle è supportata. In caso contrario, questa esercitazione può dare un'idea del funzionamento della virtualizzazione dei dati per origini dati esterne nel cluster Big Data di SQL Server.

In questa esercitazione apprenderai a:

  • Creare una tabella esterna per i dati in un database Oracle esterno.
  • Unire questi dati con dati di valore elevato nell'istanza master.

Suggerimento

Se si preferisce, è possibile scaricare ed eseguire uno script per i comandi descritti in questa esercitazione. Per istruzioni, vedere Esempi di virtualizzazione di dati in GitHub.

Prerequisiti

Creare una tabella Oracle

Questa procedura consente di creare in Oracle una tabella semplice denominata INVENTORY.

  1. Connettersi a un'istanza di Oracle e al database che si vuole usare per questa esercitazione.

  2. Eseguire l'istruzione seguente per creare la tabella INVENTORY:

     CREATE TABLE "INVENTORY"
     (
         "INV_DATE" NUMBER(10,0) NOT NULL,
         "INV_ITEM" NUMBER(10,0) NOT NULL,
         "INV_WAREHOUSE" NUMBER(10,0) NOT NULL,
         "INV_QUANTITY_ON_HAND" NUMBER(10,0)
     );
    
     CREATE INDEX INV_ITEM ON HR.INVENTORY(INV_ITEM);
    
  3. Importare nella tabella il contenuto del file inventory.csv. Questo file è stato creato a partire dagli script di creazione di esempio disponibili nella sezione Prerequisiti.

Creare un'origine dati esterna

Il primo passaggio prevede la creazione di un'origine dati esterna in grado di accedere al server Oracle.

  1. In Azure Data Studio connettersi all'istanza master di SQL Server del cluster Big Data. Per altre informazioni, vedere Connettersi all'istanza master di SQL Server.

  2. Fare doppio clic sulla connessione nella finestra Server per visualizzare il dashboard del server per l'istanza master di SQL Server. Selezionare Nuova query.

    SQL Server master instance query

  3. Eseguire il comando Transact-SQL seguente per modificare il contesto nel database Sales dell'istanza master.

    USE Sales
    GO
    
  4. Creare le credenziali con ambito database per connettersi al server Oracle. Fornire le credenziali appropriate al server Oracle nell'istruzione seguente.

    CREATE DATABASE SCOPED CREDENTIAL [OracleCredential]
    WITH IDENTITY = '<oracle_user,nvarchar(100),SYSTEM>', SECRET = '<oracle_user_password,nvarchar(100),manager>';
    
  5. Creare un'origine dati esterna che punti al server Oracle.

    CREATE EXTERNAL DATA SOURCE [OracleSalesSrvr]
    WITH (LOCATION = 'oracle://<oracle_server,nvarchar(100)>',CREDENTIAL = [OracleCredential]);
    

Facoltativo: autenticazione proxy Oracle

Oracle supporta l'autenticazione proxy per fornire il controllo di accesso con granularità fine. Un utente proxy si connette al database Oracle usando le proprie credenziali e rappresenta un altro utente nel database.

Un utente proxy può essere configurato in modo che abbia accesso limitato rispetto all'utente rappresentato. Ad esempio, è possibile consentire a un utente proxy di connettersi usando un ruolo del database specifico dell'utente rappresentato. L'identità dell'utente che si connette al database Oracle tramite l'utente proxy viene mantenuta nella connessione, anche se più utenti si connettono tramite l'autenticazione proxy. Questo consente a Oracle di applicare il controllo di accesso e di controllare le azioni intraprese per conto dell'utente effettivo.

Se lo scenario richiede l'uso di un utente proxy Oracle, sostituire i passaggi 4 e 5 precedenti con i seguenti.

  1. Creare le credenziali con ambito database per connettersi al server Oracle. Specificare le credenziali di utente proxy Oracle appropriate al server Oracle nell'istruzione seguente.

    CREATE DATABASE SCOPED CREDENTIAL [OracleProxyCredential]
    WITH IDENTITY = '<oracle_proxy_user,nvarchar(100),SYSTEM>', SECRET = '<oracle_proxy_user_password,nvarchar(100),manager>';
    
  2. Creare un'origine dati esterna che punti al server Oracle.

    CREATE EXTERNAL DATA SOURCE [OracleSalesSrvr]
    WITH (LOCATION = 'oracle://<oracle_server,nvarchar(100)>',
    CONNECTION_OPTIONS = 'ImpersonateUser=%CURRENT_USER',
    CREDENTIAL = [OracleProxyCredential]);
    

Creare una tabella esterna

Successivamente, creare una tabella esterna denominata iventory_ora sulla base della tabella INVENTORY presente nel server Oracle.

CREATE EXTERNAL TABLE [inventory_ora]
    ([inv_date] DECIMAL(10,0) NOT NULL, [inv_item] DECIMAL(10,0) NOT NULL,
    [inv_warehouse] DECIMAL(10,0) NOT NULL, [inv_quantity_on_hand] DECIMAL(10,0))
WITH (DATA_SOURCE=[OracleSalesSrvr],
        LOCATION='<oracle_service_name,nvarchar(30),xe>.<oracle_schema,nvarchar(128),HR>.<oracle_table,nvarchar(128),INVENTORY>');

Nota

I nomi delle tabelle e delle colonne useranno l'identificatore delimitato da ANSI SQL durante l'esecuzione di query su dati Oracle. Per i nomi delle variabili viene quindi fatta distinzione tra maiuscole e minuscole. Nella definizione della tabella esterna è importante specificare il nome rispettando esattamente le lettere minuscole e maiuscole dei nomi delle tabelle e delle colonne nei metadati Oracle.

Eseguire una query sui dati

Eseguire la query seguente per creare un join tra i dati della iventory_oratabella esterna e le tabelle nel database Sales locale.

SELECT TOP(100) w.w_warehouse_name, i.inv_item, SUM(i.inv_quantity_on_hand) as total_quantity
  FROM [inventory_ora] as i
  JOIN item as it
    ON it.i_item_sk = i.inv_item
  JOIN warehouse as w
    ON w.w_warehouse_sk = i.inv_warehouse
 WHERE it.i_category = 'Books' and i.inv_item BETWEEN 1 and 18000 --> get items within specific range
 GROUP BY w.w_warehouse_name, i.inv_item;

Eseguire la pulizia

Usare il comando seguente per rimuovere gli oggetti di database creati in questa esercitazione.

DROP EXTERNAL TABLE [inventory_ora];
DROP EXTERNAL DATA SOURCE [OracleSalesSrvr] ;
DROP DATABASE SCOPED CREDENTIAL [OracleCredential];

Passaggi successivi

Informazioni su come inserire dati nel pool di dati: