使用無伺服器 SQL 集區來分析資料

在本教學課程中,您將了解如何使用無伺服器 SQL 集區來分析資料。

內建的無伺服器 SQL 集區

無伺服器 SQL 集區可讓您使用 SQL,卻不用保留容量。 無伺服器 SQL 集區的計費是根據執行查詢所處理的資料量計算,不是執行查詢所用的節點數目。

每個工作區都有一個稱為內建的預先設定無伺服器 SQL 集區。

使用無伺服器 SQL 集區來分析 NYC 計程車資料

注意

請確定您已將範例資料放入主要儲存體帳戶

  1. 在 Synapse Studio 中,移至 [開發] 中樞

  2. 建立新的 SQL 指令碼。

  3. 將下列程式碼貼到指令碼中。

    SELECT
        TOP 100 *
    FROM
        OPENROWSET(
            BULK 'https://contosolake.dfs.core.windows.net/users/NYCTripSmall.parquet',
            FORMAT='PARQUET'
        ) AS [result]
    
  4. 選取 [執行]。

資料探索只是方便您了解資料基本特性的簡化案例。 在本教學課程中深入了解資料探索和分析。

建立資料探索資料庫

您可以直接透過 master 資料庫瀏覽檔案內容。 有些簡單的資料探索案例不需要建立個別的資料庫。 但在您繼續進行資料探索時,可能會想要建立一些公用程式物件,例如:

  • 代表儲存體帳戶具名參考的外部資料來源。
  • 資料庫範圍認證可讓您指定驗證外部資料來源的方式。
  • 有權存取某些資料來源或資料庫物件的資料庫使用者。
  • 您可以在查詢中使用的公用程式檢視、程序和函式。
  1. 使用 master 資料庫為自訂資料庫物件建立個別的資料庫。 您無法在 master 資料庫中建立自訂的資料庫物件。

    CREATE DATABASE DataExplorationDB 
                    COLLATE Latin1_General_100_BIN2_UTF8
    

    重要

    使用具有 _UTF8 尾碼的定序,以確保 UTF-8 文字已正確轉換成 VARCHAR 資料行。 Latin1_General_100_BIN2_UTF8 能為從 Parquet 檔案和 Azure Cosmos DB 容器讀取資料的查詢提供最佳效能。 如需變更定序的詳細資訊,請參閱 Synapse SQL 支援的定序類型

  2. 使用下列命令,將資料庫內容從 master 切換為 DataExplorationDB 。 您也可以使用 UI 控制項 [使用資料庫] 來切換目前的資料庫:

    USE DataExplorationDB
    
  3. DataExplorationDB 建立公用程式物件,例如認證和資料來源。

    CREATE EXTERNAL DATA SOURCE ContosoLake
    WITH ( LOCATION = 'https://contosolake.dfs.core.windows.net')
    

    注意

    您可以建立不含認證的外部資料來源。 如果認證不存在,可使用呼叫端的身分識別來存取外部資料來源。

  4. 或者,使用新建立 DataExplorationDB 的資料庫,為中 DataExplorationDB 存取外部資料的使用者建立登入:

    CREATE LOGIN data_explorer WITH PASSWORD = 'My Very Strong Password 1234!';
    

    接下來,針對上述登入在 中 DataExplorationDB 建立資料庫使用者,並授與 ADMINISTER DATABASE BULK OPERATIONS 許可權。

    CREATE USER data_explorer FOR LOGIN data_explorer;
    GO
    GRANT ADMINISTER DATABASE BULK OPERATIONS TO data_explorer;
    GO
    
  5. 使用相對路徑和資料來源探索檔案內容:

    SELECT
        TOP 100 *
    FROM
        OPENROWSET(
                BULK '/users/NYCTripSmall.parquet',
                DATA_SOURCE = 'ContosoLake',
                FORMAT='PARQUET'
        ) AS [result]
    
  6. 將變更發佈至工作區。

資料探索資料庫只是一個簡單的預留位置,您可以在此儲存公用程式物件。 Synapse SQL 集區可讓您執行更多作業並建立邏輯資料倉儲,這是以 Azure 資料來源建置的關聯式層。 在本 教學課程中深入瞭解如何建置邏輯資料倉儲

下一步