使用無伺服器 SQL 集區來分析資料
在本教學課程中,您將了解如何使用無伺服器 SQL 集區來分析資料。
內建的無伺服器 SQL 集區
無伺服器 SQL 集區可讓您使用 SQL,卻不用保留容量。 無伺服器 SQL 集區的計費是根據執行查詢所處理的資料量計算,不是執行查詢所用的節點數目。
每個工作區都有一個稱為內建的預先設定無伺服器 SQL 集區。
使用無伺服器 SQL 集區來分析 NYC 計程車資料
注意
請確定您已將範例資料放入主要儲存體帳戶
在 Synapse Studio 中,移至 [開發] 中樞
建立新的 SQL 指令碼。
將下列程式碼貼到指令碼中。
SELECT TOP 100 * FROM OPENROWSET( BULK 'https://contosolake.dfs.core.windows.net/users/NYCTripSmall.parquet', FORMAT='PARQUET' ) AS [result]
選取 [執行]。
資料探索只是方便您了解資料基本特性的簡化案例。 在本教學課程中深入了解資料探索和分析。
建立資料探索資料庫
您可以直接透過 master
資料庫瀏覽檔案內容。 有些簡單的資料探索案例不需要建立個別的資料庫。
但在您繼續進行資料探索時,可能會想要建立一些公用程式物件,例如:
- 代表儲存體帳戶具名參考的外部資料來源。
- 資料庫範圍認證可讓您指定驗證外部資料來源的方式。
- 有權存取某些資料來源或資料庫物件的資料庫使用者。
- 您可以在查詢中使用的公用程式檢視、程序和函式。
使用
master
資料庫為自訂資料庫物件建立個別的資料庫。 您無法在master
資料庫中建立自訂的資料庫物件。CREATE DATABASE DataExplorationDB COLLATE Latin1_General_100_BIN2_UTF8
重要
使用具有
_UTF8
尾碼的定序,以確保 UTF-8 文字已正確轉換成VARCHAR
資料行。Latin1_General_100_BIN2_UTF8
能為從 Parquet 檔案和 Azure Cosmos DB 容器讀取資料的查詢提供最佳效能。 如需變更定序的詳細資訊,請參閱 Synapse SQL 支援的定序類型。使用下列命令,將資料庫內容從
master
切換為DataExplorationDB
。 您也可以使用 UI 控制項 [使用資料庫] 來切換目前的資料庫:USE DataExplorationDB
從
DataExplorationDB
建立公用程式物件,例如認證和資料來源。CREATE EXTERNAL DATA SOURCE ContosoLake WITH ( LOCATION = 'https://contosolake.dfs.core.windows.net')
注意
您可以建立不含認證的外部資料來源。 如果認證不存在,可使用呼叫端的身分識別來存取外部資料來源。
或者,使用新建立
DataExplorationDB
的資料庫,為中DataExplorationDB
存取外部資料的使用者建立登入:CREATE LOGIN data_explorer WITH PASSWORD = 'My Very Strong Password 1234!';
接下來,針對上述登入在 中
DataExplorationDB
建立資料庫使用者,並授與ADMINISTER DATABASE BULK OPERATIONS
許可權。CREATE USER data_explorer FOR LOGIN data_explorer; GO GRANT ADMINISTER DATABASE BULK OPERATIONS TO data_explorer; GO
使用相對路徑和資料來源探索檔案內容:
SELECT TOP 100 * FROM OPENROWSET( BULK '/users/NYCTripSmall.parquet', DATA_SOURCE = 'ContosoLake', FORMAT='PARQUET' ) AS [result]
將變更發佈至工作區。
資料探索資料庫只是一個簡單的預留位置,您可以在此儲存公用程式物件。 Synapse SQL 集區可讓您執行更多作業並建立邏輯資料倉儲,這是以 Azure 資料來源建置的關聯式層。 在本 教學課程中深入瞭解如何建置邏輯資料倉儲。