事件
3月31日 下午11時 - 4月2日 下午11時
最大的網狀架構、Power BI 和 SQL 學習事件。 3 月 31 日 - 4 月 2 日。 使用程式代碼 FABINSIDER 來節省 $400 美元。
立即註冊在本教學課程中,使用 NYC 計程車數據來探索專用 SQL 集區的功能。
SQLPOOL1
。您的專用 SQL 集區會與也稱為 SQLPOOL1
的 SQL 資料庫相關聯。
專用 SQL 集區只要作用中,就會耗用可計費的資源。 您可以稍後暫停集區以降低成本。
注意
在工作區中建立新的專用 SQL 集區(先前稱為 SQL DW)時,將會開啟專用 SQL 集區布建頁面。 布建會在邏輯 SQL 伺服器上進行。
在 Synapse Studio 中,流覽至 [開發] 中樞,選取+按鈕以新增資源,然後建立新的 SQL 腳本。
在 [連線到腳本] 上方的下拉式清單中,選取 [在本教學課程的步驟 1 中建立的集SQLPOOL1
區]。
輸入下列程式碼:
IF NOT EXISTS (SELECT * FROM sys.objects O JOIN sys.schemas S ON O.schema_id = S.schema_id WHERE O.NAME = 'NYCTaxiTripSmall' AND O.TYPE = 'U' AND S.NAME = 'dbo')
CREATE TABLE dbo.NYCTaxiTripSmall
(
[VendorID] bigint,
[store_and_fwd_flag] nvarchar(1) NULL,
[RatecodeID] float NULL,
[PULocationID] bigint NULL,
[DOLocationID] bigint NULL,
[passenger_count] float NULL,
[trip_distance] float NULL,
[fare_amount] float NULL,
[extra] float NULL,
[mta_tax] float NULL,
[tip_amount] float NULL,
[tolls_amount] float NULL,
[ehail_fee] float NULL,
[improvement_surcharge] float NULL,
[total_amount] float NULL,
[payment_type] float NULL,
[trip_type] float NULL,
[congestion_surcharge] float NULL
)
WITH
(
DISTRIBUTION = ROUND_ROBIN,
CLUSTERED COLUMNSTORE INDEX
-- HEAP
)
GO
COPY INTO dbo.NYCTaxiTripSmall
(VendorID 1, store_and_fwd_flag 4, RatecodeID 5, PULocationID 6 , DOLocationID 7,
passenger_count 8,trip_distance 9, fare_amount 10, extra 11, mta_tax 12, tip_amount 13,
tolls_amount 14, ehail_fee 15, improvement_surcharge 16, total_amount 17,
payment_type 18, trip_type 19, congestion_surcharge 20 )
FROM 'https://contosolake.dfs.core.windows.net/users/NYCTripSmall.parquet'
WITH
(
FILE_TYPE = 'PARQUET'
,MAXERRORS = 0
,IDENTITY_INSERT = 'OFF'
,AUTO_CREATE_TABLE ='ON'
)
提示
如果您收到讀取 Login failed for user '<token-identified principal>'
的錯誤,您必須設定 Entra Id 管理員。
選取 [執行] 按鈕以執行指令碼。
此腳本會在 60 秒內完成。 它會將 200 萬個 NYC 計程車數據列載入名為 dbo.NYCTaxiTripSmall
的數據表。
在 Synapse Studio 中,移至 [數據中樞]。
移至 [SQLPOOL1>數據表]。 (如果您沒有在功能表中看到它,請重新整理頁面。
以滑鼠右鍵按兩下 dbo。NYCTaxiTripSmall 數據表,然後選取 [新增 SQL 腳本>選取前 100 個數據列]。
等候建立並執行新的SQL腳本。
SQL 腳稿 [連線到 ] 頂端會自動設定為名為 SQLPOOL1 的 SQL 集區。
以此程式代碼取代 SQL 腳本的文字並加以執行。
SELECT passenger_count as PassengerCount,
SUM(trip_distance) as SumTripDistance_miles,
AVG(trip_distance) as AvgTripDistance_miles
INTO dbo.PassengerCountStats
FROM dbo.NYCTaxiTripSmall
WHERE trip_distance > 0 AND passenger_count > 0
GROUP BY passenger_count;
SELECT * FROM dbo.PassengerCountStats
ORDER BY PassengerCount;
此查詢會建立數據表 dbo.PassengerCountStats
,其中包含來自字段的 trip_distance
匯總數據,然後查詢新的數據表。 數據顯示總車程距離和平均車程距離與乘客人數的關係。
在 [SQL 腳本結果] 視窗中,將 [ 檢視 ] 變更為 [圖表 ],以折線圖顯示結果的視覺效果。 將 [類別] 資料行變更為 PassengerCount
。
暫停專用 SQL 集區以降低成本。
事件
3月31日 下午11時 - 4月2日 下午11時
最大的網狀架構、Power BI 和 SQL 學習事件。 3 月 31 日 - 4 月 2 日。 使用程式代碼 FABINSIDER 來節省 $400 美元。
立即註冊訓練
認證
Microsoft Certified: Azure Data Engineer Associate - Certifications
展現對常見資料工程工作的了解,以使用多種 Azure 服務在 Microsoft Azure 上實作和管理資料工程工作負載。