使用 Transact-SQL 將資料內嵌至倉儲

適用於✅：Microsoft Fabric 的倉儲

Transact-SQL 語言提供選項，您可以利用這些選項將資料從 Lakehouse 和倉儲中的現有資料表大規模載入至倉儲中的新資料表。如果您需要使用彙總資料建立新版本的資料表、具有資料列子集的資料表版本，或建立資料表作為複雜查詢的結果，這些選項會很方便。讓我們探索一些範例。

建立具有查詢結果的新數據表

Microsoft Fabric 中的倉儲可讓您使用下列 T-SQL 語句，輕鬆地根據 T-SQL 查詢的結果建立新的數據表：

CREATE TABLE AS SELECT（CTAS）語句允許您從 SELECT 語句的輸出在資料倉儲中建立新的表格。
SELECT INTO query 子句可讓您從任何數據表來源選取結果，並將結果重新導向至新的數據表。這是 T-SQL 語言的標準功能。

這兩個語句很類似，因此下列範例著重於 CTAS 語句。

CTAS 語法會以平行方式在新的數據表中執行引入作業，使得在工作區內進行數據轉換和建立新數據表非常有效率。

您可以針對 CTAS 語句 SELECT 部分使用下列選項：

讀取資料倉儲表，例如暫存表。
在 Lakehouse 的 SQL 分析端點中使用自動產生的數據表讀取 Lakehouse Delta Lake 資料夾。
使用 OPENROWSET 函式直接從 Azure Data Lake 或 Azure Blob 記憶體讀取 CSV、Parquet 或 JSONL 檔案。

Note

本文中的範例會使用 Bing COVID-19 範例資料集。若要載入範例資料集，請遵循使用 COPY 陳述式將資料內嵌至倉儲中的步驟，以將範例資料建立至倉儲。

從 Warehouse 數據表建立數據表

第一個範例說明如何建立新的資料表，該資料表是現有 dbo.bing_covid19_data_2023 資料表的複本，但只能篩選從 2023 年開始的資料：

CREATE TABLE dbo.bing_covid19_data_2023
AS
SELECT * 
FROM dbo.bing_covid19_data 
WHERE DATEPART(YEAR, updated) = '2023';

您也可以使用新的 year、month、dayofmonth 資料行建立新的資料表，其中包含從來源資料表中的 updated 資料行取得的值。如果您嘗試依年份將感染資料視覺化，或查看觀測到最多 COVID-19 病例的月份，這非常有用：

CREATE TABLE dbo.bing_covid19_data_with_year_month_day
AS
SELECT DATEPART(YEAR, updated) AS [year],
       DATEPART(MONTH, updated) AS [month],
       DATEPART(DAY, updated) AS [dayofmonth],
       * 
FROM dbo.bing_covid19_data;

另一個範例是，您可以建立新的資料表，以摘要說明每個月觀測到的案例數目，而不論年份為何，以評估季節性如何影響特定國家/地區的分佈情況。使用在上一個範例中建立的資料表，並將新增的 month 欄作為來源：

CREATE TABLE dbo.infections_by_month
AS
SELECT country_region, [month],
       SUM(CAST(confirmed as bigint)) AS confirmed_sum
FROM dbo.bing_covid19_data_with_year_month_day
GROUP BY country_region, [month];

根據這個新資料表，我們可以看到，在所有年份的 January 月份，美國觀察到更多確診病例，其次是 December 和 October。 April 是整體案例數目最低的月份：

SELECT * FROM dbo.infections_by_month
WHERE country_region = 'United States'
ORDER BY confirmed_sum DESC;

從 Delta Lake 資料夾建立資料表

如果 Delta Lake 資料夾儲存在 lakehouse 中的 /Tables 資料夾中，則 OneLake 中的 Delta Lake 資料夾會自動表示為數據表。下列程式代碼會從 bing_covid19_data_2023 中的 Delta Lake 資料夾 /Tables/bing_covid19_delta_lake建立新的數據表：

CREATE TABLE dbo.bing_covid19_data_2023
AS
SELECT * 
FROM MyLakehouse.dbo.bing_covid19_delta_lake 
WHERE DATEPART(YEAR, updated) = '2023';

您可以使用三部分名稱表示法來參考儲存檔案的湖倉（Lakehouse）的 Delta Lake 資料夾。上一節中顯示的所有範例都適用於 Delta Lake 資料夾。

從 CSV/Parquet/JSONL 檔案建立數據表

您也可以使用 bing_covid19_data 函式，直接從外部檔案建立新的資料表，而不是從 Warehouse OPENROWSET 數據表讀取資料：

CREATE TABLE dbo.bing_covid19_data_2022
AS
SELECT *
FROM OPENROWSET(BULK 'https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/bing_covid-19_data/latest/bing_covid-19_data.parquet') AS data
WHERE DATEPART(YEAR, updated) = '2022';

您也可以從外部 CSV 檔案轉換資料來建立新的資料表：

CREATE TABLE dbo.bing_covid19_data_with_year_month_day
AS
SELECT DATEPART(YEAR, updated) AS [year], 
       DATEPART(MONTH, updated) AS [month],
       DATEPART(DAY, updated) AS [dayofmonth],
       *
FROM OPENROWSET(BULK 'https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/bing_covid-19_data/latest/bing_covid-19_data.csv') AS data;

CREATE TABLE dbo.infections_by_month_2022
AS
SELECT country_region,
       DATEPART(MONTH, updated) AS [month],
       SUM(CAST(confirmed as bigint)) AS [confirmed_sum]
FROM OPENROWSET(BULK 'https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/bing_covid-19_data/latest/bing_covid-19_data.jsonl') AS data
WHERE DATEPART(YEAR, updated) = '2022'
GROUP BY country_region, DATEPART(MONTH, updated);

SELECT * FROM dbo.infections_by_month_2022
WHERE country_region = 'United States'
ORDER BY confirmed_sum DESC;

欲了解更多查詢外部資料的資訊與範例，請參閱使用 Fabric Data Warehouse 或 SQL 分析端點查詢外部資料湖檔案。
如需更多範例和語法參考，請參閱 CREATE TABLE AS SELECT (Transact-SQL)。

使用 T-SQL 查詢將資料內嵌至現有的資料表

上述範例會根據查詢的結果建立新的資料表。 ** 若要在現有的數據表上複製範例，可以使用 INSERT ... SELECT 模式。

從倉儲數據表擷取數據

下列程式代碼會將新資料從倉儲數據表擷取至現有的數據表：

INSERT INTO dbo.bing_covid19_data_2023
SELECT *
FROM dbo.bing_covid19_data
WHERE DATEPART(YEAR, updated) = '2023';

只要產生的查詢資料行類型與目的地資料表上的資料行對齊，SELECT 陳述式的查詢準則就可以是任何有效的查詢。如果指定資料行名稱，而且只包含目的地資料表中的資料行子集，則所有其他資料行都會載入為 NULL。如需詳細資訊，請參閱使用 INSERT INTO...SELECT 以最低限度記錄和平行處理原則來大量匯入資料。

從 Delta Lake 資料夾內嵌資料

如果 Delta Lake 資料夾儲存在 lakehouse 中的 /Tables 資料夾內，則在 OneLake 中將自動表示為數據表。

下列程式代碼會從 Lakehouse 中的 Delta Lake 資料夾 /Tables/bing_covid19_delta_lake 區段 MyLakehouse* 導入新數據

INSERT INTO dbo.bing_covid19_data_2023
SELECT *
FROM MyLakehouse.dbo.bing_covid19_delta_lake 
WHERE DATEPART(YEAR, updated) = '2023';

從 CSV/Parquet/JSONL 檔案匯入數據

您可以使用函式 OPENROWSET 作為來源，以便從儲存匯入 Parquet、CSV 或 JSON 檔案：

INSERT INTO dbo.bing_covid19_data_2023
SELECT *
FROM OPENROWSET(BULK 'https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/bing_covid-19_data/latest/bing_covid-19_data.parquet') AS data
WHERE DATEPART(YEAR, updated) = '2023';

您可以使用之類的 *.parquet通配符讀取多個檔案，或將目標設為等 /year=*/month=*數據分割目錄。若要將效能優化，請在 WHERE 子句中套用篩選條件，以在查詢執行期間排除不必要的數據列和數據分割。

這些範例類似於使用 COPY INTO 擷取時所使用的範例。 COPY INTO 命令更容易使用，特別是針對直接的來源到目的地數據載入。不過，如果您需要轉換源數據（例如轉換值或與其他數據表聯結），使用 INSERT ... SELECT 可讓您彈性地在擷取期間執行轉換。

從 OneLake 匯入數據

您可以使用 OPENROWSET 函數作為來源，以便從 Fabric OneLake 儲存體匯入數據。在下列範例中，將 {workspaceId} 和 {lakehouseId} 替換為對應的工作區和 Lakehouse GUID：

INSERT INTO dbo.bing_covid19_data_2023
SELECT *
FROM OPENROWSET(BULK 'https://onelake.dfs.fabric.microsoft.com/{workspaceId}/{lakehouseId}/Files/year=*/month=*/*.parquet') AS data
WHERE data.filepath(1) = '2023'

此範例是以先前從 Azure Data Lake Storage 讀取數據的範例為基礎。當您需要轉換源數據時，請使用此方法，例如轉換值、與其他數據表聯結，或讀取特定分割區。在這種情況下，使用 INSERT ... SELECT 提供在數據擷取期間套用轉換的彈性。

從不同倉庫和湖倉中的資料表提取資料

CREATE TABLE AS SELECT和INSERT ... SELECT，SELECT語句也可以參考不同於目的地資料表儲存在的倉儲的資料表，藉由使用跨倉儲查詢。這可以使用三部分命名慣例 [warehouse_or_lakehouse_name.][schema_name.]table_name 來達成。例如，假設您有下列工作區資產：

名為 cases_lakehouse 的湖屋，具備最新的案例資料。
名為 reference_warehouse 的倉儲，具有用於參考資料的資料表。
名為 research_warehouse 的倉儲，其中會建立目的地資料表。

您可以建立新的資料表，使用三部分命名來結合這些工作區資產上資料表的資料：

CREATE TABLE research_warehouse.dbo.cases_by_continent
AS
SELECT *
FROM cases_lakehouse.dbo.bing_covid19_data AS cases
INNER JOIN reference_warehouse.dbo.bing_covid19_data AS reference
ON cases.iso3 = reference.countrycode;

若要深入了解跨倉儲查詢，請參閱撰寫跨資料庫 SQL 查詢。

審核與監控 T-SQL 的匯入

CTAS與INSERT ... SELECT透過 T-SQL 執行的操作會出現在倉庫查詢歷史/活動中，並可與其他倉庫操作一同監控。

資料擷取選項

其他將資料匯入倉庫的方式包括：

意見反應

此頁面對您有幫助嗎？

Last updated on 2025-12-05