查詢 CSV 檔案

Tip

Microsoft Fabric Data Warehouse 是一個企業規模的關聯式倉庫，建立在資料湖基礎上，具備未來準備架構、內建 AI 及新功能。如果你是資料倉儲新手，建議先從Fabric Data Warehouse開始。現有的專用 SQL 工作負載可升級至 Fabric，以取得資料科學、即時分析與報告等多項新功能。

在本文中，您將瞭解如何使用 Azure Synapse Analytics 中的無伺服器 SQL 集區來查詢單一 CSV 檔案。 CSV 檔案的格式可能不同：

含標頭資料列和不含標頭資料列
逗號和製表符分隔的值
Windows 和 Unix 格式的行結尾
未加引號和加引號的值，以及逸出字元

上述所有變化將涵蓋於下方。

快速入門範例

OPENROWSET 函式可讓您藉由提供檔案的 URL 來讀取 CSV 檔案的內容。

讀取 CSV 檔案

檢視檔案 CSV 內容最簡單的方式是透過提供檔案 URL 到 OPENROWSET 函數，並指定 csv FORMAT 和 2.0 PARSER_VERSION。如果檔案可供公開使用，或如果您的Microsoft Entra 身分識別可以存取此檔案，您應該能夠使用查詢來查看檔案的內容，如下列範例所示：

select top 10 *
from openrowset(
    bulk 'https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.csv',
    format = 'csv',
    parser_version = '2.0',
    firstrow = 2 ) as rows

選項 firstrow 可用來略過 CSV 檔案中的第一個數據列，此案例中代表標頭。請確定您可以存取此檔案。如果你的檔案是用 SAS 金鑰或自訂身份保護的，你需要設定伺服器層級的憑證來登入 sql。

重要

如果你的 CSV 檔案包含 UTF-8 字元，請確保你使用的是 UTF-8 資料庫的彙整（例如 Latin1_General_100_CI_AS_SC_UTF8）。檔案中的文字編碼與定序不符可能會導致非預期的轉換錯誤。您可以使用下列 T-SQL 語句，輕鬆變更目前資料庫的預設順序： alter database current collate Latin1_General_100_CI_AI_SC_UTF8

資料來源使用量

上一個範例會使用檔案的完整路徑。或者，您可以使用指向儲存體根資料夾的位置來建立外部資料來源：

create external data source covid
with ( location = 'https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases' );

建立資料源之後，您就可以使用該數據源和函式中 OPENROWSET 檔案的相對路徑：

select top 10 *
from openrowset(
        bulk 'latest/ecdc_cases.csv',
        data_source = 'covid',
        format = 'csv',
        parser_version ='2.0',
        firstrow = 2
    ) as rows

如果資料來源以 SAS 密鑰或自訂身份保護，你可以設定資料庫範圍憑證。

明確指定架構

OPENROWSET 可讓您使用 WITH 子句，明確指定要從檔案讀取的資料行：

select top 10 *
from openrowset(
        bulk 'latest/ecdc_cases.csv',
        data_source = 'covid',
        format = 'csv',
        parser_version ='2.0',
        firstrow = 2
    ) with (
        date_rep date 1,
        cases int 5,
        geo_id varchar(6) 8
    ) as rows

子句中 WITH 數據類型後面的數位代表 CSV 檔案中的數據行索引。

重要

如果你的 CSV 檔案包含 UTF-8 字元，請確保明確指定某個 UTF-8 排序方式，例如 Latin1_General_100_CI_AS_SC_UTF8，用於 WITH 子句中的所有欄位，或在資料庫層級設定某個 UTF-8 排序方式。檔案中的文字編碼與定序不符可能會導致非預期的轉換錯誤。您可以使用下列 T-SQL 語句，輕鬆變更目前資料庫的預設順序： alter database current collate Latin1_General_100_CI_AI_SC_UTF8 您可以使用下列定義，輕鬆地在資料行類型上設定定序： geo_id varchar(6) collate Latin1_General_100_CI_AI_SC_UTF8 8

在下列各節中，您可以看到如何查詢各種類型的 CSV 檔案。

必要條件

您的第一個步驟是 建立將建立數據表的資料庫 。然後在該資料庫上執行安裝指令碼，將物件初始化。此安裝指令碼會建立資料來源、資料庫範圍認證，以及用於這些範例中的外部檔案格式。

Windows 樣式新行

下列查詢顯示如何讀取沒有標頭資料列、使用 Windows 樣式新行且以逗號分隔資料行的 CSV 檔案。

檔案預覽：

CSV 檔案的前 10 個數據列沒有標頭，Windows 樣式新行。

SELECT *
FROM OPENROWSET(
        BULK 'csv/population/population.csv',
        DATA_SOURCE = 'SqlOnDemandDemo',
        FORMAT = 'CSV', PARSER_VERSION = '2.0',
        FIELDTERMINATOR =',',
        ROWTERMINATOR = '\n'
    )
WITH (
    [country_code] VARCHAR (5) COLLATE Latin1_General_BIN2,
    [country_name] VARCHAR (100) COLLATE Latin1_General_BIN2,
    [year] smallint,
    [population] bigint
) AS [r]
WHERE
    country_name = 'Luxembourg'
    AND year = 2017;

Unix 樣式的新行

下列查詢示範如何讀取沒有標題列的檔案，並使用 Unix 樣式的新行和逗號分隔的欄位。請注意與其他範例相比，檔案的不同位置。

檔案預覽：

沒有標頭資料列且使用 Unix 樣式新行的 CSV 檔案前 10 個資料列。

SELECT *
FROM OPENROWSET(
        BULK 'csv/population-unix/population.csv',
        DATA_SOURCE = 'SqlOnDemandDemo',
        FORMAT = 'CSV', PARSER_VERSION = '2.0',
        FIELDTERMINATOR =',',
        ROWTERMINATOR = '0x0a'
    )
WITH (
    [country_code] VARCHAR (5) COLLATE Latin1_General_BIN2,
    [country_name] VARCHAR (100) COLLATE Latin1_General_BIN2,
    [year] smallint,
    [population] bigint
) AS [r]
WHERE
    country_name = 'Luxembourg'
    AND year = 2017;

標題列

下列查詢顯示如何讀取含有標頭資料列、使用 Unix 樣式新行且以逗號分隔資料行的檔案。請注意與其他範例相比，檔案的不同位置。

檔案預覽：

CSV 檔案的前 10 列包含標頭列，並使用 Unix 風格的換行符。

SELECT *
FROM OPENROWSET(
    BULK 'csv/population-unix-hdr/population.csv',
    DATA_SOURCE = 'SqlOnDemandDemo',
    FORMAT = 'CSV', PARSER_VERSION = '2.0',
    FIELDTERMINATOR =',',
    HEADER_ROW = TRUE
    ) AS [r]

選項 HEADER_ROW = TRUE 會導致從檔案中的標頭數據列讀取數據行名稱。如果你不熟悉檔案內容，可以用這個來探索。最佳效能請參見最佳實務中的「使用適當資料類型」章節。此外，您可以在這裡閱讀更多有關 OPENROWSET 語法的資訊。

自訂引號字元

下列查詢顯示如何讀取含有標頭資料列、使用 Unix 樣式新行、以逗號分隔資料行且包含加引號值的檔案。請注意與其他範例相比，檔案的不同位置。

檔案預覽：

含有標頭資料列、使用 Unix 樣式新行且包含加引號值的 CSV 檔案前 10 個資料列。

SELECT *
FROM OPENROWSET(
        BULK 'csv/population-unix-hdr-quoted/population.csv',
        DATA_SOURCE = 'SqlOnDemandDemo',
        FORMAT = 'CSV', PARSER_VERSION = '2.0',
        FIELDTERMINATOR =',',
        ROWTERMINATOR = '0x0a',
        FIRSTROW = 2,
        FIELDQUOTE = '"'
    )
    WITH (
        [country_code] VARCHAR (5) COLLATE Latin1_General_BIN2,
        [country_name] VARCHAR (100) COLLATE Latin1_General_BIN2,
        [year] smallint,
        [population] bigint
    ) AS [r]
WHERE
    country_name = 'Luxembourg'
    AND year = 2017;

注意

如果您省略 FIELDQUOTE 參數，此查詢會傳回相同的結果，因為 FIELDQUOTE 的預設值是雙引號。

逸出字元

下列查詢顯示如何讀取含有標頭資料列、使用 Unix 樣式新行、以逗號分隔資料行，並使用逸出字元處理值內欄位分隔符號 (逗號) 的檔案。請注意與其他範例相比，檔案的不同位置。

檔案預覽：

CSV 檔案的前 10 行，包含標頭列、Unix 樣式換行符和做為欄位分隔符的逸出字元。

SELECT *
FROM OPENROWSET(
        BULK 'csv/population-unix-hdr-escape/population.csv',
        DATA_SOURCE = 'SqlOnDemandDemo',
        FORMAT = 'CSV', PARSER_VERSION = '2.0',
        FIELDTERMINATOR =',',
        ROWTERMINATOR = '0x0a',
        FIRSTROW = 2,
        ESCAPECHAR = '\\'
    )
    WITH (
        [country_code] VARCHAR (5) COLLATE Latin1_General_BIN2,
        [country_name] VARCHAR (100) COLLATE Latin1_General_BIN2,
        [year] smallint,
        [population] bigint
    ) AS [r]
WHERE
    country_name = 'Slovenia';

注意

如果沒有指定 ESCAPECHAR，這個查詢會失敗，因為「Slov，enia」中的逗號會被視為欄位分隔符，而非國家/地區名稱的一部分。「Slov,enia」會被視為兩個資料行。因此，特定數據列會有一個數據行多於其他數據列，以及一個數據行多於您在WITH子句中定義的數據行。

逸出引號字元

下列查詢顯示如何讀取含有標頭資料列、使用 Unix 樣式新行、以逗號分隔資料行，且值內包含已逸出的雙引號字元的檔案。請注意與其他範例相比，檔案的不同位置。

檔案預覽：

下列查詢顯示如何讀取含有標頭資料列、使用 Unix 樣式新行、以逗號分隔資料行，且值內包含已逸出的雙引號字元的檔案。

SELECT *
FROM OPENROWSET(
        BULK 'csv/population-unix-hdr-escape-quoted/population.csv',
        DATA_SOURCE = 'SqlOnDemandDemo',
        FORMAT = 'CSV', PARSER_VERSION = '2.0',
        FIELDTERMINATOR =',',
        ROWTERMINATOR = '0x0a',
        FIRSTROW = 2
    )
    WITH (
        [country_code] VARCHAR (5) COLLATE Latin1_General_BIN2,
        [country_name] VARCHAR (100) COLLATE Latin1_General_BIN2,
        [year] smallint,
        [population] bigint
    ) AS [r]
WHERE
    country_name = 'Slovenia';

注意

引號字元必須以另一個引號字元逸出。只有在值以引號字元括住時，引號字元才可以出現在資料行值內。

索引標籤分隔的檔案

下列查詢顯示如何讀取含有標頭資料列、使用 Unix 樣式新行且以定位點分隔資料行的檔案。請注意與其他範例相比，檔案的不同位置。

檔案預覽：

含有標頭資料列、使用 Unix 樣式新行且使用定位點分隔符號的 CSV 檔案前 10 個資料列。

SELECT *
FROM OPENROWSET(
        BULK 'csv/population-unix-hdr-tsv/population.csv',
        DATA_SOURCE = 'SqlOnDemandDemo',
        FORMAT = 'CSV', PARSER_VERSION = '2.0',
        FIELDTERMINATOR ='\t',
        ROWTERMINATOR = '0x0a',
        FIRSTROW = 2
    )
    WITH (
        [country_code] VARCHAR (5) COLLATE Latin1_General_BIN2,
        [country_name] VARCHAR (100) COLLATE Latin1_General_BIN2,
        [year] smallint,
        [population] bigint
    ) AS [r]
WHERE
    country_name = 'Luxembourg'
    AND year = 2017

傳回欄位的子集

到目前為止，您已使用WITH指定 CSV 檔案架構，並列出所有資料行。您只能針對所需的每個資料行使用序數來指定查詢中實際需要的數據行。您也可以省略不感興趣的欄位。

下列查詢會傳回檔案中相異國家/地區名稱的數目，只指定所需的數據行：

注意

查看下列查詢中的 WITH 子句，並注意在您定義 [country_name] 資料行的資料列結尾有「2」(不含引號)。這表示 [country_name] 數據行是檔案中的第二個數據行。查詢會忽略檔案中的所有數據行，但第二個數據行除外。

SELECT
    COUNT(DISTINCT country_name) AS countries
FROM OPENROWSET(
        BULK 'csv/population/population.csv',
        DATA_SOURCE = 'SqlOnDemandDemo',
        FORMAT = 'CSV', PARSER_VERSION = '2.0',
        FIELDTERMINATOR =',',
        ROWTERMINATOR = '\n'
    )
WITH (
    --[country_code] VARCHAR (5),
    [country_name] VARCHAR (100) 2
    --[year] smallint,
    --[population] bigint
) AS [r]

查詢可附加的檔案

查詢中使用的 CSV 檔案在查詢執行時不應該被更改。在長時間執行的查詢中，SQL 集區可能會重試讀取、讀取部分檔案，或甚至多次讀取檔案。檔案內容的變更會導致錯誤的結果。因此，若 SQL 池偵測到任何檔案在查詢執行中修改時間被更改，則該查詢失敗。

在某些情況下，您可能想要讀取不斷附加的檔案。若要避免查詢因經常追加檔案而失敗，您可以透過設定 OPENROWSET 讓 ROWSET_OPTIONS 函數忽略可能不一致的讀取。

select top 10 *
from openrowset(
    bulk 'https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.csv',
    format = 'csv',
    parser_version = '2.0',
    firstrow = 2,
    ROWSET_OPTIONS = '{"READ_OPTIONS":["ALLOW_INCONSISTENT_READS"]}') as rows

ALLOW_INCONSISTENT_READS 讀取選項將在查詢執行過程中停用檔案修改時間的檢查，並讀取該檔案中可用的任何內容。在可附加檔案中，現有內容不會更新，只會新增新的資料列。因此，相較於可更新的檔案，這會將錯誤結果的機率降到最低。此選項可讓您讀取經常附加的檔案，而無須處理錯誤。在大部分情況下，SQL 集區只會忽略查詢執行期間附加至檔案的某些數據列。

下一篇文章將說明如何：

意見反應

此頁面對您有幫助嗎？

Last updated on 2026-05-07

查詢 CSV 檔案

快速入門範例

讀取 CSV 檔案

資料來源使用量

明確指定架構

必要條件

Windows 樣式新行

Unix 樣式的新行

標題列

自訂引號字元

逸出字元

逸出引號字元

索引標籤分隔的檔案

傳回欄位的子集

查詢可附加的檔案

相關內容

意見反應

其他資源