你当前正在访问 Microsoft Azure Global Edition 技术文档网站。如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站，请访问 https://docs.azure.cn。

在 Azure Synapse Analytics 中使用无服务器 SQL 池查询 JSON 文件

Tip

Microsoft Fabric Data Warehouse是数据湖基础上的企业规模关系仓库，具有未来就绪的体系结构、内置 AI 和新功能。如果不熟悉数据仓库，请从Fabric Data Warehouse开始。现有的指定 SQL 池工作负荷可以升级到 Fabric，以跨数据科学、实时分析和报告访问新功能。

本文介绍如何在 Azure Synapse Analytics 中使用无服务器 SQL 池编写查询。查询的目标是使用 OPENROWSET 读取 JSON 文件。

标准 JSON 文件，其中多个 JSON 文档存储为 JSON 数组。
行分隔的 JSON 文件，其中 JSON 文档用换行符分隔。这些类型文件的常见扩展名包括jsonl、ldjson和ndjson。

读取 JSON 文档

查看 JSON 文件内容的最简单方法是将文件 URL 提供给OPENROWSET函数，指定 csvFORMAT，并为0x0b和fieldterminator设置值fieldquote。如果需要读取以行分隔的 JSON 文件，则这已经足够了。如果有经典 JSON 文件，则需要为 0x0b 设置值 rowterminator。 OPENROWSET 函数将分析 JSON 并返回以下格式的每个文档：

文档
{“date_rep”：“2020-07-24”，“day”：24，“month”：7，“year”：2020，“cases”：3，“deaths”：0，“geo_id”：“AF”}
{“date_rep”：“2020-07-25”，“day”：25，“month”：7，“year”：2020，“cases”：7，“deaths”：0，“geo_id”：“AF”}
{“date_rep”：“2020-07-26”，“day”：26，“month”：7，“year”：2020，“cases”：4，“deaths”：0，“geo_id”：“AF”}
{“date_rep”：“2020-07-27”，“day”：27，“month”：7，“year”：2020，“cases”：8，“deaths”：0，“geo_id”：“AF”}

如果文件公开可用，或者Microsoft Entra标识可以访问此文件，则应使用查询看到文件的内容，如以下示例所示。

读取 JSON 文件

以下示例查询读取 JSON 和行分隔的 JSON 文件，并将每个文档作为单独的行返回。

select top 10 *
from openrowset(
        bulk 'https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.jsonl',
        format = 'csv',
        fieldterminator ='0x0b',
        fieldquote = '0x0b'
    ) with (doc nvarchar(max)) as rows
go
select top 10 *
from openrowset(
        bulk 'https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.json',
        format = 'csv',
        fieldterminator ='0x0b',
        fieldquote = '0x0b',
        rowterminator = '0x0b' --> You need to override rowterminator to read classic JSON
    ) with (doc nvarchar(max)) as rows

前面的示例查询中的 JSON 文档包括对象数组。查询将每个对象作为结果集中的单独行返回。请确保可以访问此文件。如果文件使用 SAS 密钥或自定义标识进行保护，则需要为 sql 登录设置服务器级凭据。

数据源使用情况

前面的示例使用文件的完整路径。另一种方法是，创建一个外部数据源，其位置指向存储的根文件夹，然后在OPENROWSET函数中使用该数据源和文件的相对路径。

create external data source covid
with ( location = 'https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases' );
go
select top 10 *
from openrowset(
        bulk 'latest/ecdc_cases.jsonl',
        data_source = 'covid',
        format = 'csv',
        fieldterminator ='0x0b',
        fieldquote = '0x0b'
    ) with (doc nvarchar(max)) as rows
go
select top 10 *
from openrowset(
        bulk 'latest/ecdc_cases.json',
        data_source = 'covid',
        format = 'csv',
        fieldterminator ='0x0b',
        fieldquote = '0x0b',
        rowterminator = '0x0b' --> You need to override rowterminator to read classic JSON
    ) with (doc nvarchar(max)) as rows

如果数据源使用 SAS 密钥或自定义标识进行保护，则可以使用数据库范围的凭据配置数据源。

在以下部分中，可以看到如何查询各种类型的 JSON 文件。

分析 JSON 文档

前面的示例中的查询将每个 JSON 文档作为结果集单独行中的单个字符串返回。可以使用函数 JSON_VALUE 和分析 OPENJSON JSON 文档中的值，并将其作为关系值返回，如以下示例所示：

date_rep	案例	地理标识符 (geo_id)
2020-07-24	3	AF
2020-07-25	7	AF
2020-07-26	4	AF
2020-07-27	8	AF

示例 JSON 文档

查询示例读取包含具有以下结构的文档的 JSON 文件：

{
    "date_rep":"2020-07-24",
    "day":24,"month":7,"year":2020,
    "cases":13,"deaths":0,
    "countries_and_territories":"Afghanistan",
    "geo_id":"AF",
    "country_territory_code":"AFG",
    "continent_exp":"Asia",
    "load_date":"2020-07-25 00:05:14",
    "iso_country":"AF"
}

注释

如果这些文档存储为以行分隔的 JSON，则需要设置 FIELDTERMINATOR 和 FIELDQUOTE 0x0b。如果有标准 JSON 格式，则需要设置为 ROWTERMINATOR 0x0b。

使用 JSON_VALUE 查询 JSON 文件

以下查询演示如何使用 JSON_VALUE 从 JSON 文档检索标量值（date_rep、 countries_and_territories） cases：

select
    JSON_VALUE(doc, '$.date_rep') AS date_reported,
    JSON_VALUE(doc, '$.countries_and_territories') AS country,
    CAST(JSON_VALUE(doc, '$.deaths') AS INT) as fatal,
    JSON_VALUE(doc, '$.cases') as cases,
    doc
from openrowset(
        bulk 'latest/ecdc_cases.jsonl',
        data_source = 'covid',
        format = 'csv',
        fieldterminator ='0x0b',
        fieldquote = '0x0b'
    ) with (doc nvarchar(max)) as rows
order by JSON_VALUE(doc, '$.geo_id') desc

从 JSON 文档提取 JSON 属性后，可以定义列别名，并选择性地将文本值强制转换为某种类型。

使用 OPENJSON 查询 JSON 文件

以下查询使用 OPENJSON。它将检索塞尔维亚报告的 COVID 统计数据：

select
    *
from openrowset(
        bulk 'latest/ecdc_cases.jsonl',
        data_source = 'covid',
        format = 'csv',
        fieldterminator ='0x0b',
        fieldquote = '0x0b'
    ) with (doc nvarchar(max)) as rows
    cross apply openjson (doc)
        with (  date_rep datetime2,
                cases int,
                fatal int '$.deaths',
                country varchar(100) '$.countries_and_territories')
where country = 'Serbia'
order by country, date_rep desc;

结果在功能上与使用 JSON_VALUE 函数返回的结果相同。在某些情况下， OPENJSON 可能具有优势 JSON_VALUE：

在WITH子句中，可以显式设置每个属性的列别名和类型。无需将 CAST 函数放入 SELECT 列表中的每一列。
OPENJSON 如果返回大量属性，则速度可能更快。如果只返回 1-2 个属性，则 OPENJSON 函数可能会带来额外负担。
如果需要分析每个文档中的数组，并将其与父行联接，则必须使用该 OPENJSON 函数。

后续步骤

本系列中的下一篇文章将演示如何：

反馈

此页面是否有帮助？

Last updated on 2026-06-11