将 JSON 文档导入 SQL Server
适用范围:SQL Server 2016 (13.x) 及更高版本 Azure SQL 数据库 Azure SQL 托管实例
本文介绍如何将 JSON 文件导入 SQL Server。 JSON 文档存储许多类型的数据,例如应用程序日志、传感器数据等。 必须能够读取文件中存储的 JSON 数据、将数据载入 SQL Server 和分析数据。
本文章中的示例使用来自 GitHub 示例的 JSON 文件,其中包含书籍列表。
权限
在实例级别,此功能需要 bulkadmin 固定服务器角色的成员身份或 ADMINISTER BULK OPERATIONS
权限。
对于数据库级别,此功能需要 ADMINISTER DATABASE BULK OPERATIONS
权限。
访问Azure Blob 存储需要读写访问权限。
将 JSON 文档导入单个列
OPENROWSET(BULK)
是一个表值函数,如果 SQL Server 对本地驱动器或网络中的任一文件拥有读取访问权限,则该函数可从该文件中读取数据。 该函数返回包含单个列的表,该列包含文件的内容。 可以结合 OPENROWSET(BULK)
函数使用各种选项,例如分隔符。 但是,最简单的用法是将整个文件内容作为文本值加载。 (这单个大型值称为单字符大型对象或 SINGLE_CLOB。)
此处为 OPENROWSET(BULK)
函数的示例,其读取 JSON 文件的内容,然后以单个值的形式将该内容返回给用户:
SELECT BulkColumn
FROM OPENROWSET(BULK 'C:\JSON\Books\book.json', SINGLE_CLOB) as j;
OPENJSON(BULK)
读取文件的内容并在 BulkColumn
中返回该内容。
也可以将文件内容载入局部变量或表中,如下面的示例所示:
-- Load file contents into a variable
DECLARE @json NVARCHAR(MAX);
SELECT @json = BulkColumn
FROM OPENROWSET(BULK 'C:\JSON\Books\book.json', SINGLE_CLOB) as j
-- Load file contents into a table
SELECT BulkColumn
INTO #temp
FROM OPENROWSET(BULK 'C:\JSON\Books\book.json', SINGLE_CLOB) as j
加载 JSON 文件的内容后便可在表中保存 JSON 文本。
从 Azure 文件存储导入 JSON 文档
可以使用先前所述 OPENROWSET(BULK)
从 SQL Server 可访问的其他文件位置读取 JSON 文件。 例如,Azure 文件存储支持 SMB 协议。 因此,你可以使用以下过程将本地虚拟驱动器映射到 Azure 文件存储共享:
使用 Azure 门户或 Azure PowerShell 在 Azure 文件存储中创建一个文件存储帐户(例如
mystorage
)、一个文件共享(例如sharejson
)和一个文件夹。将一些 JSON 文件上载到文件存储共享。
在计算机上的 Windows 防火墙中创建一个允许端口 445 的出站防火墙规则。 Internet 服务提供商可能会阻止此端口。 如果以下步骤出现 DNS 错误(错误 53),则表示尚未打开端口 445,或者 ISP 阻止了该端口。
将 Azure 文件存储共享装载为本地驱动器(例如
T:
)。下面是命令语法:
net use [drive letter] \\[storage name].file.core.windows.net\[share name] /u:[storage account name] [storage account access key]
下面是向 Azure 文件存储共享分配本地驱动器号
T:
的示例:net use t: \\mystorage.file.core.windows.net\sharejson /u:myaccount hb5qy6eXLqIdBj0LvGMHdrTiygkjhHDvWjUZg3Gu7bubKLg==
可以在 Azure 门户上“设置”对话框的“密钥”部分中找到存储帐户密钥以及主要或辅助存储帐户访问密钥。
现在,可使用映射驱动器通过 Azure 文件存储共享访问 JSON 文件,如下面的示例中所示:
SELECT book.* FROM OPENROWSET(BULK N't:\books\books.json', SINGLE_CLOB) AS json CROSS APPLY OPENJSON(BulkColumn) WITH ( id NVARCHAR(100), name NVARCHAR(100), price FLOAT, pages_i INT, author NVARCHAR(100) ) AS book
有关 Azure 文件存储的详细信息,请参阅文件存储。
从 Azure Blob 存储导入 JSON 文档
适用于:SQL Server 2017 (14.x) 及更高版本和 Azure SQL
可以使用 T-SQL BULK INSERT 命令或 OPENROWSET
函数,将文件从 Azure Blob 存储直接载入 Azure SQL 数据库。
首先,按下面的示例所示创建外部数据源。
CREATE EXTERNAL DATA SOURCE MyAzureBlobStorage
WITH (
TYPE = BLOB_STORAGE,
LOCATION = 'https://myazureblobstorage.blob.core.windows.net',
CREDENTIAL = MyAzureBlobStorageCredential
);
接下来,结合 DATA_SOURCE 选项运行 BULK INSERT 命令。
BULK INSERT Product
FROM 'data/product.dat'
WITH ( DATA_SOURCE = 'MyAzureBlobStorage');
在行和列中分析 JSON 文档
你可能不希望以单个值的形式读取整个 JSON 文件,而是希望分析该文件,并将文件中的书籍及其属性以行和列的形式返回。
示例 1
在最简单的示例中,可以只从文件中加载整个列表。
SELECT value
FROM OPENROWSET(BULK 'C:\JSON\Books\books.json', SINGLE_CLOB) AS j
CROSS APPLY OPENJSON(BulkColumn);
上述 OPENROWSET
从文件中读取单个文本值。 OPENROWSET
将值作为 BulkColumn 返回,并将 BulkColumn 传递给 OPENJSON
函数。 OPENJSON
循环访问 BulkColumn 数组中 JSON 对象的数组,并在每行中返回一本书籍。 每行格式为 JSON,如下所示。
{"id":"978-0641723445", "cat":["book","hardcover"], "name":"The Lightning Thief", ... }
{"id":"978-1423103349", "cat":["book","paperback"], "name":"The Sea of Monsters", ... }
{"id":"978-1857995879", "cat":["book","paperback"], "name":"Sophie's World : The Greek", ... }
{"id":"978-1933988177", "cat":["book","paperback"], "name":"Lucene in Action, Second", ... }
示例 2
OPENJSON
函数可分析 JSON 内容,并将其转换为表或结果集。 下面的示例加载内容,分析加载的 JSON,然后以列的形式返回五个字段:
SELECT book.*
FROM OPENROWSET(BULK 'C:\JSON\Books\books.json', SINGLE_CLOB) AS j
CROSS APPLY OPENJSON(BulkColumn) WITH (
id NVARCHAR(100),
name NVARCHAR(100),
price FLOAT,
pages_i INT,
author NVARCHAR(100)
) AS book;
在此示例中,OPENROWSET(BULK)
读取文件的内容,并使用定义的架构将该内容传递给 OPENJSON
函数,以便输出内容。 OPENJSON
使用列名匹配 JSON 对象中的属性。 例如,price
属性将以 price
列的形式返回,并转换为浮点数据类型。 结果如下:
Id | 名称 | price | pages_i | 作者 |
---|---|---|---|---|
978-0641723445 | The Lightning Thief | 12.5 | 384 | Rick Riordan |
978-1423103349 | The Sea of Monsters | 6.49 | 304 | Rick Riordan |
978-1857995879 | Sophie’s World : The Greek Philosophers | 3.07 | 64 | Jostein Gaarder |
978-1933988177 | Lucene in Action, Second Edition | 30.5 | 475 | Michael McCandless |
现在,可将此表返回给用户,或者将数据载入另一个表。