使用 BULK INSERT 或 OPENROWSET(BULK...) 导入数据到 SQL Server
适用于:SQL Server Azure SQL 数据库 Azure SQL 托管实例
本文概述了如何使用 Transact-SQL BULK INSERT 语句和 INSERT...SELECT * FROM OPENROWSET(BULK...) 语句将数据从某一数据文件批量导入到 SQL Server 或 Azure SQL 数据库表中。 本文还说明了使用 BULK INSERT 和 OPENROWSET(BULK...) 以及使用这些方法从远程数据源批量导入数据的安全注意事项。
注意
在使用 BULK INSERT 或 OPENROWSET(BULK...) 时,请务必了解 SQL Server 版本处理模拟的方式。 有关详细信息,请参阅本主题后面的“安全注意事项”。
BULK INSERT 语句
BULK INSERT 将数据从数据文件加载到表中。 此功能与 bcp 命令的 in 选项提供的功能相似,但是数据文件将由 SQL Server 进程读取。 有关 BULK INSERT 语法的说明,请参阅 BULK INSERT (Transact-SQL)。
BULK INSERT 示例
- BULK INSERT
- 批量导入和导出 XML 文档的示例
- 批量导入数据时保留标识值
- 在批量导入期间保留 Null 或使用默认值
- 指定字段终止符和行终止符
- 使用格式化文件批量导入数据
- 使用字符格式导入或导出数据
- 使用本机格式导入或导出数据
- 使用 Unicode 字符格式导入或导出数据
- 使用 Unicode 本机格式导入或导出数据
- 使用格式化文件跳过表列
- 使用格式化文件将表列映射到数据文件字段
OPENROWSET(BULK…)函数
通过调用 OPENROWSET 函数并指定 BULK 选项,访问 OPENROWSET 大容量行集提供程序。 使用 OPENROWSET(BULK...) 函数可以通过 OLE DB 访问接口连接到远程数据源(如数据文件)以访问远程数据。
若要大容量导入数据,请从 INSERT 语句中的 SELECT...FROM 子句调用 OPENROWSET(BULK...)。 大容量导入数据的基本语法如下:
INSERT ... SELECT * FROM OPENROWSET(BULK...)
在 INSERT 语句中使用时,OPENROWSET(BULK...) 支持表提示。 除了常规表提示(例如 TABLOCK),BULK 子句还可以接受以下专用表提示:IGNORE_CONSTRAINTS(仅忽略 CHECK 约束)、IGNORE_TRIGGERS、KEEPDEFAULTS 和 KEEPIDENTITY。 有关详细信息,请参阅表提示 (Transact-SQL)。
有关 BULK 选项的更多使用信息,请参阅 OPENROWSET (Transact-SQL)。
INSERT...SELECT * FROM OPENROWSET(BULK...) 语句 - 示例
- 批量导入和导出 XML 文档的示例
- 批量导入数据时保留标识值
- 在批量导入期间保留 Null 或使用默认值
- 使用格式化文件批量导入数据
- 使用字符格式导入或导出数据
- 使用格式化文件跳过表列
- 使用格式化文件跳过数据字段
- 使用格式化文件将表列映射到数据文件字段
安全注意事项
如果用户使用的是 SQL Server 登录名,则系统将使用 SQL Server 进程帐户的安全配置文件。 使用 SQL Server 身份验证的登录名不能在数据库引擎外部进行身份验证。 因此,当 BULK INSERT 命令由使用 SQL Server 身份验证的登录名启动时,使用 SQL Server 进程帐户(SQL Server 数据库引擎服务使用的帐户)的安全上下文建立到数据的连接。
要成功读取源数据,你必须授予 SQL Server 数据库引擎使用的帐户访问源数据的权限。 与此相反,如果 SQL Server 用户使用 Windows 身份验证登录,则该用户只能读取用户帐户可以访问的那些文件,而不考虑 SQL Server 进程的安全配置文件。
例如,假设用户使用 Windows 身份验证登录到某个 SQL Server 实例。 对于能够使用 BULK INSERT 或 OPENROWSET 将数据从数据文件导入 SQL Server 表中的用户,用户帐户需要具有数据文件的读取权限。 有了数据文件的访问权限,即使 SQL Server 进程没有访问该文件的权限,用户也可以将数据从文件导入表中。 用户无需将文件访问权限授予 SQL Server 进程。
SQL Server 和 Microsoft Windows,使得一个 SQL Server 实例可以通过转发已经过身份验证的 Windows 用户的凭据来连接到另一个 SQL Server 实例。 这种安排称为“模拟” 或“委托” 。 在使用 BULK INSERT 或 OPENROWSET 时,请务必了解 SQL Server 版本是如何处理用户模拟的安全性的。 用户模拟允许数据文件保存在 SQL Server 进程或用户所在的计算机以外的另一台计算机上。 例如,如果 Computer_A 上的用户具有对 Computer_B上的数据文件的访问权限,而且凭据委托已设置妥当,则用户可以连接到运行在 SQL Server Computer_C 上的实例,访问 Computer_B中的数据文件以及将数据从该文件大容量导入到 Computer_C中的表中。
从远程数据文件批量导入到 SQL Server
若要使用 BULK INSERT 或 INSERT...SELECT * FROM OPENROWSET(BULK...) 从其他计算机中大容量导入数据,必须在两台计算机之间共享数据文件。 若要指定共享数据文件,请使用它的通用命名约定 (UNC) 名称,其一般形式为 \\Servername\Sharename\Path\Filename。 此外,用来访问该数据文件的帐户必须具有读取远程磁盘上的文件所需的权限。
例如,下面的 BULK INSERT
语句会将名为 SalesOrderDetail
的数据文件中的数据大容量导入到 AdventureWorks
数据库的 newdata.txt
表。 此数据文件驻留在系统 \dailyorders
的 salesforce
网络共享目录下的 computer2
共享文件夹中。
BULK INSERT AdventureWorks2022.Sales.SalesOrderDetail
FROM '\\computer2\salesforce\dailyorders\neworders.txt';
注意
此限制不适用于 bcp 实用工具,因为客户端独立于 SQL Server 读取文件。
从 Azure Blob 存储批量导入
从 Azure Blob 存储导入数据且数据非公共数据(匿名访问)时,请基于使用 MASTER KEY 加密的 SAS 密钥创建一个 DATABASE SCOPED CREDENTIAL,然后创建一个外部数据库源以用于 BULK INSERT 命令。
或者,基于 MANAGED IDENTITY
创建 DATABASE SCOPED CREDENTIAL,以对有关访问非公共存储帐户中的数据的请求授权。 使用 MANAGED IDENTITY
时,Azure 存储必须通过添加“存储 Blob 数据参与者”内置 Azure 基于角色的访问控制 (RBAC) 角色来授予对实例的托管标识的权限,该角色为必要的Azure Blob 存储容器提供对托管标识的读/写访问权限。 Azure SQL 托管实例具有系统分配的托管标识,还可以具有一个或多个用户分配的托管标识。 可以使用系统分配的托管标识或用户分配的托管标识来授权请求。 对于授权,将使用托管实例的 default
标识(即主要用户分配的托管标识,如果未指定用户分配的托管标识,则为系统分配的托管标识)。
重要
托管标识仅适用于 Azure SQL。 SQL Server 不支持托管标识。
注意
请勿使用显式事务,否则将收到 4861 错误。
使用 BULK INSERT
下面的示例演示如何使用 BULK INSERT 命令从已创建 SAS 密钥的 Azure Blob 存储位置中的 csv 文件加载数据。 Azure Blob 存储位置配置为外部数据源。 这需要使用共享访问签名的数据库范围的凭据,该签名通过用户数据库中的主密钥进行加密。
--> Optional - a MASTER KEY is not required if a DATABASE SCOPED CREDENTIAL is not required because the blob is configured for public (anonymous) access!
CREATE MASTER KEY ENCRYPTION BY PASSWORD = 'YourStrongPassword1';
GO
--> Optional - a DATABASE SCOPED CREDENTIAL is not required because the blob is configured for public (anonymous) access!
CREATE DATABASE SCOPED CREDENTIAL MyAzureBlobStorageCredential
WITH IDENTITY = 'SHARED ACCESS SIGNATURE',
SECRET = '******srt=sco&sp=rwac&se=2017-02-01T00:55:34Z&st=2016-12-29T16:55:34Z***************';
-- NOTE: Make sure that you don't have a leading ? in SAS token, and
-- that you have at least read permission on the object that should be loaded srt=o&sp=r, and
-- that expiration period is valid (all dates are in UTC time)
CREATE EXTERNAL DATA SOURCE MyAzureBlobStorage
WITH ( TYPE = BLOB_STORAGE,
LOCATION = 'https://****************.blob.core.windows.net/invoices'
, CREDENTIAL= MyAzureBlobStorageCredential --> CREDENTIAL is not required if a blob is configured for public (anonymous) access!
);
BULK INSERT Sales.Invoices
FROM 'inv-2017-12-08.csv'
WITH (DATA_SOURCE = 'MyAzureBlobStorage');
下面的示例演示如何使用 BULK INSERT 命令通过托管标识从 Azure Blob 存储位置中的 csv 文件加载数据。 Azure Blob 存储位置配置为外部数据源。
--> Optional - a MASTER KEY is not required if a DATABASE SCOPED CREDENTIAL is not required because the blob is configured for public (anonymous) access!
CREATE MASTER KEY ENCRYPTION BY PASSWORD = 'YourStrongPassword1';
GO
--> Optional - a DATABASE SCOPED CREDENTIAL is not required because the blob is configured for public (anonymous) access!
CREATE DATABASE SCOPED CREDENTIAL MyAzureBlobStorageCredential
WITH IDENTITY = 'Managed Identity';
-- NOTE: Make sure you have granted Storage Bob Data Contributor RBAC on storage to provides read/write access to the managed identity for the necessary Azure Blob Storage containers.
CREATE EXTERNAL DATA SOURCE MyAzureBlobStorage
WITH ( TYPE = BLOB_STORAGE,
LOCATION = 'https://****************.blob.core.windows.net/invoices'
, CREDENTIAL= MyAzureBlobStorageCredential --> CREDENTIAL is not required if a blob is configured for public (anonymous) access!
);
BULK INSERT Sales.Invoices
FROM 'inv-2017-12-08.csv'
WITH (DATA_SOURCE = 'MyAzureBlobStorage');
重要
托管标识仅适用于 Azure SQL。 SQL Server 不支持托管标识。
Azure SQL 数据库不支持从 Windows 文件读取内容。
使用 OPENROWSET
下面的示例演示如何使用 OPENROWSET 命令从已创建 SAS 密钥的 Azure Blob 存储位置中的 csv 文件加载数据。 Azure Blob 存储位置配置为外部数据源。 这需要使用共享访问签名的数据库范围的凭据,该签名通过用户数据库中的主密钥进行加密。
--> Optional - a MASTER KEY is not required if a DATABASE SCOPED CREDENTIAL is not required because the blob is configured for public (anonymous) access!
CREATE MASTER KEY ENCRYPTION BY PASSWORD = 'YourStrongPassword1';
GO
--> Optional - a DATABASE SCOPED CREDENTIAL is not required because the blob is configured for public (anonymous) access!
CREATE DATABASE SCOPED CREDENTIAL MyAzureBlobStorageCredential
WITH IDENTITY = 'SHARED ACCESS SIGNATURE',
SECRET = '******srt=sco&sp=rwac&se=2017-02-01T00:55:34Z&st=2016-12-29T16:55:34Z***************';
-- NOTE: Make sure that you don't have a leading ? in SAS token, and
-- that you have at least read permission on the object that should be loaded srt=o&sp=r, and
-- that expiration period is valid (all dates are in UTC time)
CREATE EXTERNAL DATA SOURCE MyAzureBlobStorage
WITH ( TYPE = BLOB_STORAGE,
LOCATION = 'https://****************.blob.core.windows.net/invoices'
, CREDENTIAL= MyAzureBlobStorageCredential --> CREDENTIAL is not required if a blob is configured for public (anonymous) access!
);
INSERT INTO achievements with (TABLOCK) (id, description)
SELECT * FROM OPENROWSET(
BULK 'csv/achievements.csv',
DATA_SOURCE = 'MyAzureBlobStorage',
FORMAT ='CSV',
FORMATFILE='csv/achievements-c.xml',
FORMATFILE_DATA_SOURCE = 'MyAzureBlobStorage'
) AS DataFile;
重要
Azure SQL 数据库不支持从 Windows 文件读取内容。