BULK INSERT (Transact-SQL)

Применимо к:SQL Server База данных SQL AzureУправляемый экземпляр SQL AzureХранилище в Microsoft Fabric

Импортирует файл данных в таблицу базы данных или представление в указанном пользователем формате в SQL Server.

Синтаксис

BULK INSERT
   { database_name.schema_name.table_or_view_name | schema_name.table_or_view_name | table_or_view_name }
      FROM 'data_file'
     [ WITH
    (
   [ [ , ] DATA_SOURCE = 'data_source_name' ]

   -- text formatting options
   [ [ , ] CODEPAGE = { 'RAW' | 'code_page' | 'ACP' | 'OEM' } ]
   [ [ , ] DATAFILETYPE = { 'char' | 'widechar' | 'native' | 'widenative' } ]
   [ [ , ] ROWTERMINATOR = 'row_terminator' ]
   [ [ , ] FIELDTERMINATOR = 'field_terminator' ]
   [ [ , ] FORMAT = 'CSV' ]
   [ [ , ] FIELDQUOTE = 'quote_characters' ]
   [ [ , ] FIRSTROW = first_row ]
   [ [ , ] LASTROW = last_row ]

   -- input file format options
   [ [ , ] FORMATFILE = 'format_file_path' ]
   [ [ , ] FORMATFILE_DATA_SOURCE = 'data_source_name' ]

   -- error handling options
   [ [ , ] MAXERRORS = max_errors ]
   [ [ , ] ERRORFILE = 'file_name' ]
   [ [ , ] ERRORFILE_DATA_SOURCE = 'errorfile_data_source_name' ]

   -- database options
   [ [ , ] KEEPIDENTITY ]
   [ [ , ] KEEPNULLS ]
   [ [ , ] FIRE_TRIGGERS ]
   [ [ , ] CHECK_CONSTRAINTS ]
   [ [ , ] TABLOCK ]

   -- source options
   [ [ , ] ORDER ( { column [ ASC | DESC ] } [ , ...n ] ) ]
   [ [ , ] ROWS_PER_BATCH = rows_per_batch ]
   [ [ , ] KILOBYTES_PER_BATCH = kilobytes_per_batch ]
   [ [ , ] BATCHSIZE = batch_size ]

    ) ]

BULK INSERT
   { database_name.schema_name.table_or_view_name | schema_name.table_or_view_name | table_or_view_name }
      FROM 'data_file'
     [ WITH
    (
   [ [ , ] DATA_SOURCE = 'data_source_name' ]

   -- text formatting options
   [ [ , ] CODEPAGE = { 'code_page' | 'ACP' } ]
   [ [ , ] DATAFILETYPE = { 'char' | 'widechar' } ]
   [ [ , ] ROWTERMINATOR = 'row_terminator' ]
   [ [ , ] FIELDTERMINATOR = 'field_terminator' ]
   [ [ , ] FORMAT = { 'CSV' | 'PARQUET' } ]
   [ [ , ] FIELDQUOTE = 'quote_characters' ]
   [ [ , ] FIRSTROW = first_row ]
   [ [ , ] LASTROW = last_row ]

   -- input file format options
   [ [ , ] FORMATFILE = 'format_file_path' ]
   [ [ , ] FORMATFILE_DATA_SOURCE = 'data_source_name' ]

   -- error handling options
   [ [ , ] MAXERRORS = max_errors ]
   [ [ , ] ERRORFILE = 'file_name' ]
   [ [ , ] ERRORFILE_DATA_SOURCE = 'errorfile_data_source_name' ]

    ) ]

Аргументы

Оператор BULK INSERT имеет различные аргументы и параметры на разных платформах. Различия приведены в следующей таблице:

Особенность	SQL Server	База данных SQL Azure и Управляемый экземпляр SQL Azure	Хранилище данных Fabric
Источник данных	Локальный путь, сетевой путь (UNC) или служба хранилища Azure	Служба хранилища Azure	Служба хранилища Azure, One Lake
Проверка подлинности источника	Проверка подлинности Windows, SAS	Идентификатор Microsoft Entra, маркер SAS, управляемое удостоверение	Идентификатор Microsoft Entra
Неподдерживаемые параметры	`*` Джокеры в пути, `FORMAT = 'PARQUET'`	`*` Джокеры в пути, `FORMAT = 'PARQUET'`	`DATAFILETYPE = {'native' \| 'widenative'}`
Включенные параметры, но без эффекта			`KEEPIDENTITY`, `FIRE_TRIGGERS`, , `CHECK_CONSTRAINTSTABLOCKORDERROWS_PER_BATCHKILOBYTES_PER_BATCH`и `BATCHSIZE` не применимы. Они не вызывают синтаксическую ошибку, но они не имеют никакого эффекта

database_name

Имя базы данных, где находится указанная таблица или представление. Если не указано, в качестве database_name используется текущая база данных.

schema_name

Указывает имя схемы таблицы или представления. Указание аргумента schema_name необязательно, если схемой по умолчанию для пользователя, выполняющего операцию массового импорта, является схема указанной таблицы или представления. Если аргумент schema не указан и схема по умолчанию для пользователя, выполняющего операцию массового импорта, отличается от указанной таблицы или представления, SQL Server возвращает сообщение об ошибке, а операция массового импорта не выполняется.

table_name

Указывает имя таблицы или представления, куда производится массовый импорт данных. Могут указываться только те представления, в которых все столбцы относятся к одной и той же базовой таблице. Для получения дополнительной информации о ограничениях загрузки данных в просмотры см. INSERT.

FROM "data_file"

Указывает полный путь файла данных, который содержит импортируемые в указанную таблицу данные или представление.

BULK INSERT может импортировать данные с диска или служба хранилища Azure (включая сеть, гибкие дискеты, жёсткие диски и так далее).

BULK INSERT bing_covid_19_data
FROM 'C:\\bing_covid-19_data\public\curated\covid-19\latest\bing_covid-19_data.csv';

data_file должен указать допустимый путь от сервера, на котором выполняется SQL Server. Если аргумент data_file является удаленным файлом, указывайте имя в формате UNC. Имя UNC имеет форму \\SystemName\ShareName\Path\FileName. Например:

BULK INSERT bing_covid_19_data
FROM '\\ShareX\bing_covid-19_data\public\curated\covid-19\latest\bing_covid-19_data.csv';

База данных SQL Azure и Fabric Data Warehouse поддерживают чтение данных из URI, но не поддерживают локальные пути к файлам.

BULK INSERT bing_covid_19_data
FROM 'https://<data-lake>.blob.core.windows.net/public/curated/covid-19/bing_covid-19_data/latest/bing_covid-19_data.csv';

Начиная с SQL Server 2017 (14.x), data_file может находиться в служба хранилища Azure. В этом случае также необходимо указать параметр data_source_name. Для примера см. раздел «Импорт данных из файла в служба хранилища Azure».

Хранилище данных Fabric поддерживает два разных стиля путей для указания пути источника:

https://<storage account>.blob.core.windows.net/<container name>/<path to file>
abfss://<container name>@<storage account>.dfs.core.windows.net/<path to file>

Fabric Data Warehouse поддерживает * дикие карты, которые могут совпадать с любым символом в URI, и позволяют определить шаблон URI для файлов, которые нужно импортировать. Например:

BULK INSERT bing_covid_19_data
FROM 'https://<data-lake>.blob.core.windows.net/public/curated/covid-19/bing_covid-19_data/latest/*.csv';

Примечание.

Замените <data-lake>.blob.core.windows.net соответствующим URL-адресом.

ИСТОЧНИК_ДАННЫХ

Применяется к: SQL Server 2017 (14.x) и более поздних версиям, База данных SQL Azure и Warehouse в Microsoft Fabric.

Указывает именованный внешний источник данных, который указывает на корневой адрес служба хранилища Azure для импорта файла.

CREATE EXTERNAL DATA SOURCE pandemicdatalake
WITH (LOCATION = 'https://<data-lake>.blob.core.windows.net/public/');

Примечание.

Замените <data-lake>.blob.core.windows.net соответствующим URL-адресом.

Дополнительные сведения см. в разделе CREATE EXTERNAL DATA SOURCE.

Путь файла в клаузе FROM должен быть относительным, который будет добавлен к корневому уровню, определённому во внешнем источнике данных.

BULK INSERT bing_covid_19_data
FROM 'curated/covid-19/bing_covid-19_data/latest/bing_covid-19_data.csv'
WITH (DATA_SOURCE = 'pandemicdatalake', FIRSTROW = 2, LASTROW = 100, FIELDTERMINATOR = ',');

Примечание.

Для простоты в следующих примерах используются относительные пути и предопределенные внешние источники данных.

CODEPAGE

Указывает кодовую страницу данных в файле данных. CODEPAGE имеет значение, только если данные содержат char, varchar или текстовые столбцы со значениями символов, превышающими 127 или меньше 32. Пример см. в статье об указании кодовой страницы.

BULK INSERT bing_covid_19_data
FROM '/curated/covid-19/bing_covid-19_data/latest/bing_covid-19_data.csv'
WITH (DATA_SOURCE = 'pandemicdatalake', FIRSTROW = 2, CODEPAGE = '65001');

CODEPAGE не поддерживается в Linux для SQL Server 2017 (14.x). Для SQL Server 2019 (15.x) разрешен 'RAW'только CODEPAGE параметр.

Вам необходимо указать имя параметров сортировки для каждого столбца в файле форматирования.

Значение `CODEPAGE`	Описание
`ACP`	Столбцы с типами данных char, varchar или text преобразуются из кодовой страницы ANSI/Microsoft Windows (ISO 1252) в кодовую страницу SQL Server.
`OEM` (по умолчанию)	Столбцы типа данных char, varchar или text преобразуются с системной `OEM` кодовой страницы на кодовую страницу SQL Server.
`RAW`	Преобразование из одной кодовой страницы в другую не выполняется. `RAW` — самый быстрый вариант.
code_page	Номер кодовой страницы, например 850. Версии до SQL Server 2016 (13.x) не поддерживают кодовую страницу 65001 (кодировка UTF-8).

Значение `CODEPAGE`	Описание
`ACP`	Столбцы с типами данных char, varchar или text преобразуются из кодовой страницы ANSI/Microsoft Windows (ISO 1252) в кодовую страницу SQL Server.
code_page	Номер кодовой страницы, например 850. Версии до SQL Server 2016 (13.x) не поддерживают кодовую страницу 65001 (кодировка UTF-8).

DATAFILETYPE

Указывает, что BULK INSERT выполняет операцию импорта с помощью указанного значения типа файла данных.

BULK INSERT bing_covid_19_data
FROM 'curated/covid-19/bing_covid-19_data/latest/bing_covid-19_data.csv'
WITH (DATA_SOURCE = 'pandemicdatalake', FIRSTROW = 2, DATAFILETYPE = 'char');

Примечание.

Замените <data-lake>.blob.core.windows.net соответствующим URL-адресом.

Значение `DATAFILETYPE`	Все данные, представленные в
`char` (по умолчанию)	В символьном формате. Для получения дополнительной информации см . раздел «Использовать формат символа для импорта или экспорта данных».
`widechar`	Знаки Юникода. Для получения дополнительной информации см. раздел «Использовать формат символов Unicode для импорта или экспорта данных».
`native`	В собственных типах базы данных. Создайте собственный файл данных путем массового импорта данных из SQL Server с помощью служебной программы bcp . Значение собственного типа обеспечивает более высокую производительность по сравнению со значением типа char. Собственный формат данных рекомендуется использовать во время массовой передачи данных между несколькими экземплярами SQL Server при помощи файла данных, не содержащего символы в расширенной или в двухбайтовой кодировке (DBCS). Для получения дополнительной информации см. раздел «Использовать родной формат для импорта или экспорта данных».
`widenative`	В собственных типах базы данных, за исключением столбцов типа char, varchar и text, в которых данные хранятся в Юникоде. `widenative` Создайте файл данных путем массового импорта данных из SQL Server с помощью служебной программы bcp. Это `widenative` значение обеспечивает более высокую производительность `widechar`. Если файл данных содержит расширенные символы ANSI, укажите `widenative`. Для получения дополнительной информации см. раздел «Использовать нативный формат Unicode для импорта или экспорта данных».

Значение `DATAFILETYPE`	Все данные, представленные в
`char` (по умолчанию)	В символьном формате. Для получения дополнительной информации см . раздел «Использовать формат символа для импорта или экспорта данных».
`widechar`	Знаки Юникода. Для получения дополнительной информации см. раздел «Использовать формат символов Unicode для импорта или экспорта данных».

MAXERRORS

Указывает максимальное число синтаксических ошибок, допустимых для файла данных, прежде чем операция массового импорта будет отменена. Каждая строка, импорт которой нельзя выполнить при массовом импорте, пропускается и считается как одна ошибка. Если аргумент max_errors не указан, значение по умолчанию равно 10.

BULK INSERT bing_covid_19_data
FROM 'curated/covid-19/bing_covid-19_data/latest/bing_covid-19_data.csv'
WITH (DATA_SOURCE = 'pandemicdatalake', MAXERRORS = 0);

Эта MAX_ERRORS опция не применяется к проверкам ограничений или для конвертации денег и типов данных bigint .

ФАЙЛ ОШИБКИ

Указывает файл, используемый для сбора строк, содержащих ошибки форматирования, которые не могут быть преобразованы в набор строк OLE DB. Эти строки без изменений копируются из файла данных в файл ошибок.

BULK INSERT bing_covid_19_data
FROM 'curated/covid-19/bing_covid-19_data/latest/bing_covid-19_data.csv'
WITH (DATA_SOURCE = 'pandemicdatalake',
      ERRORFILE = 'https://<data-lake>.blob.core.windows.net/public/curated/covid-19/bing_covid-19_data/latest/errors');

Примечание.

Замените <data-lake>.blob.core.windows.net соответствующим URL-адресом.

Файл ошибок создается на стадии выполнения команды. Если он уже существует, возникает ошибка. Кроме того, создается файл управления с расширением .ERROR.txt , который ссылается на каждую строку в файле ошибки и предоставляет диагностику ошибок. После исправления ошибок эти данные могут быть повторно загружены.

Начиная с SQL Server 2017 (14.x), error_file_path может находиться в служба хранилища Azure.

Ошибочный источник данных

Область применения: SQL Server 2017 (14.x) и более поздних версий.

Указывает именованный внешний источник данных, указывающий на адрес служба хранилища Azure файла ошибки для отслеживания ошибок, обнаруженных при импорте.

BULK INSERT bing_covid_19_data
FROM 'curated/covid-19/bing_covid-19_data/latest/bing_covid-19_data.csv'
WITH (
    DATA_SOURCE = 'pandemicdatalake',
    ERRORFILE = 'curated/covid-19/bing_covid-19_data/latest/errors',
    ERRORFILE_DATA_SOURCE = 'pandemicdatalake'
);

Для получения дополнительной информации о создании внешних источников данных см. CREATE EXTERNAL DATA SOURCE.

ПЕРВЫЙ РЯД

Указывает номер первой строки для загрузки. Значение по умолчанию — первая строка указанного файла данных. FIRSTROW — 1 на основе.

BULK INSERT bing_covid_19_data
FROM 'curated/covid-19/bing_covid-19_data/latest/bing_covid-19_data.csv'
WITH (DATA_SOURCE = 'pandemicdatalake', FIRSTROW = 2);

Атрибут FIRSTROW не предназначен для пропуска заголовков столбцов. Инструкция BULK INSERT не поддерживает пропуск заголовков. В случае пропуска строк ядро СУБД SQL Server выполняет поиск только в признаках конца поля и не проверяет данные в полях пропущенных строк.

ЛАСТРОУ

Указывает номер последней строки для загрузки. Значение по умолчанию 0, что обозначает последнюю строку в указанном файле данных.

BATCHSIZE

Указывает число строк в одном пакете. Каждый пакет копируется на сервер за одну транзакцию. Если это не удается, SQL Server фиксирует или откатывает транзакцию для каждого пакета. По умолчанию, все данные, содержащиеся в файле, передаются одним пакетом. Сведения о вопросах производительности см. в этом разделе далее в этой статье.

ПРОВЕРКА_ОГРАНИЧЕНИЙ

Указывает, что при выполнении операции массового импорта будет выполняться проверка всех ограничений целевой таблицы или представления. CHECK_CONSTRAINTS Без параметра все CHECK и FOREIGN KEY ограничения игнорируются, а после операции ограничение таблицы помечается как ненадежный.

UNIQUE и PRIMARY KEY ограничения всегда применяются. При импорте в символьный столбец, определенный с NOT NULL ограничением, BULK INSERT вставляет пустую строку, если в текстовом файле нет значения.

Рано или поздно необходимо проверять всю таблицу на соответствие ограничениям. Если таблица была непустой перед операцией массового импорта, затраты на повторную проверку ограничения могут превысить затраты на применение CHECK ограничений к добавочным данным.

Отключение проверки ограничений (настройка по умолчанию) может потребоваться в тех ситуациях, когда входные данные содержат строки, нарушающие эти ограничения. С CHECK отключенными ограничениями можно импортировать данные, а затем использовать инструкции Transact-SQL для удаления недопустимых данных.

Примечание.

Параметр MAXERRORS не применяется к проверке ограничений.

СОБЫТИЯ_ПОЖАРА

Указывает, что при массовом импорте будут выполняться триггеры типа INSERT, определенные для целевой таблицы. Если триггеры определены для INSERT операций в целевой таблице, они запускаются для каждого завершенного пакета.

Если FIRE_TRIGGERS не указано, триггеры вставки не выполняются.

KEEPIDENTITY

Указывает, что значение или значения идентификаторов в файле импортированных данных будут использоваться для столбца идентификаторов. Если KEEPIDENTITY это не указано, значения удостоверений для этого столбца проверяются, но не импортируются, а SQL Server автоматически назначает уникальные значения на основе значений начального значения и добавок, указанных во время создания таблицы. Если файл данных не содержит значений для столбца идентификаторов в таблице или представлении , укажите в файле форматирования, что столбец идентификаторов в таблице или представлении при импорте данных следует пропустить. В этом случае SQL Server автоматически назначит уникальные значения для этого столбца. Дополнительные сведения см. в статье DBCC CHECKIDENT.

Для получения дополнительной информации см. о сохранении идентификационных значений в разделе «Сохранить значения идентичности при массовом импорте данных».

KEEPNULLS

Указывает, что пустым столбцам при массовом импорте должны присваиваться значения NULL, а не значения по умолчанию, назначенные для этих столбцов. Для получения дополнительной информации см. раздел «Сохранить nulls или значения по умолчанию при массовом импорте».

KILOBYTES_PER_BATCH

Определяет приблизительное число килобайт данных в пакете как kilobytes_per_batch. По умолчанию KILOBYTES_PER_BATCH неизвестно. Сведения о вопросах производительности см. в этом разделе далее в этой статье.

ЗАКАЗ

Указывает, каким образом отсортированы данные в файле. Производительность массового импорта увеличивается, если импортируемые данные упорядочены согласно кластеризованному индексу таблицы (при наличии). Если файл данных отсортирован в порядке, отличном от порядка кластеризованного ключа индекса, или если в таблице нет кластеризованного индекса, предложение ORDER игнорируется. В целевой таблице должны быть указаны имена столбцов. По умолчанию, операция массовой вставки считает, что файл данных не отсортирован. Для оптимизированного массового импорта SQL Server также проверяет, отсортированы ли импортированные данные.

n — это заполнитель, обозначающий возможность указания нескольких столбцов.

ROWS_PER_BATCH

Указывает приблизительное число строк в файле данных.

По умолчанию все данные в файле отправляются на сервер за одну транзакцию, а число строк в пакете оптимизатору запросов неизвестно. При указании ROWS_PER_BATCH (со значением > 0) сервер использует это значение для оптимизации операции массового импорта. Указанное значение ROWS_PER_BATCH должно быть примерно таким же, как фактическое количество строк. Сведения о вопросах производительности см. в этом разделе далее в этой статье.

TABLOCK

Указывает необходимость запроса блокировки уровня таблицы на время выполнения массового импорта. Таблица может загружаться одновременно несколькими клиентами, если таблица не имеет индексов и TABLOCK не указана. По умолчанию работа блокировки определяется параметром таблицы table lock on bulk load. Блокировка на время выполнения массового импорта значительно повышает производительность, позволяя снизить состязание блокировок таблицы. Сведения о вопросах производительности см. в этом разделе далее в этой статье.

Для индекса columnstore блокировка будет действовать иначе из-за внутреннего разделения на множество наборов строк. Каждый поток загружает данные исключительно в каждый набор строк, принимая монопольную блокировку (X) в наборе строк, позволяя параллельно загружать данные с одновременными сеансами загрузки данных. TABLOCK Использование параметра приводит к тому, что поток принимает монопольную блокировку таблицы (в отличие от блокировки массового обновления (BU) для традиционных наборов строк, что предотвращает одновременную загрузку данных другими параллельными потоками.

Параметры формата входного файла

FORMAT

Область применения: SQL Server 2017 (14.x) и более поздних версий.

указывает файл данных с разделителями-запятыми, соответствующий стандарту RFC 4180.

BULK INSERT bing_covid_19_data
FROM 'curated/covid-19/bing_covid-19_data/latest/bing_covid-19_data.csv'
WITH (DATA_SOURCE = 'pandemicdatalake', FORMAT = 'CSV');

В Fabric Data Warehouse оператор BULK INSERT поддерживает те же форматы, что и оператор COPY INTO , поэтому FORMAT = 'PARQUET' также поддерживается.

ПОЛЕВЫЦИТАТА

Область применения: SQL Server 2017 (14.x) и более поздних версий.

Задает символ, используемый в качестве символа кавычки в CSV-файле. Если не указано, символ кавычки (") используется в качестве символа кавычки, как определено в стандарте RFC 4180 .

FORMATFILE

Указывает полный путь к файлу форматирования. Этот файл форматирования содержит описание файла данных — сведения, полученные путем применения программы bcp к той же таблице или представлению.

BULK INSERT bing_covid_19_data
FROM 'curated/covid-19/bing_covid-19_data/latest/bing_covid-19_data.csv'
WITH (DATA_SOURCE = 'pandemicdatalake',
      FORMATFILE = 'https://<data-lake>.blob.core.windows.net/public/curated/covid-19/bing_covid-19_data/latest/bing_covid-19_data.fmt');

Примечание.

Замените <data-lake>.blob.core.windows.net соответствующим URL-адресом.

И предназначен для случаев, когда:

файл данных содержит больше или меньше столбцов, чем таблица или представление;
столбцы расположены в другом порядке;
отличаются разделители столбцов;
- Различающиеся разделители столбцов не поддерживаются в хранилище данных фабрики. В хранилище данных Fabric первый разделитель, определённый в файле формата, применяется ко всем столбцам.
имеются какие-либо другие изменения в формате данных. Файлы форматирования обычно создаются с помощью программы bcp и затем при необходимости изменяются в текстовом редакторе. Для получения дополнительной информации смотрите разделы bcp Utility и Создать файл формата с помощью bcp.

Начиная с SQL Server 2017 (14.x), а в База данных SQL Azure, format_file_path можно использовать в служба хранилища Azure.

FORMATFILE_DATA_SOURCE

Область применения: SQL Server 2017 (14.x) и более поздних версий.

Указывает именованный внешний источник данных, указывающий на адрес служба хранилища Azure файла формата для определения схемы импортированных данных.

BULK INSERT bing_covid_19_data
FROM 'curated/covid-19/bing_covid-19_data/latest/bing_covid-19_data.csv'
WITH (
    DATA_SOURCE = 'pandemicdatalake',
    FORMATFILE = 'curated/covid-19/bing_covid-19_data/latest/bing_covid-19_data.fmt',
    FORMATFILE_DATA_SOURCE = 'pandemicdatalake'
);

FIELDTERMINATOR

Указывает терминатор поля для использования для char файлов данных и widechar данных. По умолчанию, признаком конца поля является символ \t (символ табуляции). Дополнительные сведения см. в разделе "Указание полей и терминаторов строк".

BULK INSERT bing_covid_19_data
FROM '/curated/covid-19/bing_covid-19_data/latest/bing_covid-19_data.csv'
WITH (DATA_SOURCE = 'pandemicdatalake', FIELDTERMINATOR = ',', FIRSTROW = 2);

ROWTERMINATOR

Указывает терминатор строки для char использования и widechar файлов данных.

BULK INSERT bing_covid_19_data
FROM '/curated/covid-19/bing_covid-19_data/latest/bing_covid-19_data.csv'
WITH (DATA_SOURCE = 'pandemicdatalake', ROWTERMINATOR = '\r\n', FIRSTROW = 2);

Стандартный терминатор строки — это \r\n (возврат каретки и символ новой строки). Дополнительные сведения см. в разделе "Указание полей и терминаторов строк".

Совместимость

BULK INSERT применяет строгую проверку данных и проверки данных, считываемые из файла, которые могут привести к сбою существующих скриптов при выполнении недопустимых данных. Например, проверяет, BULK INSERT что:

собственные представления типов данных float или real являются допустимыми;
Данные в Юникоде имеют четную длину.

Типы данных

Преобразования символьного типа данных в десятичный

Преобразования типов данных строки в десятичные значения, используемые в BULK INSERT следующих правилах, как функция Transact-SQL CONVERT , которая отклоняет строки, представляющие числовые значения, использующие научное нотацию. Таким образом, BULK INSERT такие строки рассматриваются как недопустимые значения и сообщения об ошибках преобразования.

Чтобы решить эту проблему, применяется файл форматирования, позволяющий выполнить массовый импорт данных типа float в экспоненциальном представлении в десятичный столбец. В файле форматирования необходимо явно описать столбец с типом данных real или float. Дополнительные сведения об этих типах данных см. в статье float и real.

Файлы форматирования представляют данные real в виде типа данных SQLFLT4, а данные float — в виде типа данных SQLFLT8. Для информации о файлах, не входящих в XML, см. Укажите тип хранения файлов с помощью bcp.

Пример импорта числового значения в экспоненциальном представлении

Этот пример использует следующую таблицу в базе данных bulktest:

CREATE TABLE dbo.t_float
(
    c1 FLOAT,
    c2 DECIMAL (5, 4)
);

Пользователю необходимо выполнить массовый импорт данных в таблицу t_float. Файл данных содержит C:\t_float-c.datданные с плавающей запятой научной нотации; например:

8.0000000000000002E-2 8.0000000000000002E-2

При копировании этого образца следует учитывать, что некоторые текстовые редакторы и кодировки сохраняют символы табуляции (\t) в виде пробелов. Символ табуляции ожидается в этом примере позже.

BULK INSERT Однако не удается импортировать эти данные непосредственно в t_float, так как второй столбец c2использует десятичный тип данных. Поэтому необходим файл форматирования. В нем данные типа float в экспоненциальном представлении должны быть сопоставлены десятичному формату столбца c2.

Следующий файл формата использует тип данных SQLFLT8 для сопоставления второго поля данных со вторым столбцом:

<?xml version="1.0"?>
<BCPFORMAT xmlns="http://schemas.microsoft.com/sqlserver/2004/bulkload/format" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance">
  <RECORD>
    <FIELD ID="1" xsi:type="CharTerm" TERMINATOR="\t" MAX_LENGTH="30" />
    <FIELD ID="2" xsi:type="CharTerm" TERMINATOR="\r\n" MAX_LENGTH="30" />
  </RECORD>
  <ROW>
    <COLUMN SOURCE="1" NAME="c1" xsi:type="SQLFLT8" />
    <COLUMN SOURCE="2" NAME="c2" xsi:type="SQLFLT8" />
  </ROW>
</BCPFORMAT>

Для использования этого файла форматирования (с именем файла C:\t_floatformat-c-xml.xml) при импорте тестовых данных в тестовую таблицу, необходимо выполнить следующую инструкцию Transact-SQL:

BULK INSERT bulktest.dbo.t_float
FROM 'C:\t_float-c.dat'
WITH (FORMATFILE = 'C:\t_floatformat-c-xml.xml');

Внимание

База данных SQL Azure и Fabric Data Warehouse поддерживают чтение только из URI (например, служба хранилища Azure).

Типы данных для массового экспорта или импорта документов SQLXML

Для массового экспорта или импорта данных SQLXML используется один из следующих типов данных в файле форматирования.

Тип данных	Действие
SQLCHAR или SQLVARCHAR	Данные отправляются в кодовой странице клиента или кодовой странице, определенной параметрами сортировки. Эффект совпадает с указанием `DATAFILETYPE = 'char'` без указания файла форматирования.
SQLNCHAR или SQLNVARCHAR	Данные отправляются в Юникоде. Эффект совпадает с указанием `DATAFILETYPE = 'widechar'` без указания файла форматирования.
SQLBINARY или SQLVARBIN	Данные отправляются без преобразования.

Замечания

Для сравнения BULK INSERT оператора, INSERT ... SELECT * FROM OPENROWSET(BULK...) оператора и bcp команды см. раздел «Массовый импорт и экспорт данных».

Сведения о подготовке данных для массового импорта см. в разделе "Подготовка данных для массового экспорта или импорта".

Инструкцию BULK INSERT можно выполнить в определяемой пользователем транзакции для импорта данных в таблицу или представление. При необходимости для использования нескольких совпадений для массового импорта данных транзакция может указать BATCHSIZE предложение в инструкции BULK INSERT . Если откат транзакции с несколькими пакетами выполняется откат, откат выполняется каждый пакет, отправляемый транзакцией в SQL Server.

Совместимость

Импорт данных из CSV-файла

Начиная с SQL Server 2017 (14.x), BULK INSERT поддерживает формат CSV, как и база данных SQL Azure.

До SQL Server 2017 (14.x) файлы со значениями с разделителями-запятыми (CSV) не поддерживаются в операциях массового импорта SQL Server. Но в некоторых случаях файл CSV может использоваться как файл данных для массового импорта данных в SQL Server. Сведения о требованиях к импорту данных из CSV-файла см. в разделе "Подготовка данных для массового экспорта или импорта".

Поведение журнала

Сведения о том, когда операции вставки строк, выполняемые массовым импортом в SQL Server, регистрируются в журнале транзакций, см. в разделе "Предварительные требования для минимального ведения журнала в массовом импорте". Минимальный уровень ведения журнала не поддерживается в базе данных SQL Azure.

Ограничения

При использовании файла BULK INSERTформатирования можно указать только до 1024 полей. Это значение совпадает с максимальным числом столбцов в таблице. При использовании файла форматирования с BULK INSERT файлом данных, содержащим более 1024 полей, BULK INSERT возникает ошибка 4822. Программа bcp не имеет этого ограничения, поэтому для файлов данных, содержащих более 1024 полей, используйте BULK INSERT без файла форматирования или используйте команду bcp .

Замечания, связанные с быстродействием

Если число страниц, которые должны быть записаны на диск в едином пакете, превышает внутренний порог, может быть произведен полный просмотр буферного пула для определения страниц, подлежащих записи на диск при фиксации пакета. Такой полный просмотр может повредить производительности массового импорта. Превышение внутреннего порога может возникнуть, если большой буферный пул работает с медленной подсистемой ввода-вывода. Чтобы избежать переполнения буферов на больших компьютерах, не используйте указание (которое удаляет массовые оптимизации) или используйте TABLOCK меньший размер пакета (который сохраняет массовые оптимизации).

Необходимо протестировать свою рабочую нагрузку с различными размерами пакетов, чтобы определить оптимальный вариант. Помните, что размер пакета имеет последствия частичного отката. Если процесс завершается сбоем и перед повторным использованием BULK INSERT , возможно, потребуется выполнить дополнительную ручную работу, чтобы удалить часть строк, которые были вставлены успешно, до сбоя.

При использовании Базы данных SQL Azure рекомендуется временно увеличить уровень производительности базы данных или экземпляра перед импортом, если вы импортируете большой объем данных.

Безопасность

Делегирование учетных записей безопасности (олицетворение)

Если пользователь использует имя входа SQL Server, используется профиль безопасности учетной записи процесса SQL Server. За пределами ядра СУБД нельзя выполнить проверку подлинности имени входа, проходящего проверку подлинности SQL Server. Поэтому при BULK INSERT запуске команды с помощью проверки подлинности SQL Server подключение к данным выполняется с помощью контекста безопасности учетной записи процесса SQL Server (учетная запись, используемая службой ядра СУБД SQL Server).

Чтобы успешно считывать исходные данные, необходимо предоставить учетную запись, используемую ядром СУБД SQL Server, доступ к исходным данным. В отличие от этого, если пользователь SQL Server входит в систему с помощью проверки подлинности Windows, пользователь может читать только те файлы, к которым можно получить доступ учетной записи пользователя, независимо от профиля безопасности процесса SQL Server.

При выполнении BULK INSERT инструкции с помощью sqlcmd или osql с одного компьютера, вставки данных в SQL Server на втором компьютере и указания data_file на третьем компьютере с помощью UNC-пути может возникнуть ошибка 4861.

Чтобы устранить эту ошибку, используйте проверку подлинности SQL Server и укажите имя входа SQL Server, использующее профиль безопасности учетной записи процесса SQL Server, или настройте Windows для включения делегирования учетных записей безопасности. Дополнительные сведения о том, как сделать учетную запись пользователя доступной для делегирования, см. в справке по Windows.

Для получения дополнительной информации об этом и других аспектах безопасности при использовании BULK INSERTсм. разделы Use BULK INSERT или OPENROWSET(BULK...) для импорта данных в SQL Server.

При импорте из служба хранилища Azure, когда данные не являются публичными (анонимный доступ), создайте DATABASE SCOPED CREDENTIAL на базе SAS-ключа, зашифрованного с мастер-ключом базы данных (DMK), а затем создайте внешний источник базы данных для использования в вашей BULK INSERT команде.

В качестве альтернативы создайте DATABASE SCOPED CREDENTIAL на MANAGED IDENTITY основе для авторизации запросов на доступ к данным в непубличных аккаунтах хранения. При использовании MANAGED IDENTITYслужба хранилища Azure должен предоставлять разрешения управляемой идентичности экземпляра, добавляя встроенную роль Storage Blob Data Contributor (RBAC), которая предоставляет доступ к управляемой идентичности для необходимых контейнеров служба хранилища Azure. Управляемый экземпляр SQL Azure иметь управляемое удостоверение, назначаемое системой, а также может иметь одно или несколько управляемых удостоверений, назначаемых пользователем. Для авторизации запросов можно использовать управляемые удостоверения, назначаемые системой или пользователем. Для авторизации default будет использоваться удостоверение управляемого экземпляра (то есть основное управляемое удостоверение, назначаемое пользователем, или управляемое удостоверение, назначаемое системой, если назначаемое пользователем управляемое удостоверение не указано). Для примера см. раздел «Импорт данных из файла в служба хранилища Azure».

Внимание

Управляемая идентичность применяется к Azure SQL, SQL Server 2025 (17.x) и более поздним версиям.

Разрешения

Следующие разрешения применяются к расположению, в котором данные импортируются массово (целевой объект).

Требуются INSERT и ADMINISTER BULK OPERATIONS разрешения. В Базе данных INSERT SQL Azure и ADMINISTER DATABASE BULK OPERATIONS необходимы разрешения.

Начиная с sql Server 2022 (16.x) накопительного обновления 24 (CU24) и SQL Server 2025 (17.x) накопительного обновления 3 (CU3), SQL Server в Linux поддерживает ADMINISTER BULK OPERATIONS разрешение и роль bulkadmin . В более ранних версиях только роль sysadmin может выполнять массовые вставки для SQL Server в Linux. Дополнительные сведения см. в разделе "Настройка операций массового импорта" для SQL Server в Linux.

Кроме того, требуется разрешение, ALTER TABLE если одно или несколько следующих условий имеет значение true:

Существуют ограничения, и CHECK_CONSTRAINTS параметр не указан.

Ограничения отключены по умолчанию. Чтобы явным образом проверить ограничения, используйте CHECK_CONSTRAINTS этот параметр.
Триггеры существуют, и FIRE_TRIGGER параметр не указан.

Триггеры не срабатывают по умолчанию. Для явного FIRE_TRIGGER срабатывания триггеров используйте этот параметр.
Вы используете KEEPIDENTITY параметр импорта значения удостоверения из файла данных.

Примеры

Примеры кода в этой статье используют базу данных образца AdventureWorks2025 или AdventureWorksDW2025, которую можно скачать с домашней страницы образцов и проектов сообщества Microsoft SQL Server и.

Внимание

База данных SQL Azure и Fabric Warehouse поддерживают только чтение из служба хранилища Azure.

А. Применение символов вертикальной черты для импорта данных из файла

В следующем примере выполняется импорт подробных сведений о заказах из указанного файла данных в таблицу AdventureWorks2022.Sales.SalesOrderDetail, используя символ вертикальной черты (|) в качестве признака конца столбца и |\n в качестве признака конца строки.

BULK INSERT AdventureWorks2022.Sales.SalesOrderDetail
FROM 'f:\orders\lineitem.tbl'
WITH (FIELDTERMINATOR = ' |', ROWTERMINATOR = ' |\n');

В. Применение аргумента FIRE_TRIGGERS

В следующем примере указывается аргумент FIRE_TRIGGERS.

BULK INSERT AdventureWorks2022.Sales.SalesOrderDetail
FROM 'f:\orders\lineitem.tbl'
WITH (FIELDTERMINATOR = ' |', ROWTERMINATOR = ':\n', FIRE_TRIGGERS);

В. Применение символа перевода строки в качестве признака конца строки

В следующем примере производится импорт файла, в котором в качестве признака конца строки используется символ перевода строки, как в файлах UNIX.

DECLARE @bulk_cmd AS VARCHAR (1000);

SET @bulk_cmd = 'BULK INSERT AdventureWorks2022.Sales.SalesOrderDetail
FROM ''<drive>:\<path>\<filename>''
WITH (ROWTERMINATOR = ''' + CHAR(10) + ''')';

EXECUTE (@bulk_cmd);

Примечание.

В Windows \n автоматически заменяется \r\n.

Д. Указание кодовой страницы

В следующем примере показано указание кодовой страницы.

BULK INSERT MyTable
FROM 'D:\data.csv'
WITH (CODEPAGE = '65001', DATAFILETYPE = 'char', FIELDTERMINATOR = ',');

Е. Импорт данных из CSV-файла

В следующем примере показано, как указать CSV-файл с пропуском заголовка (первой строки), используя ; в качестве признака конца поля и 0x0a в качестве признака конца строки:

BULK INSERT Sales.Invoices
FROM '\\share\invoices\inv-2016-07-25.csv'
WITH (
    FORMAT = 'CSV',
    FIRSTROW = 2,
    FIELDQUOTE = '\',
    FIELDTERMINATOR = ';',
    ROWTERMINATOR = '0x0a'
);

В следующем примере показано, как указать CSV-файл в формате UTF-8 (используя CODEPAGE со значением 65001) с пропуском заголовка (первой строки), используя ; в качестве признака конца поля и 0x0a в качестве признака конца строки:

BULK INSERT Sales.Invoices
FROM '\\share\invoices\inv-2016-07-25.csv'
WITH (
    CODEPAGE = '65001',
    FORMAT = 'CSV',
    FIRSTROW = 2,
    FIELDQUOTE = '\',
    FIELDTERMINATOR = ';',
    ROWTERMINATOR = '0x0a'
);

F. Импорт данных из файла в служба хранилища Azure

Загрузка данных из CSV в служба хранилища Azure с помощью токена SAS

Следующий пример показывает, как загрузить данные из CSV-файла в служба хранилища Azure, где вы создали Shared Access Signature (SAS). Местоположение служба хранилища Azure настроено как внешний источник данных, для чего требуется объём данных данных с использованием SAS-ключа, зашифрованного с помощью DMK в пользовательской базе данных.

Примечание.

Убедитесь, что у вас нет запуска ? в токене SAS, и что у вас есть хотя бы разрешение на чтение объекта, который должен быть загружен srt=o&sp=r, и что этот срок действия действителен (все даты указаны в UTC-времени).

(По желанию) DMK не требуется, если a DATABASE SCOPED CREDENTIAL не требуется, потому что blob настроен для публичного (анонимного) доступа.

CREATE MASTER KEY ENCRYPTION BY PASSWORD = '<password>';

(По желанию) A DATABASE SCOPED CREDENTIAL не требуется, потому что blob настроен для публичного (анонимного) доступа.

Не включайте лидера ? в токен SAS. Убедитесь, что у вас есть хотя бы разрешение на чтение объекта, который должен быть загружен (srt=o&sp=r), и что срок действия действителен (все даты указаны в UTC-времени).

CREATE DATABASE SCOPED CREDENTIAL MyAzureBlobStorageCredential
WITH IDENTITY = 'SHARED ACCESS SIGNATURE',
     SECRET = '******srt = sco&sp = rwac&se = 2017-02-01T00:55:34Z&st = 2016-12-29T16:55:34Z***************';

Примечание.

CREDENTIAL не требуется, если blob настроен для публичного (анонимного) доступа.

CREATE EXTERNAL DATA SOURCE MyAzureBlobStorage
WITH (
    TYPE = BLOB_STORAGE,
    LOCATION = 'https://****************.blob.core.windows.net/invoices',
    CREDENTIAL = MyAzureBlobStorageCredential
);

BULK INSERT Sales.Invoices
FROM 'inv-2017-12-08.csv'
WITH (DATA_SOURCE = 'MyAzureBlobStorage');

Загрузка данных из CSV в служба хранилища Azure с управляемой идентичностью

Следующий пример показывает, как BULK INSERT использовать команду для загрузки данных из CSV-файла в хранилище Azure с помощью управляемой идентичности. Местоположение служба хранилища Azure настроено как внешний источник данных.

CREATE MASTER KEY ENCRYPTION BY PASSWORD = '<password>';

(По желанию) A DATABASE SCOPED CREDENTIAL не требуется, так как blob настроен для публичного (анонимного) доступа:

CREATE DATABASE SCOPED CREDENTIAL MyAzureBlobStorageCredential
WITH IDENTITY = 'Managed Identity';

Присвоите роль Storage Blob Data Contributor для предоставления доступа к чтению/записи управляемой идентичности для необходимых контейнеров служба хранилища Azure.

Примечание.

CREDENTIAL не требуется, если blob настроен для публичного (анонимного) доступа.

CREATE EXTERNAL DATA SOURCE MyAzureBlobStorage
WITH (
    TYPE = BLOB_STORAGE,
    LOCATION = 'https://****************.blob.core.windows.net/invoices',
    CREDENTIAL = MyAzureBlobStorageCredential
);

BULK INSERT Sales.Invoices
FROM 'inv-2017-12-08.csv'
WITH (DATA_SOURCE = 'MyAzureBlobStorage');

Внимание

Управляемая идентичность применяется к SQL Server 2025 (17.x) и более поздним версиям, а также к Azure SQL.

G. Импортируйте данные из файла в служба хранилища Azure и укажите файл ошибки

Следующий пример показывает, как загрузить данные из CSV-файла в хранилище Azure, которое настроено как внешний источник данных, а также указать файл ошибки. Необходимы учетные данные базы данных с помощью подписанного URL-адреса. Если запущен на База данных SQL Azure, ERRORFILE опция должна сопровождаться ERRORFILE_DATA_SOURCE, иначе импорт может провалиться с ошибкой прав. Файл, указанный в ERRORFILE контейнере, не должен существовать.

BULK INSERT Sales.Invoices
FROM 'inv-2017-12-08.csv'
WITH (
    DATA_SOURCE = 'MyAzureInvoices',
    FORMAT = 'CSV',
    ERRORFILE = 'MyErrorFile',
    ERRORFILE_DATA_SOURCE = 'MyAzureInvoices'
);

Для полных BULK INSERT примеров, включая настройку учетных данных и внешнего источника данных, см. Примеры массового доступа к данным в служба хранилища Azure.

Дополнительные примеры

Другие примеры использования BULK INSERT приведены в следующих статьях:

Обратная связь

Были ли сведения на этой странице полезными?

Last updated on 2026-07-21

BULK INSERT (Transact-SQL)

Синтаксис

Аргументы

database_name

schema_name

table_name

FROM "data_file"

ИСТОЧНИК_ДАННЫХ

CODEPAGE

DATAFILETYPE

MAXERRORS

ФАЙЛ ОШИБКИ

Ошибочный источник данных

ПЕРВЫЙ РЯД

ЛАСТРОУ

BATCHSIZE

ПРОВЕРКА_ОГРАНИЧЕНИЙ

СОБЫТИЯ_ПОЖАРА

KEEPIDENTITY

KEEPNULLS

KILOBYTES_PER_BATCH

ЗАКАЗ

ROWS_PER_BATCH

TABLOCK

Параметры формата входного файла

FORMAT

ПОЛЕВЫЦИТАТА

FORMATFILE

FORMATFILE_DATA_SOURCE

FIELDTERMINATOR

ROWTERMINATOR

Совместимость

Типы данных

Преобразования символьного типа данных в десятичный

Пример импорта числового значения в экспоненциальном представлении

Типы данных для массового экспорта или импорта документов SQLXML

Замечания

Совместимость

Импорт данных из CSV-файла

Поведение журнала

Ограничения

Замечания, связанные с быстродействием

Безопасность

Делегирование учетных записей безопасности (олицетворение)

Разрешения

Примеры

А. Применение символов вертикальной черты для импорта данных из файла

В. Применение аргумента FIRE_TRIGGERS

В. Применение символа перевода строки в качестве признака конца строки

Д. Указание кодовой страницы

Е. Импорт данных из CSV-файла

F. Импорт данных из файла в служба хранилища Azure

Загрузка данных из CSV в служба хранилища Azure с помощью токена SAS

Загрузка данных из CSV в служба хранилища Azure с управляемой идентичностью

G. Импортируйте данные из файла в служба хранилища Azure и укажите файл ошибки

Дополнительные примеры

Связанный контент

Обратная связь

Дополнительные ресурсы