Мастер импорта неструктурированных файлов в SQL

Применяется к:SQL ServerAzure SQL DatabaseAzure, управляемому экземпляру SQL Azure

Сведения о мастере импорта и экспорта см. в разделе Мастер импорта и экспорта SQL Server.

Мастер импорта неструктурированных файлов позволяет легко скопировать данные из неструктурированного файла (CSV-файл, TXT-файл) в новую таблицу в вашей базе данных. Мастер импорта неструктурированных файлов поддерживает файлы форматирования с разделителями-запятыми и с фиксированной шириной. В этом обзоре описано, почему нужно использовать этот мастер, как его найти, а также приведен простой пример.

Почему нужно использовать этот мастер?

Этот мастер создан на основе интеллектуальной платформы Program Synthesis using Examples (PROSE) и позволяет улучшить текущий процесс импорта. Для пользователей, которые не обладают глубокими знаниями в предметной области, импорт данных часто представляет собой трудную и утомительную задачу, чреватую ошибками. При использовании мастера достаточно указать входной файл и уникальное имя таблицы, и платформа PROSE сделает все остальное.

PROSE анализирует шаблоны данных во входном файле и определяет имена столбцов, типы, разделители и т. д. Платформа запоминает структуру файла и выполняет все действия по обработке данных.

Предварительные требования

Эта функция доступна в SQL Server Management Studio (SSMS) 17.3 и более поздних версий. Убедитесь, что вы используете последнюю версию. Ее можно найти здесь.

Приступая к работе

Чтобы открыть мастер импорта неструктурированных файлов, выполните следующие действия.

  1. Откройте SQL Server Management Studio.
  2. Подключитесь к экземпляру ядра СУБД SQL Server или к узлу localhost.
  3. Разверните узел Базы данных, щелкните правой кнопкой мыши базу данных ("test" в примере ниже), выберите Задачи, а затем — Импорт неструктурированного файла над пунктом меню "Импорт данных".

Wizard menu

Дополнительные сведения о различных функциях мастера см. в следующем руководстве:

Руководство

При выполнении действий, описанных в этом учебнике, вы можете использовать свой собственный неструктурированный файл. Если у вас нет собственного файла, можете скопировать следующий CSV-файл из Excel. Назовите этот файл example.csv и сохраните его в формате CSV в удобном месте, например на рабочем столе.

Wizard Excel

Общие сведения.

  1. Мастер доступа
  2. Указание входного файла
  3. Предварительный просмотр данных
  4. Изменение столбцов
  5. Сводка
  6. Результаты

Шаг 1. Открытие мастера и страница "Приступая к работе"

Откройте мастер, как описано здесь.

Первая страница мастера — это страница приветствия. Если вы не хотите, чтобы она открывалась снова, установите флажок Больше не показывать это окно.

Wizard Intro

Шаг 2. Указание входного файла

Нажмите кнопку "Обзор", чтобы выбрать входной файл. По умолчанию мастер ищет файлы в форматах CSV и TXT. PROSE определит, является ли это файлом с разделителями-запятыми или с фиксированной шириной, независимо от расширения файла.

Имя новой таблицы должно быть уникальным. В противном случае вы не сможете продолжить работу мастера.

Wizard Specify

Шаг 3. Предварительный просмотр данных

Мастер открывает окно предварительного просмотра для первых 50 строк данных. Если в данных есть ошибки, нажмите кнопку "Отмена". В противном случае перейдите к следующей странице.

Wizard Preview

Шаг 4. Изменение столбцов

Мастер определяет, что он считает правильными именами столбцов, типами данных и т. д. Здесь можно изменить поля, если они неверны (например, тип данных должен быть плавающей, а не int).

Столбцы, в которых обнаруживаются пустые значения, будут иметь флажок "Разрешить значения NULL". Однако если в столбце предполагается наличие значений NULL, а флажок "Разрешить значения NULL" не установлен, здесь можно обновить определение таблицы, чтобы разрешить значения NULL в одном или во всех столбцах.

Когда все будет готово, нажмите кнопку "Далее".

Wizard Modify

Шаг 5. Сводка

Это страница сводки, на которой отображается текущая конфигурация. Если возникли проблемы, можно вернуться к предыдущим страницам мастера. В противном случае нажмите кнопку "Готово", чтобы начать импорт.

Wizard Summary

Шаг 6. Результаты

На этой странице показан результат импорта. Если на ней есть зеленая галочка, импорт завершен успешно. В противном случае проверьте конфигурацию и входной файл на наличие ошибок.

Wizard Results

Устранение неполадок

Мастер импорта неструктурированных файлов определяет типы данных на основе первых 200 строк. В сценариях, где данные, расположенные в неструктурированном файле, не соответствуют автоматически обнаруженным типам данных, во время импорта возникнет ошибка. Сообщение об ошибке будет выглядеть следующим образом:

Error inserting data into table. (Microsoft.SqlServer.Prose.Import)
The given value of type String from the data source cannot be converted to type nvarchar of the specified target column. (System.Data)
String or binary data would be truncated. (System.Data)

Тактики устранения этой ошибки:

  • Расширение размера(ов) типа данных на шаге Изменение столбцов, например длины столбца nvarchar, может компенсировать отклонения данных от остальной части неструктурированного файла.
  • Включение отчета об ошибках на шаге Изменение столбцов, особенно по меньшему числу, покажет, какие строки в неструктурированном файле содержат данные, не соответствующие выбранным типам данных. Например, в неструктурированном файле, где во второй строке появляется ошибка, при выполнении импорта с отчетом об ошибках с диапазоном 1 появляется конкретное сообщение об ошибке. Проверка файла непосредственно в расположении может обеспечить более точные изменения типов данных на основе данных в определенных строках.

Error Reporting Results

Error inserting data into table occured while inserting rows 1 - 2. (Microsoft.SqlServer.Prose.Import)
The given value of type String from the data source cannot be converted to type float of the specified target column. (System.Data)
Failed to convert parameter value from a String to a Double. (System.Data)

В настоящее время импортер использует кодировку на основе активной кодовой страницы системы. На большинстве компьютеров по умолчанию используется ANSI.

Подробнее

Дополнительные сведения о мастере.

  • Дополнительные сведения об импорте из других источников. Если вы хотите импортировать несколько неструктурированных файлов, обратитесь к разделу Мастер импорта и экспорта SQL Server.
  • Дополнительные сведения о подключении к неструктурированным файлам в качестве источников. Если вам необходимы дополнительные сведения о подключении к неструктурированным файлам в качестве источников, обратитесь к разделу Подключение к источнику данных неструктурированного файла.
  • Дополнительные сведения о PROSE. Если вам необходимы сведения об интеллектуальной платформе, которая используется этим мастером, обратитесь к разделу Пакет SDK для PROSE.