Поделиться через


Источник "Гибкая работа с файлами"

Область применения: среда выполнения интеграции SSIS SQL Server в Фабрика данных Azure

Источник Гибкая работа с файлами позволяет пакету служб SSIS считывать данные из различных поддерживаемых служб хранилища. Сейчас поддерживаются службы хранилища

Чтобы отобразить редактор источника "Гибкая работа с файлами", перетащите источник Гибкая работа с файлами в конструктор потока данных и дважды щелкните его, чтобы открыть редактор.

Источник Гибкая работа с файлами входит в состав пакета дополнительных компонентов SQL Server Integration Services (SSIS) для Azure.

Доступны следующие свойства редактора "Гибкая работа с файлами".

  • Тип файла диспетчер подключений: указывает тип диспетчера исходных соединений. Затем выберите один из указанных типов или создайте новый.
  • Путь к папке: указывает путь к исходной папке.
  • Имя файла: указывает имя исходного файла.
  • Формат файла: задает формат исходного файла. Поддерживаемые форматы: текст, Avro, ORC, Parquet. Java требуется для ORC/Parquet. Подробные сведения см. здесь.
  • Символ разделителя столбцов: указывает символ, используемый в качестве разделителя столбцов (многозначные разделители не поддерживаются).
  • Первая строка в качестве имени столбца: указывает, следует ли рассматривать первую строку как имена столбцов.
  • Распаковка файла: указывает, следует ли распаковывать исходный файл.
  • Тип сжатия: указывает формат сжатия исходного файла. Поддерживаемые форматы: GZIP, DEFLATE, BZIP2.

Доступны следующие свойства расширенного редактора.

  • rowDelimiter: символ, используемый для разделения строк в файле. Допускается только один знак. Значение по умолчанию — \r\n.
  • escapeChar: специальный символ, используемый для экранирования разделителя столбцов в содержимом входного файла. Не следует указывать escapeChar и quoteChar для таблицы одновременно. Допускается только один знак. Нет значения по умолчанию.
  • quoteChar: символ, используемый для кавычки строкового значения. Разделители столбцов и строк внутри знаков кавычек будут рассматриваться как часть строкового значения. Это свойство применяется к входному и выходному наборам данных. Не следует указывать escapeChar и quoteChar для таблицы одновременно. Допускается только один знак. Нет значения по умолчанию.
  • nullValue: один или несколько символов, используемых для представления значения NULL. Значением по умолчанию является \N.
  • encodingName: укажите имя кодирования. См. раздел Encoding.EncodingName.
  • skipLineCount: указывает количество непустых строк, которые нужно пропустить при чтении данных из входных файлов. Если указаны skipLineCount и firstRowAsHeader, то сначала пропускаются строки, а затем считываются данные заголовка из входного файла.
  • treatEmptyAsNull: указывает, следует ли рассматривать null или пустую строку как значение NULL при чтении данных из входного файла. Значение по умолчанию — true.

Указав сведения о соединении, переключитесь на страницу Столбцы, чтобы сопоставить столбцы источника со столбцами назначения для потока данных служб SSI.

Примечания о настройке разрешений для субъекта-службы

Для работы тестового подключения (к хранилищу BLOB-объектов или Data Lake Storage 2-го поколения) субъекту-службе следует назначить по крайней мере роль Читатель данных в хранилище BLOB-объектов в учетной записи хранения. Это осуществляется посредством управление доступом на основе ролей (RBAC).

Для хранилища BLOB-объектов разрешение на чтение предоставляется путем назначения по крайней мере роли Читатель данных в хранилище BLOB-объектов.

Для Data Lake Storage 2-го поколения разрешение определяется как посредством управления доступом на основе ролей (RBAC), так и с помощью списков управления доступом (ACL). Обратите внимание на то, что списки ACL настраиваются с помощью идентификатора объекта (OID) субъекта-службы для регистрации приложения, как описано здесь. Для конфигурации RBAC, напротив, используется идентификатор приложения (клиента). Когда субъекту безопасности предоставляются разрешения на данные RBAC посредством встроенной или пользовательской роли, эти разрешения сначала оцениваются при авторизации запроса. Если запрошенная операция разрешена в соответствии с назначенными субъекту безопасности ролями RBAC, авторизация происходит немедленно и дополнительные проверки ACL не проводятся. Если же субъекту безопасности роль RBAC не назначена или если запрошенная операция не соответствует предоставленному разрешению, проводятся проверки ACL, цель которых — определить, разрешено ли субъекту безопасности выполнять запрошенную операцию. Для разрешения на чтение необходимо предоставить по крайней мере разрешение на выполнение начиная с исходной файловой системы, а также разрешение на чтение целевых файлов. Можно также предоставить разрешение не ниже чтения данных из хранилища BLOB-объектов с помощью RBAC. Подробные сведения см. в этой статье.