Бөлісу құралы:


Источник "Гибкая работа с файлами"

Область применения:среда выполнения интеграции SSIS SQL Server в Фабрика данных Azure

Источник Гибкая работа с файлами позволяет пакету служб SSIS считывать данные из различных поддерживаемых служб хранилища. Сейчас поддерживаются службы хранилища

Чтобы отобразить редактор источника "Гибкая работа с файлами", перетащите источник Гибкая работа с файлами в конструктор потока данных и дважды щелкните его, чтобы открыть редактор.

Источник Гибкая работа с файлами входит в состав пакета дополнительных компонентов SQL Server Integration Services (SSIS) для Azure.

Доступны следующие свойства редактора "Гибкая работа с файлами".

  • Тип файла диспетчер подключений: указывает тип диспетчера исходных соединений. Затем выберите один из указанных типов или создайте новый.
  • Путь к папке: указывает путь к исходной папке.
  • Имя файла: указывает имя исходного файла.
  • Формат файла: задает формат исходного файла. Поддерживаемые форматы: текст, Avro, ORC, Parquet. Java требуется для ORC/Parquet. Дополнительные сведения см. в разделе "Зависимость от Java".
  • Символ разделителя столбцов: указывает символ, используемый в качестве разделителя столбцов (многозначные разделители не поддерживаются).
  • Первая строка в качестве имени столбца: указывает, следует ли рассматривать первую строку как имена столбцов.
  • Распаковка файла: указывает, следует ли распаковывать исходный файл.
  • Тип сжатия: указывает формат сжатия исходного файла. Поддерживаемые форматы: GZIP, DEFLATE, BZIP2.

Доступны следующие свойства расширенного редактора.

  • rowDelimiter: символ, используемый для разделения строк в файле. Допускается только один знак. Значение по умолчанию — \r\n.
  • escapeChar: специальный символ, используемый для экранирования разделителя столбцов в содержимом входного файла. Не следует указывать escapeChar и quoteChar для таблицы одновременно. Допускается только один знак. Нет значения по умолчанию.
  • quoteChar: символ, используемый для кавычки строкового значения. Разделители столбцов и строк внутри знаков кавычек будут рассматриваться как часть строкового значения. Это свойство применяется к входному и выходному наборам данных. Не следует указывать escapeChar и quoteChar для таблицы одновременно. Допускается только один знак. Нет значения по умолчанию.
  • nullValue: один или несколько символов, используемых для представления значения NULL. Значением по умолчанию является \N.
  • encodingName: укажите имя кодирования. См. раздел Encoding.EncodingName.
  • skipLineCount: указывает количество непустых строк, которые нужно пропустить при чтении данных из входных файлов. Если указаны skipLineCount и firstRowAsHeader, то сначала пропускаются строки, а затем считываются данные заголовка из входного файла.
  • treatEmptyAsNull: указывает, следует ли рассматривать null или пустую строку как значение NULL при чтении данных из входного файла. Значение по умолчанию — true.

Указав сведения о соединении, переключитесь на страницу Столбцы, чтобы сопоставить столбцы источника со столбцами назначения для потока данных служб SSI.

Примечания о настройке разрешений для субъекта-службы

Для работы тестового подключения (к хранилищу BLOB-объектов или Data Lake Storage 2-го поколения) субъекту-службе следует назначить по крайней мере роль Читатель данных в хранилище BLOB-объектов в учетной записи хранения. Это осуществляется посредством управление доступом на основе ролей (RBAC).

Для хранилища BLOB-объектов разрешение на чтение предоставляется путем назначения по крайней мере роли Читатель данных в хранилище BLOB-объектов.

Для Data Lake Storage 2-го поколения разрешение определяется как посредством управления доступом на основе ролей (RBAC), так и с помощью списков управления доступом (ACL). Обратите внимание, что списки управления доступом настроены с помощью идентификатора объекта (OID) субъекта-службы для регистрации приложения. Узнайте , как правильно задать списки управления доступом для субъекта-службы? Это отличается от идентификатора приложения (клиента), используемого с конфигурацией RBAC. Когда субъекту безопасности предоставляются разрешения на данные RBAC посредством встроенной или пользовательской роли, эти разрешения сначала оцениваются при авторизации запроса. Если запрошенная операция разрешена в соответствии с назначенными субъекту безопасности ролями RBAC, авторизация происходит немедленно и дополнительные проверки ACL не проводятся. Если же субъекту безопасности роль RBAC не назначена или если запрошенная операция не соответствует предоставленному разрешению, проводятся проверки ACL, цель которых — определить, разрешено ли субъекту безопасности выполнять запрошенную операцию. Для разрешения на чтение необходимо предоставить по крайней мере разрешение на выполнение начиная с исходной файловой системы, а также разрешение на чтение целевых файлов. Можно также предоставить разрешение не ниже чтения данных из хранилища BLOB-объектов с помощью RBAC. Подробные сведения см. в этой статье.