Введение

Завершено

Виртуализация данных в SQL Server 2025 — это возможность доступа к данным непосредственно на местах их нахождения. Виртуализация данных интегрирует данные во время запроса без репликации или перемещения исходных данных.

В этом модуле обучения рассматриваются параметры виртуализации данных в SQL Server 2025, в том числе:

  • Службы PolyBase
  • Соединители REST API, такие как Azure Data Lake Storage, хранилище BLOB-объектов Azure и хранилище объектов, совместимые с Amazon S3, которые позволяют получить новый доступ с виртуализацией данных
  • Transact-SQL (T-SQL), используемый для виртуализации данных, включая OPENROWSET, CREATE EXTERNAL TABLE (CET) и CREATE EXTERNAL TABLE AS SELECT (CETAS)

Принципы виртуализации данных

Виртуализация данных основана на трех принципах:

  • Абстракция данных: Абстракция данных скрывает сложности доступа к данным из базовой системы данных, форматов и структур.

  • Нулевая репликация: В отличие от традиционной извлечения-преобразования-загрузки (ETL), виртуализация данных не требует собирать данные в отдельный репозиторий, чтобы преобразовать их в целевой формат, но обрабатывает преобразование и агрегирование на лету.

  • Данные в режиме реального времени: Так как виртуализация данных подключается к источнику данных на лету, он всегда использует последние доступные данные.

Преимущества виртуализации данных

Виртуализация данных имеет следующие основные преимущества:

  • Нет перемещения данных: Обращается к данным в текущем расположении.

  • Язык T-SQL: Использует все преимущества языка T-SQL, его команды, улучшения и знание.

  • Один источник для всех данных: Использует SQL Server 2025 в качестве одного источника данных и концентратора данных для всех необходимых данных, скрывая сложность данных от приложений. Администраторы баз данных и инженеры данных могут поддерживать одну среду.

  • Безопасность. Использует функции безопасности SQL Server для детализированных разрешений, управления учетными данными и управления.

  • Гибкость затрат: Доступна во всех выпусках SQL Server 2025.

Варианты использования виртуализации данных

SQL Server 2025 предлагает следующие основные варианты использования виртуализации данных:

  • Аналитика в базе данных: Используйте и объедините все возможности SQL Server и свой опыт при использовании виртуализации данных.
  • Выгрузите или экспортируйте данные в другие источники данных.
  • Концентратор данных: Используйте SQL Server в качестве централизованного центра для подключения, защиты и запроса различных источников данных и файлов, скрывая сложность приложений. Нет необходимости использовать средство ETL для агрегирования, копирования или перемещения данных в промежуточную область.

Снимок экрана: SQL Server в качестве концентратора данных для виртуализации данных.

Цели обучения

После завершения этого модуля вы:

  • Ознакомьтесь с преимуществами и принципами виртуализации данных.
  • Узнайте, что такое PolyBase и как использовать его возможности.
  • Знакомы с решениями хранилища объектов и поддержкой sql Server 2025 для хранилища объектов, совместимого с S3.
  • Узнайте, как установить и настроить PolyBase в SQL Server 2025.
  • Узнайте, как получать доступ к внешним данным и запрашивать их с помощью PolyBase в SQL Server 2025.

Необходимые условия

  • Основные знания о работе SQL Server 2025
  • Основные знания о выполнении запросов T-SQL и SQL
  • Установлен SQL Server 2025
  • Установленный SQL Server Management Studio (SSMS)