Введение
Виртуализация данных в SQL Server 2025 — это возможность доступа к данным непосредственно на местах их нахождения. Виртуализация данных интегрирует данные во время запроса без репликации или перемещения исходных данных.
В этом модуле обучения рассматриваются параметры виртуализации данных в SQL Server 2025, в том числе:
- Службы PolyBase
- Соединители REST API, такие как Azure Data Lake Storage, хранилище BLOB-объектов Azure и хранилище объектов, совместимые с Amazon S3, которые позволяют получить новый доступ с виртуализацией данных
- Transact-SQL (T-SQL), используемый для виртуализации данных, включая OPENROWSET, CREATE EXTERNAL TABLE (CET) и CREATE EXTERNAL TABLE AS SELECT (CETAS)
Принципы виртуализации данных
Виртуализация данных основана на трех принципах:
Абстракция данных: Абстракция данных скрывает сложности доступа к данным из базовой системы данных, форматов и структур.
Нулевая репликация: В отличие от традиционной извлечения-преобразования-загрузки (ETL), виртуализация данных не требует собирать данные в отдельный репозиторий, чтобы преобразовать их в целевой формат, но обрабатывает преобразование и агрегирование на лету.
Данные в режиме реального времени: Так как виртуализация данных подключается к источнику данных на лету, он всегда использует последние доступные данные.
Преимущества виртуализации данных
Виртуализация данных имеет следующие основные преимущества:
Нет перемещения данных: Обращается к данным в текущем расположении.
Язык T-SQL: Использует все преимущества языка T-SQL, его команды, улучшения и знание.
Один источник для всех данных: Использует SQL Server 2025 в качестве одного источника данных и концентратора данных для всех необходимых данных, скрывая сложность данных от приложений. Администраторы баз данных и инженеры данных могут поддерживать одну среду.
Безопасность. Использует функции безопасности SQL Server для детализированных разрешений, управления учетными данными и управления.
Гибкость затрат: Доступна во всех выпусках SQL Server 2025.
Варианты использования виртуализации данных
SQL Server 2025 предлагает следующие основные варианты использования виртуализации данных:
- Аналитика в базе данных: Используйте и объедините все возможности SQL Server и свой опыт при использовании виртуализации данных.
- Выгрузите или экспортируйте данные в другие источники данных.
- Концентратор данных: Используйте SQL Server в качестве централизованного центра для подключения, защиты и запроса различных источников данных и файлов, скрывая сложность приложений. Нет необходимости использовать средство ETL для агрегирования, копирования или перемещения данных в промежуточную область.
Цели обучения
После завершения этого модуля вы:
- Ознакомьтесь с преимуществами и принципами виртуализации данных.
- Узнайте, что такое PolyBase и как использовать его возможности.
- Знакомы с решениями хранилища объектов и поддержкой sql Server 2025 для хранилища объектов, совместимого с S3.
- Узнайте, как установить и настроить PolyBase в SQL Server 2025.
- Узнайте, как получать доступ к внешним данным и запрашивать их с помощью PolyBase в SQL Server 2025.
Необходимые условия
- Основные знания о работе SQL Server 2025
- Основные знания о выполнении запросов T-SQL и SQL
- Установлен SQL Server 2025
- Установленный SQL Server Management Studio (SSMS)