Облікові дані та джерела даних PolyBase
Тепер, коли ви розумієте принципи віртуалізації даних і PolyBase, важливо розуміти безпеку та зв'язок. Ця одиниця описує об'єкти та оператори, що використовуються з PolyBase.
Хоча функція PolyBase увімкнена на рівні екземплярів SQL Server, об'єкти та оператори PolyBase, такі як OPENROWSET, CET і CETAS, працюють на рівні бази даних. Кожне джерело даних, зовнішній формат файлу та зовнішні облікові дані прив'язані до конкретної бази даних.
Наступна діаграма ілюструє взаємозв'язок бази даних з об'єктами PolyBase.
Головний ключ: Головний ключ бази даних (DMK) — це симетричний ключ, який використовується для захисту приватних ключів сертифікатів та асиметричних ключів, що присутні в базі даних. DMK — це механізм безпеки для безпечного зберігання всієї зовнішньої інформації про облікові дані та джерела даних. Для детальнішої інформації дивіться CREATE MASTER KEY (Transact-SQL).
Облікові дані в сфері бази даних: Команда CREATE DATABASE SCOPED CREDENTIAL створює обліковий запис, який містить інформацію про облікові дані, що використовується зовнішнім джерелом даних. Для отримання додаткової інформації див. СТВОРИТИ ОБЛІКОВІ ДАНІ БАЗИ ДАНИХ (Transact-SQL).
Зовнішнє джерело даних: Команда CREATE EXTERNAL DATA SOURCE створює джерело даних, яке містить необхідну інформацію для доступу до зовнішнього джерела даних. Зовнішнім джерелом даних може бути інший сервер баз даних або місце зберігання, таке як Azure Blob, Azure Data Lake Storage або об'єктне сховище, сумісне з S3. Для детальнішої інформації див. СТВОРИТИ ЗОВНІШНЄ ДЖЕРЕЛО ДАНИХ (Transact-SQL).
Зовнішня таблиця: Команда CREATE EXTERNAL TABLE створює віртуальну таблицю, що вказує на зовнішнє джерело даних — це або файл, або інша таблиця бази даних. Щоразу, коли використовується ця таблиця, SQL Server забирає дані з джерела. Ця команда надає користувачам і додаткам таку ж гнучкість, як і робота зі звичайною таблицею без складнощів адміністрування оригінальних даних. Для детальнішої інформації див. СТВОРИТИ ЗОВНІШНЮ ТАБЛИЦЮ (Transact-SQL).
Зовнішній формат файлу: Команда CREATE EXTERNAL FILE FORMAT визначає, як SQL Server працює з певним типом файлу. Зовнішній формат файлу визначає тип файлу, термінатор поля, розділювач, стиснення та кодування. Для детальнішої інформації див. СТВОРИТИ ЗОВНІШНІЙ ФОРМАТ ФАЙЛУ (Transact-SQL).
Підтримувані джерела даних PolyBase
Префікс розташування Connector повідомляє SQL Server про тип кінцевої точки, до якої ви очікуєте підключитися. Наприклад, якщо ви хочете підключитися до облікового запису зберігання Azure Blob, ви використовуєте abs, а для підключення до сервера Oracle — .oracle
| Зовнішнє джерело даних | Префікс розташування роз'єму | Шлях розташування | Автентифікація |
|---|---|---|---|
| Azure Blob Storage | abs |
abs://<storage_account_name>.blob.core.windows.net/<container_name> |
Підпис спільного доступу (SAS) |
| Azure Data Lake Storage | adls |
adls://<storage_account_name>.dfs.core.windows.net/<container_name> |
SAS |
| SQL Server | sqlserver |
<server_name>[\<instance_name>][:port] |
Лише SQL-автентифікація |
| Oracle (Оракул | oracle |
<server_name>[:port] |
Лише базова автентифікація |
| Teradata | teradata |
<server_name>[:port] |
Лише базова автентифікація |
| API MongoDB або Azure Cosmos DB для MongoDB | mongodb |
<server_name>[:port] |
Лише базова автентифікація |
| Універсальне підключення до відкритої бази даних (ODBC) | odbc |
<server_name>[:port] |
Лише базова автентифікація |
| Групові операції | https |
<storage_account>.blob.core.windows.net/<container> |
SAS |
| S3-сумісне сховище об'єктів | s3 |
s3://<server_name>:<port>/ |
Деякі префікси змінювалися порівняно з попередньою версією SQL Server з міркувань сумісності. Повний перелік джерел даних та відповідних префіксів див. CREATE EXTERNAL DATA SOURCE.
Підтримувані формати файлів для PolyBase
SQL Server 2025 підтримує такі формати файлів:
- CSV
- Parquet
- Розділений текст
- Delta (тільки для читання). SQL Server може читати файли Delta, але не може експортувати результат таблиці як Delta.
OPENROWSET, CET та CETAS
PolyBase використовує три оператори для запиту або віртуалізації даних. Цей навчальний модуль охоплює ці команди та їхні сценарії використання.
OPENROWSET — це легка команда, яка дозволяє SQL-движку отримувати доступ до даних поза межами SQL Server, будь то файл або інша база даних. OPENROWSET оптимізований для ad-hoc виконання та рекомендований для завантаження даних або дослідження даних. Для детальнішої інформації див. OPENROWSET (Transact-SQL).
CREATE EXTERNAL TABLE (CET) створює таблицю, де дані залишаються у своєму початковому місці поза SQL Server. Коли таблиця вибирається, SQL-рушій надає користувачу запитувані дані. Зовнішня таблиця має перевагу від багаторазового використання та може використовувати статистику для кращої продуктивності. Для детальнішої інформації див. СТВОРИТИ ЗОВНІШНЮ ТАБЛИЦЮ (Transact-SQL).
CREATE EXTERNAL TABLE AS SELECT (CETAS) виконує комбінацію операцій в одній команді. По-перше, CETAS дозволяє SQL Server трансформувати та конвертувати дані, що зберігаються всередині або поза базою даних. CETAS експортує дані в інше місце, або в мережеву локацію, або в Azure. Нарешті, CETAS створює зовнішню таблицю, орієнтовану на нові експортовані дані. Для детальнішої інформації дивіться СТВОРИТИ ЗОВНІШНЮ ТАБЛИЦЮ ЯК SELECT (Transact-SQL).