Introducere în PolyBase
PolyBase este caracteristica utilizată de SQL Server pentru a activa conceptul de virtualizare a datelor. PolyBase a fost lansat inițial în SQL Server 2016 și este îmbunătățit în fiecare versiune ulterioară de SQL Server. Cu toate acestea, conceptul general de accesare a datelor de la distanță, fără a fi necesar să copiați datele de la SQL Server 7.0 cu introducerea Serverului legat.
Următorul tabel listează prima versiune SQL Server pentru a accepta diverse caracteristici PolyBase.
| SQL Server 2016 | SQL Server 2017 | SQL Server 2019 | SQL Server 2025 |
|---|---|---|---|
| • Hadoop • Stocare blob Azure |
• îmbunătățiri OPENROWSET • CSV pentru stocarea blobului Azure • Acreditare cu domeniu de bază de date |
• Serverul SQL •Oracol • Azure Cosmos DB • MongoDB • Teradata • Asistență Linux • ODBC generic |
• Cadru conector nou • Integrarea stocării obiectelor • CSV •Parchet •Deltă • CETAS |
Pentru mai multe informații despre PolyBase, consultați caracteristicile și limitările PolyBase.
Îmbunătățiri PolyBase în SQL Server 2025
Suport nativ pentru CSV, Parquet și Delta 1: Serviciul de interogare PolyBase pentru instalarea datelor externe nu mai este necesar pentru a utiliza OPENROWSET, CREATE EXTERNAL TABLE sau CREATE EXTERNAL TABLE AS SELECT cu următoarele tipuri de date externe: Parquet, Delta, Azure Blob Storage (ABS), Azure Data Lake Storage (ADLS) sau S3-Compatible Object storage.
Utilizarea surselor de date ODBC generice pe Linux: Pentru mai multe informații, consultați Configurarea PolyBase pentru a accesa date externe cu tipuri generice ODBC.
Suport TDS 8.0: Atunci când utilizați Microsoft ODBC Driver 18 pentru SQL Server, TDS 8.0 nu este acceptat pentru SQL Server ca sursă de date externă.
Stocarea obiectelor compatibilă cu S3
SQL Server 2025 acceptă stocarea de obiecte compatibilă cu S3. Pentru a activa această integrare, SQL Server 2025 utilizează o arhitectură de cadru de conector API REST care urmează cadrul S3. Orice stocare de obiecte care acceptă cadrul S3 funcționează și cu SQL Server 2025. Soluțiile de stocare a obiectelor compatibile cu S3 pot rula local, în rețea, în cloud sau într-un mediu hibrid.
Stocarea obiectelor, numită și stocare bazată pe obiecte, este o strategie care gestionează și manipulează stocarea datelor ca unități distincte, numite obiecte. Aceste obiecte sunt păstrate într-un singur depozit și nu sunt gravate în fișiere din alte foldere. În schimb, stocarea obiectelor combină fragmentele de date care alcătuiesc un fișier, adaugă toate metadatele relevante la acel fișier și atașează un identificator particularizat.
Unele caracteristici principale ale stocării obiectelor comparativ cu un sistem de fișiere tradițional sunt:
- Păstrează metadatele încorporate în fișier.
- Permite fișierelor să aibă atribute, cum ar fi etichetele.
- Mai eficiente din costuri pentru a scala și a fi mai ușor de întreținut.
- Optimizat pentru volume mari de date, cum ar fi Big Data, Internet of Things (IoT), AI, Învățare programată și analiză.
- Nu este recomandat pentru sarcinile de lucru OLTP (high-transactional or online transaction processing).
De asemenea, puteți utiliza stocarea obiectelor compatibile cu S3 pentru scenarii de backup și restaurare utilizând comanda BACKUP LA URL. Pentru mai multe informații, consultați backup și restaurare SQL Server cude stocare a obiectelor compatibile cu S3.
Cadrul standard S3 este larg adoptat, iar mulți furnizori importanți de stocare oferă acum soluții de stocare obiectelor compatibile cu S3. Dacă o soluție oferă compatibilitate cu API-urile REST S3, este compatibilă cu SQL Server 2025. Pentru o listă a furnizorilor de stocare a obiectelor suportate, vezi Furnizori de stocare a obiectelor compatibile cu S3.
Unii parteneri de stocare a obiectelor oferă capacitatea de a-și rula soluția ca software capabil să virtualizeze spațiul de stocare curent. Puteți să instalați și să încercați aceste soluții pe propria mașină sau mașină virtuală (VM).
Serviciile PolyBase versus caracteristica API REST PolyBase
Pentru a utiliza PolyBase, trebuie să instalați Serviciul de interogare PolyBase pentru de date externe și să activați PolyBase la un nivel de instanță utilizând sp_configure. Configurarea PolyBase instalează două servicii PolyBase, SQL Server PolyBase Engine și Mișcare date PolyBase Sql Server.
sql Server PolyBase Engine
- Executabil serviciu:
mpdwsvc.exe -dweng - Analizează interogările.
- Generează planuri de interogare.
- Distribuie lucrul pentru a calcula nodurile (SQL Server 2019).
- Procesează rezultatele de calcul ale nodului și rezultatele înapoi la client (SQL Server 2019).
- Executabil serviciu:
Mișcări de date SQL Server PolyBase
- Executabil serviciu:
mpdwsvc.exe -dms - Transferă date între sursele de date externe și între capul PolyBase și nodurile de calcul (SQL Server 2019).
- Inserează date în alte surse de date, cum ar fi Azure Storage.
- Executabil serviciu:
Surse de date precum SQL Server, Oracle, MongoDB sau surse bazate pe ODBC utilizează aceste servicii PolyBase. Sursele de date care utilizează arhitectura PolyBase bazată pe API REST SQL Server 2025 nu necesită ca aceste servicii să ruleze sau să fie configurate, dar serviciul de interogare PolyBase pentru date externe trebuie să fie în continuare instalat și activat.
Puteți utiliza API-urile REST PolyBase pentru a accesa Azure Data Lake Storage, Azure Blob Storage, orice spațiu de stocare de obiecte compatibil cu S3 și formate de fișier, cum ar fi Fișiere Parquet, Delta și CSV. Sursele de date acceptate anterior utilizează în continuare SQL Server PolyBase Engine și SQL Server PolyBase Data Movement servicii.
| Sursă de date | Servicii PolyBase | Caracteristica API REST PolyBase |
|---|---|---|
| Azure Blob Storage |
|
|
| Azure Data Lake Storage |
|
|
| Stocarea obiectelor compatibilă cu S3 |
|
|
| SQL Server |
|
|
| Oracol |
|
|
| Teradata |
|
|
| MongoDB sau Azure Cosmos DB API pentru MongoDB |
|
|
| Conectivitate generică la baze de date deschise (ODBC) |
|
|
| Operațiuni în bloc |
|
|