A PolyBase bemutatása
- 8 perc
A PolyBase az SQL Server által az adatvirtualizálási koncepció engedélyezéséhez használt funkció. A PolyBase eredetileg az SQL Server 2016-ban jelent meg, és az SQL Server minden későbbi verziójában továbbfejlesztve lett. Az adatok távoli elérésének általános fogalma, az adatok másolása nélkül, az SQL Server 7.0-s verziójához kötődik, a csatolt kiszolgáló bevezetésével.
Az alábbi táblázat felsorolja a különböző PolyBase-funkciókat támogató első SQL Server-verziót.
| SQL Server 2016 | SQL Server 2017 | SQL Server 2019 | SQL Server 2025 |
|---|---|---|---|
| • Hadoop • Azure Blob Storage (tárolószolgáltatás az Azure felhőben) |
• OPENROWSET fejlesztések • CSV az Azure Blob Storage-hoz • Adatbázis-hatókörű hitelesítő adatok |
• SQL Server Oracle • Azure Cosmos DB • MongoDB • Teradata • Linux-támogatás • Általános ODBC |
• Új összekötő-keretrendszer • Objektumtároló-integráció •CSV • Parketta •Delta • CETAS |
További információ a PolyBase-ről: PolyBase funkciói és korlátozásai.
PolyBase-fejlesztések az SQL Server 2025-ben
A CSV, a Parquet és a Delta 1 natív támogatása: A PolyBase Query Service for External Data telepítése már nem szükséges az OPENROWSET, a CREATE EXTERNAL TABLE vagy a CREATE EXTERNAL TABLE AS SELECT használatához a következő külső adatokkal: Parquet, Delta, Azure Blob Storage (ABS), Azure Data Lake Storage (ADLS) vagy S3-Compatible Object Storage.
Általános ODBC-adatforrások használata Linuxon: További információ: A PolyBase konfigurálása a külső adatok ODBC-típusok használatával való eléréséhez.
TDS 8.0-támogatás: Ha a Microsoft ODBC Driver 18 for SQL Servert használja, a TDS 8.0 nem támogatott külső adatforrásként az SQL Serverhez.
S3-kompatibilis objektumtároló
Az SQL Server 2025 támogatja az S3-kompatibilis objektumtárolást. Az integráció engedélyezéséhez az SQL Server 2025 az S3 keretrendszert követő REST API-összekötő-keretrendszer-architektúrát használja. Minden olyan objektumtároló, amely támogatja az S3-keretrendszert, az SQL Server 2025-kel is működik. Az S3-kompatibilis objektumtárolási megoldások helyileg, a hálózaton, a felhőben vagy hibrid környezetben is futtathatók.
Az objektumtárolás, más néven objektumalapú tárolás, egy olyan stratégia, amely az adattárolást különálló egységekként, úgynevezett objektumokként kezeli. Ezek az objektumok egyetlen tárolóban vannak tárolva, és nem kerülnek más mappákba lévő fájlokba. Ehelyett az objektumtároló egyesíti a fájlt alkotó adatrészleteket, hozzáadja az összes releváns metaadatot a fájlhoz, és csatol egy egyéni azonosítót.
Az objektumtárolás néhány fő funkciója a hagyományos fájlrendszerhez képest a következők:
- A metaadatok beágyazva maradnak a fájlba.
- Lehetővé teszi, hogy a fájlok olyan attribútumokkal rendelkezzenek, mint a címkék.
- Költséghatékonyabban méretezhető és könnyebben karbantartható.
- Nagy mennyiségű adathoz, például big data-hoz, ioT-hez, AI-hoz, gépi tanuláshoz és elemzéshez optimalizálva.
- Nagy tranzakciós vagy online tranzakciófeldolgozási (OLTP) számítási feladatokhoz nem ajánlott.
S3-kompatibilis objektumtárolót is használhat biztonsági mentési és visszaállítási forgatókönyvekhez a BACKUP TO URL paranccsal. További információ: SQL Server biztonsági mentése és visszaállítása S3-kompatibilis objektumtárolóval.
Az S3 szabvány keretrendszer széles körben elterjedt, és számos nagyobb tárolószolgáltató kínál S3-kompatibilis objektumtárolási megoldásokat. Ha egy megoldás kompatibilis az S3 REST API-kkal, kompatibilis az SQL Server 2025-tel. A támogatott objektumtároló-szolgáltatók listáját az S3-kompatibilis objektumtárolók szolgáltatói című témakörben találja.
Egyes objektumtároló partnerek lehetővé teszi a megoldásuk futtatását szoftverként, amely képes virtualizálni az aktuális tárterületet. Ezeket a megoldásokat saját gépére vagy virtuális gépére is telepítheti és kipróbálhatja.
PolyBase-szolgáltatások és a PolyBase REST API-funkció
A PolyBase használatához telepítenie kell a PolyBase lekérdezési szolgáltatást külső adatokhoz, és engedélyeznie kell a PolyBase-t példányszinten a sp_configurehasználatával. A PolyBase telepítő két PolyBase-szolgáltatást telepít: SQL Server PolyBase Engine és SQL Server PolyBase Adatmozgatás.
SQL Server PolyBase-rendszer
- Végrehajtható szolgáltatás:
mpdwsvc.exe -dweng - Elemzi a lekérdezéseket.
- Lekérdezésterveket hoz létre.
- A számítási csomópontokra (SQL Server 2019) osztja el a munkát.
- Feldolgozza a számítási csomópont eredményeit, és visszaküldi az eredményeket az ügyfélnek (SQL Server 2019).
- Végrehajtható szolgáltatás:
SQL Server PolyBase-adatáthelyezési
- Végrehajtható szolgáltatás:
mpdwsvc.exe -dms - Adatokat továbbít a külső adatforrások, valamint a PolyBase fej- és számítási csomópontok (SQL Server 2019) között.
- Adatokat szúr be más adatforrásokba, például az Azure Storage-ba.
- Végrehajtható szolgáltatás:
Az olyan adatforrások, mint az SQL Server, az Oracle, a MongoDB vagy az ODBC-alapú források, ezeket a PolyBase-szolgáltatásokat használják. Az SQL Server 2025 REST API-alapú PolyBase-architektúrát használó adatforrások nem igénylik a szolgáltatások futtatását vagy konfigurálását, de a külső adatokhoz készült PolyBase lekérdezési szolgáltatást továbbra is telepíteni és engedélyezni kell.
A PolyBase REST API-kkal hozzáférhet az Azure Data Lake Storage-hoz, az Azure Blob Storage-hoz, az S3-kompatibilis objektumtárolókhoz és a fájlformátumokhoz, például Parquet-, Delta- és CSV-fájlokhoz. A korábban támogatott adatforrások továbbra is az SQL Server PolyBase engine és SQL Server PolyBase-adatáthelyezési szolgáltatásokat használják.
| Adatforrás | PolyBase-szolgáltatások | PolyBase REST API-funkció |
|---|---|---|
| Azure Blob Storage |
|
|
| Azure Data Lake Storage |
|
|
| S3-kompatibilis objektumtároló |
|
|
| SQL Server |
|
|
| Orákulum |
|
|
| Teradata |
|
|
| MongoDB vagy Azure Cosmos DB API a MongoDB-hez |
|
|
| Általános nyílt adatbázis-kapcsolat (ODBC) |
|
|
| Tömeges műveletek |
|
|