Megjegyzés
Az oldalhoz való hozzáféréshez engedély szükséges. Megpróbálhat bejelentkezni vagy módosítani a címtárat.
Az oldalhoz való hozzáféréshez engedély szükséges. Megpróbálhatja módosítani a címtárat.
A következőkre vonatkozik:SQL Server
Azure Synapse Analytics
Elemzési platformrendszer (PDW)
A PolyBase lehetővé teszi az SQL Server adatvirtualizálását.
Mi az a PolyBase?
A PolyBase lehetővé teszi, hogy az SQL Server-példány az SQL Server, Oracle, Teradata, MongoDB, Hadoop-fürtök, Cosmos DB és S3-kompatibilis objektumtárolók adatainak lekérdezését Transact-SQL (T-SQL) használatával végezze, anélkül hogy külön ügyfélkapcsolati szoftvert kellene telepíteni. Az általános ODBC-összekötővel külső ODBC-illesztőprogramok használatával további szolgáltatókhoz is csatlakozhat. A PolyBase lehetővé teszi, hogy a T-SQL-lekérdezések külső forrásokból származó adatokat relációs táblákhoz csatlakozzanak az SQL Server egy példányában.
A PolyBase támogatja a részben strukturált és strukturált fájlalapú adatformátumok( például CSV, Parquet, JSON és Delta Lake-fájlok) lekérdezését is. Ez lehetővé teszi a fájlalapú adatok zökkenőmentes integrálását a T-SQL-munkafolyamatokba.
A PolyBase szolgáltatással végzett adatvirtualizálás egyik fő felhasználási esete, hogy lehetővé teszi az adatok eredeti helyének és formátumának megtartását. A külső adatokat virtualizálhatja az SQL Server-példányon keresztül, hogy azok lekérdezhetők legyenek, mint az SQL Server bármely más táblája. Ez a folyamat minimálisra csökkenti az adatáthelyezési ETL-folyamatok szükségességét. Ez az adatvirtualizálási forgatókönyv a PolyBase-összekötők használatával lehetséges.
Támogatott SQL-termékek és -szolgáltatások
A PolyBase ugyanazokat a funkciókat biztosítja a Microsoft alábbi SQL-termékeihez:
SQL Server 2016 (13.x) és újabb verziók (Windows)
SQL Server 2019 (15.x) és újabb verziók (Windows és Linux)
A felügyelt Azure SQL-példány részleteiért tekintse át a felügyelt Azure SQL-példány adatvirtualizálását
Az Azure SQL Database részleteiért tekintse át az adatvirtualizálást az Azure SQL Database-lel (előzetes verzió)
SQL Server Analytics Platform System (PDW)
Azure Synapse Analytics (dedikált SQL-készletekhez)
- Az Azure Synapse Analytics adatvirtualizálása két módban érhető el: PolyBase és natív. További információ: Külső táblák használata a Synapse SQL-sel.
Az SQL Server 2025 PolyBase fejlesztései
| Az SQL Server 2025 újdonságai (17.x) | Részletek |
|---|---|
| CsV, Parquet és Delta 1 natív támogatása | A PolyBase Query Service külső adatok telepítéséhez már nem szükséges a következő típusú külső adatok használataOPENROWSETCREATE EXTERNAL TABLECREATE EXTERNAL TABLE AS SELECT: Parquet, Delta, Azure Blob Storage (ABS), Azure Data Lake Storage (ADLS) vagy S3-Compatible objektumtároló. |
| Általános ODBC-adatforrások használata Linuxon | További információ: A PolyBase konfigurálása a külső adatok ODBC általános típusok használatával való eléréséhez. |
| TDS 8.0-támogatás | A PolyBase az SQL Server 18-es és Encrypt=Yes (kötelező) verziójához használt ODBC-illesztővel alapértelmezés szerint biztonságos konfigurációt használ. Más SQL Server-funkciókkal ellentétben a PolyBase lehetővé teszi TrustServerCertificate=True az önaláírt tanúsítványokkal kapcsolatos forgatókönyveket. A TLS 1.3 és a szigorú titkosítás TDS 8.0-val való kényszerítéséhez állítsa be Encrypt=Strict és TrustServerCertificate=No. További információ: CREATE EXTERNAL DATA SOURCE – CONNECTION_OPTIONS. Tekintse át az SQL Server 2025 adatbázismotor-funkcióinak kompatibilitástörő változásait. |
| Felügyelt identitás | A felügyelt identitás elérhető az Azure Arc és az SQL Server 2025 által engedélyezett SQL Server esetében, amely az Azure-beli virtuális gépeken fut. |
1 Az SQL Server 2025 -en (17.x) a külső adatokhoz készült PolyBase Query Service továbbra is szükséges más adatbázisokkal való csatlakozáshoz. Például: SQL Server, Oracle, DB2, Teradata, MongoDB vagy ODBC.
Az SQL Server 2022 PolyBase fejlesztései
| Az SQL Server 2022 újdonságai (16.x) | Részletek |
|---|---|
| S3-kompatibilis objektumtároló | Az SQL Server 2022 (16.x) új összekötőt, S3-kompatibilis objektumtárolót ad hozzá az S3 REST API használatával. Az OPENROWSET és a CREATE EXTERNAL TABLE használatával is lekérdezheti az adatfájlokat az S3-kompatibilis objektumtárolóban. |
| Egyes összekötők elkülönülnek a PolyBase-szolgáltatásoktól | Az S3-kompatibilis objektumtároló-összekötő, az ADSL Gen2 és az Azure Blob Storage már nem függ a PolyBase-szolgáltatásoktól. A PolyBase-szolgáltatásoknak továbbra is futniuk kell az Oracle, a Teradata, a MongoDB és az Általános ODBC kapcsolatának támogatásához. A PolyBase szolgáltatást továbbra is telepíteni kell az SQL Server-példányra. |
| Parquet fájlformátum | A PolyBase mostantól képes adatokat lekérdezni az S3-kompatibilis objektumtárolóban tárolt Parquet-fájlokból. További információ: Parquet-fájl virtualizálása egy S3-kompatibilis objektumtárolóban a PolyBase használatával. |
| Delta tábla formátuma | A PolyBase mostantól képes lekérdezni (csak olvasható módon) adatokat Delta Table formátumból, amelyeket S3-kompatibilis objektumtárolóban, Azure Storage Account V2-ben vagy Azure Data Lake Storage Gen2-ben tárolnak. További információ: Delta-tábla virtualizálása a PolyBase használatával |
| Külső tábla létrehozása lekérdezéssel (CETAS) | A PolyBase mostantól a CETAS használatával létrehozhat egy külső táblát, majd ezzel párhuzamosan exportálhatja egy Transact-SQL SELECT utasítás eredményét az Azure Data Lake Storage Gen2-be, az Azure Storage-fiók V2-be és az S3-kompatibilis objektumtárolóba. További információ: CREATE EXTERNAL TABLE AS SELECT (CETAS). |
Az SQL Server 2022 (16.x) további új funkcióiért tekintse meg az SQL Server 2022 újdonságait.
Jótanács
Az SQL Server 2022 (16.x) PolyBase funkcióit és képességeit bemutató oktatóanyagért tekintse meg a PolyBase használatának első lépéseit az SQL Server 2022-ben.
PolyBase-összekötők
A PolyBase szolgáltatás a következő külső adatforrásokhoz biztosít kapcsolatot:
| Külső adatforrások | SQL Server 2016-2019 a PolyBase használatával | SQL Server 2022 (16.x) a PolyBase használatával | APS PDW | Azure Synapse Analytics |
|---|---|---|---|---|
| Oracle, MongoDB, Teradata | Olvasás | Olvasás | Nem | Nem |
| Általános ODBC | Olvasás (csak Windows rendszeren) | Olvasás (csak Windows rendszeren) | Nem | Nem |
| Azure Storage | Olvasás/írás | Olvasás/írás | Olvasás/írás | Olvasás/írás |
| Hadoop | Olvasás/írás | Nem | Olvasás/írás | Nem |
| SQL Server | Olvasás | Olvasás | Nem | Nem |
| S3-kompatibilis objektumtároló | Nem | Olvasás/írás | Nem | Nem |
- Az SQL Server 2022 (16.x) és újabb verziói nem támogatják a Hadoopot.
- Az SQL Server 2016 (13.x) bemutatta a PolyBase-t a Hadoop és az Azure Blob Storage kapcsolatainak támogatásával.
- Az SQL Server 2019 (15.x) több összekötőt vezetett be, köztük az SQL Servert, az Oracle-t, a Teradata-t és a MongoDB-t.
- Az SQL Server 2022 (16.x) bevezette az S3-kompatibilis tároló-összekötőt.
- Az SQL Server 2019 (15.x) 19. kumulatív frissítése támogatást vezetett be az Oracle TNS-hez.
- Az SQL Server 2022 (16.x) 2. kumulatív frissítése támogatást vezetett be az Oracle TNS-hez.
Külső összekötők például a következők:
1 A PolyBase két Hadoop-szolgáltatót, a Hortonworks Data Platformot (HDP) és a Cloudera Distributed Hadoopot (CDH) támogatja az SQL Server 2019-en keresztül. A HDFS Cloudera (CDP) és a Hortonworks (HDP) külső adatforrások SQL Server-támogatása megszűnt, és nem szerepel az SQL Server 2022 (16.x) és újabb verzióiban. További információkért tekintse meg a Nagy adathalmaz-beállításokat a Microsoft SQL Server platformon.
A PolyBase használata az SQL Server egy példányában:
- Telepítse a PolyBase-t Windows rendszeren , vagy telepítse a PolyBase-et Linuxra.
- Az SQL Server 2019-től kezdve (15.x) szükség esetén engedélyezze a PolyBase-t sp_configure.
- Hozzon létre egy külső adatforrást.
- Hozzon létre egy külső táblát.
Azure-integráció
A PolyBase segítségével a T-SQL-lekérdezések adatokat is importálhatnak és exportálhatnak az Azure Blob Storage-ból. Emellett a PolyBase lehetővé teszi az Azure Synapse Analytics számára az adatok importálását és exportálását az Azure Data Lake Store-ból és az Azure Blob Storage-ból.
Miért érdemes a PolyBase-t használni?
A PolyBase lehetővé teszi, hogy külső adatokkal csatlakozzon egy SQL Server-példány adataihoz. Mielőtt a PolyBase engedélyezi az adatok külső adatforrásokhoz való csatlakoztatását, a következőkre van lehetősége:
- Vigye át az adatok felét úgy, hogy az összes adat egy helyen legyen.
- Lekérdezheti mindkét adatforrást, majd egyéni lekérdezési logikát írhat az adatok ügyfélszintű összekapcsolásához és integrálásához.
A PolyBase lehetővé teszi, hogy Transact-SQL használatával csatlakozzon az adatokhoz.
A PolyBase nem követeli meg, hogy további szoftvereket telepítsen a Hadoop-környezetbe. Külső adatokat az adatbázistáblák lekérdezéséhez használt T-SQL-szintaxissal kérdezhet le. A PolyBase által végrehajtott támogatási műveletek mindegyike transzparens módon történik. A lekérdezés készítőjének nincs szüksége a külső forrásra vonatkozó ismeretekre.
A PolyBase a következőket használja:
A PolyBase az alábbi forgatókönyveket teszi lehetővé az SQL Serveren:
- Közvetlen adathozzáférés: A T-SQL használatával lekérdezhet más RDBM-eket vagy külső fájlokat, például CSV-, Parquet- és Delta Lake-táblákat, mintha natív táblák lennének.
- Hideg adatok áthelyezése: Miközben könnyen elérhető marad.
- Nagyobb termelékenység: Csökkentse a több forrásból származó adatok integrálásához és elemzéséhez szükséges időt és erőfeszítést.
- Költséghatékonyság: A hagyományos adatintegrációs módszerekhez kapcsolódó adatreplikáció és tárolási költségek minimalizálása.
- Valós idejű elemzések: Valós idejű adatlekérdezés és elemzések engedélyezése az adatáthelyezés vagy -szinkronizálás által okozott késések nélkül.
- Biztonság: Az SQL Server biztonsági funkcióit részletes engedélyekhez, hitelesítő adatok kezeléséhez és vezérléséhez használhatja.
Teljesítmény
Nincs korlátozva a fájlok száma vagy a lekérdezhető adatok mennyisége. A lekérdezési teljesítmény függ az adatok mennyiségétől, az adatformátumtól, az adatok rendszerezésének módjától, valamint a lekérdezések és illesztések összetettségétől.
A PolyBase teljesítményével kapcsolatos útmutatással és javaslatokkal kapcsolatos további információkért tekintse meg az SQL Serverhez készült PolyBase teljesítményével kapcsolatos szempontokat.
Frissítés az SQL Server 2022-re
Az SQL Server 2022 -től kezdve (16.x) a Hortonworks Data Platform (HDP) és a Cloudera Distributed Hadoop (CDH) már nem támogatott. A módosítások miatt manuálisan kell elvetnie az SQL Server TYPE = HADOOP vagy az Azure Storage korábbi verzióiban létrehozott PolyBase külső adatforrásokat, mielőtt az SQL Server 2022-re (16.x) vagy újabb verzióra migrál. A külső adatforrások elvetéséhez a társított adatbázis-objektumok, például az adatbázis hatókörébe tartozó hitelesítő adatok és külső táblák elvetése is szükséges.
Az Azure Storage-összekötőket a következő referenciatáblázat alapján kell módosítani:
| Külső adatforrás | Ettől kezdve | Há |
|---|---|---|
| Azure Blob Storage | wasb[s] |
abs |
| ADLS Gen 2 | abfs[s] |
adls |
Első lépések
A PolyBase használata előtt telepítenie kell a PolyBase-t Windows rendszeren , vagy Linuxon kell telepítenie a PolyBase-t, és szükség esetén engedélyeznie kell a PolyBase-t sp_configure .
A PolyBase funkcióival és képességeivel kapcsolatos oktatóanyagért tekintse meg a PolyBase használatának első lépéseit az SQL Server 2022-ben.
További oktatóanyagok a különböző külső adatforrásokról:
- Hadoop
- Azure Blob-tároló
- SQL Server
- Jóslat
- Teradata
- MongoDB
- ÁLTALÁNOS ODBC-típusok
- S3-kompatibilis objektumtároló
- CSV-fájl
- Parquet-fájl
- Delta tábla
Adatvirtualizálás más platformokon
Az adatvirtualizálási funkciók más platformokon is elérhetők:
- Külső táblák használata a Synapse SQL-sel
- Adatvirtualizálás felügyelt Azure SQL-példánysal
- Adatvirtualizálás az Azure SQL Database-lel (előzetes verzió)
Kapcsolódó tartalom
- A PolyBase használatának első lépései az SQL Server 2022-ben
- OPENROWSET (Transact-SQL)
- HOZZON LÉTRE KÜLSŐ TÁBLÁT (Transact-SQL)
- KÜLSŐ TÁBLA LÉTREHOZÁSA KIVÁLASZTÁSKÉNT (CETAS) (Transact-SQL)
- Teljesítményre vonatkozó szempontok az SQL Server PolyBase-ben
- Gyakori kérdések a PolyBase-ben
- PolyBase- monitorozása és hibaelhárítása
- PolyBase Transact-SQL referencia