Sdílet prostřednictvím


Skupiny pro horizontální škálování PolyBase

platí pro: SQL Server (jenom Windows) Nepodporuje se. Azure SQL Database Nepodporuje se. Azure Synapse Analytics Nepodporuje se. Analytics Platform System (PDW)

Samostatná instance SQL Serveru s PolyBase se může stát kritickým bodem výkonu při práci s obrovskými datovými sadami v Hadoopu nebo Azure Blob Storage. Funkce PolyBase Group umožňuje vytvořit cluster instancí SQL Serveru pro zpracování velkých datových sad z externích zdrojů dat, jako je Hadoop nebo Azure Blob Storage, škálovatelným způsobem pro lepší výkon dotazů. Teď můžete škálovat výpočetní prostředky SQL Serveru tak, aby splňovaly požadavky na výkon vaší úlohy. Skupiny s horizontálním navýšením kapacity PolyBase, skupina instancí SQL Serveru, umožňují zpracovávat velké externí datové sady v architektuře paralelního zpracování. Načítání dat a výkon dotazů se může při přidávání dalších instancí SQL Serveru do skupiny zvyšovat lineárně.

Důležité

Škálovatelné skupiny systému Microsoft SQL Server PolyBase byly zrušeny. Funkce škálování na více systémů byla v produktu odstraněna počínaje SQL Serverem 2022 (16.x) a novějšími verzemi. Virtualizace dat PolyBase bude nadále plně podporována jako funkce vertikálního navýšení kapacity na SQL Serveru. Další informace najdete v tématu možnosti velkých objemů dat na platformě Microsoft SQL Server.

Viz Začínáme s PolyBase a Příručka PolyBase.

Diagram znázorňující skupiny s horizontálním navýšením kapacity PolyBase

Hlavní uzel

Hlavní uzel obsahuje instanci SQL Serveru, do které se odesílají dotazy PolyBase. Každá skupina PolyBase může mít pouze jeden hlavní uzel. Hlavní uzel je logická skupina databázového stroje SQL Serveru, PolyBase Engine a služby přesunu dat PolyBase v instanci SQL Serveru. S SQL Serverem 2017 a SQL Serverem 2016 musí být hlavní uzel Enterprise Edition. Počínaje SQL Serverem 2019 může být hlavní uzel PolyBase buď edice Enterprise, nebo Standard.

Výpočetní uzel

Výpočetní uzel obsahuje instanci SQL Serveru, která pomáhá při škálování zpracování dotazů na externí data. Výpočetní uzel je logická skupina SQL Serveru a služba přesunu dat PolyBase v instanci SQL Serveru. Skupina PolyBase může mít několik výpočetních uzlů. Hlavní uzel a výpočetní uzly musí mít stejnou verzi SQL Serveru. Počáteční verze SQL Serveru 2016 umožňovala výpočetní uzly být edice Enterprise nebo Standard. Počínaje SQL Serverem 2016 SP1 můžou být všechny edice SQL Serveru výpočetním uzlem.

Čtení se škálováním na více instancí

Při dotazování externích instancí SQL Serveru, Oracle nebo Teradata budou dělené tabulky těžit z čtení s horizontálním škálováním. Každý uzel ve skupině s horizontálním navýšením kapacity PolyBase může pro čtení externích dat aktivovat až 8 čtenářů. Každému čtenáři je přiřazen jeden oddíl ke čtení v externí tabulce.

Řekněme například, že máte externí tabulku SQL Serveru s 12 měsíčními partice a 3 uzly PolyBase s víceuzlovým škálováním, přičemž každý uzel bude ke zpracování každé ze 12 particí používat 4 zpracovatele PolyBase. To je znázorněno na následujícím obrázku.

Poznámka:

Toto se liší od horizontálního škálování čtení přes Hadoop.

Horizontální čtení PolyBase

Distribuované zpracování dotazů

Dotazy PolyBase se odesílají na SQL Server v hlavním uzlu. Část dotazu, která odkazuje na externí tabulky, se předává modulu PolyBase.

Modul PolyBase je klíčovou součástí dotazů PolyBase. Parsuje dotaz na externí data, vygeneruje plán dotazu a distribuuje práci službě pro přesun dat na výpočetních uzlech pro spuštění. Po dokončení práce obdrží výsledky z výpočetních uzlů a odešle je do SQL Serveru pro zpracování a vrácení klientovi.

Služba přesunu dat PolyBase přijímá instrukce z modulu PolyBase a přenáší data mezi HDFS a SQL Serverem a mezi instancemi SQL Serveru na hlavním a výpočetním uzlu.

Další kroky

Pokud chcete nakonfigurovat rozšiřovací skupinu PolyBase, podívejte se do následující příručky:

Zlepšení PolyBase scale-out skupin ve Windowsu

Viz také

sys-dm-exec-compute-nodes
sys-dm-exec-compute-node-status
sys.dm_exec_compute_node_errors