Sdílet prostřednictvím


Příprava dat

platí pro:SQL Server

Kolekce dat je komponenta SQL Serveru, která shromažďuje různé sady dat. Shromažďování dat se buď spouští nepřetržitě, nebo podle uživatelem definovaného plánu. Kolektor dat ukládá shromážděná data do relační databáze označované jako datový sklad pro správu.

Co je kolektor dat?

Kolektor dat je základní součástí platformy pro shromažďování dat pro SQL Server a nástroje poskytované SQL Serverem. Kolektor dat poskytuje jeden centrální bod pro shromažďování dat napříč databázovými servery a aplikacemi. Tento bod shromažďování může získávat data z různých zdrojů a není omezen na údaje o výkonu, na rozdíl od trasování SQL.

Kolektor dat umožňuje upravit rozsah shromažďování dat tak, aby vyhovoval testovacím a produkčním prostředím. Kolektor dat také používá datový sklad, relační databázi, která umožňuje spravovat data, která shromažďujete, nastavením různých období uchovávání dat pro vaše data.

Kolektor dat podporuje dynamické ladění pro shromažďování dat a je rozšiřitelný prostřednictvím svého rozhraní API. Další informace naleznete v tématu Programování kolektoru dat.

Následující obrázek ukazuje, jak kolektor dat zapadá do celkové strategie pro shromažďování dat a správu dat v SQL Serveru.

Diagram role kolektoru dat ve správě dat

Koncepce

Kolektor dat je integrovaný s agentem SQL Serveru a integračními službami a používá obojí široce. Než začnete s kolektorem dat pracovat, měli byste tudíž porozumět určitým konceptům souvisejícím s každou z těchto komponent SQL Serveru.

Agent SQL Serveru se používá k plánování a spuštění úloh zaměřených na sběr dat. Měli byste porozumět následujícím konceptům:

  • Job
  • Krok úlohy
  • Plán úloh
  • Podsystém
  • Účty proxy serveru

Další informace naleznete v tématu Úlohy automatizované správy (agent SQL Serveru).

Integrační služby (SSIS) slouží ke spouštění balíčků, které shromažďují data od jednotlivých poskytovatelů dat. Měli byste být obeznámeni s následujícími nástroji a koncepty služby SSIS:

  • Balíček SSIS
  • Konfigurace balíčku SSIS

Další informace najdete v tématu Balíčky služby SSIS (Integration Services).

Terminologie

Term Description
Cíl Instance databázového stroje v edici SQL Serveru, která podporuje shromažďování dat. Další informace o podporovaných edicích najdete v části Spravovatelnost v edicích a podporovaných funkcích SQL Serveru 2022.

Cílový kořen definuje podstrom v cílové hierarchii. Cílová sada je skupina cílů, které vznikají aplikací filtru na podstrom definovaný kořenem cíle. Cílovým kořenem může být databáze, instance SQL Serveru nebo instance počítače.
Typ cíle Typ cíle, který má určité charakteristiky a chování. Například cíl instance SQL Serveru má jiné charakteristiky než cíl databáze SQL Serveru.
Poskytovatel dat Známý zdroj dat specifický pro cílový typ, který poskytuje data typu kolektoru.
Typ kolektoru Logický obal kolem balíčků SSIS, které poskytují hlavní mechanismus pro shromažďování dat a jejich nahrání do správního datového skladu.
Položka sbírky Instance typu sběrače. Položka kolekce se vytvoří s určitými vstupními vlastnostmi a frekvencí kolekce.
Sada kolekcí Skupina položek kolekce. Sada kolekcí je jednotka shromažďování dat, se kterou může uživatel pracovat prostřednictvím uživatelského rozhraní.
Režim kolekce Způsob, jakým se data shromažďují a ukládají. Režim kolekce může být uložen v mezipaměti nebo není uložený v mezipaměti. Režim v mezipaměti podporuje průběžné shromažďování, zatímco režim, který není uložený v mezipaměti, je určený pro kolekci na vyžádání nebo pro snímek kolekce.
Datový sklad pro správu Relační databáze použitá k ukládání shromážděných dat.

Následující obrázek znázorňuje závislosti a vztahy mezi komponentami kolektoru dat.

Diagram funkčních závislostí kolektoru dat

Jak je znázorněno na obrázku, poskytovatel dat je externí ke kolektoru dat a podle definice má implicitní vztah s cílem. Zprostředkovatel dat je specifický pro konkrétní cíl (například službu SQL Serveru, jako je relační modul), a poskytuje data, jako jsou systémová zobrazení sql Serveru, čítače sledování výkonu a zprostředkovatelé rozhraní WMI, které může kolektor dat využívat.

Typ kolektoru je specifický pro cílový typ na základě logického přidružení zprostředkovatele dat k cílovému typu. Typ kolektoru definuje způsob shromažďování dat z konkrétního zprostředkovatele dat (pomocí schématizovaných parametrů) a určuje schéma úložiště dat. K uložení shromážděných dat se vyžaduje schéma zprostředkovatele dat a schéma úložiště. Typ kolektoru také poskytuje umístění datového skladu pro správu, které se může nacházet v počítači, na kterém běží shromažďování dat nebo na jiném počítači.

Položka kolekce zobrazená na obrázku je instance konkrétního typu kolektoru, parametrizovaná vstupními parametry, jako je schéma XML pro typ kolektoru. Všechny položky kolekce musí fungovat ve stejném cílovém kořenovém adresáři nebo v prázdném cílovém kořenovém adresáři. Umožňuje to sběrači dat kombinovat typy sběračů z operačního systému nebo z konkrétního cílového kořene, ale ne z různých cílových kořenů.

Položka kolekce má definovanou frekvenci sběru, která určuje, jak často se snímky hodnot pořídí. I když se jedná o stavební blok pro sadu kolekcí, položka kolekce nemůže existovat samostatně.

Sady kolekcí se definují a nasazují v instanci serveru a dají se spouštět nezávisle na sobě. Každou sadu sbírek lze použít na cíl, který odpovídá typům cílů všech typů sběračů, jež jsou součástí sady sbírek. Sada kolekcí se spouští úlohou nebo úlohami agenta SQL Serveru a data se nahrají do datového skladu pro správu podle předdefinovaného plánu.

Všechna data shromážděná různými instancemi v sadě kolekcí se nahrají do datového skladu pro správu ve stejném plánu. Tento plán je definován jako sdílený plán agenta SQL Serveru a může ho používat více než jedna sada kolekcí. Sada kolekcí je zapnutá nebo vypnutá jako jedna entita; položky kolekce nelze zapnout ani vypnout jednotlivě.

Když vytvoříte nebo aktualizujete sadu kolekcí, můžete nakonfigurovat režim shromažďování dat a nahrát je do datového skladu pro správu. Typ kolekce určuje typ plánování: cache nebo necache. Pokud je kolekce uložená v mezipaměti, úlohy pro sběr dat a nahrání každá běží v samostatném procesu. Kolekce běží podle plánu, který se spustí při spuštění agenta SQL Serveru a běží na frekvenci zadané v položce kolekce. Nahrávání se spustí podle plánu určeného uživatelem.

Při nezachování mezipaměti se shromažďování dat a nahrávání spouští na jedné úloze, ale ve dvou krocích. Krok 1 je sběr a krok 2 je nahrávání. Pro kolekci na vyžádání se nevyžaduje žádný plán.

Po povolení sady kolekcí se shromažďování dat může spustit podle plánu nebo na vyžádání. Při spuštění shromažďování dat spustí agent SQL Serveru proces pro shromažďovač dat, který pak načte balíčky služeb Integration Services pro sadu sbírek. Položky kolekce, které představují typy kolekcí, shromažďují data od příslušných zprostředkovatelů dat pro zadané cíle. Po ukončení cyklu shromažďování se tato data nahrají do datového skladu pro správu.