Role v práci s daty

Dokončeno

Sdělovat něco daty je cesta, která obvykle nezačíná vámi. Data musí odněkud pocházet. Dostat tato data na místo, které je pro vás použitelné, znamená úsilí, které je nejspíš mimo vaše možnosti, zejména pokud bereme v úvahu podnik.

Dnešní aplikace a projekty můžou být velké a komplikované a často využívají dovednosti a znalosti mnoha jednotlivců. Každá osoba přináší jedinečný talent a odbornost, o které se dělí ve snaze o spolupráci a při koordinování úloh a povinností, aby se projekt dotáhl od konceptu k realizaci.

V nedávné době byly normou pro porozumění datům a jejich zpracování role jako obchodní analytici a vývojáři BI. Prudký růst velikosti a různých typů dat ale způsobily, že se tyto role vyvinuly ve specializovanější sadu dovedností, které modernizují a zefektivňují procesy přípravy a analýzy dat.

role v práci s daty

V následujících oddílech si popíšeme tyto různé role v práci s daty a jejich konkrétní povinnosti v celkovém spektru zjišťování dat a porozumění jim:

  • Obchodní analytik

  • Datový analytik

  • Datový inženýr

  • Datový vědec

  • Správce databáze

Obchodní analytik

I když mezi datovým analytikem a obchodním analytikem existují určité podobnosti, klíčovým rozdílem mezi těmito dvěma rolemi je to, co dělají s daty. Obchodní analytik je blíže podnikání a je odborníkem na interpretaci dat, která pocházejí z vizualizace. Role datového analytika a obchodního analytika může často zastávat stejný člověk.

Datový analytik

Datový analytik dat umožňuje firmám maximalizovat hodnotu jejich datových prostředků prostřednictvím nástrojů pro vizualizace a vytváření sestav, jako je Microsoft Power BI. Datoví analytici zodpovídají za profilování, čištění a transformaci dat. Mezi jejich povinnosti patří také navrhování a vytváření škálovatelných a efektivních sémantických modelů a povolení a implementace pokročilých analytických funkcí do sestav pro analýzu. Datový analytik spolupracuje s příslušnými účastníky na identifikaci vhodných a nezbytných požadavků na data a sestavy a následně má za úkol proměnit nezpracovaná data v relevantní a smysluplné poznatky.

Datový analytik je také zodpovědný za správu prostředků Power BI, včetně sestav, řídicích panelů, pracovních prostorů a podkladových sémantických modelů, které se v sestavách používají. Má za úkol v souvislosti s požadavky účastníků implementovat a konfigurovat správné postupy zabezpečení, aby se zajistilo uchování všech prostředků Power BI a jejich dat.

Datoví analytici spolupracují s datovými inženýry, aby určili a našli vhodné zdroje dat, které splňují požadavky účastníků. Dále spolupracují s datovým inženýrem a správcem databáze, aby zajistili, aby měl analytik správný přístup k potřebným zdrojům dat. Datový analytik také spolupracuje s datovým inženýrem na identifikaci nových procesů nebo vylepšování stávajících procesů pro shromažďování dat k analýze.

Datový inženýr

Datoví inženýři zřizují a nastavují technologie datových platforem, které můžou být místní nebo cloudové. Spravují a zabezpečují tok strukturovaných a nestrukturovaných dat z více zdrojů. Mezi datové platformy, které používají, můžou patřit relační databáze, nerelační databáze, datové proudy a úložiště souborů. Datoví inženýři také zajišťují bezpečnou a bezproblémovou integraci datových služeb napříč datovými platformami.

Mezi primární povinnosti datových inženýrů patří používání místních a cloudových datových služeb a nástrojů k ingestování, výchozímu přenosu a transformaci dat z více zdrojů. Datoví inženýři spolupracují s firemními účastníky na identifikaci a splnění datových požadavků. Navrhují a implementují řešení.

I když se některé úkoly a povinnosti datového inženýra můžou shodovat se správcem databáze, rozsah práce datové inženýra sahá daleko za péči o databázi a server, na kterém je hostovaná, a pravděpodobně nezahrnuje celkovou správu provozních dat.

Datový inženýr přidává projektům business intelligence a projektům datové vědy obrovskou hodnotu. Když datový inženýr shromažďuje a transformuje data, urychlí se vývoj projektů, protože datoví vědci se můžou soustředit na vlastní oblasti práce.

Jako datový analytik byste úzce spolupracovali s datovým inženýrem na zajištění přístupu k nejrůznějším strukturovaným a nestrukturovaným zdrojům dat, protože vám pomohou optimalizovat sémantické modely, které se obvykle obsluhují z moderního datového skladu nebo datového jezera.

Správci databází i odborníci v oblasti business intelligence se můžou přenést do role datového inženýra. Stačí jim seznámit se s nástroji a technologiemi používanými ke zpracování velkých objemů dat.

Datový vědec

Datoví vědci provádějí pokročilé analýzy umožňující získat z dat hodnotu. Jejich práce může být různá – od deskriptivní analýzy k prediktivní analýze. Při deskriptivní analýze se data vyhodnocují prostřednictvím procesu označovaného jako průzkumná analýza dat (EDA). Prediktivní analýza slouží ve strojovém učení k použití modelovacích technik, které zjišťují anomálie nebo vzory. Tyto analýzy jsou důležité součásti modelů prognóz.

Deskriptivní a prediktivní analýzy jsou jenom částečnými aspekty práce datových vědců. Někteří datoví vědci můžou pracovat v oblasti hlubokého učení a iterativním způsobem experimentovat při řešení složitých datových problémů s využitím vlastních algoritmů.

Neoficiální důkazy svědčí o tom, že většinu práce v projektu datové vědy tvoří transformace dat a vytváření funkcí. Když datoví inženýři využijí svých dovedností k úspěšné transformaci dat, můžou datoví vědci proces experimentování urychlit.

Navenek se může zdát, že práce datového vědce a datového analytika se velmi liší, ale tato domněnka není pravdivá. Datový vědec se dívá na data, aby určil otázky, které potřebují odpovědi, a často sestaví hypotézu nebo experiment a pak se obrátí na datového analytika, aby pomohl s vizualizací dat a vytvářením sestav.

Správce databáze

Správce databáze implementuje a spravuje provozní aspekty řešení platforem nativních pro cloud a hybridních datových platforem, které jsou postavené na datových službách Microsoft Azure a na Microsoft SQL Serveru. Správce databáze zodpovídá za celkovou dostupnost a konzistentní výkon a optimalizace databázových řešení. Spolupracuje s účastníky na identifikaci a implementaci zásad, nástrojů a procesů pro zálohování dat a plány obnovení.

Role správce databáze se liší od role datového inženýra. Správce databáze monitoruje a spravuje celkový stav databáze a hardwaru, na kterém se nachází, zatímco datový inženýr se podílí na transformaci dat, přesněji na ingestování, transformaci, ověřování a čištění dat, aby splňovala obchodní potřeby a požadavky.

Správce databáze také zodpovídá za správu celkového zabezpečení dat, tedy za udělování a omezování přístupu a oprávnění uživatelů k datům podle obchodních potřeb a požadavků.