Rollen voor gegevens

Voltooid

Een verhaal vertellen met de data is een reis die meestal niet bij jou begint. De gegevens moeten ergens vandaan komen. Om die gegevens op een voor u bruikbare plaats te krijgen, zijn inspanningen nodig die waarschijnlijk buiten uw bereik vallen, vooral met het oog op de onderneming.

De toepassingen en projecten van vandaag kunnen groot en ingewikkeld zijn, waarbij vaak gebruik wordt gemaakt van vaardigheden en kennis van tal van individuen. Elke persoon brengt unieke talenten en expertise met zich mee, door samen te werken en taken en verantwoordelijkheden te coördineren om een project van concept tot productie door te voeren.

In het recente verleden waren rollen zoals bedrijfsanalisten en business intelligence-ontwikkelaars de standaard voor gegevensverwerking en begrip. Door overmatige uitbreiding van de omvang en verschillende soorten gegevens zijn deze rollen echter geëvolueerd naar meer gespecialiseerde reeksen vaardigheden die de processen van data-engineering en analyse moderniseren en stroomlijnen.

De volgende secties belichten deze verschillende rollen in gegevens en de specifieke verantwoordelijkheid in het algemene spectrum van gegevensontdekking en begrip:

  • Bedrijfsanalist

  • Gegevensanalist

  • Data engineer

  • Data scientist

  • Databasebeheerder

Bedrijfsanalist

Hoewel er gelijkenissen zijn tussen een gegevensanalist en een bedrijfsanalist, is het belangrijkste onderscheid tussen de twee rollen wat ze doen met gegevens. Een bedrijfsanalist staat dichter bij het bedrijf en is een specialist in het interpreteren van de gegevens die afkomstig zijn van de visualisatie. Vaak zijn de rollen van gegevensanalist en bedrijfsanalist de verantwoordelijkheid van één persoon.

Gegevensanalist

Een gegevensanalist stelt bedrijven in staat de waarde van hun data-assets te maximaliseren door middel van visualisatie- en rapportagetools zoals Microsoft Power BI. Gegevensanalisten zijn verantwoordelijk voor het profileren, opschonen en transformeren van gegevens. Hun verantwoordelijkheden omvatten ook het ontwerpen en bouwen van schaalbare en effectieve semantische modellen, en het inschakelen en implementeren van de geavanceerde analysemogelijkheden in rapporten voor analyse. Een gegevensanalist werkt samen met de relevante stakeholders om de juiste en noodzakelijke data- en rapportagevereisten te identificeren, en vervolgens krijgt hij de taak om ruwe data om te zetten in relevante en zinvolle inzichten.

Een gegevensanalist is ook verantwoordelijk voor het beheer van Power BI-assets, waaronder rapporten, dashboards, werkruimten en de onderliggende semantische modellen die in de rapporten worden gebruikt. Ze hebben de taak passende beveiligingsprocedures te implementeren en te configureren, in combinatie met vereisten van de belanghebbenden, om ervoor te zorgen dat alle Power BI-assets en de bijbehorende gegevens veilig worden gesteld.

Gegevensanalisten werken samen met gegevensingenieurs om geschikte gegevensbronnen te bepalen en te lokaliseren die voldoen aan de eisen van belanghebbenden. Bovendien werken gegevensanalisten samen met de gegevensingenieur en databasebeheerder om ervoor te zorgen dat de analist de juiste toegang heeft tot de benodigde gegevensbronnen. De gegevensanalist werkt ook samen met de data engineer om nieuwe processen te identificeren of om bestaande processen voor het verzamelen van gegevens voor analyse te verbeteren.

Gegevensingenieur

Data-engineers richten on-premises en cloudgebaseerde gegevensplatformtechnologieën in en stellen deze in. Ze beheren en beveiligen de stroom van gestructureerde en niet-gestructureerde gegevens uit meerdere bronnen. De gegevensplatformen die ze gebruiken, bevatten onder andere relationele databases, niet-relationele databases, gegevensstromen en bestandsopslag. Data engineers zorgen er ook voor dat gegevensservices veilig en naadloos worden geïntegreerd tussen gegevensplatforms.

Primaire verantwoordelijkheden van data engineers zijn onder meer het gebruiken van on-premises en cloudgegevensservices en van hulpprogramma's om gegevens uit meerdere bronnen op te nemen, uit te voeren en te transformeren. Data engineers werken samen met belanghebbenden in het bedrijf om de vereisten voor gegevens te identificeren en daaraan te voldoen. Zij ontwerpen en implementeren oplossingen.

Hoewel er overlap kan zijn tussen de taken en verantwoordelijkheden van een data engineer en die van een databasebeheerder, gaan de taken van een data engineer veel verder dan zorgen voor een database en de server waarop deze wordt gehost en valt het algemene operationele gegevensbeheer daar niet onder.

Een data engineer voegt enorm veel waarde toe aan business intelligence en data science-projecten. Wanneer de data engineer gegevens bij elkaar brengt, wat vaak wordt beschreven als data-wrangling, verlopen projecten sneller omdat data scientists zich kunnen richten op hun eigen werkterrein.

Als gegevensanalist werkt u nauw samen met een data engineer om ervoor te zorgen dat u toegang hebt tot de verschillende gestructureerde en ongestructureerde gegevensbronnen, omdat deze u ondersteunen bij het optimaliseren van semantische modellen, die doorgaans worden bediend vanuit een modern datawarehouse of data lake.

Zowel databasebeheerders als business intelligence-professionals kunnen overstappen naar een data engineer-rol; ze moeten de tools en technologie leren die worden gebruikt om grote hoeveelheden gegevens te verwerken.

Data scientist

Data scientists voeren geavanceerde analyses uit om de waarde uit de gegevens te extraheren. Hun werk kan variëren van beschrijvende analyses tot voorspellende analyses (predictive analytics). Beschrijvende analyses evalueren gegevens via een proces dat verkennende gegevensanalyse (EDA: Exploratory Data Analysis) wordt genoemd. Voorspellende analyses worden gebruikt bij machine learning voor de toepassing van modelleringstechnieken waarmee afwijkingen of patronen kunnen worden gedetecteerd. Deze analyses zijn belangrijke onderdelen van prognosemodellen.

Beschrijvende en voorspellende analyses zijn slechts gedeeltelijke aspecten van het werk van gegevenswetenschappers. Sommige gegevenswetenschappers werken mogelijk op het gebied van deep learning en voeren iteratieve experimenten uit om een complex gegevensprobleem op te lossen met behulp van aangepaste algoritmen.

Anekdotisch bewijs wijst erop dat het meeste werk in een data science-project wordt besteed aan data-wrangling en functie-engineering. Data scientists kunnen het proces van experimenteren versnellen wanneer data engineers hun vaardigheden inzetten om data-wrangling uit te voeren.

Op het eerste gezicht lijkt het erop dat een datawetenschapper en gegevensanalist ver uit elkaar staan in het werk dat ze doen, maar dit vermoeden is niet waar. Een datawetenschapper kijkt naar data om de vragen te bepalen die antwoorden nodig hebben en bedenkt vaak een hypothese of een experiment en wendt zich vervolgens tot de gegevensanalist om te helpen bij de datavisualisatie en rapportage.

Databasebeheerder

Een databasebeheerder implementeert en beheert de operationele aspecten van de cloudeigen en hybride gegevensplatformoplossingen die zijn gebouwd op basis van Microsoft Azure-gegevensservices en Microsoft SQL Server. Een databasebeheerder is verantwoordelijk voor de algehele beschikbaarheid en consistente prestaties en optimalisaties van de databaseoplossingen. Ze werken samen met belanghebbenden om de beleidsregels, hulpprogramma's en processen voor gegevensback-up en herstelplannen te identificeren en te implementeren.

De rol van een databasebeheerder wijkt af van de rol van een data engineer. Een databasebeheerder bewaakt en beheert de algehele gezondheid van een database en de hardware waarop deze zich bevindt, terwijl een data-engineer betrokken is bij het proces van data wrangling, met andere woorden, het opnemen, transformeren, valideren en opschonen van data om te voldoen aan zakelijke behoeften en vereisten.

De databasebeheerder is ook verantwoordelijk voor het beheren van de algehele beveiliging van de gegevens, het toewijzen en beperken van gebruikerstoegang en bevoegdheden voor de gegevens zoals bepaald op basis van de behoeften en vereisten van het bedrijf.