Gegevens democratiseren met digitale uitvindingen

Kolen, olie en menselijk potentieel waren de drie meest consequente activa tijdens de industriële revolutie. Deze activa bouwden bedrijven op, verschoven markten en veranderden uiteindelijk landen. In de digitale economie zijn er drie even belangrijke troeven voor innovatie: gegevens, apparaten en menselijk potentieel. Deze troeven hebben een groot innovatiepotentieel. Voor elke innovatie-inspanning in het moderne tijdperk zijn gegevens de nieuwe olie.

In elk bedrijf zijn er gegevens die kunnen worden gebruikt om te voldoen aan de behoeften van klanten. Helaas kan het proces van het analyseren van die gegevens om innovatie te stimuleren kostbaar en tijdrovend zijn, waardoor er geen behoeften worden ontdekt en er geen oplossingen worden gemaakt. Gegevensdemocratisering kan dit probleem oplossen.

Wat is gegevensdemocratisering? Het is het proces om gegevens in de juiste handen te krijgen om innovatie te stimuleren. Dit democratiseringsproces kan verschillende vormen aannemen, maar over het algemeen omvatten ze oplossingen voor opgenomen of geïntegreerde onbewerkte gegevens, centralisatie van gegevens, het delen van gegevens en het beveiligen van gegevens. Wanneer gegevens worden gedemocratiseerd, kunnen experts in het bedrijf deze gebruiken om hypothesen te vormen en te testen. In veel gevallen kunnen cloudacceptatieteams bouwen met empathie van klanten met behulp van alleen gegevens, om snel te voldoen aan de behoeften van klanten.

Manieren om gegevens te democratiseren

Er zijn verschillende manieren om gegevens te democratiseren, maar de meeste omvatten methoden voor het verzamelen, centraliseren, beheren en delen van de gegevens. In de volgende secties worden enkele van deze methoden beschreven. Wanneer u een oplossing voor een klanthypothese bouwt, moet u beoordelen of gegevens moeten worden gedemocratiseerd, in welke mate en hoe u dit moet doen.

Proces voor het democratiseren van gegevens toont deze processen: beheren, centraliseren, verzamelen en delen van gegevens.

Gegevens delen

Wanneer u bouwt met empathie van de klant, moet de klant de oplossing begeleiden. Als er gegevens nodig zijn, stelt de oplossing de klant in staat om de gegevens rechtstreeks te ondervragen, te analyseren en te rapporteren, zonder ondersteuning van IT-medewerkers.

Veel succesvolle innovaties beginnen als een minimum viable product (MVP) dat gegevens aan de klant levert. Een MVP is een versie van het product die precies genoeg functies heeft om door de klant te kunnen worden gebruikt. Het toont de mogelijke mogelijkheden van het product om feedback van de klant te verzamelen. In dit concierge-model is een werknemer de gegevensgebruiker. Die werknemer gebruikt gegevens om de klant te helpen. Telkens wanneer de klant handmatige ondersteuning inschakelt, kan een hypothese worden getest en gevalideerd. Deze aanpak is vaak een kosteneffectieve manier om een klantgerichte hypothese te testen voordat u veel investeert in geïntegreerde oplossingen.

De primaire hulpprogramma's voor het rechtstreeks delen van gegevens met gegevensgebruikers zijn selfservicerapportage of gegevens die zijn ingesloten in andere ervaringen, met behulp van hulpprogramma's zoals Power BI.

Notitie

Voordat u gegevens deelt, controleert u of u de volgende secties hebt gelezen. Voor het delen van gegevens is mogelijk governance vereist om de gegevens te beveiligen. En als de gegevens meerdere clouds omvatten, kan centralisatie nodig zijn. Als gegevens zich in toepassingen bevinden, moet u deze verzamelen om ze te kunnen delen.

Gegevens beheren

Het delen van gegevens kan snel een minimaal levensvatbaar product opleveren voor gebruik in klantgesprekken. Om die gedeelde gegevens om te zetten in nuttige en bruikbare kennis, is er echter meer nodig.

Nadat een hypothese is gevalideerd via het delen van gegevens, is de volgende ontwikkelingsfase doorgaans gegevensbeheer.

Gegevensbeheer is een breed onderwerp waarvoor een eigen toegewezen framework kan worden vereist, een kwestie die buiten het bereik van de Cloud Adoption Framework valt.

Er zijn verschillende aspecten van gegevensbeheer die u moet overwegen zodra u de hypothese van de klant valideert. Bijvoorbeeld:

  • Zijn de gedeelde gegevens gevoelig?Gegevens moeten worden geclassificeerd voordat ze openbaar worden gedeeld om de belangen van klanten en het bedrijf te beschermen.
  • Als de gegevens gevoelig zijn, zijn deze dan beveiligd? Bescherming van gevoelige gegevens is een must voor gedemocratiseerde gegevens. De voorbeeldworkload die wordt besproken in Gegevensoplossingen beveiligen bevat enkele verwijzingen voor het beveiligen van gegevens.
  • Zijn de gegevens gecatalogeerd? Het identificeren van de aard van de gedeelde gegevens helpt bij gegevensbeheer op de lange termijn. Hulpprogramma's voor het documenteren van gegevens, zoals Azure Data Catalog, maken dit proces veel eenvoudiger in de cloud. Richtlijnen met betrekking tot de aantekening van gegevens en de documentatie van gegevensbronnen kunnen het proces versnellen.

Wanneer democratisering van gegevens belangrijk is voor een klantgerichte hypothese, moet u ervoor zorgen dat de governance van gedeelde gegevens in het releaseplan staat. Dit beschermt klanten, gegevensgebruikers en het bedrijf.

Gegevens centraliseren

Centralisatie van gegevens leidt tot zinvollere rapportage, zorgt ervoor dat dezelfde gegevens beschikbaar zijn in de hele organisatie en verhoogt uw ROI. Wanneer gegevens verspreid zijn over een IT-omgeving, kunnen mogelijkheden om te innoveren uiterst beperkt, duur en tijdrovend zijn. De cloud biedt nieuwe mogelijkheden om gegevens te centraliseren. Wanneer centralisatie van meerdere gegevensbronnen vereist is om te bouwen met empathie van de klant, kan de cloud het testen van hypothesen versnellen.

Waarschuwing

Centralisatie van gegevens vormt een risicopunt in elk innovatieproces. Wanneer gegevens centralisatie een technische piek is en geen bron van klantwaarde, raden we u aan centralisatie uit te stellen totdat de hypothesen van de klant zijn gevalideerd.

Wanneer u centraliseert, hebt u een geschikt gegevensarchief nodig voor de gecentraliseerde gegevens. Het is een goede gewoonte om een datawarehouse in de cloud tot stand te brengen. Deze schaalbare optie biedt een centrale locatie voor al uw gegevens. Dit type oplossing is beschikbaar in opties voor online analytische verwerking (OLAP) of big data.

De referentiearchitecturen voor OLAP - en big data-oplossingen kunnen u helpen bij het kiezen van de meest geschikte centralisatieoplossing in Azure. Als een hybride oplossing vereist is, kan de referentiearchitectuur voor het uitbreiden van on-premises gegevens ook helpen bij het versnellen van de ontwikkeling van oplossingen.

Belangrijk

Voor sommige behoeften en oplossingen van klanten kan een eenvoudige aanpak voldoende zijn. De cloudarchitect moet het team uitdagen om goedkope oplossingen te overwegen om de hypothese van de klant te valideren, met name tijdens de vroege ontwikkeling. In deze sectie over het verzamelen van gegevens worden scenario's besproken die een andere oplossing voor uw situatie kunnen voorstellen.

Gegevens verzamelen

De twee primaire vormen van gegevensverzameling zijn integratie en opname.

Integratie: Gegevens die zich in een bestaand gegevensarchief bevinden, kunnen worden geïntegreerd in het gecentraliseerde gegevensarchief met behulp van traditionele technieken voor gegevensverplaatsing. Dit is met name gebruikelijk voor scenario's waarin gegevensopslag in meerdere clouds is betrokken. Bij deze technieken worden de gegevens uit het bestaande gegevensarchief geëxtraheerd en vervolgens in het centrale gegevensarchief geladen. Op een bepaald moment in dit proces worden de gegevens doorgaans getransformeerd om bruikbaarder en relevanter te zijn in de centrale opslag.

Cloudhulpprogramma's hebben deze technieken omgezet in hulpprogramma's voor betalen per gebruik, waardoor de toegangsdrempel voor gegevensverzameling en centralisatie is verkleind. Hulpprogramma's zoals Azure Database Migration Service en Azure Data Factory zijn twee voorbeelden. De referentiearchitectuur voor Data Factory met een OLAP-gegevensarchief is een voorbeeld van een dergelijke oplossing.

Ingestion: Sommige gegevens bevinden zich niet in een bestaand gegevensarchief. Wanneer deze tijdelijke gegevens een primaire bron van innovatie zijn, kunt u overwegen om alternatieve benaderingen te overwegen. Tijdelijke gegevens kunnen worden gevonden in verschillende bestaande bronnen, zoals toepassingen, API's, gegevensstromen, IoT-apparaten, een blockchain, een toepassingscache, in media-inhoud of zelfs in platte bestanden.

U kunt deze verschillende vormen van gegevens integreren in een centraal gegevensarchief op een OLAP- of big data-oplossing. Voor vroege iteraties van de build-measure-learn-cyclus kan een OLTP-oplossing (Online Transactional Processing) echter voldoende zijn om een klanthypothese te valideren. OLTP-oplossingen zijn niet de beste optie voor elk rapportagescenario. Wanneer u echter bouwt met empathie van klanten, is het belangrijker om u te richten op de behoeften van de klant dan op beslissingen voor technische hulpprogramma's. Nadat de klanthypothese op schaal is gevalideerd, is mogelijk een geschikter platform vereist. De referentiearchitectuur van OLTP-gegevensarchieven kan u helpen bepalen welk gegevensarchief het meest geschikt is voor uw oplossing.

Virtualiseren: Integratie en opname van gegevens kunnen innovatie soms vertragen. Wanneer er al een oplossing voor gegevensvirtualisatie beschikbaar is, kan dit een redelijkere aanpak zijn. Opname en integratie kunnen zowel opslag- als ontwikkelingsvereisten dupliceren, gegevenslatentie toevoegen, de kwetsbaarheid voor aanvallen vergroten, kwaliteitsproblemen veroorzaken en governance-inspanningen verhogen. Gegevensvirtualisatie is een moderner alternatief dat de oorspronkelijke gegevens op één locatie achterlaat en passthrough- of in de cache opgeslagen query's van de brongegevens maakt.

SQL Server 2017 en Azure SQL Data Warehouse beide ondersteuning voor PolyBase, de benadering van gegevensvirtualisatie die het meest wordt gebruikt in Azure.

Volgende stappen

Met een strategie voor het democratiseren van gegevens wilt u vervolgens benaderingen voor toepassingsontwikkeling evalueren.