Azure-technologieën voor het learn-proces

Voltooid

In deze les leert u hoe u de resultaten van de metingstap in de levenscyclus van innovatie kunt toepassen. U leert ook over het belang van data-democratisering.

Democratisering van gegevens

Zoals u in vorige lessen hebt geleerd, kunt u gegevens van uw klanten verzamelen met behulp van meerdere bronnen. Deze bronnen omvatten micro-enquêtes, gebruiksgegevens die zijn afgeleid van Azure-toepassing Insights en functievlagmen die klanten zelf kunnen beslissen om ze in of uit te schakelen. Hoe meer gegevens u hebt, hoe beter uw beslissingen zijn, maar u hebt een manier nodig om deze steeds toenemende gegevensstroom af te handelen.

In 2014 sprak Satya Nadella over het belang van de datacultuur in een organisatie. Hij zei dat beslissingen niet moeten worden genomen op basis van gevoelens of subjectieve meningen, maar door gegevens te gebruiken om ze te valideren. Hij zei ook dat gegevens beschikbaar moeten zijn voor iedereen die het nodig heeft, en het moet eenvoudig worden omgezet in bruikbare inzichten om gegevensgestuurde beslissingen te vergemakkelijken.

Een organisatie kan alleen uitgebreide gegevensbeslissingen nemen als deze beslissingen zijn gebaseerd op een solide, toegankelijk gegevensplatform. Deze inspanning omvat vier gebieden:

  • Gegevens verzamelen: De eerste stap bij het nemen van gegevensgestuurde beslissingen heeft altijd gegevens. Gegevensverzameling kan meerdere vormen aannemen: migratie van bestaande gegevensopslagplaatsen, het genereren van gegevens uit bronnen zoals Azure-toepassing Inzichten of gegevensopname uit andere bronnen.
  • Gegevens delen: verzamelde gegevens moeten beschikbaar zijn voor iedereen die deze nodig heeft, niet alleen voor gegevensexperts. Alle personen in een organisatie moeten gegevens kunnen gebruiken om hun beslissingen te nemen.
  • Gegevens centraliseren: gecentraliseerde gegevensplatforms kunnen helpen bij het vereenvoudigen van het delen en beheren van gegevens.
  • Gegevens beheren: het delen van gegevens betekent niet dat alle gegevens beschikbaar moeten zijn voor iedereen. Zorg ervoor dat gevoelige gegevens worden beveiligd, bijgehouden en beheerd voordat u deze deelt.

Azure-gegevensplatform

Het Azure-platform heeft betrekking op de volledige levenscyclus van gegevens, wat essentieel is voor gegevensgestuurde besluitvorming en democratisering van gegevens. Van lichtgewicht, on-demand databases tot enorme datawarehouses of flexibele NoSQL-systemen, kunt u met het Azure-gegevensplatform de vier gebieden van gegevensactiviteit behandelen.

Gegevens verzamelen

Het Azure-gegevensecosysteem bevat services en hulpprogramma's voor het migreren, opnemen, opslaan en analyseren van gegevens. In de volgende lijst ziet u slechts een paar van de mechanismen die u kunt gebruiken om gegevens te verwerken en deze beschikbaar te maken voor later delen om gegevensgestuurde besluitvorming te vergemakkelijken:

  • Gegevensanalyse: Azure Synapse Analytics is een zakelijke analyseservice waarmee u sneller inzicht krijgt in datawarehouses en big data-systemen. Azure Synapse Analytics combineert het beste van:
    • SQL-technologieën die worden gebruikt in datawarehousing voor ondernemingen.
    • Spark-technologieën die worden gebruikt voor big data.
    • Pijplijnen voor gegevensintegratie en ETL (extraheren, transformeren, laden) en ELT (extraheren, laden, transformeren).
    • Diepgaande integratie met andere Microsoft-services zoals Power BI, Azure Cosmos DB en Azure Machine Learning.
  • Gegevensmigratie: Gegevens kunnen al in bestaande bronnen worden opgeslagen, maar moeten worden gemigreerd naar een modern platform voordat ze kunnen worden geconverteerd naar bruikbare inzichten. Azure Database Migration Service bevat hulpprogramma's die helpen bij gegevensmigraties van systemen zoals SQL Server, PostgreSQL, Oracle en MongoDB.
  • Gegevensverwerking: Azure bevat services voor het analyseren en transformeren van gegevensstromen met Azure Stream Analytics en het uitvoeren van ETL-processen op grote schaal met Azure Data Factory.

Delen van gegevens

Microsoft Power BI is een set hulpprogramma's waarmee gegevens uit verschillende bronnen worden samengevoegd in geïntegreerde, interactieve visualisaties. Gebruikers kunnen de gegevens bekijken door intuïtieve besturingselementen te gebruiken. De kracht van inzichten is beschikbaar voor iedereen in een organisatie, niet alleen voor dataprofessionals.

Eigenaren van gebieden kunnen rapporten en dashboards maken die de relevante informatie bevatten over specifieke aspecten van de toepassing. Nadat nieuwe functionaliteit is geïntroduceerd om een hypothese te valideren, zijn gegevens direct beschikbaar om de hypothese te valideren of af te wijzen op basis van echt klantgebruik.

Microsoft Power BI kan u helpen bij het delen van gegevens vanuit meerdere perspectieven. Hieronder volgen een aantal voorbeelden:

  • Gegevens delen met collega's en partners: Power BI-dashboards vereenvoudigen het verbruik van gegevens. Met visualisaties kunnen mensen die geen gegevensexperts zijn, inzoomen op gegevens zonder dat ze bekend hoeven te zijn met de onderliggende structuur.
  • Snel gegevensinzichten genereren: Power BI kan automatisch visualisaties van gegevenssets genereren met de Snelle inzichten-functionaliteit. U kunt snel dashboards maken en gegevenscorrelaties vinden die in eerste instantie mogelijk niet duidelijk waren.
  • Rapporten insluiten in een website of portal: Met Power BI hebt u niet alleen toegang tot visualisaties in de systeemeigen Power BI-portal, maar u kunt ook rapporten en dashboards insluiten in andere webtoepassingen. Op deze manier hoeven gebruikers hun vertrouwde bedrijfswebsites niet te verlaten om de gegevens te vinden die ze nodig hebben voor hun besluitvormingsproces.

Centralisatie van gegevens

Het belangrijkste probleem van gegevens centralisatie is schaal op verschillende niveaus. Met het risico om te veel te illustreren, kunnen we het verminderen tot de 3 V's van big data:

  • Volume: Azure Data Lake Storage Gen2 is een rendabel en schaalbaar Azure-platform voor gegevensopslag. Op basis van de enorme schaalbaarheid van Azure Storage is Azure Data Lake Storage ontworpen voor het onderhouden van meerdere petabytes aan informatie en tegelijkertijd honderden gigabits aan doorvoer.
  • Variëteit: Deze term verwijst vaak naar het feit dat gegevens niet altijd gestructureerd zijn. Mogelijk hebt u ook semi-gestructureerde en zelfs ongestructureerde gegevens. Azure Synapse schijnt op dit gebied, omdat het het beste van SQL-technologieën combineert die worden gebruikt in zakelijke datawarehousing met Spark, dat vaak wordt gebruikt voor big data.
  • Snelheid: een probleem dat vaak voorkomt in oudere gegevensarchitecturen, is de interdependency tussen opslagcapaciteit, analysesnelheid en opnamesnelheid. In Azure-gegevensoplossingen kan een organisatie verschillende dimensies van het platform onafhankelijk schalen door ze los te koppelen. Gegevens kunnen worden opgenomen, verwerkt en gedeeld via gegevenspijplijnen die gebruikmaken van de vereiste Azure-gegevensservices, zoals in de bedrijfsinformatiearchitectuur wordt weergegeven.

Gegevens-governance

In de huidige wereld vertegenwoordigen gegevens zowel een kritieke asset als een aanzienlijke verantwoordelijkheid. Opgeslagen gegevens bevatten vaak vertrouwelijke informatie die kan leiden tot financiële of persoonlijke schade als deze ongepast worden gelekt of gedeeld. Het impliciet opslaan en verwerken van gegevens betekent dat een organisatie die verantwoordelijkheid accepteert. Wettelijke voorschriften kunnen leiden tot sancties voor organisaties die persoonsgegevens of vertrouwelijke gegevens verkeerd verwerken.

Als gevolg hiervan is gegevensgovernance essentieel voor elke organisatie die een doel heeft van gegevens democratisatie. De eerste stap voor gegevensbeheer is het classificeren van gegevens die op specifieke manieren moeten worden behandeld. Als voorbeeld gebruikt Microsoft deze gegevenscategorieën intern voor gegevensclassificatie:

  • Niet-zakelijk: gegevens uit uw persoonlijke leven die niet bij Microsoft horen.
  • Openbaar: Bedrijfsgegevens die vrij beschikbaar en goedgekeurd zijn voor openbaar gebruik.
  • Algemeen: Bedrijfsgegevens die niet bedoeld zijn voor een publiek.
  • Vertrouwelijk: Bedrijfsgegevens die schadelijk kunnen zijn voor Microsoft als ze te veel worden gedeeld.
  • Zeer vertrouwelijk: zakelijke gegevens die grote schade aan Microsoft zouden veroorzaken als ze te veel worden gedeeld.

De volgende stap na gegevensclassificatie zorgt ervoor dat elke gegevenscategorie wordt beveiligd tegen onbevoegde toegang. ondersteuning voor Azure deze technologieën die vertrouwelijkheid afdwingen:

  • Versleuteling van data-at-rest: alle Azure-gegevens worden versleuteld wanneer ze worden opgeslagen in Microsoft-datacenters. Sommige Azure-services bieden specifieke versleutelingsfuncties, zoals transparante gegevensversleuteling in Azure Synapse en Azure SQL Database.
  • Versleuteling van gegevens tijdens de vlucht: alle Azure-gegevensservices versleutelen gegevens met TLS/SSL voordat ze via het netwerk worden verzonden. Sommige services, zoals Azure Storage, kunnen optioneel niet-versleuteld verkeer toestaan. Organisaties moeten alle niet-versleutelde communicatie uitschakelen voor elk type gevoelige gegevens.
  • Toegangsbeheer voor gegevens: Azure biedt geavanceerde verificatie- en autorisatiemechanismen voor toegang tot het Azure-platform en voor toegang tot gegevens zelf. Op rollen gebaseerd toegangsbeheer van Azure, Voorwaardelijke toegang en Privileged Identity Management zijn drie voorbeelden van essentiële services die kunnen helpen ervoor te zorgen dat alleen geautoriseerde personen toegang hebben tot gevoelige informatie.
  • Gegevenscontrole: veel nalevingsstandaarden voor regelgeving vragen bewijs van mechanismen voor gegevensbescherming door te documenteren wie bepaalde bewerkingen heeft uitgevoerd en bepaalde gegevens heeft geopend. Zoals beschreven in Auditing voor Azure SQL Database en Azure Synapse Analytics, worden in Azure drie aspecten van controle overwogen:
    • Behoud een audittrail van geselecteerde gebeurtenissen, waar u categorieën van gegevensacties kunt definiëren die moeten worden gecontroleerd.
    • Rapport over databaseactiviteit, optioneel met vooraf geconfigureerde rapporten en dashboards om snel aan de slag te gaan.
    • Rapporten analyseren om verdachte gebeurtenissen, ongebruikelijke activiteiten en trends te ontdekken

Groeimentaliteit

De leerfase levert soms slecht nieuws. Hypothesen waarvan u dacht dat het goed was, kunnen verkeerd blijken te zijn. Openstaan voor alternatieve ideeën is essentieel dat het innovatieproces soepel verloopt. Misschien was de hele hypothese verkeerd, of misschien was het probleem alleen de manier waarop het prototype werd ontwikkeld.

In elk geval moeten conclusies altijd worden ondersteund met gegevens. Het team moet doorgaan met het formuleren van de volgende hypothese, mogelijk een soort revisie of iteratie van de eerste hypothese.

Met bestaande gegevens kunt u mogelijk niet ondubbelzinnig concluderen of de hypothese juist of onjuist was. In dit geval moet de gegevensset die het besluitvormingsproces helpt, worden verbeterd. Introduceer nieuwe telemetriepunten in de toepassing of ontdek nieuwe manieren om informatie over de klantervaring op te halen.

Een groeimentaliteit is in dit stadium fundamenteel. Denk aan hypothesen die verkeerd of gedeeltelijk verkeerd zijn bewezen als leerkansen. Organisaties mogen geen tijd verspillen aan een innovatie die niet de verwachte bedrijfsresultaten genereert.

Waar moet ik naartoe kijken?

In deze les bespreken we nog veel van de concepten in de documentatie van het Cloud Adoption Framework over gegevens democratisering.