Ideeën voor oplossingen
Dit artikel is een oplossingsidee. Als u wilt dat we de inhoud uitbreiden met meer informatie, zoals mogelijke gebruiksvoorbeelden, alternatieve services, implementatieoverwegingen of prijsrichtlijnen, kunt u ons dit laten weten door gitHub-feedback te geven.
Met deze architectuur kunt u alle gegevens op elke schaal combineren met aangepaste machine learning en bijna realtime gegevensanalyses krijgen op streamingservices.
Architectuur
Een Visio-bestand van deze architectuur downloaden.
Gegevensstroom
- Breng al uw gestructureerde, ongestructureerde en semi-gestructureerde gegevens (logboeken, bestanden en media) samen met behulp van Synapse Pipelines om Azure Data Lake Storage.
- Gebruik Apache Spark-pools om de structuurloze gegevenssets op te schonen en te transformeren en te combineren met gestructureerde gegevens uit operationele databases of datawarehouses.
- Gebruik schaalbare machine learning/deep learning-technieken om diepere inzichten uit deze gegevens af te leiden met behulp van Python, Scala of .NET, met notebook-ervaringen in Apache Spark-pool.
- Pas Apache Spark-pool en Synapse-pijplijnen toe in Azure Synapse Analytics om gegevens op schaal te openen en te verplaatsen.
- Query's uitvoeren op en rapporteren over gegevens in Power BI.
- Gebruik de inzichten van Apache Spark-pools voor Azure Cosmos DB om ze toegankelijk te maken via web- en mobiele apps.
Werkstroom
- Azure Synapse Analytics is het snelle, flexibele en vertrouwde clouddatawarehouse waarmee u elastisch en onafhankelijk kunt schalen, berekenen en opslaan, met een enorm parallelle verwerkingsarchitectuur.
- Documentatie voor Synapse Pipelines biedt u de mogelijkheid om etl-/ELT-werkstromen te maken, te plannen en te organiseren.
- Azure Blob Storage is een zeer schaalbare objectopslag voor elk type ongestructureerde gegevensafbeeldingen, video's, audio, documenten en eenvoudiger en rendabeler.
- Azure Synapse Analytics Spark-pools is een snel, eenvoudig en gezamenlijk op Apache Spark gebaseerd analyseplatform.
- Azure Cosmos DB is een wereldwijd gedistribueerde databaseservice met meerdere modellen. Meer informatie over het repliceren van uw gegevens in een willekeurig aantal Azure-regio's en het schalen van uw doorvoer onafhankelijk van uw opslag.
- met Azure Synapse Link voor Azure Cosmos DB kunt u bijna realtime analyses uitvoeren op operationele gegevens in Azure Cosmos DB, zonder dat dit invloed heeft op de prestaties of kosten van uw transactionele workload, met behulp van de twee analyse-engines die beschikbaar zijn in uw Azure Synapse werkruimte: SQL Serverloze en Spark-pools.
- Azure Analysis Services is een zakelijke analyse als een service waarmee u uw BI-oplossing met vertrouwen kunt beheren, implementeren, testen en leveren.
- Power BI is een suite met hulpprogramma's voor bedrijfsanalyse die inzichten in uw hele organisatie bieden. Maak verbinding met honderden gegevensbronnen, vereenvoudig gegevensvoorbereiding en maak ongeplande analyses mogelijk. Maak prachtige rapporten en publiceer deze vervolgens voor uw organisatie voor gebruik op internet en op mobiele apparaten.
Alternatieven
- Synapse Link is de voorkeursoplossing van Microsoft voor analyses boven op Azure Cosmos DB-gegevens.
Scenariodetails
Transformeer uw gegevens in bruikbare inzichten met behulp van de beste machine learning-hulpprogramma's in zijn klasse. Met deze oplossing kunt u alle gegevens op elke schaal combineren en aangepaste machine learning-modellen op schaal bouwen en implementeren. Als u wilt weten hoe gegevensplatforms op ondernemingsniveau worden ontworpen als onderdeel van een bedrijfslandingszone, raadpleegt u de documentatie over Cloud Adoption Framework Data-landingszone.
Potentiële gebruikscases
Organisaties hebben de mogelijkheid om toegang te krijgen tot meer gegevens dan ooit tevoren. Geavanceerde analyses helpen om te profiteren van gegevens insights. Dit zijn onder andere de volgende gebieden:
- Klantenservice.
- Voorspellend onderhoud.
- Producten of services aanbevelen.
- Systeemoptimalisatie van alles, van toeleveringsketens tot datacenterbewerkingen.
- Product- en servicesontwikkeling.
Overwegingen
Kostenoptimalisatie
Kostenoptimalisatie gaat over het zoeken naar manieren om onnodige uitgaven te verminderen en de operationele efficiëntie te verbeteren. Zie Overzicht van de pijler kostenoptimalisatie voor meer informatie.
Volgende stappen
- Meer informatie over het ontwerp van gegevensplatforms op ondernemingsniveau
- Meer informatie over het ontwerpen en implementeren van een end-to-end platform voor gegevensanalyse
Zie de volgende documentatie over de services die in deze architectuur worden aanbevolen:
- Documentatie voor Synapse Analytics
- Documentatie voor Synapse-pijplijnen
- Inleiding tot objectopslag in Azure
- Azure Synapse Analytics Spark-pools
- Documentatie voor Azure Cosmos DB
- Documentatie voor Analysis Services
- Documentatie voor Power BI
Gerelateerde resources
- Een data lakehouse beveiligen met Azure Synapse Analytics
- Operationele gegevens op MongoDB Atlas analyseren met behulp van Azure Synapse Analytics
- Big data-analyse met beveiliging op bedrijfsniveau met behulp van Azure Synapse
- Spaceborne-gegevensanalyse met Azure Synapse Analytics
- End-to-end analyse met Azure Synapse