Översikt över arkitekturer
Innan du börjar bygga ut dataarkitekturerna i ditt analysramverk i molnskala bör du läsa artiklarna i följande tabell.
Avsnitt | beskrivning |
---|---|
Skapa en initial strategi | Så här skapar du din datastrategi och pivot för att bli en datadriven organisation. |
Definiera din plan | Så här utvecklar du en plan för analys i molnskala. |
Förbereda analysegendom | Översikt över hur du förbereder din molnskalig analysegendom med viktiga designområdesöverväganden som företagsregistrering, nätverk, identitets- och åtkomsthantering, principer, affärskontinuitet och haveriberedskap. |
Styra din analys | Krav för att styra data, datakatalog, ursprung, hantering av huvuddata, datakvalitet, avtal för datadelning och metadata. |
Skydda din analysegendom | Skydda analysegendom med autentisering och auktorisering, datasekretess och hantering av dataåtkomst. |
Organisera personer och team | Så här organiserar du effektiva åtgärder, roller, team och teamfunktioner. |
Hantera din analysegendom | Hur du etablerar plattform och observerbarhet för ett scenario. |
Fysisk arkitektur
Den fysiska implementeringen av analys i molnskala består av två huvudarkitekturer: landningszonen för datahantering och datalandningszonen.
Dataprogram
Dataprogram är ett grundläggande begrepp för att leverera en dataprodukt och kan anpassas till både lakehouse- och datanätmönster.
Analys i molnskala
Du kan skala distributionen av analys i molnskala med hjälp av flera datalandningszoner.
Datanät
Implementera datanät med hjälp av analys i molnskala. Även om de flesta riktlinjer för analys i molnskala gäller finns det vissa skillnader att vara medveten om för datadomäner, självbetjäningsdataplattformar, registrering av dataprodukter, styrning, datamarknad och datadelning.
Distributionsmallar för analys i molnskala
I följande tabell visas referensmallar som du kan distribuera.
Lagringsplats | Innehåll | Obligatoriskt | Distributionsmodell |
---|---|---|---|
Mall för datahantering | Centrala datahanteringstjänster och delade datatjänster som datakatalog och lokalt installerad integrationskörning | Ja | En analys per molnskala |
Mall för datalandningszon | Delade tjänster i datalandningszonen, inklusive inmatnings-, hanterings- och datalagringstjänster | Ja | En per datalandningszon |
Dataintegreringsmall – batchbearbetning | Ytterligare tjänster som krävs för bearbetning av batchdata | Nej | En eller flera per datalandningszon |
Dataintegreringsmall – dataströmbearbetning | Ytterligare tjänster som krävs för dataströmbearbetning | Nej | En eller flera per datalandningszon |
Dataproduktmall – analys och datavetenskap | Ytterligare tjänster som krävs för dataanalys och AI | Nej | En eller flera per datalandningszon |
Dessa mallar innehåller Azure Resource Manager-mallar, mallarnas parameterfiler och CI/CD-pipelinedefinitioner för resursdistribution.
Mallar kan ändras över tid på grund av nya Azure-tjänster och krav. Skydda varje lagringsplatss huvudgren så att den förblir felfri och redo för förbrukning och distribution. Använd en utvecklingsprenumeration för att testa mallkonfigurationsändringar innan du sammanfogar funktionsförbättringar till huvudgrenen.
Ansluta till miljöer privat
Referensarkitekturen är säker avsiktligt. Den använder en säkerhetsmetod med flera lager för att övervinna vanliga dataexfiltreringsrisker.
Den enklaste säkerhetslösningen är att vara värd för en jumpbox i det virtuella nätverket i landningszonen för datahantering eller datalandningszonen för att ansluta till datatjänsterna via privata slutpunkter.
Vanliga frågor och svar
En lista med frågor och svar om analys i molnskala finns i Vanliga frågor och svar.