Řešení popsané v tomto článku kombinuje celou řadu služeb Azure, které budou ingestovat, ukládat, zpracovávat, rozšiřovat a obsluhovat data a přehledy z různých zdrojů (strukturované, částečně strukturované, nestrukturované a streamované).
Architektura
Stáhněte si soubor aplikace Visio s touto architekturou.
Poznámka:
- Služby, na které se tato architektura vztahuje, jsou pouze podmnožinou mnohem větší řady služeb Azure. Podobné výsledky lze dosáhnout pomocí jiných služeb nebo funkcí, které tento návrh nepokrývá.
- Konkrétní obchodní požadavky pro váš případ použití analýz můžou vyžadovat použití různých služeb nebo funkcí, které nejsou v tomto návrhu považovány.
Tok dat
Případy použití analýz pokryté architekturou znázorňují různé zdroje dat na levé straně diagramu. Data procházejí řešením zespodu následujícím způsobem:
Poznámka:
V následujících částech se Azure Data Lake používá jako domovská stránka pro data v různých fázích životního cyklu dat. Azure Data Lake je uspořádané podle různých vrstev a kontejnerů následujícím způsobem:
- Nezpracovaná vrstva je cílová oblast pro data přicházející ze zdrojových systémů. Jak název napovídá, data v této vrstvě jsou v nezpracované, nefiltrované a nepurifikované podobě.
- V další fázi životního cyklu se data přesunou do rozšířené vrstvy, ve které se data vyčistí, filtrují a případně transformují.
- Data se pak přesunou do kurátorované vrstvy, kde se uchovávají data připravená pro spotřebitele.
Úplnou kontrolu vrstev a kontejnerů Azure Data Lake a jejich použití najdete v dokumentaci k zónám a kontejnerům Data Lake.
Datové služby Azure, nativní cloudový protokol HTAP se službou Azure Cosmos DB a dataverse
Zpracovat
Azure Synapse Link pro Azure Cosmos DB a Azure Synapse Link pro Službu Dataverse umožňují spouštět analýzy téměř v reálném čase přes provozní a obchodní data aplikací pomocí analytických modulů dostupných z pracovního prostoru Azure Synapse: BEZserverové a sparkové fondy.
Pokud používáte Azure Synapse Link pro Azure Cosmos DB, použijte buď bezserverový dotaz SQL, nebo poznámkový blok fondu Sparku. K analytickému úložišti Azure Cosmos DB se dostanete a pak zkombinujete datové sady z provozních dat téměř v reálném čase s daty z datového jezera nebo z datového skladu.
Pokud používáte Azure Synapse Link pro službu Dataverse, použijte dotaz bez serveru SQL nebo poznámkový blok fondu Sparku. K vybraným tabulkám Dataverse se dostanete a pak zkombinujete datové sady z dat obchodních aplikací téměř v reálném čase s daty z datového jezera nebo z datového skladu.
Uložit
- Výsledné datové sady z dotazů SQL Bez serveru je možné zachovat ve vašem datovém jezeře. Pokud používáte poznámkové bloky Sparku, výsledné datové sady se dají zachovat buď ve vašem datovém jezeře, nebo ve službě Data Warehouse (fond SQL).
Sloužit
Načtěte relevantní data z fondu Azure Synapse SQL nebo datového jezera do datových sad Power BI pro vizualizaci a zkoumání dat. Modely Power BI implementují sémantický model, který zjednodušuje analýzu obchodních dat a relací. Obchodní analytici používají sestavy a řídicí panely Power BI k analýze dat a odvození obchodních přehledů.
Data je také možné bezpečně sdílet s jinými obchodními jednotkami nebo externími důvěryhodnými partnery pomocí služby Azure Data Share. Uživatelé dat mají svobodu zvolit formát dat, který chtějí použít, a také to, jaký výpočetní modul je nejvhodnější pro zpracování sdílených datových sad.
Strukturovaná a nestrukturovaná data uložená v pracovním prostoru Synapse se dají použít také k vytváření řešení pro dolování znalostí a k odhalení cenných obchodních přehledů napříč různými typy dokumentů a formáty, včetně dokumentů Office, souborů PDF, obrázků, zvuku, formulářů a webových stránek.
Relační databáze
Ingestování
- Pomocí kanálů Azure Synapse můžete načíst data z široké škály databází, a to jak místně, tak i v cloudu. Kanály je možné aktivovat na základě předem definovaného plánu v reakci na událost nebo je můžete explicitně volat prostřednictvím rozhraní REST API.
Uložit
V rámci vrstvy Nezpracovaného datového jezera uspořádejte datové jezero podle osvědčených postupů, které vrstvy se mají vytvořit, jaké struktury složek se mají používat v jednotlivých vrstvách a jaký formát souborů se mají použít pro jednotlivé analytické scénáře.
Z kanálu Azure Synapse pomocí aktivity kopírování dat připravte data zkopírovaná z relačních databází do nezpracované vrstvy datového jezera Azure Data Lake Store Gen2 . Data můžete uložit v textovém formátu s oddělovači nebo komprimovat jako soubory Parquet.
Zpracovat
Pomocí toků dat, dotazů bez serveru SQL nebo poznámkových bloků Sparku můžete datové sady ověřovat, transformovat a přesouvat z nezpracované vrstvy, prostřednictvím rozšířené vrstvy a do kurátorované vrstvy ve vašem datovém jezeře.
- V rámci transformací dat můžete volat modely strojového trénování z fondů SQL pomocí standardních poznámkových bloků T-SQL nebo Sparku. Tyto modely ML je možné použít k obohacení datových sad a generování dalších obchodních přehledů. Tyto modely strojového učení je možné využívat ze služeb Azure Cognitive Services nebo vlastních modelů ML z Azure ML.
Sloužit
Konečnou datovou sadu můžete obsluhovat přímo z vrstvy Kurátorované datové jezero nebo můžete pomocí aktivity Kopírování dat ingestovat konečnou datovou sadu do tabulek fondu SQL pomocí příkazu COPY pro rychlý příjem dat.
Načtěte relevantní data z fondu Azure Synapse SQL nebo datového jezera do datových sad Power BI pro vizualizaci dat. Modely Power BI implementují sémantický model, který zjednodušuje analýzu obchodních dat a relací. Obchodní analytici používají sestavy a řídicí panely Power BI k analýze dat a odvození obchodních přehledů.
Data je také možné bezpečně sdílet s jinými obchodními jednotkami nebo externími důvěryhodnými partnery pomocí služby Azure Data Share. Uživatelé dat mají svobodu zvolit formát dat, který chtějí použít, a také to, jaký výpočetní modul je nejvhodnější pro zpracování sdílených datových sad.
Strukturovaná a nestrukturovaná data uložená v pracovním prostoru Synapse se dají použít také k vytváření řešení pro dolování znalostí a k odhalení cenných obchodních přehledů napříč různými typy dokumentů a formáty, včetně dokumentů Office, souborů PDF, obrázků, zvuku, formulářů a webových stránek.
Částečně strukturované zdroje dat
Ingestování
Pomocí kanálů Azure Synapse můžete načíst data z široké škály částečně strukturovaných zdrojů dat, a to jak místně, tak i v cloudu. Příklad:
- Ingestování dat ze zdrojů založených na souborech obsahujících soubory CSV nebo JSON
- Připojte se k databázím No-SQL, jako je Azure Cosmos DB nebo MongoDB.
- Volejte rozhraní REST API poskytovaná aplikacemi SaaS, které budou fungovat jako zdroj dat pro kanál.
Uložit
V rámci vrstvy Nezpracovaného datového jezera uspořádejte datové jezero podle osvědčených postupů, které vrstvy se mají vytvořit, jaké struktury složek se mají používat v jednotlivých vrstvách a jaký formát souborů se mají použít pro jednotlivé analytické scénáře.
Z kanálu Azure Synapse pomocí aktivity kopírování dat připravte data zkopírovaná z částečně strukturovaných zdrojů dat do nezpracované vrstvy datového jezera Azure Data Lake Store Gen2 . Uložte data, aby se zachoval původní formát získaný ze zdrojů dat.
Zpracovat
Pro dávkové nebo mikrodávkové kanály použijte buď toky dat, dotazy SQL bez serveru nebo poznámkové bloky Sparku k ověření, transformaci a přesunutí datových sad do kurátorované vrstvy ve vašem datovém jezeře. Bezserverové dotazy SQL zpřístupňují podkladové soubory CSV, Parquet nebo JSON jako externí tabulky, aby je bylo možné dotazovat pomocí T-SQL.
- V rámci transformací dat můžete volat modely strojového učení z fondů SQL pomocí standardních poznámkových bloků T-SQL nebo Sparku. Tyto modely ML je možné použít k obohacení datových sad a generování dalších obchodních přehledů. Tyto modely strojového učení je možné využívat ze služeb Azure Cognitive Services nebo vlastních modelů ML z Azure ML.
Pro scénáře analýzy téměř v reálném čase a analýzy časových řad můžete pomocí fondů Průzkumníka dat snadno ingestovat, konsolidovat a korelovat data protokolů a událostí IoT napříč několika zdroji dat. S fondy Průzkumníka dat můžete pomocí dotazů Kusto (KQL) provádět analýzu časových řad, geoprostorové clusteringy a rozšiřování strojového učení.
Sloužit
Konečnou datovou sadu můžete obsluhovat přímo z vrstvy Kurátorované datové jezero nebo můžete pomocí aktivity Kopírování dat ingestovat konečnou datovou sadu do tabulek fondu SQL pomocí příkazu COPY pro rychlý příjem dat.
Načtěte relevantní data z fondů Azure Synapse SQL, fondů Průzkumníka dat nebo datového jezera do datových sad Power BI pro vizualizaci dat. Modely Power BI implementují sémantický model, který zjednodušuje analýzu obchodních dat a relací. Obchodní analytici používají sestavy a řídicí panely Power BI k analýze dat a odvození obchodních přehledů.
Data je také možné bezpečně sdílet s jinými obchodními jednotkami nebo externími důvěryhodnými partnery pomocí služby Azure Data Share. Uživatelé dat mají svobodu zvolit formát dat, který chtějí použít, a také to, jaký výpočetní modul je nejvhodnější pro zpracování sdílených datových sad.
Strukturovaná a nestrukturovaná data uložená v pracovním prostoru Synapse se dají použít také k vytváření řešení pro dolování znalostí a k odhalení cenných obchodních přehledů napříč různými typy dokumentů a formáty, včetně dokumentů Office, souborů PDF, obrázků, zvuku, formulářů a webových stránek.
Nestrukturované zdroje dat
Ingestování
Pomocí kanálů Azure Synapse můžete načíst data z široké škály nestrukturovaných zdrojů dat, a to jak místně, tak i v cloudu. Příklad:
- Ingestování videa, obrázku, zvuku nebo volného textu ze zdrojů založených na souborech, které obsahují zdrojové soubory.
- Volejte rozhraní REST API poskytovaná aplikacemi SaaS, které budou fungovat jako zdroj dat pro kanál.
Uložit
V rámci vrstvy Nezpracovaného datového jezera uspořádejte datové jezero podle osvědčených postupů, které se mají vytvořit, jaké struktury složek se mají v každé vrstvě používat, a podle toho, jaký formát souborů se má použít pro každý scénář analýzy.
Z kanálu Azure Synapse pomocí aktivity kopírování dat připravte data zkopírovaná z nestrukturovaných zdrojů dat do nezpracované vrstvy datového jezera Azure Data Lake Store Gen2 . Uložte data zachováním původního formátu získaného ze zdrojů dat.
Zpracovat
Poznámkové bloky Sparku můžete použít k ověření, transformaci, rozšiřování a přesouvání datových sad z nezpracované vrstvy, prostřednictvím rozšířené vrstvy a do kurátorované vrstvy ve vašem datovém jezeře.
- V rámci transformací dat můžete volat modely strojového učení z fondů SQL pomocí standardních poznámkových bloků T-SQL nebo Sparku. Tyto modely ML je možné použít k obohacení datových sad a generování dalších obchodních přehledů. Tyto modely strojového učení je možné využívat ze služeb Azure Cognitive Services nebo vlastních modelů ML z Azure ML.
Sloužit
Konečnou datovou sadu můžete obsluhovat přímo z vrstvy Data Lake Kurátorované nebo můžete pomocí aktivity Kopírování dat ingestovat konečnou datovou sadu do tabulek datového skladu pomocí příkazu COPY pro rychlý příjem dat.
Načtěte relevantní data z fondu Azure Synapse SQL nebo datového jezera do datových sad Power BI pro vizualizaci dat. Modely Power BI implementují sémantický model, který zjednodušuje analýzu obchodních dat a relací.
Obchodní analytici používají sestavy a řídicí panely Power BI k analýze dat a odvození obchodních přehledů.
Data je také možné bezpečně sdílet s jinými obchodními jednotkami nebo externími důvěryhodnými partnery pomocí služby Azure Data Share. Uživatelé dat mají svobodu zvolit formát dat, který chtějí použít, a také to, jaký výpočetní modul je nejvhodnější pro zpracování sdílených datových sad.
Strukturovaná a nestrukturovaná data uložená v pracovním prostoru Synapse se dají použít také k vytváření řešení pro dolování znalostí a k odhalení cenných obchodních přehledů napříč různými typy dokumentů a formáty, včetně dokumentů Office, souborů PDF, obrázků, zvuku, formulářů a webových stránek.
Streamování
Ingestování
- K ingestování datových proudů generovaných klientskými aplikacemi nebo zařízeními IoT použijte Azure Event Hubs nebo Azure IoT Hubs . Event Hubs nebo IoT Hub pak budou ingestovat a ukládat streamovaná data, která zachová sekvenci přijatých událostí. Uživatelé se pak můžou připojit ke koncovým bodům služby Event Hubs nebo IoT Hub a načíst zprávy ke zpracování.
Uložit
V rámci vrstvy Nezpracovaného datového jezera uspořádejte datové jezero podle osvědčených postupů, které vrstvy se mají vytvořit, jaké struktury složek se mají používat v jednotlivých vrstvách a jaký formát souborů se mají použít pro jednotlivé analytické scénáře.
Nakonfigurujte koncové body služby Event Hubs Capture nebo IoT Hub Storage tak, aby ukládaly kopii událostí do nezpracované vrstvy vašeho datového jezera Azure Data Lake Store Gen2. Tato funkce implementuje "studenou cestu" vzoru architektury Lambda a umožňuje provádět historické a trendové analýzy dat datového proudu uloženého ve vašem datovém jezeře pomocí bezserverových dotazů SQL nebo poznámkových bloků Sparku podle vzoru pro částečně strukturované zdroje dat popsané výše.
Zpracovat
Pro přehledy v reálném čase použijte úlohu Stream Analytics k implementaci "horké cesty" modelu architektury Lambda a odvozujte přehledy z přenášených dat datového proudu. Definujte aspoň jeden vstup pro datový proud pocházející z event Hubs nebo IoT Hubu, jeden dotaz pro zpracování vstupního datového streamu a jednoho výstupu Power BI do místa, kam se budou odesílat výsledky dotazu.
- V rámci zpracování dat pomocí Stream Analytics můžete volat modely strojového učení, které obohatijí datové sady datových proudů a řídí obchodní rozhodnutí na základě vygenerovaných předpovědí. Tyto modely strojového učení je možné využívat ze služeb Azure Cognitive Services nebo z vlastních modelů ML ve službě Azure Machine Learning.
Pomocí dalších výstupů úlohy Stream Analytics můžete odesílat zpracovávané události do fondů Azure Synapse SQL nebo fondů Data Exploreru pro další případy použití analýz.
V případě scénářů analýzy telemetrie a časových řad téměř v reálném čase můžete pomocí fondů Průzkumníka dat snadno ingestovat události IoT přímo ze služby Event Hubs nebo IoT Hubs. S fondy Průzkumníka dat můžete pomocí dotazů Kusto (KQL) provádět analýzu časových řad, geoprostorové clusteringy a rozšiřování strojového učení.
Sloužit
Obchodní analytici pak pomocí datových sad a řídicích panelů Power BI v reálném čase vizualizují rychle se měnící přehledy vygenerované dotazem Stream Analytics.
Data je také možné bezpečně sdílet s jinými obchodními jednotkami nebo externími důvěryhodnými partnery pomocí služby Azure Data Share. Uživatelé dat mají svobodu zvolit formát dat, který chtějí použít, a také to, jaký výpočetní modul je nejvhodnější pro zpracování sdílených datových sad.
Strukturovaná a nestrukturovaná data uložená v pracovním prostoru Synapse se dají použít také k vytváření řešení pro dolování znalostí a k odhalení cenných obchodních přehledů napříč různými typy dokumentů a formáty, včetně dokumentů Office, souborů PDF, obrázků, zvuku, formulářů a webových stránek.
Komponenty
V architektuře byly použity následující služby Azure:
- Azure Synapse Analytics
- Azure Data Lake Gen2
- Azure Cosmos DB
- Azure Cognitive Services
- Azure Machine Learning
- Azure Event Hubs
- Azure IoT Hub
- Azure Stream Analytics
- Microsoft Purview
- Azure Data Share
- Microsoft Power BI
- Microsoft Entra ID
- Microsoft Cost Management
- Azure Key Vault
- Azure Monitor
- Microsoft Defender for Cloud
- Azure DevOps
- Azure Policy
- GitHub
Alternativy
Ve výše uvedené architektuře jsou kanály Azure Synapse zodpovědné za orchestraci datových kanálů. Kanály služby Azure Data Factory také poskytují stejné funkce, jak je popsáno v tomto článku.
Azure Databricks lze také použít jako výpočetní modul, který slouží ke zpracování strukturovaných a nestrukturovaných dat přímo v datovém jezeře.
Ve výše uvedené architektuře je služba Azure Stream Analytics zodpovědná za zpracování streamovaných dat. Fondy Azure Synapse Spark a Azure Databricks se dají použít také k provedení stejné role při provádění poznámkových bloků.
Clustery Azure HDInsight Kafka je možné použít také k ingestování streamovaných dat a zajištění správné úrovně výkonu a škálovatelnosti vyžadované velkými úlohami streamování.
Službu Azure Functions můžete také využít k vyvolání vlastních modelů ML služby Azure Cognitive Services nebo Azure Machine Learning z kanálu Azure Synapse.
Porovnání jiných alternativ najdete tady:
Podrobnosti scénáře
Tento ukázkový scénář ukazuje, jak používat Azure Synapse Analytics s rozsáhlou řadu služeb Azure Data Services k vytvoření moderní datové platformy, která dokáže zvládnout nejběžnější problémy s daty v organizaci.
Potenciální případy použití
Tento přístup lze použít také k:
- Vytvořte architekturu datového produktu , která se skládá z datového skladu pro strukturovaná data a datové jezero pro částečně strukturovaná a nestrukturovaná data. Můžete se rozhodnout nasadit jeden datový produkt pro centralizovaná prostředí nebo více datových produktů pro distribuovaná prostředí, jako je Data Mesh. Další informace o Správa dat a cílových zónách dat.
- Integrujte relační zdroje dat s jinými nestrukturovanými datovými sadami s využitím technologií pro zpracování velkých objemů dat.
- Pro jednodušší analýzu dat používejte sémantické modelování a výkonné vizualizační nástroje.
- Sdílejte datové sady v rámci organizace nebo s důvěryhodnými externími partnery.
- Implementujte dolování znalostí řešení pro extrakci cenných obchodních informací skrytých na obrázcích, souborech PDF, dokumentech atd.
Doporučení
Zjišťování a řízení
Zásady správného řízení dat jsou běžnou výzvou ve velkých podnikových prostředích. Obchodní analytici musí být na jedné straně schopni zjišťovat a rozumět datovým prostředkům, které jim můžou pomoct řešit obchodní problémy. Na druhou stranu ředitelé dat chtějí získat přehled o ochraně osobních údajů a zabezpečení obchodních dat.
Microsoft Purview
Microsoft Purview slouží ke zjišťování dat a přehledům o datových prostředcích, klasifikaci dat a citlivosti, která pokrývá celou oblast dat organizace.
Microsoft Purview vám může pomoct udržovat obchodní glosář s konkrétní obchodní terminologií potřebnou pro uživatele, aby pochopili sémantiku toho, co datové sady znamenají a jak se mají používat v celé organizaci.
Můžete zaregistrovat všechny zdroje dat a uspořádat je do kolekcí, které slouží také jako hranice zabezpečení pro vaše metadata.
Nastavte pravidelné kontroly , které automaticky katalogují a aktualizují relevantní metadata o datových prostředcích v organizaci. Microsoft Purview může také automaticky přidávat informace o rodokmenu dat na základě informací z kanálů Azure Data Factory nebo Azure Synapse.
Klasifikaci dat a popisky citlivosti dat je možné do datových prostředků přidat automaticky na základě předem nakonfigurovaných nebo celních pravidel použitých během pravidelných kontrol.
Odborníci na zásady správného řízení dat můžou pomocí sestav a přehledů generovaných Microsoft Purview udržet kontrolu nad celým prostředím dat a chránit organizaci před všemi problémy se zabezpečením a ochranou osobních údajů.
Služby platformy
Aby bylo možné zlepšit kvalitu řešení Azure, postupujte podle doporučení a pokynů definovaných v architektuře Azure s pěti pilíři efektivity architektury: Optimalizace nákladů, efektivita provozu, efektivita výkonu, spolehlivost a zabezpečení.
V následujících doporučeních by se následující služby měly považovat za součást návrhu:
- Microsoft Entra ID: služby identit, jednotné přihlašování a vícefaktorové ověřování napříč úlohami Azure.
- Microsoft Cost Management: finanční zásady správného řízení nad úlohami Azure
- Azure Key Vault: Zabezpečení přihlašovacích údajů a správy certifikátů. Například azure Synapse Pipelines, fondy Azure Synapse Spark a Azure ML můžou načítat přihlašovací údaje a certifikáty ze služby Azure Key Vault, které se používají k bezpečnému přístupu k úložišti dat.
- Azure Monitor: Shromážděte, analyzujte a zareagujte na telemetrické informace o prostředcích Azure, abyste proaktivně identifikovali problémy a maximalizovali výkon a spolehlivost.
- Microsoft Defender pro cloud: posílení a monitorování stavu zabezpečení úloh Azure
- Azure DevOps a GitHub: Implementujte postupy DevOps pro vynucení automatizace a dodržování předpisů pro vaše kanály vývoje a nasazení úloh pro Azure Synapse a Azure ML.
- Azure Policy: Implementujte organizační standardy a zásady správného řízení pro konzistenci prostředků, dodržování právních předpisů, zabezpečení, náklady a správu.
Důležité informace
Tyto aspekty implementují pilíře dobře architektuře Azure, což je sada hlavních principů, které je možné použít ke zlepšení kvality úlohy. Další informace naleznete v tématu Microsoft Azure Well-Architected Framework.
Technologie v této architektuře byly vybrány, protože každá z nich poskytuje nezbytné funkce pro řešení nejběžnějších problémů s daty v organizaci. Tyto služby splňují požadavky na škálovatelnost a dostupnost a pomáhají jim řídit náklady. Služby, na které se tato architektura vztahuje, jsou pouze podmnožinou mnohem větší řady služeb Azure. Podobné výsledky lze dosáhnout pomocí jiných služeb nebo funkcí, které tento návrh nepokrývá.
Konkrétní obchodní požadavky pro případy použití analýz můžou také požádat o použití různých služeb nebo funkcí, které nejsou v tomto návrhu považovány.
Podobnou architekturu je možné implementovat také pro předprodukční prostředí, kde můžete vyvíjet a testovat úlohy. Zvažte konkrétní požadavky pro vaše úlohy a možnosti každé služby pro nákladově efektivní předprodukční prostředí.
Optimalizace nákladů
Optimalizace nákladů se zabývá způsoby, jak snížit zbytečné výdaje a zlepšit efektivitu provozu. Další informace najdete v tématu Přehled pilíře optimalizace nákladů.
K odhadu nákladů použijte cenovou kalkulačku Azure. Ideální jednotlivá cenová úroveň a celkové náklady na každou službu zahrnutou v architektuře závisí na množství dat, která se mají zpracovat a uložit, a přijatelnou očekávanou úroveň výkonu. Další informace o cenách jednotlivých služeb najdete v níže uvedeném průvodci:
Bezserverová architektura Azure Synapse Analytics umožňuje nezávisle škálovat úrovně výpočetních prostředků a úložiště. Výpočetní prostředky se účtují na základě využití a tyto prostředky můžete škálovat nebo pozastavit na vyžádání. Prostředky úložiště se účtují na terabajt, takže se vaše náklady zvýší, jakmile ingestujete další data.
Azure Data Lake Gen2 se účtuje na základě množství uložených dat a na základě počtu transakcí pro čtení a zápis dat.
Služba Azure Event Hubs a Azure IoT Hubs se účtují na základě množství výpočetních prostředků potřebných ke zpracování datových proudů zpráv.
Poplatky za Azure Machine Learning pocházejí z množství výpočetních prostředků používaných k trénování a nasazování modelů strojového učení.
Služby Cognitive Services se účtují na základě počtu volání, které provedete v rozhraních API služby.
Microsoft Purview je cenován na základě počtu datových prostředků v katalogu a množství výpočetního výkonu potřebného ke kontrole.
Azure Stream Analytics se účtuje na základě výpočetního výkonu potřebného ke zpracování dotazů streamu.
Power BI nabízí různé možnosti produktu pro různé požadavky. Power BI Embedded poskytuje možnost založenou na Azure pro vkládání funkcí Power BI do vašich aplikací. Instance Power BI Embedded je součástí výše uvedené ukázky cen.
Služba Azure Cosmos DB je cenová na základě množství úložiště a výpočetních prostředků vyžadovaných vašimi databázemi.
Nasazení tohoto scénáře
Toto nasazení vám dává možnost implementovat celou referenční architekturu nebo zvolit, jaké úlohy potřebujete pro váš případ použití analýzy. Máte také možnost vybrat, jestli jsou služby přístupné prostřednictvím veřejných koncových bodů nebo jestli se mají přistupovat jenom přes privátní koncové body.
Pomocí následujícího tlačítka nasaďte odkaz pomocí webu Azure Portal.
Podrobné informace a další možnosti nasazení najdete v průvodci nasazením v úložišti GitHub s dokumentací a kódem použitým k definování tohoto řešení.
Přispěvatelé
Tento článek aktualizuje a udržuje Microsoft. Původně byla napsána následujícími přispěvateli.
Hlavní autor:
- Fabio Braga | Hlavní technický architekt MTC
Pokud chcete zobrazit neveřejné profily LinkedIn, přihlaste se na LinkedIn.
Další kroky
Projděte si pokyny definované ve scénáři správy a analýzy dat Azure pro škálovatelné analytické prostředí v Azure.
Prozkoumejte studijní programy Datoví technici na webu Microsoft learn, kde najdete další školicí obsah a cvičení o službách, které jsou součástí této referenční architektury.
Projděte si dokumentaci a nasaďte referenční architekturu pomocí akcelerátoru nasazení dostupného na GitHubu.