Co je Azure Synapse Analytics?

Azure Synapse je podniková analytická služba, která zkracuje dobu potřebnou k získání přehledu o datových skladech a systémech velkých objemů dat. Azure Synapse spojuje to nejlepší z technologií SQL používaných v podnikových datových skladech, technologie Spark používané pro velké objemy dat, Data Explorer pro analýzu protokolů a časových řad, kanály pro integraci dat a ETL/ELT a hloubkovou integraci s dalšími službami Azure, jako jsou Power BI, CosmosDB a AzureML.

Diagram architektury Azure Synapse Analytics

Špičkový SQL

Synapse SQL je distribuovaný dotazovací systém pro T-SQL, který umožňuje scénáře virtualizace dat a datové sklady a rozšiřuje T-SQL o scénáře streamování a strojového učení.

  • Synapse SQL nabízí modely bezserverových i vyhrazených prostředků. Pokud potřebujete předvídatelný výkon a náklady, vytvoříte vyhrazené fondy SQL, kterými si rezervujete výkon pro data uložená v tabulkách SQL. V případě neplánovaných nebo nárazových úloh použijte vždy dostupný bezserverový koncový bod SQL.
  • Použití integrovaných možností streamování k rozdělení dat z cloudových zdrojů dat do tabulek SQL
  • Integrace AI s SQL pomocí modelů strojového učení k určení skóre dat pomocí funkce PREDICT jazyka T-SQL

Standardní Apache Spark

Apache Spark pro Azure Synapse hluboce a bezproblémově integruje Apache Spark – nejoblíbenější open source modul pro velké objemy dat používaný pro přípravu dat, přípravu dat, ETL a strojové učení.

  • Modely ML s algoritmy SparkML a integrací AzureML pro Apache Spark 3.1 s integrovanou podporou Linux Foundation Delta Lake.
  • Zjednodušený model prostředků, který vás osvobodí od starostí o správu clusterů.
  • Rychlé spuštění Sparku a agresivní automatické škálování
  • Integrovaná podpora pro .NET pro Spark, která umožňuje v aplikaci Spark opakovaně používat znalosti jazyka C# a stávající kód .NET.

Práce se službou Data Lake

Azure Synapse odstraňuje tradiční technologické překážky mezi společným používáním SQL a Sparku. Můžete je bez problémů kombinovat a sladit na základě vašich potřeb a odborných znalostí.

  • Tabulky definované u souborů v datovém jezeře bez problémů využívá Spark nebo Hive.
  • SQL a Spark můžou přímo zkoumat a analyzovat soubory Parquet, CSV, TSV a JSON uložené v datovém jezeře.
  • Rychlé a škálovatelné načítání dat mezi databázemi SQL a Spark

Integrovaná integrace dat

Azure Synapse obsahuje stejný modul pro integraci dat a prostředí jako Azure Data Factory, což umožňuje vytvářet bohaté kanály ETL ve velkém měřítku, aniž byste museli opustit Azure Synapse Analytics.

  • Ingestování dat z více než 90 zdrojů dat
  • Code-Free ETL s aktivitami toku dat
  • Orchestrace poznámkových bloků, úloh Sparku, uložených procedur, skriptů SQL a dalších

Data Explorer (Preview)

Azure Synapse Data Explorer poskytuje zákazníkům interaktivní dotazovací prostředí, které umožňuje získat přehledy z dat protokolů a telemetrie. Modul runtime Data Explorer analytics je optimalizovaný pro efektivní analýzu protokolů s využitím výkonné technologie indexování, která automaticky indexuje volnotextová a částečně strukturovaná data, která se v telemetrických datech běžně nacházejí.

Použijte Data Explorer jako datovou platformu pro vytváření řešení analytiky protokolů a IoT téměř v reálném čase pro:

  • Konsolidujte a korelujte data protokolů a událostí napříč místními, cloudovými zdroji dat a zdroji dat třetích stran.
  • Zrychlení cesty k provoznímu prostředí AI (rozpoznávání vzorů, detekce anomálií, prognózování a další)
  • Nahrazením řešení prohledávání protokolů založených na infrastruktuře ušetříte náklady a zvýšíte produktivitu.
  • Sestavte řešení IoT Analytics pro data IoT.
  • Vytvářejte analytická řešení SaaS, která budou nabízet služby vašim interním i externím zákazníkům.

Jednotné prostředí

Synapse Studio poskytuje podnikům jediný způsob, jak vytvářet řešení, udržovat a zabezpečit vše v jediném uživatelském prostředí.

  • Provádění klíčových úloh: ingestování, prozkoumání, příprava, orchestrace, vizualizace
  • Monitorování prostředků, využití a uživatelů v SQL, Sparku a Data Explorer
  • Zjednodušení přístupu k analytickým prostředkům pomocí řízení přístupu na základě role
  • Psaní kódu SQL, Sparku nebo KQL a integrace s podnikovými procesy CI/CD

Zapojení komunity Synapse

Další kroky