Mi az Azure Synapse Data Explorer? (Előzetes verzió)

Fontos

Az Azure Synapse Analytics Data Explorer (előzetes verzió) 2025. október 7-én megszűnik. Ezen dátum után a Synapse Data Explorerben futó számítási feladatok törlődnek, és a kapcsolódó alkalmazásadatok elvesznek. Javasoljuk , hogy migráljon az Eventhouse-ba a Microsoft Fabricben.

A Microsoft Cloud Migration Factory (CMF) program célja, hogy segítse az ügyfeleket a Fabricbe való migrálásban. A program ingyenesen kínál gyakorlati billentyűzetes erőforrásokat az ügyfélnek. Ezek az erőforrások 6–8 hétig vannak hozzárendelve, előre meghatározott és egyeztetett hatókörrel. Az ügyfél-jelöléseket a Microsoft-fiók csapatától vagy közvetlenül a CMF-csapatnak küldött segítségkéréssel fogadjuk el.

Az Azure Synapse Data Explorer interaktív lekérdezési felületet biztosít az ügyfeleknek a napló- és telemetriaadatokból származó megállapítások feloldásához. A meglévő SQL- és Apache Spark-elemzési futtatókörnyezeti motorok kiegészítése érdekében a Data Explorer analytics-futtatókörnyezete hatékony naplóelemzésre van optimalizálva hatékony indexelési technológiával, amely automatikusan indexeli a telemetriai adatokban gyakran előforduló szabad szöveges és részben strukturált adatokat.

Az Azure Synapse architektúrát bemutató ábra.

További információkért tekintse meg az alábbi videót:

Mi teszi egyedivé az Azure Synapse Data Explorert?

  • Egyszerű betöltés – Az Adatkezelő beépített integrációkat kínál kód nélküli/alacsony kódszámú, nagy átviteli sebességű adatbetöltéshez és valós idejű forrásokból származó gyorsítótárazáshoz. Az adatok olyan forrásokból is betölthetők, mint az Azure Event Hubs, a Kafka, az Azure Data Lake, a nyílt forráskódú ügynökök, például a Fluentd/Fluent Bit, valamint a felhőbeli és helyszíni adatforrások széles választéka.

  • Nincs összetett adatmodellezés – Az Adatkezelővel nincs szükség összetett adatmodellek létrehozására, és nincs szükség összetett szkriptekre az adatok felhasználása előtt történő átalakításához.

  • Nincs indexkarbantartás – Nincs szükség karbantartási feladatokra az adatok lekérdezési teljesítményhez való optimalizálásához, és nincs szükség indexkarbantartásra. Az Adatkezelővel minden nyers adat azonnal elérhető, így nagy teljesítményű és nagy egyidejűségi lekérdezéseket futtathat a streamelési és az állandó adatokon. Ezekkel a lekérdezésekkel közel valós idejű irányítópultokat és riasztásokat hozhat létre, és operatív elemzési adatokat csatlakoztathat a többi adatelemzési platformhoz.

  • Az adatelemzés demokratizálása – Az Adatkezelő demokratizálja az önkiszolgáló, big data-elemzést az intuitív Kusto Query Language (KQL) használatával, amely az Excel egyszerűségével biztosítja az SQL kifejezőképességét és erejét. A KQL kiválóan optimalizált a nyers telemetriai és idősoros adatok feltárására azáltal, hogy az Adatkezelő kategóriájában legjobb szövegindexelési technológiáját használja a hatékony szabadszöveg- és regex-kereséshez, valamint átfogó elemzési képességeket biztosít a nyomkövetési\szöveges adatok és a JSON félig strukturált adatok, köztük tömbök és beágyazott struktúrák lekérdezéséhez. A KQL fejlett idősorozat-támogatást nyújt több idősor létrehozásához, manipulálásához és elemzéséhez a motoron belüli Python-végrehajtási támogatással a modell pontozásához.

  • Bevált technológia petabájtos skálán – Az Adatkezelő egy elosztott rendszer számítási erőforrásokkal és tárterületekkel, amelyek egymástól függetlenül méretezhetők, lehetővé téve a gigabájtos vagy petabájtos adatok elemzését.

  • Integrálva – Az Azure Synapse Analytics lehetővé teszi az adatok közötti interoperabilitást az Adatkezelő, az Apache Spark és az SQL-motorok között, így az adatmérnökök, adattudósok és adatelemzők egyszerűen és biztonságosan férhetnek hozzá és dolgozhatnak ugyanazon adatokon a data lake-ben.

Mikor érdemes használni az Azure Synapse Data Explorert?

Az Adatkezelőt adatplatformként használhatja közel valós idejű naplóelemzési és IoT-elemzési megoldások létrehozásához a következő célokra:

  • A naplók és események adatainak összesítése és korrelálása helyszíni, felhőbeli és külső adatforrásokban.

  • Felgyorsíthatja az AI-műveletek folyamatát (mintafelismerés, anomáliadetektálás, előrejelzés stb.).

  • Cserélje le az infrastruktúra-alapú naplókeresési megoldásokat a költségek megtakarítása és a termelékenység növelése érdekében.

  • IoT-elemzési megoldásokat hozhat létre az IoT-adatokhoz.

  • Elemzési SaaS-megoldásokat hozhat létre, hogy szolgáltatásokat nyújtson belső és külső ügyfeleinek.

Az Adatkezelő készletarchitektúrája

Az Adatkezelő-készletek a számítási és tárolási erőforrások elkülönítésével egy kibővített architektúrát implementálnak. Ez lehetővé teszi az egyes erőforrások egymástól függetlenül történő skálázását, és például több írásvédett számítás futtatását ugyanazon az adaton. Az Adatkezelő-készletek olyan számítási erőforrások készletéből állnak, amelyek az automatikus indexelésért, tömörítésért, gyorsítótárazásért és elosztott lekérdezések kiszolgálásáért felelős motort futtatják. Emellett egy második számítási erőforráskészlettel is rendelkeznek, amelyek a háttérrendszer-feladatokért felelős adatkezelési szolgáltatást, valamint a felügyelt és várólistás adatbetöltést futtatják. A rendszer minden adatot tömörített oszlopos formátumban tárol a felügyelt blobtároló-fiókokon.

A Data Explorer gazdag ökoszisztémát támogat az adatok bevitelére összekötők, SDK-k, REST API-k és egyéb felügyelt képességek használatával. Az adatfogyasztás különböző módokon lehetséges alkalmi lekérdezésekhez, jelentésekhez, irányítópultokhoz, riasztásokhoz, REST API-khoz és SDK-khoz.

Az Adatkezelő készletarchitektúrája

Számos egyedi képesség teszi a Data Explore-t a napló- és idősorozat-elemzések legjobb elemzési motorjának az Azure-ban.

A következő szakaszok kiemelik a főbb különbségeket.

A szabadszöveges és félig strukturált adatindexelés közel valós idejű, nagy teljesítményű és nagy egyidejű lekérdezéseket tesz lehetővé

Az Adatkezelő a részben strukturált adatokat (JSON) és strukturálatlan adatokat (szabad szöveg) indexeli, így a futó lekérdezések jól teljesítenek az ilyen típusú adatokon. Alapértelmezés szerint minden mező indexelve van az adatbetöltés során, és egy alacsony szintű kódolási szabályzatot használhat az adott mezők indexének finomhangolásához vagy letiltásához. Az index hatóköre egyetlen adatszilánk.

Az index megvalósítása a mező típusától függ, az alábbiak szerint:

Mezőtípus Indexelés implementálása
String A motor invertált kifejezésindexet hoz létre a sztringoszlop értékeihez. A rendszer minden sztringértéket normalizált kifejezésekre bont, és az egyes kifejezésekhez a logikai pozíciók rendezett listáját rögzíti a rendszer, amely rekord-sorszámokat tartalmaz. Az eredményként kapott rendezett kifejezések listája és a hozzájuk tartozó pozíciók nem módosítható B-faként lesznek tárolva.
Numerikus
DátumIdő
TimeSpan
A motor egy egyszerű tartományalapú továbbítási indexet hoz létre. Az index rögzíti az egyes blokkok minimális/maximális értékeit, a blokkok egy csoportját és az adatszilánkon belüli teljes oszlopot.
Dinamikus A betöltési folyamat felsorolja a dinamikus érték összes "atomi" elemét, például a tulajdonságneveket, az értékeket és a tömbelemeket, és továbbítja őket az indexszerkesztőnek. A dinamikus mezők invertált kifejezésindexe megegyezik a karakterlánc mezők indexével.

Ezek a hatékony indexelési képességek lehetővé teszik, hogy a Data Explore közel valós időben elérhetővé tegye az adatokat nagy teljesítményű és nagy egyidejűségi lekérdezésekhez. A rendszer automatikusan optimalizálja az adatszilánkokat a teljesítmény további növelése érdekében.

Kusto lekérdezésnyelv

A KQL nagy, növekvő közösséggel rendelkezik az Azure Monitor Log Analytics és az Application Insights, a Microsoft Sentinel, az Azure Data Explorer és más Microsoft-ajánlatok gyors bevezetése révén. A nyelv jól megtervezett, könnyen olvasható szintaxissal rendelkezik, és zökkenőmentes átmenetet biztosít az egyszerű egysorosról az összetett adatfeldolgozási lekérdezésekre. Ez lehetővé teszi, hogy az Adatkezelő gazdag Intellisense-támogatást és számos olyan nyelvi szerkezetet és beépített képességet biztosítson az összesítésekhez, idősorokhoz és felhasználói elemzésekhez, amelyek nem érhetők el az SQL-ben a telemetriai adatok gyors feltárásához.

Következő lépések