Online analitikus feldolgozás (OLAP)

Azure Analysis Services

Az online elemzési feldolgozás (OLAP) egy olyan technológia, amely nagy üzleti adatbázisok rendszerezését és összetett elemzéseket támogat. Összetett elemzési lekérdezések végrehajtására használható anélkül, hogy negatív hatással lenne a tranzakciós rendszerekre.

Azokat az adatbázisokat, amelyeket egy vállalat az összes tranzakciójának és rekordjának tárolására használ, online tranzakciófeldolgozási (OLTP) adatbázisoknak nevezzük. Ezek az adatbázisok általában egyenként megadott rekordokkal rendelkeznek. Gyakran sok olyan információt tartalmaznak, amely értékes a szervezet számára. Az OLTP-hez használt adatbázisok azonban nem elemzésre lettek tervezve. Ezért ezeknek az adatbázisoknak a válaszok beolvasása idő és erőfeszítés szempontjából költséges. Az OLAP-rendszereket úgy tervezték, hogy nagy teljesítményű módon nyerjék ki ezeket az üzletiintelligencia-információkat az adatokból. Ennek az az oka, hogy az OLAP-adatbázisok nagy olvasási és írási feladatokhoz vannak optimalizálva.

Diagram that shows the OLAP logical architecture in Azure.

Szemantikai modellezés

A szemantikai adatmodellek olyan elméleti modellek, amelyek a benne található adatelemek jelentését írják le. A szervezetek gyakran rendelkeznek saját kifejezésekkel a dolgokhoz, néha szinonimákhoz, vagy akár más jelentéssel is ugyanarra a kifejezésre. Előfordulhat például, hogy egy leltáradatbázis egy eszközazonosítóval és sorozatszámmal rendelkező berendezést követ nyomon, de egy értékesítési adatbázis eszközazonosítóként hivatkozhat a sorozatszámra. Ezeket az értékeket nem lehet egyszerűen összekapcsolni a kapcsolatot leíró modell nélkül.

A szemantikai modellezés absztrakciós szintet biztosít az adatbázissémán, így a felhasználóknak nem kell ismernie a mögöttes adatstruktúrákat. Így a végfelhasználók egyszerűbben kérdezhetik le az adatokat anélkül, hogy a mögöttes sémán aggregátumokat és illesztéseket végeznek. Az oszlopokat általában felhasználóbarátabb nevekre nevezik át, hogy az adatok kontextusa és jelentése egyértelműbb legyen.

A szemantikai modellezést túlnyomórészt írásvédett forgatókönyvekhez, például elemzésekhez és üzleti intelligenciához (OLAP) használják, szemben a nagyobb írási terhelésű tranzakciós adatfeldolgozással (OLTP). Ez többnyire egy tipikus szemantikai réteg természetének köszönhető:

  • Az aggregációs viselkedések úgy vannak beállítva, hogy a jelentéskészítő eszközök megfelelően jelenjenek meg.
  • Az üzleti logika és számítások definiálva vannak.
  • A rendszer időorientált számításokat is tartalmaz.
  • Az adatok gyakran több forrásból integrálva lesznek.

A szemantikai réteg hagyományosan egy adattárház fölé kerül ezen okok miatt.

Example diagram of a semantic layer between a data warehouse and a reporting tool

A szemantikai modelleknek két elsődleges típusa van:

  • Táblázatos. Relációs modellezési szerkezeteket (modell, táblák, oszlopok) használ. A metaadatok belsőleg az OLAP-modellezési szerkezetekből (kockák, dimenziók, mértékek) öröklődnek. A kód és a szkript OLAP-metaadatokat használ.
  • Többdimenziós. Hagyományos OLAP-modellezési szerkezeteket (kockákat, dimenziókat, mértékeket) használ.

Kapcsolódó Azure-szolgáltatás:

Példa használati esetre

A szervezetek nagy adatbázisban tárolt adatokat tárolnak. Ezeket az adatokat elérhetővé szeretné tenni az üzleti felhasználók és ügyfelek számára, hogy saját jelentéseket hozzanak létre és elemezhessenek. Az egyik lehetőség az, hogy közvetlen hozzáférést ad ezeknek a felhasználóknak az adatbázishoz. Ennek azonban számos hátránya van, például a biztonság kezelése és a hozzáférés szabályozása. Emellett az adatbázis tervezése, beleértve a táblák és oszlopok nevét is, nehéz lehet megérteni a felhasználó számára. A felhasználóknak tudniuk kell, hogy mely táblákat kell lekérdezni, hogyan kell ezeket a táblákat összekapcsolni, és más üzleti logikát kell alkalmazni a megfelelő eredmények lekéréséhez. A felhasználóknak az első lépésekhez is ismernie kell egy olyan lekérdezési nyelvet, mint az SQL. Ez általában azt eredményezi, hogy több felhasználó is ugyanazt a metrikát jelenti, de eltérő eredménnyel.

Egy másik lehetőség a felhasználók számára szükséges összes információ beágyazása szemantikai modellbe. A szemantikai modellt a felhasználók egyszerűbben kérdezhetik le egy tetszőleges jelentéskészítő eszközzel. A szemantikai modell által biztosított adatok egy adattárházból származnak, így minden felhasználó egyetlen igazságverziót lát. A szemantikai modell felhasználóbarát tábla- és oszlopneveket, táblák közötti kapcsolatokat, leírásokat, számításokat és sorszintű biztonságot is biztosít.

A szemantikai modellezés jellemző tulajdonságai

A szemantikai modellezés és az elemzési feldolgozás általában a következő jellemzőket tartalmazza:

Követelmény Leírás
Schema Séma írásra, erősen kikényszerített
Tranzakciókat használ Nem
Zárolási stratégia None
Frissíthető Nem (általában újrafordítási kockát igényel)
Hozzáfűzhető Nem (általában újrafordítási kockát igényel)
Workload Nehéz olvasások, írásvédett
Indexelés Többdimenziós indexelés
Datum mérete Kicsi és közepes méretű
Modell Többdimenziós
Adatalakzat: Kocka vagy csillag/hópehely séma
Lekérdezési rugalmasság Rendkívül rugalmas
Scale (Méretezés): Nagy (10s-100s GBs)

Mikor érdemes használni ezt a megoldást?

Fontolja meg az OLAP-ot a következő forgatókönyvekben:

  • Az összetett elemzési és alkalmi lekérdezéseket gyorsan kell végrehajtania anélkül, hogy negatívan befolyásolná az OLTP-rendszereket.
  • Azt szeretné, hogy az üzleti felhasználók egyszerű módon generáljanak jelentéseket az adataiból
  • Több olyan aggregációt szeretne megadni, amelyek lehetővé teszik a felhasználók számára a gyors és konzisztens eredményeket.

Az OLAP különösen hasznos az összesített számítások nagy mennyiségű adatra történő alkalmazásához. Az OLAP-rendszerek írásvédett forgatókönyvekhez, például elemzésekhez és üzleti intelligenciához vannak optimalizálva. Az OLAP lehetővé teszi a felhasználók számára a többdimenziós adatok szeletekbe való szegmentálását, amelyek két dimenzióban (például kimutatástáblában) tekinthetők meg, vagy meghatározott értékek alapján szűrhetik az adatokat. Ezt a folyamatot néha "szeletelésnek és diktálásnak" is nevezik, és attól függetlenül elvégezhető, hogy az adatok több adatforrás között vannak-e particionálva. Így a felhasználók a hagyományos adatelemzés részleteinek ismerete nélkül is megtalálhatják a trendeket, kihasználhatják a mintázatokat és felfedezhetik az adatokat.

A szemantikai modellek segíthetnek az üzleti felhasználóknak elvont kapcsolatok összetettségében, és megkönnyítik az adatok gyors elemzését.

Problémák

Az OLAP-rendszerek által nyújtott előnyök miatt néhány kihívást jelentenek:

  • Míg az OLTP-rendszerek adatai folyamatosan frissülnek a különböző forrásokból érkező tranzakciókon keresztül, az OLAP-adattárak általában sokkal lassabb időközönként frissülnek az üzleti igényektől függően. Ez azt jelenti, hogy az OLAP-rendszerek jobban alkalmasak a stratégiai üzleti döntésekre, nem pedig a változásokra adott azonnali válaszokra. Emellett az OLAP-adattárak naprakészen tartásához bizonyos szintű adattisztítást és vezénylést kell tervezni.
  • Az OLTP rendszerekben található hagyományos, normalizált relációs táblákkal ellentétben az OLAP-adatmodellek általában többdimenziósak. Ez megnehezíti vagy lehetetlenné teszi az entitás-kapcsolat vagy az objektumorientált modellek közvetlen leképezését, ahol minden attribútum egy oszlopra van leképezve. Ehelyett az OLAP-rendszerek általában csillag- vagy hópehelyséma használatával rendelkeznek a hagyományos normalizálás helyett.

OLAP az Azure-ban

Az Azure-ban az OLTP-rendszerekben, például az Azure SQL Database-ben tárolt adatok át lesznek másolva az OLAP-rendszerbe, például az Azure Analysis Servicesbe. Az adatfeltárási és vizualizációs eszközök, például a Power BI, az Excel és a külső lehetőségek csatlakoznak az Analysis Services-kiszolgálókhoz, és rendkívül interaktív és vizuálisan gazdag betekintést nyújtanak a modellezett adatokba. Az OLTP-adatokból az OLAP-ba történő adatáramlást általában az SQL Server Integration Services használatával vezénylik, amely az Azure Data Factory használatával hajtható végre.

Az Azure-ban az alábbi adattárak mindegyike megfelel az OLAP alapvető követelményeinek:

Az SQL Server Analysis Services (SSAS) OLAP- és adatbányászati funkciókat kínál az üzletiintelligencia-alkalmazásokhoz. Telepítheti az SSAS-t helyi kiszolgálókra, vagy egy Azure-beli virtuális gépen belül üzemeltetheti. Az Azure Analysis Services egy teljes körűen felügyelt szolgáltatás, amely ugyanazokat a fő funkciókat biztosítja, mint az SSAS. Az Azure Analysis Services támogatja a felhőben és a szervezeten belüli különböző adatforrásokhoz való csatlakozást.

A fürtözött oszlopcentrikus indexek az SQL Server 2014-ben és újabb verziókban, valamint az Azure SQL Database-ben érhetők el, és ideálisak OLAP-számítási feladatokhoz. Az SQL Server 2016-tól kezdve (beleértve az Azure SQL Database-t is) azonban a hibrid tranzakciós/elemzési feldolgozás (HTAP) előnyeit is kihasználhatja a frissíthető nemclustered oszlopcentrikus indexek használatával. A HTAP lehetővé teszi az OLTP- és OLAP-feldolgozást ugyanazon a platformon, ami szükségtelenné teszi az adatok több másolatának tárolását, és szükségtelenné teszi a különálló OLTP- és OLAP-rendszerek használatát. További információ: A Columnstore használatának első lépései valós idejű üzemeltetési elemzésekhez.

Kulcsválasztási feltételek

A lehetőségek szűkítéséhez először válaszoljon az alábbi kérdésekre:

  • Szeretne felügyelt szolgáltatást ahelyett, hogy saját kiszolgálókat kezel?

  • Biztonságos hitelesítést igényel a Microsoft Entra ID használatával?

  • Valós idejű elemzést szeretne végezni? Ha igen, szűkítse a lehetőségeket a valós idejű elemzést támogató lehetőségekre.

    Ebben a kontextusban a valós idejű elemzés egyetlen adatforrásra, például egy vállalati erőforrás-tervezési (ERP) alkalmazásra vonatkozik, amely operatív és elemzési számítási feladatot is futtat. Ha több forrásból származó adatokat kell integrálnia, vagy szélsőséges elemzési teljesítményt igényel előre összesített adatok, például kockák használatával, akkor is szükség lehet külön adattárházra.

  • Előaggregált adatokat kell használnia, például olyan szemantikai modelleket kell biztosítania, amelyek üzleti szempontból felhasználóbarátabbá teszik az elemzést? Ha igen, válasszon egy többdimenziós kockákat vagy táblázatos szemantikai modelleket támogató lehetőséget.

    Az összesítések biztosítása segíthet a felhasználóknak az adataggregátumok következetes kiszámításában. Az előre összesített adatok nagy teljesítménynövelést is biztosíthatnak, ha több oszlopot kezelnek több sorban. Az adatok előre összesíthetők többdimenziós kockákban vagy táblázatos szemantikai modellekben.

  • Több forrásból származó adatokat kell integrálnia az OLTP-adattáron kívül? Ha igen, fontolja meg a több adatforrást egyszerűen integráló lehetőségeket.

Képességmátrix

Az alábbi táblázatok összefoglalják a képességek főbb különbségeit.

Általános képességek

Funkció Azure Analysis Services SQL Server Analysis Services SQL Server oszlopcentrikus indexekkel Azure SQL Database oszlopcentrikus indexekkel
Felügyelt szolgáltatás Igen Nem No Igen
Támogatja a többdimenziós kockákat Nem Igen Nem Nem
Táblázatos szemantikai modellek támogatása Igen Igen Nem Nem
Több adatforrás egyszerű integrálása Igen Igen No 1 No 1
Támogatja a valós idejű elemzést Nem No Yes Igen
A forrás(ok) adatainak másolásához folyamat szükséges Igen Igen Nem Nem
Microsoft Entra-integráció Igen Nem 2. szám Igen

[1] Bár az SQL Server és az Azure SQL Database nem használható több külső adatforrás lekérdezésére és integrálására, továbbra is létrehozhat egy folyamatot, amely ezt az SSIS vagy az Azure Data Factory használatával végzi. Az Azure-beli virtuális gépeken üzemeltetett SQL Server további lehetőségeket is kínál, például csatolt kiszolgálókat és PolyBase-et. További információkért lásd a folyamat vezénylését, a folyamatvezérlést és az adatáthelyezést.

[2] Az Azure-beli virtuális gépen futó SQL Serverre való Csatlakozás microsoft Entra-fiók használata nem támogatott. Helyette használjon tartományi Active Directory-fiókot.

Méretezhetőségi képességek

Funkció Azure Analysis Services SQL Server Analysis Services SQL Server oszlopcentrikus indexekkel Azure SQL Database oszlopcentrikus indexekkel
Redundáns regionális kiszolgálók magas rendelkezésre álláshoz Igen Nem Yes Igen
Támogatja a lekérdezések horizontális felskálázását Igen Nem Yes Igen
Dinamikus méretezhetőség (vertikális felskálázás) Igen Nem Yes Igen

Közreműködők

Ezt a cikket a Microsoft tartja karban. Eredetileg a következő közreműködők írták.

Fő szerző:

További lépések