Az Azure Synapse Analytics működése

Befejeződött

A mai szervezetek elemzési igényeinek támogatása érdekében az Azure Synapse Analytics egyesíti az adattárolási és feldolgozási központosított szolgáltatást egy bővíthető architektúrával, amellyel a társított szolgáltatások lehetővé teszik a gyakran használt adattárak, feldolgozási platformok és vizualizációs eszközök integrálását.

Azure Synapse Analytics-munkaterület létrehozása és használata

A Synapse Analytics-munkaterület a Synapse Analytics szolgáltatás egy példányát határozza meg, amelyben kezelheti az elemzési megoldáshoz szükséges szolgáltatásokat és adaterőforrásokat. Synapse Analytics-munkaterületet interaktívan hozhat létre egy Azure-előfizetésben az Azure Portal használatával, vagy automatizálhatja az üzembe helyezést az Azure PowerShell, az Azure parancssori felülete (CLI) vagy egy Azure Resource Manager- vagy Bicep-sablon használatával.

A Synapse Analytics-munkaterület létrehozása után kezelheti a benne lévő szolgáltatásokat, és adatelemzési feladatokat végezhet velük a Synapse Studio használatával, amely az Azure Synapse Analytics webalapú portálja.

Screenshot of Azure Synapse Studio.

Fájlok használata data lake-ben

A Synapse Analytics-munkaterületek egyik alapvető erőforrása egy adattó, amelyben az adatfájlok nagy méretekben tárolhatók és feldolgozhatók. A munkaterületek általában alapértelmezett data lake-sel rendelkeznek, amely egy Azure Data Lake Storage Gen2-tárolóhoz társított szolgáltatásként van implementálva. Szükség esetén több, különböző tárolási platformon alapuló adattóhoz is hozzáadhat társított szolgáltatásokat.

Screenshot of a data lake linked service in Azure Studio.

Adatok betöltése és átalakítása folyamatokkal

A legtöbb nagyvállalati adatelemzési megoldásban az adatok több operatív forrásból származnak, és egy központi adattóba vagy adattárházba kerülnek elemzés céljából. Az Azure Synapse Analytics beépített támogatást nyújt olyan folyamatok létrehozásához, futtatásához és kezeléséhez, amelyek az adatok különböző forrásokból való lekéréséhez, szükség szerint átalakításához és az így kapott adatok elemzési tárolóba való betöltéséhez szükségesek.

Screenshot of a pipeline in Azure Synapse Studio.

Megjegyzés:

Az Azure Synapse Analytics folyamatainak alapja ugyanaz, mint az Azure Data Factory. Ha már ismeri az Azure Data Factoryt, a meglévő készségeit kihasználva adatbetöltési és átalakítási megoldásokat hozhat létre az Azure Synapse Analyticsben.

Adatok lekérdezése és manipulálása SQL-lel

A strukturált lekérdezési nyelv (SQL) az adatok lekérdezésének és manipulálásának mindenhol elterjedt nyelve, és a relációs adatbázisok alapja, beleértve a népszerű Microsoft SQL Server adatbázisplatformot is. Az Azure Synapse Analytics kétféle SQL-készleten keresztül támogatja az SQL-alapú adatok lekérdezését és kezelését, amelyek az SQL Server relációs adatbázismotorján alapulnak:

  • Egy beépített kiszolgáló nélküli készlet, amely a relációs SQL szemantikának a data lake-ben lévő fájlalapú adatok lekérdezésére van optimalizálva.
  • Relációs adattárházakat üzemeltető egyéni dedikált SQL-készletek.

Az Azure Synapse SQL-rendszer elosztott lekérdezésfeldolgozó modellt használ az SQL-műveletek párhuzamossá viteléhez, ami nagy mértékben skálázható megoldást eredményez a relációs adatfeldolgozáshoz. A beépített kiszolgáló nélküli készletet használhatja a data lake-beli fájladatok költséghatékony elemzéséhez és feldolgozásához, valamint dedikált SQL-készletek használatával relációs adattárházakat hozhat létre a vállalati adatmodellezéshez és -jelentéskészítéshez.

Screenshot of a SQL query and databases in Azure Synapse Studio.

Adatok feldolgozása és elemzése az Apache Spark használatával

Az Apache Spark egy nyílt forráskód platform a big data-elemzéshez. A Spark a támogatott programozási nyelvek bármelyikével implementálható feladatok futtatásával végzi el a fájlok elosztott feldolgozását egy data lake-ben. A Sparkban támogatott nyelvek közé tartozik a Python, a Scala, a Java, az SQL és a C#.

Az Azure Synapse Analyticsben létrehozhat egy vagy több Spark-készletet, és interaktív jegyzetfüzetekkel kombinálhatja a kódot és a jegyzeteket az adatelemzési, gépi tanulási és adatvizualizációs megoldások létrehozásakor.

Screenshot of a Spark notebook in Azure Synapse Studio.

Adatok feltárása az Adatkezelővel

Az Azure Synapse Data Explorer egy adatfeldolgozási motor az Azure Synapse Analyticsben, amely az Azure Data Explorer szolgáltatáson alapul. Az Adatkezelő a Kusto lekérdezésnyelv (KQL) nevű intuitív lekérdezési szintaxissal teszi lehetővé a kötegelt és streamelési adatok nagy teljesítményű, alacsony késésű elemzését.

Screenshot of a Kusto Query Language script in Azure Synapse Studio.

Integrálás más Azure-beli adatszolgáltatásokkal

Az Azure Synapse Analytics integrálható más Azure-adatszolgáltatásokkal a végpontok közötti elemzési megoldásokhoz. Az integrált megoldások a következők:

  • Az Azure Synapse Link közel valós idejű szinkronizálást tesz lehetővé az Azure Cosmos DB, az Azure SQL Database, az SQL Server és a Microsoft Power Platform Dataverse és az Azure Synapse Analyticsben lekérdezhető elemzési adatok között.
  • A Microsoft Power BI-integráció lehetővé teszi, hogy az adatelemzők egy Power BI-munkaterületet integráljanak Egy Synapse-munkaterületbe, és interaktív adatvizualizációt hajtsanak végre az Azure Synapse Studióban.
  • A Microsoft Purview-integráció lehetővé teszi a szervezetek számára az adategységek katalogizálását az Azure Synapse Analyticsben, és megkönnyíti az adatmérnökök számára az adategységek megtalálását és az adatsorok nyomon követését az adatok Azure Synapse Analyticsbe való betöltésekor.
  • Az Azure Machine Tanulás integrációja lehetővé teszi, hogy az adatelemzők és adattudósok integrálják a prediktív modell betanítását és használatát az elemzési megoldásokba.