Az Azure Synapse Analytics használata felhőalapú elemzéssel
Az Azure Synapse Analytics egy kiépített integrált elemzési szolgáltatás, amely felgyorsítja az adatraktárak és big data rendszerek áttekintésének idejét. Az Azure Synapse Analytics a következő elemeket egyesíti:
- A vállalati adattárházakban használt legjobb SQL-technológiák.
- A big data-hoz használt Spark-technológiák.
- Folyamatok adatalkalmazáshoz (forráshoz igazított) és kinyeréshez, átalakításhoz és betöltéshez (ETL) vagy kinyeréshez, betöltéshez és átalakításhoz (ELT).
Az Azure Synapse Studio egy eszköz az Azure Synapse-ban, amely egységes felületet biztosít a felügyelethez, a monitorozáshoz, a kódoláshoz és a biztonsághoz. A Synapse Studio mély integrációval rendelkezik más Azure-szolgáltatásokkal, például a Power BI-val, az Azure Cosmos DB-vel és az Azure Machine-Tanulás.
Megjegyzés:
Ez a szakasz a felhőalapú elemzésekre jellemző, előírt konfigurációkat ismerteti. Ez egy bók az Azure Synapse Analytics hivatalos dokumentációjának.
Áttekintés
Az adat-kezdőzóna kezdeti beállítása során egyetlen Azure Synapse Analytics-munkaterületet helyezhet üzembe az összes elemző és adatelemző számára. Több munkaterületet is létrehozhat adott adatintegrációkhoz vagy adattermékekhez.
Szükség lehet további Azure Synapse Analytics-munkaterületekre, ha az adatterméknek sorszintű és oszlopszintű biztonsággal kell hozzáférést biztosítania a szabványosított adatokhoz . Ezeket a munkaterületeket Azure Synapse-készletekkel is elláthatja. Előfordulhat, hogy az adattermék-csapatoknak saját munkaterületre van szükségük az adattermékek létrehozásához, és egy külön munkaterületre, amely csak a hatókörön belüli fejlesztési hozzáféréssel rendelkező termékcsoportok számára érhető el.
Az Azure Synapse Analytics beállítása
Az Azure Synapse Analytics üzembe helyezésének első lépése egy Azure Purview-fiókhoz csatlakoztatott Azure Synapse-munkaterület beállítása.
Azure Synapse Analytics hálózatkezelés
Az adat-kezdőzóna egy Azure Synapse Analytics által felügyelt virtuális hálózattal rendelkező munkaterületeket hoz létre. Az Azure Synapse-jal való kommunikáció az általa elérhetővé tott három végponton keresztül történik: SQL-készlet, igény szerinti SQL és fejlesztési végpont.
A felhőalapú elemzések hálózati szinten synapse által felügyelt privát végpontokat használnak. Ezek a végpontok biztosítják, hogy az adat-kezdőzóna virtuális hálózata és az Azure Synapse-munkaterületek közötti összes forgalom teljes mértékben a Microsoft gerinchálózatán halad át.
Azure Synapse adathozzáférés-vezérlés
Hozzáférés-vezérlési listák használata a Microsoft Entra-átengedéssel az Azure Synapse Analyticsben a data lake-beli fájlokhoz való hozzáférés kezeléséhez.
Az olyan adatok esetében, ahol korlátoznia kell a visszaadott oszlopokat és sorokat, a sorszintű és az oszlopszintű biztonságot javasoljuk, hogy korlátozza a dedikált vagy kiszolgáló nélküli Azure Synapse SQL-készlet tábláihoz való adathozzáférést. A sorszintű biztonság és az oszlopszintű biztonság az adatbázis szintjén és az adatbázisszerepkörök mellett valósul meg.
A sorszintű biztonság például biztosítja, hogy egy adott (forráshoz igazított) vagy adattermékben lévő felhasználók csak a saját adataikat lássák. Még akkor is, ha a tábla a teljes vállalat adatait tartalmazza.
A sorszintű biztonság és az oszlopszintű biztonság kombinálásával korlátozhatja a bizalmas adatokkal rendelkező oszlopokhoz való hozzáférést. Így a sorszintű biztonság és az oszlopszintű biztonság is az adatbázisszinten alkalmazza a hozzáférés-korlátozás logikáját az alkalmazásszint helyett. A rendszer minden alkalommal kiértékeli az engedélyt, amikor bármilyen szintről megkísérli az adathozzáférést.
Megjegyzés:
Az Azure Synapse kiszolgáló nélküli SQL-készlete a nézetek oszlopszintű biztonságát támogatja, külső táblák esetében nem. Külső táblák esetén a külső tábla tetején logikai nézetet hozhat létre, és nem alkalmazhat oszlopszintű biztonságot. Sorszintű biztonság esetén az egyéni nézetek áthidaló megoldásként használhatók.
További információ: Azure Synapse Analytics adathozzáférés-vezérlés.
Azure Synapse adathozzáférés-vezérlés az Azure Data Lake-ben
Azure Synapse Analytics-munkaterület üzembe helyezésekor szüksége lesz egy Azure Data Lake Storage-fiókra az előfizetésből, vagy manuálisan a tárfiók URL-címének használatával. A megadott tárfiók elsődlegesként van beállítva az üzembe helyezett Azure Synapse-munkaterület számára az adatok tárolásához. Az Azure Synapse egy olyan tárolóban tárolja az adatokat, amely Apache Spark-táblákat és Spark-alkalmazásnaplókat tartalmaz egy úgynevezett /synapse/{workspaceName}
mappában. Emellett rendelkezik egy tárolóval a telepíteni kívánt kódtárak kezeléséhez.
Tipp.
Javasoljuk, hogy egy dedikált tárolót használjon a fejlesztési rétegben vagy a Data Lake Three-fiókban . Ez a tároló elsődleges tárolóként szolgál a Spark-metaadatok tárolásához.
Az adathozzáférés beállítására vonatkozó javaslatokért tekintse meg az Azure Synapse Analytics adathozzáférés-vezérlését .