Adatfolyamat-vezénylési technológia kiválasztása az Azure-ban
A legtöbb big data-megoldás ismétlődő adatfeldolgozási műveletekből áll, amelyek munkafolyamatokba vannak ágyazva. A folyamatvezénylő olyan eszköz, amely segít automatizálni ezeket a munkafolyamatokat. A vezénylők feladatokat ütemezhetnek, munkafolyamatokat hajthatnak végre, és összehangolhatják a tevékenységek közötti függőségeket.
Milyen lehetőségei vannak az adatfolyam-vezénylésre?
Az Azure-ban a következő szolgáltatások és eszközök felelnek meg a folyamat vezénylésére, a folyamatvezérlésre és az adatáthelyezésre vonatkozó alapvető követelményeknek:
Ezek a szolgáltatások és eszközök egymástól függetlenül használhatók, vagy együtt használhatók hibrid megoldás létrehozásához. Az Azure Data Factory V2 integrációs modulja (INTEGRÁCIÓ) például natív módon hajthat végre SSIS-csomagokat felügyelt Azure számítási környezetben. Bár a szolgáltatások között átfedés van a funkciók között, van néhány fő különbség.
Kulcsválasztási feltételek
A lehetőségek szűkítéséhez először válaszoljon az alábbi kérdésekre:
Szüksége van big data-képességekre az adatok áthelyezéséhez és átalakításához? Ez általában több gigabájttól több terabájtnyi adatig jelent. Ha igen, szűkítse a lehetőségeket a big data-hoz leginkább megfelelő lehetőségekre.
Olyan felügyelt szolgáltatásra van szüksége, amely nagy léptékben működik? Ha igen, válassza ki az egyik felhőalapú szolgáltatást, amelyet nem korlátoz a helyi feldolgozási teljesítmény.
Vannak a helyszínen található adatforrások? Ha igen, keressen olyan lehetőségeket, amelyek a felhőbeli és a helyszíni adatforrásokkal vagy célhelyekkel is használhatók.
A forrásadatok EGY HDFS-fájlrendszer blobtárolójában találhatók? Ha igen, válasszon egy olyan lehetőséget, amely támogatja a Hive-lekérdezéseket.
Képességmátrix
Az alábbi táblázatok összefoglalják a képességek főbb különbségeit.
Általános képességek
Funkció | Azure Data Factory | Az SQL Server Integration Servicest (SSIS) | Oozie a HDInsighton |
---|---|---|---|
Felügyelt | Igen | Nem | Igen |
Felhőalapú | Igen | Nem (helyi) | Igen |
Előfeltétel | Azure-előfizetés | SQL Server | Azure-előfizetés, HDInsight-fürt |
Felügyeleti eszközök | Azure Portal, PowerShell, PARANCSSOR, .NET SDK | SSMS, PowerShell | Bash shell, Oozie REST API, Oozie webes felhasználói felület |
Díjszabás | Használatalapú fizetés | Licencelés / szolgáltatások kifizetése | A HDInsight-fürt futtatása után nincs további díj |
Folyamat képességei
Funkció | Azure Data Factory | Az SQL Server Integration Servicest (SSIS) | Oozie a HDInsighton |
---|---|---|---|
Adatok másolása | Igen | Igen | Igen |
Egyéni átalakítások | Igen | Igen | Igen (MapReduce, Pig és Hive feladatok) |
Azure Machine Tanulás pontozása | Igen | Igen (szkriptekkel) | Nem |
IGÉNY SZERINTI HDInsight | Igen | Nem | Nem |
Azure Batch | Igen | Nem | Nem |
Pig, Hive, MapReduce | Igen | Nem | Igen |
Spark | Igen | Nem | Nem |
SSIS-csomag végrehajtása | Igen | Igen | Nem |
Átvitelvezérlés | Igen | Igen | Igen |
Helyszíni adatok elérése | Igen | Igen | Nem |
Méretezhetőségi képességek
Funkció | Azure Data Factory | Az SQL Server Integration Servicest (SSIS) | Oozie a HDInsighton |
---|---|---|---|
Vertikális felskálázás | Igen | Nem | Nem |
Horizontális felskálázás | Igen | Nem | Igen (feldolgozó csomópontok fürthöz való hozzáadásával) |
Big Data-adatokra optimalizálva | Igen | Nem | Igen |
Közreműködők
Ezt a cikket a Microsoft tartja karban. Eredetileg a következő közreműködők írták.
Fő szerző:
- Zoiner Tejada | vezérigazgató és tervező
Következő lépések
- Társított szolgáltatások az Azure Data Factoryben és az Azure Synapse Analyticsben
- Az Azure-SSIS integrációs modul kiépítése az Azure Data Factoryben
- Oozie a HDInsighton
Kapcsolódó erőforrások
Visszajelzés
https://aka.ms/ContentUserFeedback.
Hamarosan elérhető: 2024-ben fokozatosan kivezetjük a GitHub-problémákat a tartalom visszajelzési mechanizmusaként, és lecseréljük egy új visszajelzési rendszerre. További információ:Visszajelzés küldése és megtekintése a következőhöz: