Az adat-előállító betöltési módszereinek listázása

Befejeződött

Az Azure Data Factory a különböző kiindulási ponttól kezdve képes befogadni az adatintegrációs projektekbe bekapcsolódó szervezeteket. Ritkán fordul elő, hogy egy adatmigrálási projekt zöldmezős projekt legyen. Sok adatintegrációs munkafolyamatnak általában figyelembe kell vennie a korábbi projekteken létrehozott, különböző függőségekkel és különböző technológiákkal létrehozott folyamatokat. Ennek érdekében különböző betöltési módszerek állnak rendelkezésre az adatok különböző forrásokból való kinyerésére.

Adatok betöltése a másolási tevékenység használatával

Ezzel a módszerrel kód nélküli adatbetöltési folyamatokat hozhat létre, amelyek nem igényelnek átalakítást az adatok kinyerése során. A másolási tevékenység több mint 100 natív összekötőt támogat. Ez a módszer megfelelhet a zöldmezős projekteknek, amelyek egyszerű kinyerési módszerrel rendelkeznek egy közbenső adattárban. Az adatok másolási tevékenység használatával történő betöltésére példa lehet például az adatok kinyerése több forrásadatbázis-rendszerből, és az adatoknak a data lake-tárolóban lévő fájlokba való kicsomagolása. Ennek a betöltési módszernek az az előnye, hogy egyszerűek, de nem képesek kifinomult átalakításokkal vagy üzleti logikával foglalkozni.

Adatok betöltése számítási erőforrások használatával

Az Azure Data Factory meghívhatja a számítási erőforrásokat az adatok olyan adatplatform-szolgáltatás általi feldolgozására, amely jobban megfelel a feladatnak. Erre jó példa, hogy az Azure Data Factory létrehozhat egy folyamatot egy elemzési adatplatformhoz, például egy Azure Synapse Analytics-példány Spark-készleteihez egy összetett számítás végrehajtásához, amely új adatokat hoz létre. Ezek az adatok ezután vissza lesznek osztva a folyamatba további továbbfeldolgozás céljából. A számítási erőforrások széles köre és a kapcsolódó tevékenységek, amelyeket az alábbi táblázatban látható módon végezhetnek el:

Számítási környezet tevékenységek
Igény szerinti HDInsight-fürt vagy saját HDInsight-fürt Hive, Pig, Spark, MapReduce, Hadoop Streaming
Azure Batch Egyéni tevékenységek
Azure Machine Tanulás Studio Machine Tanulás tevékenységek: Kötegelt végrehajtás és erőforrás frissítése
Azure Machine Learning Azure Machine Tanulás folyamat végrehajtása
Azure Data Lake Analytics Data Lake Analytics U-SQL
Azure SQL, Azure SQL Data Warehouse, SQL Server Tárolt eljárás
Azure Databricks Notebook, Jar, Python
Azure Function Azure-függvénytevékenység

Adatok betöltése SSIS-csomagok használatával

Számos szervezet több évtizedes fejlesztési befektetéssel rendelkezik az SQL Server Integration Services (SSIS) csomagjaiba, amelyek a helyszíni és a felhőbeli adattárakból származó betöltési és átalakítási logikát is tartalmazzák. Az Azure Data Factory lehetővé teszi a meglévő SSIS-számítási feladatok emelését és áthelyezését egy Azure-SSIS integrációs modul létrehozásával az SSIS-csomagok natív végrehajtásához, és lehetővé teszi a meglévő SSIS-csomagok üzembe helyezését és kezelését olyan ismert eszközökkel, mint az SQL Server Data Tools (SSDT) és az SQL Server Management Studio (SSMS), A helyszíni SSIS-hez hasonlóan.