Az adat-előállító betöltési módszereinek listázása
Az Azure Data Factory a különböző kiindulási ponttól kezdve képes befogadni az adatintegrációs projektekbe bekapcsolódó szervezeteket. Ritkán fordul elő, hogy egy adatmigrálási projekt zöldmezős projekt legyen. Sok adatintegrációs munkafolyamatnak általában figyelembe kell vennie a korábbi projekteken létrehozott, különböző függőségekkel és különböző technológiákkal létrehozott folyamatokat. Ennek érdekében különböző betöltési módszerek állnak rendelkezésre az adatok különböző forrásokból való kinyerésére.
Adatok betöltése a másolási tevékenység használatával
Ezzel a módszerrel kód nélküli adatbetöltési folyamatokat hozhat létre, amelyek nem igényelnek átalakítást az adatok kinyerése során. A másolási tevékenység több mint 100 natív összekötőt támogat. Ez a módszer megfelelhet a zöldmezős projekteknek, amelyek egyszerű kinyerési módszerrel rendelkeznek egy közbenső adattárban. Az adatok másolási tevékenység használatával történő betöltésére példa lehet például az adatok kinyerése több forrásadatbázis-rendszerből, és az adatoknak a data lake-tárolóban lévő fájlokba való kicsomagolása. Ennek a betöltési módszernek az az előnye, hogy egyszerűek, de nem képesek kifinomult átalakításokkal vagy üzleti logikával foglalkozni.
Adatok betöltése számítási erőforrások használatával
Az Azure Data Factory meghívhatja a számítási erőforrásokat az adatok olyan adatplatform-szolgáltatás általi feldolgozására, amely jobban megfelel a feladatnak. Erre jó példa, hogy az Azure Data Factory létrehozhat egy folyamatot egy elemzési adatplatformhoz, például egy Azure Synapse Analytics-példány Spark-készleteihez egy összetett számítás végrehajtásához, amely új adatokat hoz létre. Ezek az adatok ezután vissza lesznek osztva a folyamatba további továbbfeldolgozás céljából. A számítási erőforrások széles köre és a kapcsolódó tevékenységek, amelyeket az alábbi táblázatban látható módon végezhetnek el:
Számítási környezet | tevékenységek |
---|---|
Igény szerinti HDInsight-fürt vagy saját HDInsight-fürt | Hive, Pig, Spark, MapReduce, Hadoop Streaming |
Azure Batch | Egyéni tevékenységek |
Azure Machine Tanulás Studio Machine | Tanulás tevékenységek: Kötegelt végrehajtás és erőforrás frissítése |
Azure Machine Learning | Azure Machine Tanulás folyamat végrehajtása |
Azure Data Lake Analytics | Data Lake Analytics U-SQL |
Azure SQL, Azure SQL Data Warehouse, SQL Server | Tárolt eljárás |
Azure Databricks | Notebook, Jar, Python |
Azure Function | Azure-függvénytevékenység |
Adatok betöltése SSIS-csomagok használatával
Számos szervezet több évtizedes fejlesztési befektetéssel rendelkezik az SQL Server Integration Services (SSIS) csomagjaiba, amelyek a helyszíni és a felhőbeli adattárakból származó betöltési és átalakítási logikát is tartalmazzák. Az Azure Data Factory lehetővé teszi a meglévő SSIS-számítási feladatok emelését és áthelyezését egy Azure-SSIS integrációs modul létrehozásával az SSIS-csomagok natív végrehajtásához, és lehetővé teszi a meglévő SSIS-csomagok üzembe helyezését és kezelését olyan ismert eszközökkel, mint az SQL Server Data Tools (SSDT) és az SQL Server Management Studio (SSMS), A helyszíni SSIS-hez hasonlóan.