Integrációs modulok kezelése
A Data Factoryban a végrehajtandó műveletet egy tevékenység határozza meg. A társított szolgáltatások a céladattárat vagy a számítási szolgáltatást határozzák meg. Az integrációs modul biztosítja a tevékenységhez és a társított szolgáltatásokhoz tartozó infrastruktúrát.
Az integrációs modulra a társított szolgáltatás vagy tevékenység hivatkozik, és azt a számítási környezetet biztosítja, ahol a tevékenység fut, vagy ahonnan a rendszer küldi. Ily módon a tevékenység végrehajtható a céladattárhoz vagy számítási szolgáltatáshoz lehető legközelebb eső régióban, a lehető leghatékonyabban, a biztonsági és megfelelőségi igényeknek is megfelelően.
Röviden: az integrációs modul (INTEGRÁCIÓ) az Azure Data Factory által használt számítási infrastruktúra. A következő adatintegrációs képességeket biztosítja különböző hálózati környezetekben, többek között:
- Adatfolyam: Adatfolyam végrehajtása felügyelt Azure számítási környezetben.
- Adatáthelyezés: Adatok másolása a nyilvános hálózatban lévő adattárak és a magánhálózat (helyszíni vagy virtuális magánhálózat) adattárai között. Támogatást biztosít a beépített összekötőkhöz, a formátum átalakításához, az oszlopleképezéshez és a nagy teljesítményű, méretezhető adatátvitelhez.
- Tevékenységküldés: Különböző számítási szolgáltatásokon futó átalakítási tevékenységek küldése és monitorozása, mint például az Azure Databricks, az Azure HDInsight, az Azure Machine Tanulás, az Azure SQL Database, az SQL Server stb.
- SSIS-csomag végrehajtása: Natívan végrehajthat SQL Server Integration Services- (SSIS-) csomagokat egy Azure-beli felügyelt számítási környezetben.
Amikor létrehoz egy Azure Data Factory-példányt, létrejön egy alapértelmezett integrációs futtatókörnyezet, amely támogatja a nyilvános hálózaton lévő felhőalapú adattárakon és számítási szolgáltatásokon végzett műveleteket. Ez akkor tekinthető meg, ha az integrációs modul automatikus feloldási értékre van állítva
Integrációsmodul-típusok
A Data Factory három típusú integrációs modult ajánl, és ki kell választania azt a típust, amely a leginkább megfelel az adatintegrációsképesség- és hálózatikörnyezet-igényeinek. A három típus a következő:
- Azure
- Saját üzemeltetésű
- Azure-SSIS
Explicit módon megadhatja az integrációs modul beállításait a connectVia tulajdonságban, ha ez nincs meghatározva, akkor az alapértelmezett integrációs modult használja a rendszer az Automatikus feloldás tulajdonsággal.
Az alábbi táblázat ismerteti az integrációs modulok egyes típusainak képességeit és hálózati támogatását:
IR-típus | Nyilvános hálózat | Magánhálózat |
---|---|---|
Azure | Adatfolyam | Adatfolyam |
Adatáthelyezés | Adatáthelyezés | |
Tevékenység feladása | Tevékenység feladása | |
Saját üzemeltetésű | Adatáthelyezés | Adatáthelyezés |
Tevékenység küldése | Tevékenység küldése | |
Azure-SSIS | SSIS-csomag végrehajtása | SSIS-csomag végrehajtása |
A használni kívánt integrációs modul meghatározása
Számos tényező befolyásolja a használni kívánt integrációs modult. Az alábbi útmutató segítséget nyújt a megfelelő integrációs modul kiválasztásában
Másolási tevékenység
A Copy tevékenység esetében a forrás- és fogadóalapú társított szolgáltatásokra van szükség az adatfolyam irányának meghatározásához. A rendszer az alábbi logikával határozza meg, melyik integrációsmodell-példányt használja a másolás végrehajtásához:
Másolás két felhőalapú adatforrás között: ha a forrás és a fogadó társított szolgáltatás is az Azure-beli integrációs modult használja, az ADF a regionális Azure-beli integrációs modult fogja használni, ha meg lett adva, vagy az automatikus feloldású integrációs modul választása esetén (alapértelmezett) automatikusan meghatároz egy helyet Az integrációs modul helye részben foglaltak szerint.
Egy felhőalapú adatforrás és egy magánhálózaton lévő adatforrás közötti másolás: ha a forrás vagy a fogadó társított szolgáltatása egy saját üzemeltetésű integrációs modulra mutat, a rendszer azon a saját üzemeltetésű integrációs modulon hajtja végre a másolási tevékenységet.
A magánhálózat két adatforrása közötti másolás: a forráshoz és a fogadóhoz társított szolgáltatásnak ugyanarra az integrációs futtatókörnyezetre kell mutatnia, és az integrációs futtatókörnyezetet használja a másolási tevékenység végrehajtásához.
Keresési és metaadat-beolvasási tevékenység
A keresési és metaadat-beolvasási tevékenységet a rendszer az adattár társított szolgáltatásához rendelt integrációs modulon hajtja végre.
Átalakítási tevékenység
Minden átalakítási tevékenységhez tartozik egy cél számítási társított szolgáltatás, amely egy integrációs modulra mutat. Ez az integrációsmodul-példány az, ahonnan a rendszer küldi az átalakítási tevékenységet.
Adatfolyam tevékenység
Adatfolyam tevékenység a hozzá társított integrációs modulon lesz végrehajtva.