Megosztás a következőn keresztül:


Adatok átalakítása SAP ODP-forrásból az SAP CDC-összekötővel az Azure Data Factoryben vagy az Azure Synapse Analyticsben

A következőkre vonatkozik: Azure Data Factory Azure Synapse Analytics

Tipp.

Próbálja ki a Data Factoryt a Microsoft Fabricben, amely egy teljes körű elemzési megoldás a nagyvállalatok számára. A Microsoft Fabric az adattovábbítástól az adatelemzésig, a valós idejű elemzésig, az üzleti intelligenciáig és a jelentéskészítésig mindent lefed. Ismerje meg, hogyan indíthat új próbaverziót ingyenesen!

Ez a cikk azt ismerteti, hogyan alakíthat át adatokat SAP ODP-forrásból az SAP CDC-összekötő használatával a leképezési adatfolyam használatával. További információért olvassa el az Azure Data Factory vagy az Azure Synapse Analytics bevezető cikkét. Az adatok Azure Data Factoryvel és Azure Synapse-elemzéssel való átalakításának bemutatásához olvassa el a leképezési adatfolyamot vagy az adatfolyam-leképezéssel kapcsolatos oktatóanyagot.

Tipp.

Az SAP-adatintegrációs forgatókönyv általános támogatásának megismeréséhez tekintse meg az SAP-adatintegrációt az Azure Data Factory tanulmányában az egyes SAP-összekötők részletes ismertetésével, összehasonlításával és útmutatásával.

Támogatott képességek

Ez az SAP CDC-összekötő a következő képességeket támogatja:

Támogatott képességek IR
Adatfolyam leképezése (forrás/-) ①, ②

(1) Azure-integrációs modul (2) Saját üzemeltetésű integrációs modul

Ez az SAP CDC-összekötő az SAP ODP-keretrendszer használatával nyer ki adatokat az SAP-forrásrendszerekből. A megoldás architektúrájának bemutatásához olvassa el az SAP-adatrögzítés (CDC) bemutatása és architektúrája című cikket az SAP tudásközpontjában.

Az SAP ODP-keretrendszer minden naprakész SAP NetWeaver-alapú rendszerben megtalálható, beleértve az SAP ECC-t, az SAP S/4HANA-t, az SAP BW-t, az SAP BW/4HANA-t és az SAP LT replikációs kiszolgálót (SLT). Az előfeltételekről és a minimálisan szükséges kiadásokról lásd : Előfeltételek és konfiguráció.

Az SAP CDC-összekötő támogatja az alapszintű hitelesítést vagy a biztonságos hálózati kommunikációt (SNC), ha az SNC konfigurálva van.

Jelenlegi korlátozások

Az SAP CDC-összekötő jelenlegi korlátozásai a Data Factoryben:

  • Az ODQ-előfizetések nem állíthatók vissza vagy törölhetők a Data Factoryben (ehhez használja a csatlakoztatott SAP-rendszerben az ODQMON tranzakciót).
  • A megoldással nem használhat SAP-hierarchiát.

Előfeltételek

Az SAP CDC-összekötő használatához tekintse meg az SAP CDC-összekötő előfeltételeit és beállítását.

Első lépések

A Copy tevékenység folyamattal való végrehajtásához használja az alábbi eszközök vagy SDK-k egyikét:

Társított szolgáltatás létrehozása az SAP CDC-összekötőhöz felhasználói felületen

Kövesse az SAP CDC társított szolgáltatás előkészítése az SAP CDC-összekötő társított szolgáltatásának létrehozásához az Azure Portal felhasználói felületén leírt lépéseket.

Adathalmaz tulajdonságai

Az SAP CDC-adatkészlet előkészítéséhez kövesse az SAP CDC-forrásadatkészlet előkészítését.

Adatok átalakítása az SAP CDC-összekötővel

A nyers SAP ODP változáscsatorna nehezen értelmezhető és a fogadóra való megfelelő frissítése kihívást jelenthet. Az egyes sorokkal (például ODQ_CHANGEMODE) társított műszaki attribútumokat például úgy kell értelmezni, hogy megfelelően alkalmazzák a módosításokat a fogadóra. Emellett az ODP-ből származó változásadatok kivonata több módosítást is tartalmazhat ugyanahhoz a kulcshoz (például ugyanarra az értékesítési rendelésre). Ezért fontos tiszteletben tartani a változások sorrendjét, ugyanakkor optimalizálni kell a teljesítményt a változások párhuzamos feldolgozásával. Ezenkívül a változásadat-rögzítési adatcsatorna kezeléséhez az állapot nyomon követésére is szükség van, például a hibahelyreállítás beépített mechanizmusainak biztosításához. Az Azure Data Factory-leképezési adatfolyamok minden ilyen szempontot figyelembe vesznek. Ezért az SAP CDC-kapcsolat a leképezési adatfolyam-élmény része. Így a felhasználók a szükséges átalakítási logikára összpontosíthatnak anélkül, hogy foglalkozniuk kellene az adatkinyerés technikai részleteivel.

Első lépésként hozzon létre egy folyamatot egy leképezési adatfolyammal.

Screenshot of add data flow activity in pipeline.

Ezután adjon meg egy átmeneti társított szolgáltatást és átmeneti mappát az Azure Data Lake Gen2-ben, amely az SAP-ból kinyert adatok köztes tárolójaként szolgál.

Feljegyzés

  • Az átmeneti társított szolgáltatás nem használhat saját üzemeltetésű integrációs modult.
  • Az előkészítési mappát az SAP CDC-összekötő belső tárolójának kell tekinteni. Az SAP CDC-futtatókörnyezet további optimalizálása érdekében a megvalósítás részletei, például az átmeneti adatokhoz használt fájlformátum változhatnak. Ezért javasoljuk, hogy ne használja az előkészítési mappát más célokra, például más másolási tevékenységek vagy adatfolyamok leképezése forrásként.

Screenshot of specify staging folder in data flow activity.

Az SAP CDC-futtatókörnyezet az Ellenőrzőpont kulcsot használja a változásadat-rögzítési folyamat állapotadatainak tárolására. Ez például lehetővé teszi, hogy az SAP CDC-leképezési adatfolyamok automatikusan helyreálljanak a hibahelyzetekből, vagy tudják, hogy már létrejött-e egy változásadat-rögzítési folyamat egy adott adatfolyamhoz. Ezért fontos, hogy minden forráshoz egyedi Ellenőrzőpont-kulcsot használjon. Ellenkező esetben az egyik forrás állapotadatait egy másik forrás felülírja.

Feljegyzés

  • Az ütközések elkerülése érdekében alapértelmezés szerint egy egyedi azonosító jön létre Ellenőrzőpont-kulcsként.
  • Ha paraméterekkel használja ugyanazt az adatfolyamot több forrás esetében, ügyeljen arra, hogy a Checkpoint-kulcsot forrásonként egyedi értékekkel parametriázze.
  • A Checkpoint Key tulajdonság nem jelenik meg, ha az SAP CDC-forráson belüli futtatási mód minden futtatáskor Megtelt (lásd a következő szakaszt), mert ebben az esetben nincs változási adatrögzítési folyamat.

Screenshot of checkpoint key property in data flow activity.

Adatfolyam-tulajdonságok leképezése

Ha az SAP CDC-összekötővel forrásként szeretne leképezési adatfolyamot létrehozni, hajtsa végre a következő lépéseket:

  1. Az ADF Studióban nyissa meg a Szerzői központ Adatfolyamok szakaszát, válassza a ... gombot az Adatfolyam-műveletek menü legördülő menüjéhez, majd válassza az Új adatfolyam elemet. Kapcsolja be a hibakeresési módot az adatfolyam-vászon felső sávjának Adatfolyam hibakeresés gombjával.

    Screenshot of the data flow debug button in mapping data flow.

  2. A leképezési adatfolyam-szerkesztőben válassza a Forrás hozzáadása lehetőséget.

    Screenshot of add source in mapping data flow.

  3. A Forrásbeállítások lapon válasszon egy előkészített SAP CDC-adatkészletet, vagy az Új gombra kattintva hozzon létre egy újat. Másik lehetőségként választhatja a Beágyazott elemet is a Forrás típusú tulajdonságban, és explicit adatkészlet definiálása nélkül folytathatja a műveletet.

    Screenshot of the select dataset option in source settings of mapping data flow source.

  4. A Forrásbeállítások lapon válassza a Teljes lehetőséget minden futtatáskor, ha teljes pillanatképeket szeretne betölteni a leképezési adatfolyam minden végrehajtására. Első futtatáskor válassza a Teljes lehetőséget, majd növekményesen , ha az SAP-forrásrendszerből szeretne előfizetni egy változáscsatornára, beleértve a kezdeti teljes adatpillanatképet. Ebben az esetben a folyamat első futtatása delta inicializálást végez, ami azt jelenti, hogy létrehoz egy ODP delta-előfizetést a forrásrendszerben, és visszaad egy aktuális teljes adat pillanatképet. A későbbi folyamatfuttatások csak növekményes változásokat adnak vissza az előző futtatás óta. A beállítás növekményes módosításai csak ODP-delta-előfizetést hoznak létre anélkül, hogy az első futtatáskor a teljes adatok kezdeti pillanatképét adnák vissza. Az ezt követő futtatások csak az előző futtatás óta növekményes változásokat adnak vissza. Mindkét növekményes terhelési beállításnak meg kell adnia az ODP-forrásobjektum kulcsait a Kulcsoszlopok tulajdonságban.

    Screenshot of the run mode property in source options of mapping data flow source.

    Screenshot of the key columns selection in source options of mapping data flow source.

  5. A Leképezés, az Optimalizálás és a Vizsgálat lapfülek esetében kövesse a leképezési adatfolyamot.

Teljes vagy kezdeti terhelés teljesítményének optimalizálása forrásparticionálással

Ha a futtatási mód minden futtatáskor Megtelt vagy Az első futtatáskor megtelt, akkor növekményes, akkor az Optimalizálás lap egy Forrás nevű kijelölési és particionálási típust kínál. Ezzel a beállítással több partíciós (azaz szűrési) feltételt adhat meg, hogy egy nagy forrásadatkészlet több kisebb részre legyen bontva. Az SAP CDC-összekötő minden partícióhoz külön kinyerési folyamatot indít el az SAP-forrásrendszerben.

Screenshot of the partitioning options in optimize of mapping data flow source.

Ha a partíciók mérete egyenlő, a forrásparticionálás lineárisan növelheti az adatkinyerés átviteli sebességét. Az ilyen teljesítménybeli fejlesztések eléréséhez elegendő erőforrásra van szükség az SAP-forrásrendszerben, a saját üzemeltetésű integrációs modult üzemeltető virtuális gépen és az Azure integrációs modulban.