Megosztás a következőn keresztül:


Rögzített hosszúságú szövegfájlok feldolgozása Data Factory-leképezési adatfolyamok használatával

A következőkre vonatkozik: Azure Data Factory Azure Synapse Analytics

Tipp.

Próbálja ki a Data Factoryt a Microsoft Fabricben, amely egy teljes körű elemzési megoldás a nagyvállalatok számára. A Microsoft Fabric az adattovábbítástól az adatelemzésig, a valós idejű elemzésig, az üzleti intelligenciáig és a jelentéskészítésig mindent lefed. Ismerje meg, hogyan indíthat új próbaverziót ingyenesen!

A Microsoft Azure Data Factoryben az adatfolyamok leképezésével rögzített szélességű szöveges fájlokból alakíthatja át az adatokat. Az alábbi feladatban meghatározunk egy adatkészletet egy elválasztójel nélküli szövegfájlhoz, majd beállítjuk a részszűrési felosztásokat az ordinális pozíció alapján.

Folyamat létrehozása

  1. Új folyamat létrehozásához válassza az +Új folyamat lehetőséget.

  2. Adjon hozzá egy adatfolyam-tevékenységet, amely rögzített szélességű fájlok feldolgozására szolgál:

    Rögzített szélességű folyamat

  3. Az adatfolyam-tevékenységben válassza az Új leképezési adatfolyam lehetőséget.

  4. Forrás-, származtatott oszlop-, kijelölés- és fogadóátalakítás hozzáadása:

    Rögzített szélességű Adatfolyam

  5. Konfigurálja a forrásátalakítást úgy, hogy egy új adatkészletet használjon, amely tagolt szöveg típusú lesz.

  6. Ne állítson be oszlopelválasztót vagy fejlécet.

    Most meg fogjuk adni a mező kezdőpontjait és hosszát a fájl tartalmához:

    1234567813572468
    1234567813572468
    1234567813572468
    1234567813572468
    1234567813572468
    1234567813572468
    1234567813572468
    1234567813572468
    1234567813572468
    1234567813572468
    1234567813572468
    1234567813572468
    1234567813572468
    
  7. A Forrásátalakítás Előrejelzés lapján egy Column_1 nevű karakterláncoszlopnak kell megjelennie.

  8. A Származtatott oszlopban hozzon létre egy új oszlopot.

  9. Egyszerű neveket adunk az oszlopoknak, például az 1.

  10. A kifejezésszerkesztőben írja be a következőket:

    substring(Column_1,1,4)

    származtatott oszlop

  11. Ismételje meg a 10. lépést az összes elemezni kívánt oszlop esetében.

  12. Válassza a Vizsgálat lapot a létrehozandó új oszlopok megtekintéséhez:

    ellenőriz

  13. A Kijelölés átalakítás használatával eltávolíthatja az átalakításhoz nem szükséges oszlopokat:

    átalakítás kiválasztása

  14. A Fogadóval az adatokat egy mappába lehet kihozni:

    rögzített szélességű fogadó

    A kimenet a következőképpen fog kinézni:

    rögzített szélességű kimenet

A rögzített szélességű adatok most fel vannak osztva négy karakterrel, és a Col1, Col2, Col3, Col4 stb. Az előző példa alapján az adatok négy oszlopra oszlanak.