Tarifaforgatókönyv a Dataflow Gen2 használatával 2 GB helyszíni CSV-adat lakehouse-táblába való betöltéséhez
Ebben a forgatókönyvben a Dataflow Gen2-t 2 GB helyszíni CSV-adat betöltésére használták egy Lakehouse-táblába a Microsoft Fabricben.
Az alábbi példában használt árak hipotetikusak, és nem szándékoznak pontos tényleges díjszabást feltételezni. Ezek csupán bemutatják, hogyan becsülheti meg, tervezheti és kezelheti a Data Factory-projektek költségeit a Microsoft Fabricben. Mivel a Fabric-kapacitások ára régiónként egyedi, használatalapú fizetéses díjszabást használunk az USA 2. nyugati régiójában (egy tipikus Azure-régióban) lévő Fabric-kapacitáshoz, óránként 0,18 USD/CU áron. Tekintse meg a Microsoft Fabric – Díjszabás című témakört, amelyből megismerheti a Fabric kapacitására vonatkozó egyéb lehetőségeket.
Konfiguráció
A forgatókönyv végrehajtásához létre kell hoznia egy adatfolyamot az alábbi lépésekkel:
- Adatfolyam inicializálása: Először töltsön fel 2 GB CSV-fájlokat a helyszíni környezetből az adatfolyamba.
- A Power Query konfigurálása:
- Lépjen a Power Queryre.
- Tiltsa le a lekérdezés átmeneti beállítását.
- Folytassa a CSV-fájlok kombinálásával.
- Adatátalakítás:
- Fejlécek előléptetése az egyértelműség érdekében.
- Távolítsa el a szükségtelen oszlopokat.
- Szükség szerint módosítsa az oszlop adattípusát.
- Kimeneti adatok célhelyének meghatározása:
- Konfigurálja a Lakehouse-t adatkimeneti célként.
- Ebben a példában létrehoztunk és felhasználtunk egy Lakehouse-t a Fabricben.
Költségbecslés a Fabric Metrics alkalmazással
Az adatfolyam Gen2 frissítési művelete 4749,42 CU másodpercet, két nagy léptékű adatfolyam számítási művelet pedig 7,78 CU másodpercet és 7,85 CU másodpercet fogyasztott.
Feljegyzés
Bár metrikaként jelentve, a futtatás tényleges időtartama nem releváns a tényleges CU-órák a Fabric Metrics alkalmazással való kiszámításakor, mivel a cu másodperces metrika, amelyről a jelentés is beszámol, már az időtartamát is figyelembe veszi.
Metrika | Számítási felhasználás |
---|---|
Adatfolyam Gen2 – CU-frissítés másodpercben | 4749,42 CU másodperc |
Nagy léptékű adatfolyamok számítási CU-másodperce | (7,78 + 7,85) 15,63 CU másodperc |
Hatályos CU-órák számlázása | (4749,42 + 15,63) / (60*60) = 1,32 CU óra |
Teljes futási költség 0,18 USD/CU óránként = (1,32 CU-óra) * (0,18 USD/CU óra) ~= $0,24