Megosztás a következőn keresztül:


Tarifaforgatókönyv a Dataflow Gen2 használatával 2 GB helyszíni CSV-adat lakehouse-táblába való betöltéséhez

Ebben a forgatókönyvben a Dataflow Gen2-t 2 GB helyszíni CSV-adat betöltésére használták egy Lakehouse-táblába a Microsoft Fabricben.

Az alábbi példában használt árak hipotetikusak, és nem szándékoznak pontos tényleges díjszabást feltételezni. Ezek csupán bemutatják, hogyan becsülheti meg, tervezheti és kezelheti a Data Factory-projektek költségeit a Microsoft Fabricben. Mivel a Fabric-kapacitások ára régiónként egyedi, használatalapú fizetéses díjszabást használunk az USA 2. nyugati régiójában (egy tipikus Azure-régióban) lévő Fabric-kapacitáshoz, óránként 0,18 USD/CU áron. Tekintse meg a Microsoft Fabric – Díjszabás című témakört, amelyből megismerheti a Fabric kapacitására vonatkozó egyéb lehetőségeket.

Konfiguráció

A forgatókönyv végrehajtásához létre kell hoznia egy adatfolyamot az alábbi lépésekkel:

  1. Adatfolyam inicializálása: Először töltsön fel 2 GB CSV-fájlokat a helyszíni környezetből az adatfolyamba.
  2. A Power Query konfigurálása:
    1. Lépjen a Power Queryre.
    2. Tiltsa le a lekérdezés átmeneti beállítását.
    3. Folytassa a CSV-fájlok kombinálásával.
  3. Adatátalakítás:
    1. Fejlécek előléptetése az egyértelműség érdekében.
    2. Távolítsa el a szükségtelen oszlopokat.
    3. Szükség szerint módosítsa az oszlop adattípusát.
  4. Kimeneti adatok célhelyének meghatározása:
    1. Konfigurálja a Lakehouse-t adatkimeneti célként.
    2. Ebben a példában létrehoztunk és felhasználtunk egy Lakehouse-t a Fabricben.

Költségbecslés a Fabric Metrics alkalmazással

Screenshot showing the duration and CU consumption of the job in the Fabric Metrics App.

Screenshot showing details of the Dataflow Gen2 Refresh cost

Screenshot showing details of a Dataflow Gen2 High Scale Dataflow Compute consumption used in the run.

Screenshot showing details of a second Dataflow Gen2 High Scale Dataflow Compute consumption used in the run.

Az adatfolyam Gen2 frissítési művelete 4749,42 CU másodpercet, két nagy léptékű adatfolyam számítási művelet pedig 7,78 CU másodpercet és 7,85 CU másodpercet fogyasztott.

Feljegyzés

Bár metrikaként jelentve, a futtatás tényleges időtartama nem releváns a tényleges CU-órák a Fabric Metrics alkalmazással való kiszámításakor, mivel a cu másodperces metrika, amelyről a jelentés is beszámol, már az időtartamát is figyelembe veszi.

Metrika Számítási felhasználás
Adatfolyam Gen2 – CU-frissítés másodpercben 4749,42 CU másodperc
Nagy léptékű adatfolyamok számítási CU-másodperce (7,78 + 7,85) 15,63 CU másodperc
Hatályos CU-órák számlázása (4749,42 + 15,63) / (60*60) = 1,32 CU óra

Teljes futási költség 0,18 USD/CU óránként = (1,32 CU-óra) * (0,18 USD/CU óra) ~= $0,24