Dela via


Prisscenario med Dataflow Gen2 och Virtual Network Data Gateway för att läsa in 2 GB Parquet-data till en Lakehouse-tabell

I det här scenariot användes Dataflow Gen2 och Virtual Network Data Gateway för att läsa in 2 GB Parquet-data som lagras i Azure Data Lake Storage (ADLS) Gen2 till en Lakehouse-tabell i Microsoft Fabric. Vi använde NYC Taxi-green-exempeldata för Parquet-data.

Priserna som används i följande exempel är hypotetiska och avser inte att innebära exakta faktiska priser. Dessa är bara för att visa hur du kan beräkna, planera och hantera kostnader för Data Factory-projekt i Microsoft Fabric. Eftersom Infrastrukturkapaciteter är unikt prissatta mellan regioner använder vi prissättningen betala per användning för en Infrastrukturkapacitet i USA, västra 2 (en typisk Azure-region) till 0,18 USD per CU per timme. Se Microsoft Fabric – Priser för att utforska andra prisalternativ för Infrastrukturkapacitet.

Konfiguration

För att åstadkomma det här scenariot måste du skapa ett dataflöde med följande steg:

  1. Initiera Dataflöde: Hämta 2 GB Parquet-filer från ADLS Gen2-lagringskonto.
  2. Konfigurera virtuell nätverksdatagateway med 1 instans och 30 minuters realtidstid.
  3. Konfigurera Power Query.
  4. Konfigurera Lakehouse som datautdatamål.

Kostnadsuppskattning med hjälp av fabric Metrics-appen

Skärmbild som visar varaktigheten och CU-förbrukningen för jobbet i Fabric Metrics-appen.

Skärmbild som visar information om CU-förbrukning för drifttid för virtuell nätverksdatagateway.

När du kör ett dataflöde för att läsa in data via den virtuella nätverksdatagatewayen delas den totala förbrukningen in i två huvudkomponenter: uppdatering av dataflöde och drifttid för virtuell nätverksdatagateway. Avgifterna för datagatewayen för virtuellt nätverk baseras på dess drifttid, vilket omfattar både arbetsbelastningens körningstid och dess time-to-live när gatewayen är aktiv.

Belastningsåtgärden förbrukade cirka 2 minuter med 970,6228 CU-sekunder på Dataflow Gen2-uppdatering och 7480,6466 CU-sekunder på drifttiden för Virtual Network Data Gateway.

Kommentar

Även om den rapporteras som ett mått är den faktiska varaktigheten för körningen inte relevant när du beräknar de effektiva CU-timmarna med Fabric Metrics-appen eftersom CU-sekundersmåttet som det också rapporterar redan står för dess varaktighet.

Mått Beräkningsförbrukning
Uppdatering av Dataflöde Gen2 970.6228 CU sekunder
Drifttid för virtuell nätverksdatagateway 7480.6466 CU sekunder

Total körningskostnad på $0.18/CU hour = (970.6228 + 7480.6466) / (60 * 60) CU-hours * ($0.18/CU hour) ~= $0.42