Sdílet prostřednictvím


Ceny toku dat Gen2 pro Data Factory v Microsoft Fabric

Tok dat Gen2 umožňuje využívat rozhraní s nízkým kódem s více než 300 transformacemi založenými na datech a umělé inteligenci, díky kterým můžete transformovat data snadněji a flexibilněji než jakýkoli jiný nástroj. Tok dat Gen2 je vytvořený pomocí známého prostředí Power Query, které je dnes dostupné napříč několika produkty a službami Microsoftu, jako jsou Excel, Power BI, Power Platform, aplikace Dynamics 365 Insights a další. Po publikování toku dat se vygeneruje definice toku dat – jedná se o program, který se spustí po aktualizaci toku dat a vytvoří tabulky v přípravném úložišti nebo výstupním cíli. Během aktualizace se definice toku dat používá modul toku dat k vygenerování plánu orchestrace, správě prostředků a orchestraci provádění dotazů mezi zdroji dat, bránami a výpočetními moduly a k vytváření tabulek v přípravném úložišti nebo cíli dat.

Diagram architektury Toku dat Gen2

Diagram, který je zde znázorněn, zachycuje různé komponenty architektury DataFlow DataFlow Gen2 služby Data Factory, včetně Lakehouse používaného k ingestování dat, a artefaktu skladu používaného jako výpočetní modul a znamená rychlejší zápis výsledků do přípravných nebo podporovaných cílů výstupu. Pokud se výpočetní prostředky warehouse nedají použít nebo když je příprava pro dotaz zakázaná, modul Mashup extrahuje, transformuje nebo načte data do přípravného nebo datového cíle. Další informace o tom, jak tok dat Gen2 funguje, najdete v tomto blogovém příspěvku: Data Factory Spotlight: Dataflow Gen2.

Když aktualizujete nebo publikujete položku Toku dat Gen2, spotřebují se jednotky kapacity prostředků infrastruktury pro následující moduly.

  • Standardní výpočetní prostředky: Poplatky se vám účtují na základě doby vyhodnocení dotazu napříč všemi dotazy toku dat spuštěnými prostřednictvím modulu Mashup.
  • Výpočetní prostředky s vysokým škálováním toků dat: Účtuje se vám, když je příprava povolená na základě doby spotřeby modulu SQL pro Lakehouse (přípravné úložiště) a skladu (výpočetní prostředky úložiště).

Cenový model Toku dat Gen2

Následující tabulka uvádí, že k určení nákladů na spuštění Toku Dataflow Gen2 využívá každé spuštění dotazu modul mashupu pro standardní výpočty a že doba provádění výpočetních prostředků se přeloží na spotřebu 16 jednotek CU za hodinu. Za druhé platí, že pro scénáře výpočetních prostředků ve velkém měřítku, kdy je povolená příprava, by se měla počítat také doba provádění modulu SQL Lakehouse/Warehouse. Doba trvání provádění výpočetních prostředků se překládá na spotřebu 6 JEDNOTek za hodinu. Na konci každého spuštění Dataflow Gen2 se spotřeba jednotek kapacity (CU) pro každý typ motoru sečte a účtuje se podle přeložené ceny kapacity Fabric v oblasti, ve které je nasazená.

Typ modulu Dataflow Gen2 Měřiče spotřeby Míra spotřeby CU infrastruktury Členitost generování sestav spotřeby
Compute úrovně Standard Na základě každé doby provádění dotazů mashupového stroje v sekundách. 16 jednotek CU za hodinu Na položku Toku dat Gen2
Výpočty toků dat ve velkém měřítku Na základě doby provádění modulu SQL pro Lakehouse/Warehouse (s povolenou přípravou) v sekundách. 6 jednotek CU za hodinu Na pracovní prostor
Pohyb dat Na základě doby trvání rychlého kopírování v hodinách a použitých prostředků s inteligentní optimalizací propustnosti. 1,5 JEDNOTek za hodinu Na položku Toku dat Gen2

Ceny brány dat virtuální sítě s využitím toku dat Gen2

Brána dat virtuální sítě se účtuje jako poplatek za doplňkovou infrastrukturu přidruženou k kapacitě Infrastruktury. To znamená, že má vlastní měřič a účtuje se faktura, která je konzistentní napříč všemi spuštěními položek Infrastruktury a navíc.

Celková faktura za spouštění toků dat Gen2 prostřednictvím brány dat virtuální sítě se vypočítá jako: Poplatky za toky dat Gen2 + poplatky za bránu dat virtuální sítě.

Poplatek za bránu dat virtuální sítě je úměrný vašemu využití brány dat virtuální sítě, kde je využití definované jako doba provozu nebo kdykoli je brána dat virtuální sítě zapnutá.

Míra spotřeby CU brány dat virtuální sítě: (4 HODINA CU) * (kapacita prostředků infrastruktury za jednotkovou cenu)

Další informace najdete v cenách a fakturaci bran dat virtuální sítě.

Změny míry spotřeby úloh Microsoft Fabric

Sazby spotřeby se můžou kdykoli změnit. Microsoft používá přiměřené úsilí k poskytování oznámení prostřednictvím e-mailu a oznámení v produktu. Změny jsou platné k datu uvedené v poznámkách k verzi a blogu Microsoft Fabric. Pokud se nějaká změna míry spotřeby úloh Microsoft Fabric výrazně zvýší kapacitní jednotky (CU) vyžadované k použití konkrétní úlohy, můžou zákazníci použít možnosti zrušení dostupné pro zvolený způsob platby.

Výpočet odhadovaných nákladů pomocí aplikace Metriky prostředků infrastruktury

Aplikace Microsoft Fabric Capacity Metrics poskytuje přehled o využití kapacity pro všechny pracovní prostory Infrastruktury svázané s kapacitou. Správci kapacity ji používají ke sledování výkonu úloh a jejich využití v porovnání s zakoupenou kapacitou. Použití aplikace Metrics představuje nejpřesnější způsob, jak odhadnout náklady na spuštění aktualizace Toku dat Gen2. Při zátěžovém testování scénáře vytvořte položku Tok dat Gen2 v novém pracovním prostoru, abyste snížili veškerý hlášený šum v aplikaci Metriky infrastruktury.

Následující tabulka se dá využít jako šablona k výpočtu odhadovaných nákladů pomocí aplikace Fabric Metrics pro aktualizaci Toku dat Gen2:

Metrika Compute úrovně Standard Vysokokapacitní výpočetní prostředky
Celkový počet jednotek CU s CU sekundy h CU sekundy
Fakturované efektivní hodiny CU s / (60*60) = S CU-hour h / (60*60) = H CU-hour

Celkové náklady na aktualizaci = (S + H CU hodina) * (kapacita fabric za jednotkovou cenu)