Příklad cen: Kopírování dat a transformace pomocí Azure Databricks po hodinách

PLATÍ PRO: Azure Data Factory Azure Synapse Analytics

Tip

Vyzkoušejte si službu Data Factory v Microsoft Fabric, řešení pro analýzy typu all-in-one pro podniky. Microsoft Fabric zahrnuje všechno od přesunu dat až po datové vědy, analýzy v reálném čase, business intelligence a vytváření sestav. Přečtěte si, jak začít používat novou zkušební verzi zdarma.

V tomto scénáři chcete zkopírovat data z AWS S3 do služby Azure Blob Storage a transformovat je pomocí Azure Databricks podle hodinového plánu na 8 hodin denně po dobu 30 dnů.

Ceny použité v tomto příkladu jsou hypotetické a nemají za cíl znamenat přesné skutečné ceny. Náklady na čtení a zápis a monitorování se nezobrazují, protože jsou obvykle zanedbatelné a nebudou mít významný vliv na celkové náklady. Spuštění aktivit se také zaokrouhlují na nejbližší 1000 v odhadech cenové kalkulačky.

Podrobnější scénáře a odhad budoucích nákladů na používání služby najdete v cenové kalkulačce Azure.

Konfigurace

Pokud chcete tento scénář provést, musíte vytvořit kanál s následujícími položkami:

  • Jedna aktivita kopírování se vstupní datovou sadou, která se má zkopírovat z AWS S3, a výstupní datovou sadou pro data v úložišti Azure.
  • Jedna aktivita Azure Databricks pro transformaci dat
  • Jedna aktivační událost plánu pro spuštění kanálu každou hodinu. Když chcete spustit kanál, můžete ho aktivovat okamžitě nebo naplánovat. Kromě samotného kanálu se každá instance triggeru počítá jako jedno spuštění aktivity.

Diagram shows a pipeline with a schedule trigger. In the pipeline, copy activity flows to an input dataset, an output dataset, and a DataBricks activity, which runs on Azure Databricks. The input dataset flows to an AWS S3 linked service. The output dataset flows to an Azure Storage linked service.

Odhad nákladů

Operations Typy a jednotky
Spuštění kanálu 3 Spuštění aktivity na spuštění (1 pro spuštění triggeru, 2 pro spuštění aktivit) = 720 spuštění aktivit, zaokrouhleno nahoru, protože kalkulačka umožňuje pouze přírůstky 1 000.
Předpoklad kopírování dat: Hodiny DIU za spuštění = 10 min 10 min \ 60 min * 4 Azure Integration Runtime (výchozí nastavení DIU = 4) Další informace o jednotkách integrace dat a optimalizaci výkonu kopírování najdete v tomto článku.
Předpoklad aktivity Spuštění Databricks: hodiny externího spuštění za spuštění = 10 min 10 min \ 60 min provádění aktivity externího kanálu

Příklad cenové kalkulačky

Celková cena scénáře za 30 dní: 41,01 Kč

Screenshot of the pricing calculator configured for a copy data and transform with Azure Databricks scenario.