Freigeben über


Preisgestaltungsszenario mit einer Datenpipeline zum Laden von 1 TB Parquet-Daten in ein Datenlager

In diesem Szenario wurde eine Kopieraktivität in einer Datenpipeline verwendet, um 1 TB Parquet-Tabellendaten, die in Azure Data Lake Storage (ADLS) Gen2 gespeichert sind, in ein Data Warehouse in Microsoft Fabric zu laden.

Die im folgenden Beispiel verwendeten Preise sind hypothetisch und stellen nicht die tatsächlichen genauen Preise dar. Diese Beispiele sollen nur zeigen, wie Sie die Kosten für Data Factory-Projekte in Microsoft Fabric schätzen, planen und verwalten können. Da die Preise für Fabric-Kapazitäten in jeder Region unterschiedlich sind, verwenden wir nutzungsbasierte Preise für eine Fabric-Kapazität in USA, Westen 2 (einer typischen Azure-Region) in Höhe von 0,18 $ pro CU und Stunde. Weitere Preisoptionen für Fabric-Kapazitäten finden Sie unter Microsoft Fabric – Preise.

Konfiguration

Um dieses Szenario zu erreichen, müssen Sie eine Pipeline mit der folgenden Konfiguration erstellen:

Screenshot der Konfiguration einer Pipeline zum Kopieren von Parkettdaten aus ADLS Gen2 in ein Data Warehouse.

Kostenschätzung mithilfe der Fabric-Metrik-App

Screenshot, der die Dauer und den CU-Verbrauch des Auftrags in der Fabric Metrics App zeigt.

Der Datenverschiebungsvorgang nutzte 3.960 CU-Sekunden mit einer Dauer von 662,64 Sekunden, während der Aktivitätsausführungsvorgang null war, da keine Nichtkopienaktivitäten in der Pipeline ausgeführt wurden.

Die Preise basieren auf der verwendeten intelligenten Durchsatzoptimierung, die von ihrem konfigurierten Maximum in der Kopieraktivität abhängt. Es kann aus dem Aktivitätsergebnis unter usedDataIntegrationUnits bezogen werden. Weitere Informationen finden Sie in diesem Artikel. In diesem Beispiel ist die verwendete intelligente Durchsatzoptimierung 4.

Die verwendeten CU-Sekunden können mithilfe der folgenden Berechnung abgeleitet werden:

Laut Datenpipeline-Preismodell verbraucht jede Einheit des intelligenten Optimierungsdurchsatzes 1,5 CU Stunden. Angesichts der Tatsache, dass die verwendete intelligente Durchsatzoptimierung 4 beträgt und die Dauer des Datenverschiebungsvorgangs 662,64 Sekunden (ca. 11 Minuten) beträgt, werden die insgesamt genutzten CU-Stunden sein:

Genutzte CU-Stunden = 4 * 1,5 * (11/60) = 1,1

Wenn Sie CU-Stunden in CU-Sekunden konvertieren möchten, multiplizieren Sie sie mit 3600 (die Anzahl der Sekunden in einer Stunde).

Genutzte CU-Sekunden = 1,1 * 3600 = 3960

Hinweis

Obwohl die tatsächliche Ausführungsdauer als Metrik gemeldet wird, ist sie für die Berechnung der effektiven CU-Stunden mit der Fabric-Metrik-App nicht relevant, da die ebenfalls gemeldete CU-Sekunden-Metrik die Dauer bereits berücksichtigt.

Maßeinheit Datenverschiebungsvorgang
CU-Sekunden 3.960 CU Sekunden
Effektive CU-Stunden (3,960) / (60*60) CU-Stunden = 1,1 CU-Stunden

Gesamtlaufkosten bei 0,18 $ / CU-Stunde = (1,1 CU-Stunde) * ($0,18/CU-Stunde) ~= $0,20