Κοινή χρήση μέσω


Σενάριο τιμολόγησης που χρησιμοποιεί το Dataflow Gen2 για τη φόρτωση 2 GB δεδομένων CSV εσωτερικής εγκατάστασης σε έναν πίνακα lakehouse

Σε αυτό το σενάριο, το Dataflow Gen2 χρησιμοποιήθηκε για τη φόρτωση 2 GB δεδομένων CSV εσωτερικής εγκατάστασης σε έναν πίνακα Lakehouse στο Microsoft Fabric.

Οι τιμές που χρησιμοποιούνται στο παρακάτω παράδειγμα είναι υποθετικές και δεν πρόκειται να συνεπάγονται ακριβείς πραγματικές τιμές. Αυτά είναι απλώς για να σας δείξουμε πώς μπορείτε να εκτιμήσετε, να σχεδιάσετε και να διαχειριστείτε το κόστος για έργα του Data Factory στο Microsoft Fabric. Επίσης, δεδομένου ότι οι εκχωρημένοι πόροι Fabric τιμολογούνται με μοναδικό τρόπο σε όλες τις περιοχές, χρησιμοποιούμε τις τιμές pay-as-you-go για ένα σύνολο εκχωρημένων πόρων Fabric στη Δυτική Η.Π.Α. 2 (μια τυπική περιοχή Azure), στα 0,18 $ ανά CU ανά ώρα. Ανατρέξτε εδώ στο Microsoft Fabric - Τιμολόγηση για να εξερευνήσετε άλλες επιλογές τιμολόγησης χωρητικότητας Fabric.

Ρύθμιση παραμέτρων

Για να ολοκληρώσετε αυτό το σενάριο, πρέπει να δημιουργήσετε μια ροή δεδομένων με τα παρακάτω βήματα:

  1. Προετοιμασία ροής δεδομένων: Ξεκινήστε αποστέλλοντας αρχεία CSV 2 GB από το περιβάλλον εσωτερικής εγκατάστασης στη ροή δεδομένων.
  2. Ρύθμιση παραμέτρων Power Query:
    1. Μεταβείτε στο Power Query.
    2. Απενεργοποιήστε την επιλογή προετοιμασίας του ερωτήματος.
    3. Συνεχίστε για να συνδυάσετε τα αρχεία CSV.
  3. Μετασχηματισμός δεδομένων:
    1. Προβιβάστε κεφαλίδες για λόγους σαφήνειας.
    2. Καταργήστε περιττές στήλες.
    3. Προσαρμόστε τους τύπους δεδομένων στήλης, ανάλογα με τις ανάγκες.
  4. Ορισμός προορισμού δεδομένων εξόδου:
    1. Ρυθμίστε τις παραμέτρους του Lakehouse ως προορισμού εξόδου δεδομένων.
    2. Σε αυτό το παράδειγμα, δημιουργήθηκε και χρησιμοποιήθηκε ένα Lakehouse μέσα στο Fabric.

Εκτίμηση κόστους με χρήση της εφαρμογής Fabric Metrics

Screenshot showing the duration and CU consumption of the job in the Fabric Metrics App.

Screenshot showing details of the Dataflow Gen2 Refresh cost

Screenshot showing details of a Dataflow Gen2 High Scale Dataflow Compute consumption used in the run.

Screenshot showing details of a second Dataflow Gen2 High Scale Dataflow Compute consumption used in the run.

Η λειτουργία ανανέωσης Dataflow Gen2 κατανάλωσε 4749,42 CU δευτερόλεπτα και δύο λειτουργίες υπολογιστικής λειτουργίας ροών δεδομένων υψηλής κλίμακας κατανάλωναν 7,78 cu δευτερόλεπτα + 7,85 cu δευτερόλεπτα το καθένα.

Σημείωμα

Παρόλο που αναφέρεται ως μετρικό, η πραγματική διάρκεια της εκτέλεσης δεν είναι σχετική κατά τον υπολογισμό των αποτελεσματικών ωρών CU με την εφαρμογή μετρικών Fabric από το μετρικό των δευτερολέπτων CU, αναφέρει επίσης ήδη τη διάρκειά της.

Metric Υπολογιστική κατανάλωση
Ροή δεδομένων Gen2 Ανανέωση CU δευτερόλεπτα 4749,42 CU δευτερόλεπτα
Οι ροές δεδομένων υψηλής κλίμακας υπολογίζουν cu δευτερόλεπτα (7,78 + 7,85) 15,63 CU δευτερόλεπτα
Ισχύει cu ώρες με χρέωση (4749,42 + 15,63) / (60*60) = 1,32 ώρες CU

Συνολικό κόστος εκτέλεσης σε $0.18/ΏΡΑ CU = (1.32 CU-hours) * ($0.18/CU ώρα) ~= $0.24