Κοινή χρήση μέσω


Σενάριο τιμολόγησης που χρησιμοποιεί το Dataflow Gen2 για τη φόρτωση 2 GB δεδομένων Parquet σε έναν πίνακα lakehouse

Σε αυτό το σενάριο, το Dataflow Gen2 χρησιμοποιήθηκε για τη φόρτωση 2 GB δεδομένων Parquet που ήταν αποθηκευμένα στο Azure Data Lake Υπηρεσία αποθήκευσης (ADLS) Gen2 σε έναν πίνακα Lakehouse στο Microsoft Fabric. Χρησιμοποιήσαμε το δείγμα δεδομένων για το πράσινο των ταξί της Νέας Υόρκης για τα δεδομένα του Parquet.

Οι τιμές που χρησιμοποιούνται στο παρακάτω παράδειγμα είναι υποθετικές και δεν πρόκειται να συνεπάγονται ακριβείς πραγματικές τιμές. Αυτά είναι απλώς για να σας δείξουμε πώς μπορείτε να εκτιμήσετε, να σχεδιάσετε και να διαχειριστείτε το κόστος για έργα του Data Factory στο Microsoft Fabric. Επίσης, δεδομένου ότι οι εκχωρημένοι πόροι Fabric τιμολογούνται με μοναδικό τρόπο σε όλες τις περιοχές, χρησιμοποιούμε τις τιμές pay-as-you-go για ένα σύνολο εκχωρημένων πόρων Fabric στη Δυτική Η.Π.Α. 2 (μια τυπική περιοχή Azure), στα 0,18 $ ανά CU ανά ώρα. Ανατρέξτε εδώ στο Microsoft Fabric - Τιμολόγηση για να εξερευνήσετε άλλες επιλογές τιμολόγησης χωρητικότητας Fabric.

Ρύθμιση παραμέτρων

Για να ολοκληρώσετε αυτό το σενάριο, πρέπει να δημιουργήσετε μια ροή δεδομένων με τα παρακάτω βήματα:

  1. Προετοιμασία ροής δεδομένων: Αποκτήστε δεδομένα αρχείων parquet 2 GB από τον λογαριασμό αποθήκευσης ADLS Gen2.
  2. Ρύθμιση παραμέτρων Power Query:
    1. Μεταβείτε στο Power Query.
    2. Βεβαιωθείτε ότι η επιλογή προετοιμασίας του ερωτήματος είναι ενεργοποιημένη.
    3. Συνεχίστε για να συνδυάσετε τα αρχεία Parquet.
  3. Μετασχηματισμός δεδομένων:
    1. Προβιβάστε κεφαλίδες για λόγους σαφήνειας.
    2. Καταργήστε περιττές στήλες.
    3. Προσαρμόστε τους τύπους δεδομένων στήλης, ανάλογα με τις ανάγκες.
  4. Ορισμός προορισμού δεδομένων εξόδου:
    1. Ρυθμίστε τις παραμέτρους του Lakehouse ως προορισμού εξόδου δεδομένων.
    2. Σε αυτό το παράδειγμα, δημιουργήθηκε και χρησιμοποιήθηκε ένα Lakehouse μέσα στο Fabric.

Εκτίμηση κόστους με χρήση της εφαρμογής Fabric Metrics

Screenshot showing the duration and CU consumption of the job in the Fabric Metrics App.

Screenshot showing details of Dataflow Gen2 Refresh duration and CU consumption.

Screenshot showing details of SQL Endpoint Query duration and CU consumption used in the run.

Screenshot showing details of Warehouse Query and OneLake Compute duration and CU consumption used in the run.

Screenshot showing details of Query and Dataset On-Demand Refresh duration and CU consumption and SQL Endpoint Query used in the run.

Screenshot showing details of a second Query and Dataset On-Demand Refresh duration and CU consumption used in the run.

Screenshot showing details of OneLake Compute and 2 High Scale Dataflow Compute duration and CU consumption used in the run.

Ο μετρητής υπολογιστικής ροής δεδομένων υψηλής κλίμακας κατέγραψε αμελητέα δραστηριότητα. Ο τυπικός μετρητής υπολογιστικής λειτουργίας για λειτουργίες ανανέωσης Dataflow Gen2 καταναλώνει 112.098,540 μονάδες υπολογιστικής λειτουργίας (CUs). Είναι σημαντικό να λάβετε υπόψη ότι άλλες λειτουργίες, όπως το Ερώτημα αποθήκης, το Ερώτημα τελικού σημείου SQL και η Ανανέωση συνόλου δεδομένων κατ' απαίτηση, αποτελούν λεπτομερείς πτυχές της υλοποίησης Dataflow Gen2, οι οποίες είναι προς το παρόν διαφανείς και απαραίτητες για τις αντίστοιχες λειτουργίες τους. Ωστόσο, αυτές οι λειτουργίες θα αποκρύπτονται σε μελλοντικές ενημερώσεις και θα πρέπει να μην λαμβάνονται υπόψη κατά την εκτίμηση του κόστους για το Dataflow Gen2.

Σημείωμα

Παρόλο που αναφέρεται ως μετρικό, η πραγματική διάρκεια της εκτέλεσης δεν είναι σχετική κατά τον υπολογισμό των αποτελεσματικών ωρών CU με την εφαρμογή μετρικών Fabric από το μετρικό των δευτερολέπτων CU, αναφέρει επίσης ήδη τη διάρκειά της.

Metric Τυπική υπολογιστική λειτουργία Υπολογιστική υψηλής κλίμακας
Σύνολο CU δευτερολέπτων 112.098,54 CU δευτερόλεπτα 0 CU δευτερόλεπτα
Ισχύει CU-ώρες χρέωσης 112.098,54 / (60*60) = 31,14 ώρες CU 0 / (60*60) = 0 CU ώρες

Συνολικό κόστος εκτέλεσης σε $0.18/CU ώρα = (31.14 CU-hours) * ($0.18/CU ώρα) ~= $5.60