Bagikan melalui


Skenario harga menggunakan Dataflow Gen2 untuk memuat 2 GB data CSV lokal ke tabel Lakehouse

Dalam skenario ini, Dataflow Gen2 digunakan untuk memuat 2 GB data CSV lokal ke tabel Lakehouse di Microsoft Fabric.

Harga yang digunakan dalam contoh berikut bersifat hipotetis dan tidak berniat untuk menyiratkan harga aktual yang tepat. Ini hanya untuk menunjukkan bagaimana Anda dapat memperkirakan, merencanakan, dan mengelola biaya untuk proyek Data Factory di Microsoft Fabric. Selain itu, karena kapasitas Fabric dihargai secara unik di seluruh wilayah, kami menggunakan harga bayar sesuai pemakaian untuk kapasitas Fabric di US Barat 2 (wilayah Azure biasa), sebesar $ 0,18 per CU per jam. Lihat di sini ke Microsoft Fabric - Harga untuk menjelajahi opsi harga kapasitas Fabric lainnya.

Konfigurasi

Untuk mencapai skenario ini, Anda perlu membuat aliran data dengan langkah-langkah berikut:

  1. Inisialisasi Aliran Data: Mulailah dengan mengunggah file CSV 2 GB dari lingkungan lokal Anda ke dalam aliran data.
  2. Mengonfigurasi Power Query:
    1. Navigasi ke Power Query.
    2. Nonaktifkan opsi untuk penahapan kueri.
    3. Lanjutkan untuk menggabungkan file CSV.
  3. Transformasi Data:
    1. Promosikan header untuk kejelasan.
    2. Hapus kolom yang tidak perlu.
    3. Sesuaikan jenis data kolom sesuai kebutuhan.
  4. Tentukan Tujuan Data Output:
    1. Konfigurasikan Lakehouse sebagai tujuan output data.
    2. Dalam contoh ini, Lakehouse dalam Fabric dibuat dan digunakan.

Estimasi biaya menggunakan Aplikasi Metrik Fabric

Screenshot showing the duration and CU consumption of the job in the Fabric Metrics App.

Screenshot showing details of the Dataflow Gen2 Refresh cost

Screenshot showing details of a Dataflow Gen2 High Scale Dataflow Compute consumption used in the run.

Screenshot showing details of a second Dataflow Gen2 High Scale Dataflow Compute consumption used in the run.

Operasi Refresh Aliran Data Gen2 mengonsumsi 4749,42 CU detik, dan dua operasi Komputasi Aliran Data Skala Tinggi menggunakan masing-masing 7,78 CU detik + 7,85 CU detik.

Catatan

Meskipun dilaporkan sebagai metrik, durasi aktual eksekusi tidak relevan saat menghitung jam CU yang efektif dengan Aplikasi Metrik Fabric sejak metrik detik CU, itu juga melaporkan durasinya.

Metric Konsumsi komputasi
Dataflow Gen2 Refresh CU detik 4749,42 CU detik
Detik CU Komputasi Aliran Data Skala Tinggi (7,78 + 7,85) 15,63 CU detik
Jam CU efektif ditagih (4749,42 + 15,63) / (60*60) = 1,32 jam CU

Total biaya eksekusi pada $0,18/JAM CU = (1,32 jam CU) * ($0,18/jam CU) ~= $0,24