Fitur premium aliran data

Aliran data didukung untuk pengguna Power BI Pro, Premium Per Pengguna (PPU), dan Power BI Premium. Beberapa fitur hanya tersedia dengan langganan Power BI Premium (yang merupakan kapasitas Premium atau lisensi PPU). Artikel ini menjelaskan dan merinci fitur khusus PPU dan Premium serta penggunaannya.

Fitur berikut hanya tersedia dengan Power BI Premium (PPU atau langganan kapasitas Premium):

  • Mesin komputasi yang disempurnakan
  • DirectQuery
  • Entitas terkomputasi
  • Entitas tertaut
  • Refresh bertahap

Bagian berikut menjelaskan masing-masing fitur ini secara rinci.

Penting

Artikel ini berlaku untuk generasi pertama aliran data (Gen1), dan tidak berlaku untuk generasi kedua (Gen2) aliran data, yang tersedia di Microsoft Fabric (pratinjau). Untuk informasi selengkapnya, lihat Mendapatkan dari aliran data Generasi 1 ke aliran data Generasi 2.

Mesin komputasi yang ditingkatkan

Mesin komputasi yang ditingkatkan di Power BI memungkinkan pelanggan Power BI Premium menggunakan kapasitasnya untuk mengoptimalkan penggunaan aliran data. Menggunakan mesin komputasi yang ditingkatkan memberikan keuntungan berikut:

  • Secara drastis mengurangi waktu refresh yang diperlukan untuk langkah-langkah ETL yang berjalan lama (ekstrak, transformasi, muat) atas entitas komputasi, seperti melakukan gabungan, berbeda, filter, dan mengelompokkan menurut.
  • Melakukan kueri DirectQuery melalui entitas.

Catatan

  • Proses validasi dan refresh menginformasikan aliran data skema model. Untuk mengatur skema tabel sendiri, gunakan Editor Power Query dan atur jenis data.
  • Fitur ini tersedia di semua kluster Power BI kecuali WABI-INDIA-CENTRAL-A-PRIMARY

Mengaktifkan mesin komputasi yang ditingkatkan

Penting

Mesin komputasi yang ditingkatkan hanya berfungsi untuk kapasitas Power BI A3 atau lebih besar.

Di Power BI Premium, mesin komputasi yang ditingkatkan diatur secara individual untuk setiap aliran data. Ada tiga konfigurasi yang dapat dipilih:

  • Nonaktif

  • Dioptimalkan (default) - Mesin komputasi yang ditingkatkan dimatikan. Ini secara otomatis diaktifkan ketika tabel dalam aliran data dirujuk oleh tabel lain atau ketika aliran data tersambung ke aliran data lain di ruang kerja yang sama.

  • On

Untuk mengubah pengaturan default dan mengaktifkan mesin komputasi yang ditingkatkan, lakukan langkah-langkah berikut:

  1. Di ruang kerja Anda, di samping aliran data yang ingin Anda ubah pengaturannya, pilih Opsi lainnya.

  2. Dari menu Opsi lainnya aliran data, pilih Pengaturan.

    Screenshot of a dataflows more options menu with the settings setting highlighted.

  3. Perluas pengaturan mesin komputasi yang ditingkatkan.

    Screenshot of a dataflow settings page with the enhanced compute engine settings setting highlighted.

  4. Di pengaturan Mesin komputasi yang ditingkatkan, pilih Aktif lalu pilih Terapkan.

    Screenshot of the enhanced compute engine settings with the on selection turned on and the apply button highlighted.

Menggunakan mesin komputasi yang ditingkatkan

Setelah mesin komputasi yang ditingkatkan aktif, kembali ke aliran data dan Anda akan melihat peningkatan performa dalam tabel komputasi apa pun yang melakukan operasi kompleks, seperti gabungan atau kelompokkan menurut operasi untuk aliran data yang dibuat dari entitas tertaut yang ada pada kapasitas yang sama.

Untuk memanfaatkan mesin komputasi dengan sebaik-baiknya, bagi tahap ETL menjadi dua aliran data terpisah, dengan cara berikut:

  • Aliran data 1 - aliran data ini seharusnya hanya menyerap semua yang diperlukan dari sumber data.
  • Aliran data 2 - lakukan semua operasi ETL dalam aliran data kedua ini, tetapi pastikan Anda mereferensikan Aliran Data 1, yang seharusnya berada pada kapasitas yang sama. Pastikan juga Anda melakukan operasi yang dapat melipat terlebih dahulu: filter, kelompokkan menurut, berbeda, bergabung). Dan lakukan operasi ini sebelum operasi lain, untuk memastikan mesin komputasi digunakan.

Pertanyaan dan jawaban umum

Pertanyaan: Saya telah mengaktifkan mesin komputasi yang ditingkatkan, tetapi refresh saya lebih lambat. Mengapa?

Jawaban: Jika Anda mengaktifkan mesin komputasi yang ditingkatkan, ada dua kemungkinan penjelasan yang dapat menyebabkan waktu refresh yang lebih lambat:

  • Ketika mesin komputasi yang ditingkatkan diaktifkan, dibutuhkan beberapa memori untuk berfungsi dengan baik. Dengan demikian, memori yang tersedia untuk melakukan refresh berkurang dan oleh karena itu meningkatkan kemungkinan refresh untuk diantrekan. Peningkatan tersebut kemudian mengurangi jumlah aliran data yang dapat di-refresh secara bersamaan. Untuk mengatasi masalah ini, saat mengaktifkan komputasi yang ditingkatkan, tingkatkan memori yang ditetapkan untuk aliran data untuk memastikan bahwa memori yang tersedia untuk refresh aliran data bersamaan tetap sama.

  • Alasan lain Anda mungkin mengalami refresh yang lebih lambat adalah bahwa mesin komputasi hanya berfungsi di atas entitas yang ada. Jika aliran data Anda mereferensikan sumber data yang bukan aliran data, Anda tidak akan melihat peningkatan. Tidak akan ada peningkatan performa, karena dalam beberapa skenario big data, bacaan awal dari sumber data akan lebih lambat karena data perlu diteruskan ke mesin komputasi yang ditingkatkan.

Pertanyaan: Saya tidak dapat melihat tombol mesin komputasi yang ditingkatkan. Mengapa?

Jawaban: Mesin komputasi yang ditingkatkan sedang dirilis secara bertahap ke wilayah di seluruh dunia, tetapi belum tersedia di setiap wilayah.

Pertanyaan: Apa saja jenis data yang didukung untuk mesin komputasi?

Jawaban: Mesin komputasi dan aliran data yang ditingkatkan saat ini mendukung jenis data berikut. Jika aliran data Anda tidak menggunakan salah satu jenis data berikut, kesalahan terjadi selama refresh:

  • Tanggal/Waktu
  • Bilangan desimal
  • Teks
  • Bilangan bulat
  • Tanggal/waktu/zona
  • Benar/salah
  • Tanggal
  • Waktu

Menggunakan DirectQuery dengan aliran data di Power BI

Anda dapat menggunakan DirectQuery untuk terhubung langsung ke aliran data, dan dengan demikian terhubung langsung ke aliran data Anda tanpa harus mengimpor datanya.

Menggunakan DirectQuery dengan aliran data memungkinkan penyempurnaan berikut ke proses Power BI dan aliran data Anda:

  • Hindari jadwal refresh terpisah - DirectQuery terhubung langsung ke aliran data, menghapus kebutuhan untuk membuat model semantik yang diimpor. Dengan demikian, menggunakan DirectQuery dengan aliran data Anda berarti Anda tidak lagi memerlukan jadwal refresh terpisah untuk aliran data dan model semantik untuk memastikan data Anda disinkronkan.

  • Memfilter data - DirectQuery berguna untuk mengerjakan tampilan data yang difilter di dalam aliran data. Anda dapat menggunakan DirectQuery dengan mesin komputasi untuk memfilter data aliran data dan bekerja dengan subset yang difilter yang Anda butuhkan. Memfilter data memungkinkan Anda bekerja dengan subset data yang lebih kecil dan lebih mudah dikelola di aliran data Anda.

Menggunakan DirectQuery untuk aliran data

Menggunakan DirectQuery dengan aliran data tersedia di Power BI Desktop.

Ada prasyarat untuk menggunakan DirectQuery dengan aliran data:

  • Aliran data Anda harus berada dalam ruang kerja yang diaktifkan Power BI Premium.
  • Mesin komputasi harus dinyalakan.

Untuk mempelajari selengkapnya tentang DirectQuery dengan aliran data, lihat Menggunakan DirectQuery dengan aliran data.

Mengaktifkan DirectQuery untuk aliran data

Untuk memastikan aliran data Anda tersedia untuk akses DirectQuery, mesin komputasi yang ditingkatkan harus dalam keadaan dioptimalkan. Untuk mengaktifkan DirectQuery untuk aliran data, atur opsi pengaturan mesin komputasi yang ditingkatkan baru ke Aktif.

Screenshot of the enhanced compute engine settings with the on option selected.

Setelah Anda menerapkan pengaturan tersebut, refresh aliran data agar pengoptimalan diterapkan.

Pertimbangan dan batasan untuk DirectQuery

Ada beberapa batasan yang diketahui dengan DirectQuery dan aliran data:

  • Model gabungan/campuran yang memiliki sumber data impor dan DirectQuery saat ini tidak didukung.

  • Aliran data besar mungkin mengalami masalah dengan masalah waktu habis saat melihat visualisasi. Aliran data besar yang mengalami masalah dengan masalah waktu habis harus menggunakan mode Impor.

  • Di bawah pengaturan sumber data, konektor aliran data akan menampilkan kredensial yang tidak valid jika Anda menggunakan DirectQuery. Peringatan ini tidak memengaruhi perilaku, dan model semantik akan berfungsi dengan baik.

Entitas terkomputasi

Anda dapat melakukan komputasi dalam penyimpanan saat menggunakan aliran data dengan langganan Power BI Premium. Fitur ini memungkinkan Anda melakukan penghitungan pada aliran data yang ada, dan mengembalikan hasil yang memungkinkan Anda untuk fokus pada pembuatan laporan dan analitik.

Screenshot of a Power Query Editor, highlighting a table that is being edited.

Untuk melakukan komputasi dalam penyimpanan, Anda harus terlebih dahulu membuat aliran data dan membawa data ke penyimpanan aliran data Power BI tersebut. Setelah Anda memiliki aliran data yang berisi data, Anda dapat membuat entitas komputasi, yang merupakan entitas yang melakukan komputasi dalam penyimpanan.

Pertimbangan dan batasan entitas komputasi

  • Saat Anda bekerja dengan aliran data yang dibuat di akun Azure Data Lake Storage Gen2 organisasi, entitas tertaut dan entitas yang dihitung hanya berfungsi dengan baik saat entitas berada di akun penyimpanan yang sama.

Sebagai praktik terbaik, saat melakukan komputasi pada data yang bergabung dengan data lokal dan cloud, buat aliran data baru untuk setiap sumber (satu untuk lokal dan satu untuk cloud) lalu buat aliran data ketiga untuk menggabungkan/menghitung dua sumber data ini.

Entitas tertaut

Anda dapat mereferensikan aliran data yang ada dengan menggunakan entitas tertaut dengan langganan Power BI Premium, yang memungkinkan Anda melakukan penghitungan pada entitas ini menggunakan entitas komputasi atau memungkinkan Anda membuat tabel "satu sumber kebenaran" yang dapat Anda gunakan kembali dalam beberapa aliran data.

Refresh bertahap

Aliran data dapat diatur untuk menyegarkan secara bertahap untuk menghindari harus menarik semua data pada setiap refresh. Untuk melakukannya, pilih aliran data lalu pilih ikon Refresh Bertahap.

Screenshot of the table in a Power BI dataflow with the Incremental Refresh icon highlighted.

Pengaturan refresh bertahap menambahkan parameter ke aliran data untuk menentukan rentang tanggal. Untuk informasi terperinci tentang cara menyiapkan refresh bertahap, lihatMenggunakan refresh bertahap dengan aliran data.

Pertimbangan kapan tidak mengatur refresh bertahap

Jangan atur aliran data ke refresh bertahap dalam situasi berikut:

  • Entitas tertaut tidak boleh menggunakan refresh bertahap jika mereferensikan aliran data.

Artikel berikut ini menyediakan informasi selengkapnya tentang aliran data dan Power BI: