Bagikan melalui


Menggunakan Python di Editor Power Query

Anda dapat menggunakan Python, bahasa pemrograman yang banyak digunakan oleh ahli statistik, ilmuwan data, dan analis data, di Power BI Desktop Power Query Editor. Integrasi Python ke Power Query Editor ini memungkinkan Anda melakukan pembersihan data menggunakan Python, dan melakukan pembentukan dan analitik data tingkat lanjut dalam himpunan data, termasuk penyelesaian data, prediksi, dan pengklusteran yang hilang, hanya untuk beberapa nama. Python adalah bahasa yang kuat, dan dapat digunakan di Editor Power Query untuk menyiapkan model data Anda dan membuat laporan.

Prasyarat

Anda harus menginstal Python dan panda sebelum memulai.

  • Instal Python - Untuk menggunakan Python di Power BI Desktop Power Query Editor, Anda perlu menginstal Python di komputer lokal Anda. Anda dapat mengunduh dan menginstal Python secara gratis dari banyak lokasi, termasuk halaman unduhan Python Resmi, dan Anaconda.

  • Instal panda - Untuk menggunakan Python dengan Power Query Editor, Anda juga perlu menginstal panda. Panda digunakan untuk memindahkan data antara Power BI dan lingkungan Python.

Menggunakan Python dengan Editor Power Query

Untuk memperlihatkan cara menggunakan Python di Editor Power Query, ambil contoh ini dari himpunan data pasar saham, berdasarkan file CSV yang bisa Anda unduh dari sini dan ikuti. Langkah-langkah untuk contoh ini adalah prosedur berikut:

  1. Pertama, muat data Anda ke Power BI Desktop. Dalam contoh ini, muat file EuStockMarkets_NA.csv dan pilih Dapatkan data>Teks/CSV dari pita Beranda di Power BI Desktop.

    Cuplikan layar pita Dapatkan Data di Power BI Desktop, memperlihatkan pilihan CSV.

  2. Pilih file dan pilih Buka, dan CSV ditampilkan dalam dialog file CSV .

    Cuplikan layar dialog file CSV, memperlihatkan CSV yang dipilih.

  3. Setelah data dimuat, Anda melihatnya di panel Bidang di Power BI Desktop.

    Cuplikan layar panel Bidang, memperlihatkan data yang dimuat.

  4. Buka Editor Power Query dengan memilih Transformasi data dari tab Beranda di Power BI Desktop.

    Cuplikan layar Editor Power Query di Power BI Desktop, memperlihatkan pilihan Transformasi data.

  5. Di tab Transformasi , pilih Jalankan Skrip Python dan editor Jalankan Skrip Python muncul seperti yang ditunjukkan pada langkah berikutnya. Baris 15 dan 20 menderita data yang hilang, seperti halnya baris lain yang tidak dapat Anda lihat dalam gambar berikut. Langkah-langkah berikut menunjukkan bagaimana Python menyelesaikan baris tersebut untuk Anda.

    Cuplikan layar tab Transformasi, memperlihatkan baris data.

  6. Untuk contoh ini, masukkan kode skrip berikut:

    import pandas as pd
    completedData = dataset.fillna(method='backfill', inplace=False)
    dataset["completedValues"] =  completedData["SMI missing values"]
    

    Nota

    Anda harus menginstal pustaka panda di lingkungan Python Anda agar kode skrip sebelumnya berfungsi dengan baik. Untuk menginstal panda, jalankan perintah berikut di penginstalan Python Anda: pip install pandas

    Saat dimasukkan ke dalam dialog Jalankan Skrip Python , kode terlihat seperti contoh berikut:

    Cuplikan layar dialog Jalankan Skrip Python, memperlihatkan kode skrip.

  7. Setelah Anda memilih OK, Editor Power Query menampilkan peringatan tentang privasi data.

    Cuplikan layar panel Editor Power Query, memperlihatkan peringatan tentang privasi data.

  8. Agar skrip Python berfungsi dengan baik di layanan Power BI, semua sumber data perlu diatur ke publik. Untuk informasi selengkapnya tentang pengaturan privasi dan implikasinya, lihat Tingkat Privasi.

    Cuplikan layar dialog tingkat privasi, memperlihatkan bahwa Publik disetel.

    Perhatikan kolom baru di panel Fields bernama completedValues. Perhatikan ada beberapa elemen data yang hilang, seperti pada baris 15 dan 18. Lihat bagaimana Python menanganinya di bagian berikutnya.

Hanya dengan tiga baris skrip Python, Editor Power Query mengisi nilai yang hilang dengan model prediktif.

Membuat visual dari data skrip Python

Sekarang kita dapat membuat visual untuk melihat bagaimana kode skrip Python menggunakan pustaka panda menyelesaikan nilai yang hilang, seperti yang ditunjukkan pada gambar berikut:

Cuplikan layar visual, memperlihatkan data asli dan nilai yang hilang yang telah dilengkapi di pustaka pandas.

Setelah visual selesai, dan visual lain yang mungkin ingin Anda buat menggunakan Power BI Desktop, Anda bisa menyimpan file Power BI Desktop . File Power BI Desktop disimpan dengan ekstensi nama file .pbix . Kemudian gunakan model data, termasuk skrip Python yang merupakan bagian darinya, di layanan Power BI.

Nota

Ingin melihat file .pbix yang telah diselesaikan dengan langkah-langkah ini? Kau beruntung. Anda dapat mengunduh file Power BI Desktop yang telah selesai yang digunakan dalam contoh ini di sini.

Setelah Anda mengunggah file .pbix ke layanan Power BI, beberapa langkah lagi diperlukan untuk mengaktifkan data untuk di-refresh dalam layanan dan untuk memungkinkan visual diperbarui dalam layanan. Data memerlukan akses ke Python agar visual diperbarui. Langkah-langkah lainnya adalah langkah-langkah berikut:

  • Aktifkan refresh terjadwal untuk himpunan data. Untuk mengaktifkan refresh terjadwal untuk buku kerja yang berisi himpunan data Anda dengan skrip Python, lihat Mengonfigurasi refresh terjadwal, yang juga menyertakan informasi tentang Gateway Pribadi.
  • Instal Gateway Pribadi. Anda memerlukan Gateway Pribadi yang diinstal pada komputer tempat file berada, dan tempat Python diinstal. Layanan Power BI harus mengakses buku kerja tersebut dan merender ulang visual yang diperbarui. Untuk informasi selengkapnya, lihat menginstal dan mengonfigurasi Gateway Pribadi.

Pertimbangan dan keterbatasan

Ada beberapa batasan untuk kueri yang menyertakan skrip Python yang dibuat di Editor Power Query:

  • Semua pengaturan sumber data Python harus diatur ke Publik, dan semua langkah lain dalam kueri yang dibuat di Editor Power Query juga harus publik. Untuk masuk ke pengaturan sumber data, di Power BI Desktop pilih Opsi File > dan pengaturan > Pengaturan sumber data.

    Cuplikan layar menu File di Power BI Desktop, memperlihatkan pilihan Pengaturan sumber data.

    Dari dialog Pengaturan Sumber Data , pilih sumber data lalu pilih Edit Izin... dan pastikan Bahwa Tingkat Privasi diatur ke Publik.

    Cuplikan layar dialog Pengaturan sumber data, memperlihatkan Tingkat Privasi diatur ke Publik.

  • Untuk mengaktifkan refresh terjadwal visual atau himpunan data Python, Anda perlu mengaktifkan Refresh terjadwal dan menginstal Gateway Pribadi di komputer yang menampung buku kerja dan penginstalan Python. Untuk informasi selengkapnya tentang keduanya, lihat bagian sebelumnya di artikel ini, yang menyediakan tautan untuk mempelajari selengkapnya tentang masing-masing.

  • Tabel berlapis, yang merupakan tabel yang terdiri dari tabel, saat ini tidak didukung.

Ada semua hal yang dapat Anda lakukan dengan Python dan kueri kustom, jadi jelajahi dan bentuk data Anda seperti yang Anda inginkan untuk muncul.