Bagikan melalui


Menggunakan Python di Editor Power Query

Anda dapat menggunakan Python, bahasa pemrograman yang banyak digunakan oleh ahli statistik, ilmuwan data, dan analis data, dalam Editor Power Query Power BI Desktop. Integrasi Python ini ke dalam Editor Power Query memungkinkan Anda melakukan pembersihan data menggunakan Python serta melakukan pembentukan dan analitik data lanjutan dalam himpunan data, termasuk penyelesaian data yang hilang, prediksi, serta pengklusteran, dan banyak lagi. Python adalah bahasa yang kuat, dan dapat digunakan dalam Editor Power Query untuk menyiapkan model data Anda dan membuat laporan.

Prasyarat

Anda harus menginstal Python dan panda sebelum memulai.

  • Instal Python - Untuk menggunakan Python di Editor Power Query Power BI Desktop, Anda perlu menginstal Python di komputer lokal Anda. Anda dapat mengunduh dan menginstal Python secara gratis dari banyak lokasi, termasuk halaman unduhan Python Resmi, dan Anaconda.

  • Pasang panda - Untuk menggunakan Python dengan Editor Power Query, Anda juga perlu menginstal panda. Panda digunakan untuk memindahkan data antara Power BI dan lingkungan Python.

Menggunakan Python dengan Editor Power Query

Untuk menunjukkan cara menggunakan Python di Editor Power Query, ambil contoh ini dari himpunan data pasar saham, berdasarkan file CSV yang dapat Anda unduh dari sini dan ikuti. Langkah-langkah untuk contoh ini adalah prosedur berikut:

  1. Pertama, muat data Anda ke dalam Power BI Desktop. Dalam contoh ini, muat file EuStockMarkets_NA.csv dan pilih Dapatkan Teks/CSV data>dari pita Beranda di Power BI Desktop.

    Screenshot of the Get Data ribbon in Power BI Desktop, showing the CSV selection.

  2. Pilih file dan pilih Open (Buka), dan CSV akan ditampilkan dalam dialog file CSV.

    Screenshot of the CSV file dialog, showing the selected CSV.

  3. Setelah data dimuat, Anda melihatnya di panel Bidang di Power BI Desktop.

    Screenshot of the Fields pane, showing the loaded data.

  4. Buka Editor Power Query dengan memilih Transform data (Ubah data) dari tab Home (Beranda) di Power BI Desktop.

    Screenshot of the Power Query Editor in Power BI Desktop, showing the Transform data selection.

  5. Di tab Transformasi , pilih Jalankan Skrip Python dan editor Jalankan Skrip Python muncul seperti yang ditunjukkan pada langkah berikutnya. Baris 15 dan 20 menderita data yang hilang, seperti halnya baris lain yang tidak dapat Anda lihat dalam gambar berikut. Langkah-langkah berikut menunjukkan bagaimana Python menyelesaikan baris tersebut untuk Anda.

    Screenshot of the Transform tab, showing rows of data.

  6. Untuk contoh ini, masukkan kode skrip berikut:

    import pandas as pd
    completedData = dataset.fillna(method='backfill', inplace=False)
    dataset["completedValues"] =  completedData["SMI missing values"]
    

    Catatan

    Anda harus menginstal pustaka panda di lingkungan Python Anda agar kode skrip sebelumnya berfungsi dengan baik. Untuk menginstal panda, jalankan perintah berikut di penginstalan Python Anda: pip install pandas

    Saat dimasukkan ke dalam dialog Jalankan Skrip Python, kode terlihat seperti contoh berikut:

    Screenshot of the Run Python Script dialog, showing the script code.

  7. Setelah Anda memilih OK, Editor Power Query menampilkan peringatan tentang privasi data.

    Screenshot of the Power Query Editor pane, showing the warning about data privacy.

  8. Agar skrip Python berfungsi dengan baik di layanan Power BI, semua sumber data perlu diatur ke public (publik). Untuk informasi selengkapnya tentang pengaturan privasi dan implikasinya, lihat Tingkat Privasi.

    Screenshot of the Privacy levels dialog, showing that Public is set.

    Perhatikan kolom baru di panel Fields (Bidang) yang disebut completedValues. Perhatikan ada beberapa elemen data yang hilang, seperti pada baris 15 dan 18. Lihat bagaimana Python menanganinya di bagian berikutnya.

Hanya dengan tiga baris skrip Python, Editor Power Query mengisi nilai yang hilang dengan model prediktif.

Membuat visual dari data skrip Python

Sekarang kita dapat membuat visual untuk melihat bagaimana kode skrip Python menggunakan pustaka panda menyelesaikan nilai yang hilang, seperti yang ditunjukkan pada gambar berikut:

Screenshot of the visual, showing original data and completed missing values of the pandas library.

Setelah visual selesai, dan visual lain yang mungkin ingin Anda buat menggunakan Power BI Desktop, Anda bisa menyimpan file Power BI Desktop . File Power BI Desktop disimpan dengan ekstensi nama file .pbix . Kemudian gunakan model data, termasuk skrip Python yang merupakan bagian darinya, di layanan Power BI.

Catatan

Ingin melihat file .pbix yang telah selesai dengan menyelesaikan langkah-langkah ini? Anda beruntung. Anda dapat mengunduh file Power BI Desktop yang telah selesai yang digunakan dalam contoh ini di sini.

Setelah Anda mengunggah file .pbix ke layanan Power BI, beberapa langkah lagi diperlukan untuk mengaktifkan data untuk di-refresh dalam layanan dan untuk memungkinkan visual diperbarui dalam layanan. Data memerlukan akses ke Python agar visual diperbarui. Langkah-langkah lainnya adalah langkah-langkah berikut:

  • Aktifkan refresh terjadwal untuk himpunan data. Untuk mengaktifkan refresh terjadwal untuk buku kerja yang berisi himpunan data Anda dengan skrip Python, lihat Mengonfigurasi refresh terjadwal, yang juga menyertakan informasi tentang Gateway Pribadi.
  • Instal Gateway Pribadi. Anda memerlukan Gateway Pribadi yang diinstal pada komputer tempat file berada, dan tempat Python diinstal. layanan Power BI harus mengakses buku kerja tersebut dan merender ulang visual yang diperbarui. Untuk informasi selengkapnya, lihat menginstal dan mengonfigurasi Gateway Pribadi.

Pertimbangan dan batasan

Ada beberapa batasan untuk kueri yang menyertakan skrip Python yang dibuat dalam Editor Power Query:

  • Semua pengaturan sumber data Python harus diatur ke Public (Publik), dan semua langkah lain dalam kueri yang dibuat di Editor Power Query juga harus publik. Untuk masuk ke pengaturan sumber data, di Power BI Desktop, pilih Opsi File > dan pengaturan >Data source settings (Pengaturan sumber data).

    Screenshot of the File menu in Power BI Desktop, showing the Data source settings selection.

    Dari dialog sumber data Pengaturan, pilih sumber data lalu pilih Edit Izin... dan pastikan bahwa Tingkat Privasi diatur ke Publik.

    Screenshot of the Data source settings dialog, showing the Privacy Level is set to Public.

  • Untuk mengaktifkan refresh terjadwal visual atau himpunan data Python, Anda perlu mengaktifkan Refresh terjadwal dan menginstal Gateway Pribadi di komputer yang menampung buku kerja dan penginstalan Python. Untuk informasi selengkapnya, lihat bagian sebelumnya di artikel ini, yang menyediakan tautan untuk mempelajari selengkapnya.

  • Tabel berlapis, yang merupakan tabel tabel, saat ini tidak didukung.

Ada berbagai hal yang dapat Anda lakukan dengan Python dan kueri kustom, jadi jelajahi dan bentuk data seperti yang ingin Anda munculkan.