Aracılığıyla paylaş


Power Query Düzenleyicisi'de Python kullanma

İstatistikçiler, veri bilimcileri ve veri analistleri tarafından yaygın olarak kullanılan bir programlama dili olan Python'ı Power BI Desktop Power Query Düzenleyicisi kullanabilirsiniz. Python'ın Power Query Düzenleyicisi ile tümleştirilmesi, Python kullanarak veri temizleme gerçekleştirmenize ve veri kümelerinde eksik verilerin tamamlanması, tahminler ve kümeleme gibi gelişmiş veri şekillendirme ve analiz işlemleri gerçekleştirmenize olanak tanır. Python güçlü bir dildir ve veri modelinizi hazırlamak ve rapor oluşturmak için Power Query Düzenleyicisi kullanılabilir.

Önkoşullar

Başlamadan önce Python ve pandas'ı yüklemeniz gerekir.

  • Python'ı yükleme - Python'ı Power BI Desktop'ın Power Query Düzenleyicisi kullanmak için yerel makinenize Python yüklemeniz gerekir. Python'ı Resmi Python indirme sayfası ve Anaconda dahil olmak üzere birçok konumdan ücretsiz olarak indirip yükleyebilirsiniz.

  • Pandas'ı yükleme - Python'ı Power Query Düzenleyicisi kullanmak için pandas'ı da yüklemeniz gerekir. Pandas, Power BI ile Python ortamı arasında veri taşımak için kullanılır.

Python'Power Query Düzenleyicisi kullanma

Python'ın Power Query Düzenleyicisi'da nasıl kullanılacağını göstermek için bu örneği, buradan indirebileceğiniz ve takip edebileceğiniz bir CSV dosyasını temel alan bir borsa veri kümesinden alın. Bu örneğin adımları aşağıdaki yordamdır:

  1. İlk olarak, verilerinizi Power BI Desktop'a yükleyin. Bu örnekte, EuStockMarkets_NA.csv dosyasını yükleyin ve Power BI Desktop'taki Giriş şeridinden Veri>Al Metin/CSV'yi seçin.

    Screenshot of the Get Data ribbon in Power BI Desktop, showing the CSV selection.

  2. Dosyayı seçip Aç'ı seçtiğinizde CSV dosyası iletişim kutusunda CSV görüntülenir.

    Screenshot of the CSV file dialog, showing the selected CSV.

  3. Veriler yüklendikten sonra Power BI Desktop'taki Alanlar bölmesinde görürsünüz.

    Screenshot of the Fields pane, showing the loaded data.

  4. Power BI Desktop'ta Giriş sekmesinden Verileri dönüştür'ü seçerek Power Query Düzenleyicisi açın.

    Screenshot of the Power Query Editor in Power BI Desktop, showing the Transform data selection.

  5. Dönüştür sekmesinde Python Betiğini Çalıştır'ı seçin ve sonraki adımda gösterildiği gibi Python Betiğini Çalıştır düzenleyicisi görüntülenir. 15 ve 20. satırlar, aşağıdaki görüntüde göremeyeceğiniz diğer satırlarda olduğu gibi eksik verilerden muzdarip. Aşağıdaki adımlarda Python'ın bu satırları sizin için nasıl tamamlayacağı gösterilmektedir.

    Screenshot of the Transform tab, showing rows of data.

  6. Bu örnek için aşağıdaki betik kodunu girin:

    import pandas as pd
    completedData = dataset.fillna(method='backfill', inplace=False)
    dataset["completedValues"] =  completedData["SMI missing values"]
    

    Dekont

    Önceki betik kodunun düzgün çalışması için Python ortamınızda pandas kitaplığının yüklü olması gerekir. Pandas'ı yüklemek için Python yüklemenizde aşağıdaki komutu çalıştırın: pip install pandas

    Python Betiğini Çalıştır iletişim kutusuna yerleştirildiğinde kod aşağıdaki örneğe benzer:

    Screenshot of the Run Python Script dialog, showing the script code.

  7. Tamam'ı seçtikten sonra Power Query Düzenleyicisi veri gizliliğiyle ilgili bir uyarı görüntüler.

    Screenshot of the Power Query Editor pane, showing the warning about data privacy.

  8. Python betiklerinin Power BI hizmeti düzgün çalışması için tüm veri kaynaklarının genel olarak ayarlanması gerekir. Gizlilik ayarları ve bunların etkileri hakkında daha fazla bilgi için bkz . Gizlilik Düzeyleri.

    Screenshot of the Privacy levels dialog, showing that Public is set.

    Alanlar bölmesinde completedValues adlı yeni bir sütuna dikkat edin. Satır 15 ve 18 gibi birkaç eksik veri öğesi olduğuna dikkat edin. Sonraki bölümde Python'ın bunu nasıl işlediğine göz atın.

Yalnızca üç python betiği satırıyla Power Query Düzenleyicisi eksik değerleri tahmine dayalı bir modelle doldurdu.

Python betik verilerinden görsel oluşturma

Artık aşağıdaki görüntüde gösterildiği gibi pandas kitaplığını kullanan Python betik kodunun eksik değerleri nasıl tamamladiğini görmek için bir görsel oluşturabiliriz:

Screenshot of the visual, showing original data and completed missing values of the pandas library.

Bu görsel ve Power BI Desktop kullanarak oluşturmak isteyebileceğiniz diğer tüm görseller tamamlandıktan sonra Power BI Desktop dosyasını kaydedebilirsiniz. Power BI Desktop dosyaları .pbix dosya adı uzantısıyla kaydedilir. Ardından Power BI hizmeti içindeki Python betikleri de dahil olmak üzere veri modelini kullanın.

Dekont

Bu adımların tamamlandığı tamamlanmış bir .pbix dosyası görmek ister misiniz? Şansın yaver gitmedi. Bu örneklerde kullanılan tamamlanmış Power BI Desktop dosyasını buradan indirebilirsiniz.

.pbix dosyasını Power BI hizmeti yükledikten sonra, hizmette verilerin yenilenmesini ve hizmette görsellerin güncelleştirilebilmesini sağlamak için birkaç adım daha gerekir. Görsellerin güncelleştirilmesi için verilerin Python'a erişmesi gerekir. Diğer adımlar aşağıdaki adımlardır:

  • Veri kümesi için zamanlanmış yenilemeyi etkinleştirin. Python betikleri içeren veri kümenizi içeren çalışma kitabı için zamanlanmış yenilemeyi etkinleştirmek için bkz. Personal Gateway hakkındaki bilgileri de içeren zamanlanmış yenilemeyi yapılandırma.
  • Kişisel Ağ Geçidi'ni yükleyin. Dosyanın bulunduğu makinede ve Python'ın yüklü olduğu makinede bir Kişisel Ağ Geçidi yüklü olmalıdır. Power BI hizmeti bu çalışma kitabına erişmeli ve güncelleştirilmiş görselleri yeniden işlemelidir. Daha fazla bilgi için bkz . Personal Gateway'i yükleme ve yapılandırma.

Dikkat edilecekler ve sınırlamalar

Power Query Düzenleyicisi'de oluşturulan Python betiklerini içeren sorgularda bazı sınırlamalar vardır:

  • Tüm Python veri kaynağı ayarları Genel olarak ayarlanmalıdır ve Power Query Düzenleyicisi oluşturulan bir sorgudaki diğer tüm adımlar da genel olmalıdır. Veri kaynağı ayarlarına ulaşmak için Power BI Desktop'ta Dosya > Seçenekleri ve ayarları > Veri kaynağı ayarları'nı seçin.

    Screenshot of the File menu in Power BI Desktop, showing the Data source settings selection.

    Veri Kaynağı Ayarlar iletişim kutusunda veri kaynaklarını seçin ve ardından İzinleri Düzenle... öğesini seçin ve Gizlilik Düzeyi'nin Genel olarak ayarlandığından emin olun.

    Screenshot of the Data source settings dialog, showing the Privacy Level is set to Public.

  • Python görsellerinizin veya veri kümenizin zamanlanmış yenilemesini etkinleştirmek için Zamanlanmış yenilemeyi etkinleştirmeniz ve çalışma kitabını ve Python yüklemesini barındıran bilgisayarda bir Kişisel Ağ Geçidi'nin yüklü olması gerekir. Her ikisi hakkında daha fazla bilgi için bu makalenin her bir hakkında daha fazla bilgi edinmek için bağlantılar sağlayan önceki bölümüne bakın.

  • Tablo tablosu olan iç içe tablolar şu anda desteklenmiyor.

Python ve özel sorgularla yapabileceğiniz her türlü şey vardır, bu nedenle verilerinizi tam olarak görünmesini istediğiniz şekilde keşfedin ve şekillendirin.