Microsoft Fabric'te Pandas ile veri okuma ve yazma

Microsoft Fabric not defterleri, veri araştırma ve işleme için en popüler Python kitaplığı olan Pandas'ı kullanarak Lakehouse verileriyle sorunsuz etkileşimi destekler. Bir not defteri içinde kullanıcılar Lakehouse'larından çeşitli dosya biçimlerinde verileri hızlı bir şekilde okuyabilir ve geri yazabilir. Bu kılavuz, kendi not defterinize başlamanıza yardımcı olacak kod örnekleri sağlar.

Önemli

Microsoft Fabric şu anda ÖNİzLEME aşamasındadır. Bu bilgiler, yayımlanmadan önce önemli ölçüde değiştirilebilen bir yayın öncesi ürünle ilgilidir. Microsoft, burada sağlanan bilgilerle ilgili olarak açık veya zımni hiçbir garanti vermez.

Ön koşullar

  • Power BI Premium aboneliği. Aboneliğiniz yoksa bkz. Power BI Premium satın alma.

  • Premium kapasite atanmış bir Power BI çalışma alanı. Çalışma alanınız yoksa, çalışma alanı oluşturma bölümündeki adımları kullanarak bir çalışma alanı oluşturun ve bunu Premium kapasiteye atayın.

  • Microsoft Fabric'te oturum açın.

Lakehouse verilerini not defterine yükleme

Microsoft Fabric not defterinize bir Lakehouse ekledikten sonra, sayfadan çıkmadan depolanan verileri inceleyebilir ve tıklamalar halinde not defterinize okuyabilirsiniz. Herhangi bir Lakehouse dosyasının seçilmesi, bir Spark veya Pandas DataFrame'e "Veri yükleme" seçeneklerini gösterir. (Dosyanın tam ABFS yolunu veya kolay bir göreli yolu da kopyalayabilirsiniz.)

Pandas DataFrame'e veri yükleme seçeneklerinin nerede seçileceği gösteren ekran görüntüsü.

"Veri yükleme" istemlerinden birine tıklanması, bu dosyayı not defterinizdeki bir DataFrame'e yüklemek için bir kod hücresi oluşturur.

Not defterine eklenen kod hücresinin ekran görüntüsü.

Spark DataFrame'i Pandas DataFrame'e Dönüştürme

Başvuru için, aşağıdaki komut Spark DataFrame'in Pandas DataFrame'e nasıl dönüştürüldüğünü gösterir.

# Replace "spark_df" with the name of your own Spark DataFrame
pandas_df = spark_df.toPandas() 

Çeşitli dosya biçimlerini okuma ve yazma

Aşağıdaki kod örnekleri, çeşitli dosya biçimlerini okumak ve yazmak için Pandas işlemlerini belgelemektedir.

Not

Aşağıdaki örneklerde dosya yollarını değiştirmeniz gerekir. Pandas burada gösterildiği gibi hem göreli yolları hem de tam ABFS yollarını destekler. Önceki adıma göre arabirimden alınabilir ve kopyalanabilir.

CSV dosyasından veri okuma

import pandas as pd

# Read a CSV file from your Lakehouse into a Pandas DataFrame
# Replace LAKEHOUSE_PATH and FILENAME with your own values
df = pd.read_csv("/LAKEHOUSE_PATH/Files/FILENAME.csv")
display(df)

Verileri CSV dosyası olarak yazma

import pandas as pd 

# Write a Pandas DataFrame into a CSV file in your Lakehouse
# Replace LAKEHOUSE_PATH and FILENAME with your own values
df.to_csv("/LAKEHOUSE_PATH/Files/FILENAME.csv") 

Parquet dosyasından veri okuma

import pandas as pd 
 
# Read a Parquet file from your Lakehouse into a Pandas DataFrame
# Replace LAKEHOUSE_PATH and FILENAME with your own values
df = pandas.read_parquet("/LAKEHOUSE_PATH/Files/FILENAME.parquet") 
display(df)

Verileri Parquet dosyası olarak yazma

import pandas as pd 
 
# Write a Pandas DataFrame into a Parquet file in your Lakehouse
# Replace LAKEHOUSE_PATH and FILENAME with your own values
df.to_parquet("/LAKEHOUSE_PATH/Files/FILENAME.parquet") 

Excel dosyasından veri okuma

import pandas as pd 
 
# Read an Excel file from your Lakehouse into a Pandas DataFrame
# Replace LAKEHOUSE_PATH and FILENAME with your own values
df = pandas.read_excel("/LAKEHOUSE_PATH/Files/FILENAME.xlsx") 
display(df) 

Verileri Excel dosyası olarak yazma

import pandas as pd 

# Write a Pandas DataFrame into an Excel file in your Lakehouse
# Replace LAKEHOUSE_PATH and FILENAME with your own values
df.to_excel("/LAKEHOUSE_PATH/Files/FILENAME.xlsx") 

JSON dosyasından veri okuma

import pandas as pd 
 
# Read a JSON file from your Lakehouse into a Pandas DataFrame
# Replace LAKEHOUSE_PATH and FILENAME with your own values
df = pandas.read_json("/LAKEHOUSE_PATH/Files/FILENAME.json") 
display(df) 

Verileri JSON dosyası olarak yazma

import pandas as pd 
 
# Write a Pandas DataFrame into a JSON file in your Lakehouse
# Replace LAKEHOUSE_PATH and FILENAME with your own values
df.to_json("/LAKEHOUSE_PATH/Files/FILENAME.json") 

Sonraki adımlar