Microsoft Fabric'te Pandas ile veri okuma ve yazma

Microsoft Fabric not defterleri, veri araştırma ve işleme için en popüler Python kitaplığı olan Pandas'ı kullanarak Lakehouse verileriyle sorunsuz etkileşimi destekler. Bir not defteri içinde, Lakehouse kaynaklarından çeşitli dosya biçimlerindeki verileri hızla okuyabilir ve bu kaynaklara geri yazabilirsiniz. Bu kılavuz, kendi not defterinize başlamanıza yardımcı olacak kod örnekleri sağlar.

Önkoşullar

Lakehouse verilerini not defterine yükleme

Microsoft Fabric not defterinize bir Lakehouse ekledikten sonra, depolanan verileri sayfadan çıkmadan keşfedebilir ve birkaç adımda not defterinizde okuyabilirsiniz. Herhangi bir Lakehouse dosyasının seçilmesi, Spark veya Pandas DataFrame'e "Veri yükleme" seçeneklerini ortaya çıkar. Dosyanın tam ABFS yolunu veya kolay bir göreli yolu da kopyalayabilirsiniz.

Pandas DataFrame'e veri yükleme seçeneklerini gösteren ekran görüntüsü.

"Verileri yükle" istemlerinden birinin seçilmesi, bu dosyayı not defterinizdeki bir DataFrame'e yüklemek için bir kod hücresi oluşturur.

Not defterine eklenen kod hücresini gösteren ekran görüntüsü.

Spark DataFrame'i Pandas DataFrame'e dönüştürme

Başvuru için, bu komut Spark DataFrame'in Pandas DataFrame'e nasıl dönüştürüldüğünü gösterir:

# Replace "spark_df" with the name of your own Spark DataFrame
pandas_df = spark_df.toPandas() 

Çeşitli dosya biçimlerini okuma ve yazma

Bu kod örnekleri, çeşitli dosya biçimlerini okumak ve yazmak için Pandas işlemlerini açıklar.

Not

Bu kod örneklerindeki dosya yollarını değiştirmeniz gerekir. Pandas burada gösterildiği gibi hem göreli yolları hem de tam ABFS yollarını destekler. Her iki türdeki yollar önceki adıma göre arabirimden alınabilir ve kopyalanabilir.

CSV dosyasından veri okuma

import pandas as pd

# Read a CSV file from your Lakehouse into a Pandas DataFrame
# Replace LAKEHOUSE_PATH and FILENAME with your own values
df = pd.read_csv("/LAKEHOUSE_PATH/Files/FILENAME.csv")
display(df)

Verileri CSV dosyası olarak yazma

import pandas as pd 

# Write a Pandas DataFrame into a CSV file in your Lakehouse
# Replace LAKEHOUSE_PATH and FILENAME with your own values
df.to_csv("/LAKEHOUSE_PATH/Files/FILENAME.csv") 

Parquet dosyasından veri okuma

import pandas as pd 
 
# Read a Parquet file from your Lakehouse into a Pandas DataFrame
# Replace LAKEHOUSE_PATH and FILENAME with your own values
df = pandas.read_parquet("/LAKEHOUSE_PATH/Files/FILENAME.parquet") 
display(df)

Parquet dosyası olarak veri yazma

import pandas as pd 
 
# Write a Pandas DataFrame into a Parquet file in your Lakehouse
# Replace LAKEHOUSE_PATH and FILENAME with your own values
df.to_parquet("/LAKEHOUSE_PATH/Files/FILENAME.parquet") 

Excel dosyasından veri okuma

import pandas as pd 
 
# Read an Excel file from your Lakehouse into a Pandas DataFrame
# Replace LAKEHOUSE_PATH and FILENAME with your own values
df = pandas.read_excel("/LAKEHOUSE_PATH/Files/FILENAME.xlsx") 
display(df) 

Verileri Excel dosyası olarak yazma

import pandas as pd 

# Write a Pandas DataFrame into an Excel file in your Lakehouse
# Replace LAKEHOUSE_PATH and FILENAME with your own values
df.to_excel("/LAKEHOUSE_PATH/Files/FILENAME.xlsx") 

JSON dosyasından veri okuma

import pandas as pd 
 
# Read a JSON file from your Lakehouse into a Pandas DataFrame
# Replace LAKEHOUSE_PATH and FILENAME with your own values
df = pandas.read_json("/LAKEHOUSE_PATH/Files/FILENAME.json") 
display(df) 

Verileri JSON dosyası olarak yazma

import pandas as pd 
 
# Write a Pandas DataFrame into a JSON file in your Lakehouse
# Replace LAKEHOUSE_PATH and FILENAME with your own values
df.to_json("/LAKEHOUSE_PATH/Files/FILENAME.json")