Läsa och skriva data med Pandas i Microsoft Fabric

Microsoft Fabric-notebook-filer stöder sömlös interaktion med Lakehouse-data med Pandas, det mest populära Python-biblioteket för datautforskning och bearbetning. I en notebook-fil kan du snabbt läsa data från och skriva data tillbaka till dina Lakehouse-resurser i olika filformat. Den här guiden innehåller kodexempel som hjälper dig att komma igång i din egen notebook-fil.

Förutsättningar

Skaffa en Microsoft Fabric-prenumeration. Eller registrera dig för en kostnadsfri utvärderingsversion av Microsoft Fabric.
Logga in på Microsoft Fabric.
Växla till Fabric genom att använda upplevelseväxlaren längst ned till vänster på startsidan.

Slutför stegen i Förbereda systemet för självstudier för datavetenskap för att skapa en ny notebook-fil och bifoga en Lakehouse till den. I den här artikeln följer du stegen för att skapa en ny notebook-fil i stället för att importera en befintlig.

Läsa in Lakehouse-data i en notebook-fil

Kommentar

Du behöver lite data i Lakehouse för att följa stegen i det här avsnittet. Om du inte har några data följer du stegen i Ladda ned datamängd och ladda upp till Lakehouse för att lägga till filenchurn.csv i Lakehouse.

När du har bifogat en Lakehouse till din Microsoft Fabric-notebook-fil kan du utforska lagrade data utan att lämna sidan och läsa den i anteckningsboken med bara några få steg. Om du väljer en Lakehouse-fil visas alternativ för att "läsa in data" i en Spark- eller Pandas-dataram. Du kan också kopiera filens fullständiga ABFS-sökväg eller en egen relativ sökväg.

Om du väljer någon av "Läs in data" genereras en kodcell som läser in filen i en DataFrame i notebook-filen.

Konvertera en Spark DataFrame till en Pandas DataFrame

Som referens visar det här kommandot hur du konverterar en Spark DataFrame till en Pandas DataFrame:

# Replace "spark_df" with the name of your own Spark DataFrame
pandas_df = spark_df.toPandas()

Läsa och skriva olika filformat

Kommentar

Om du ändrar versionen av ett visst paket kan det eventuellt bryta andra paket som är beroende av det. Till exempel kan nedgradering azure-storage-blob orsaka problem med Pandas och olika andra bibliotek som förlitar sig på Pandas, inklusive mssparkutils, fsspec_wrapperoch notebookutils. Du kan visa listan över förinstallerade paket och deras versioner för varje körning här.

Dessa kodexempel visar Pandas-åtgärder för att läsa och skriva olika filformat. De här exemplen är inte avsedda att köras sekventiellt som i en självstudie, utan i stället kopieras och klistras in i din egen notebook-fil efter behov.

Kommentar

Du måste ersätta filsökvägarna i dessa kodexempel. Pandas stöder både relativa sökvägar, som visas här, och fullständiga ABFS-sökvägar. Du kan hämta och kopiera sökvägar av båda typerna från gränssnittet med hjälp av föregående steg.

Läsa data från en CSV-fil

import pandas as pd

# Read a CSV file from your Lakehouse into a Pandas DataFrame
# Replace LAKEHOUSE_PATH and FILENAME with your own values
df = pd.read_csv("/LAKEHOUSE_PATH/Files/FILENAME.csv")
display(df)

Skriva data som en CSV-fil

import pandas as pd 

# Write a Pandas DataFrame into a CSV file in your Lakehouse
# Replace LAKEHOUSE_PATH and FILENAME with your own values
df.to_csv("/LAKEHOUSE_PATH/Files/FILENAME.csv")

Läsa data från en Parquet-fil

import pandas as pd 
 
# Read a Parquet file from your Lakehouse into a Pandas DataFrame
# Replace LAKEHOUSE_PATH and FILENAME with your own values
df = pd.read_parquet("/LAKEHOUSE_PATH/Files/FILENAME.parquet") 
display(df)

Skriva data som en Parquet-fil

import pandas as pd 
 
# Write a Pandas DataFrame into a Parquet file in your Lakehouse
# Replace LAKEHOUSE_PATH and FILENAME with your own values
df.to_parquet("/LAKEHOUSE_PATH/Files/FILENAME.parquet")

Läsa data från en Excel-fil

import pandas as pd 
 
# Read an Excel file from your Lakehouse into a Pandas DataFrame
# Replace LAKEHOUSE_PATH and FILENAME with your own values
# If the file is in a subfolder, add the correct file path after Files/
# For the default lakehouse attached to the notebook, use: df = pd.read_excel("/lakehouse/default/Files/FILENAME.xlsx") 
df = pd.read_excel("/LAKEHOUSE_PATH/Files/FILENAME.xlsx") 
display(df)

Skriva data som en Excel-fil

import pandas as pd 

# Write a Pandas DataFrame into an Excel file in your Lakehouse
# Replace LAKEHOUSE_PATH and FILENAME with your own values
df.to_excel("/LAKEHOUSE_PATH/Files/FILENAME.xlsx")

Läsa data från en JSON-fil

import pandas as pd 
 
# Read a JSON file from your Lakehouse into a Pandas DataFrame
# Replace LAKEHOUSE_PATH and FILENAME with your own values
df = pd.read_json("/LAKEHOUSE_PATH/Files/FILENAME.json") 
display(df)

Skriva data som en JSON-fil

import pandas as pd 
 
# Write a Pandas DataFrame into a JSON file in your Lakehouse
# Replace LAKEHOUSE_PATH and FILENAME with your own values
df.to_json("/LAKEHOUSE_PATH/Files/FILENAME.json")

Arbeta med Delta-tabeller

Deltatabeller är standardtabellformatet i Microsoft Fabric och lagras i avsnittet Tabeller i Lakehouse. Till skillnad från filer kräver Delta-tabeller en tvåstegsprocess för att arbeta med Pandas: läs först tabellen i en Spark DataFrame och konvertera den sedan till en Pandas DataFrame.

Skapa en Test Delta-tabell

Om du vill följa stegen i det här avsnittet behöver du en Delta-tabell i Lakehouse. Följ stegen i Ladda ned datauppsättning och ladda upp till lakehouse för att lägga till filenchurn.csv i Lakehouse och skapa sedan en testtabell från churn.csv-filen genom att köra den här koden i notebook-filen:

import pandas as pd
# Create a test Delta table from the churn.csv file

df = pd.read_csv("/lakehouse/default/Files/churn/raw/churn.csv")
spark_df = spark.createDataFrame(df)
spark_df.write.format("delta").mode("overwrite").saveAsTable("churn_table")

Då skapas en Delta-tabell med namnet churn_table som du kan använda för att testa exemplen nedan.

Läsa data från en Delta-tabell

# Read a Delta table from your Lakehouse into a pandas DataFrame
# This example uses the churn_table created above
spark_df = spark.read.format("delta").load("Tables/churn_table")
pandas_df = spark_df.toPandas()
display(pandas_df)

Du kan också läsa Delta-tabeller med Spark SQL-syntax:

# Alternative method using Spark SQL
spark_df = spark.sql("SELECT * FROM churn_table")
pandas_df = spark_df.toPandas()
display(pandas_df)

Skriva Pandas DataFrame till en Delta-tabell

# Convert pandas DataFrame to Spark DataFrame, then save as Delta table
# Replace TABLE_NAME with your desired table name
spark_df = spark.createDataFrame(pandas_df)
spark_df.write.format("delta").mode("overwrite").saveAsTable("TABLE_NAME")

Du kan också spara till en specifik sökväg i avsnittet Tabeller:

# Save to a specific path in the Tables section
spark_df = spark.createDataFrame(pandas_df)
spark_df.write.format("delta").mode("overwrite").save("Tables/TABLE_NAME")

Skrivlägen för Delta-tabeller

När du skriver till Delta-tabeller kan du ange olika lägen:

# Overwrite the entire table
spark_df.write.format("delta").mode("overwrite").saveAsTable("TABLE_NAME")

# Append new data to existing table
spark_df.write.format("delta").mode("append").saveAsTable("TABLE_NAME")

Kommentar

Deltatabeller som skapats i avsnittet Tabeller i lakehouse kan identifieras utan ytterligare registrerings- eller konfigurationssteg och kan efterfrågas med Spark SQL. De visas också i Lakehouse Explorer-gränssnittet (du kan behöva uppdatera Lakehouse-utforskaren för att se de senaste ändringarna).

Använda Data Wrangler för att rensa och förbereda dina data
Starta ML-träningsmodeller

Feedback

Var den här sidan till hjälp?

Last updated on 2025-08-30

Dela via

Läsa och skriva data med Pandas i Microsoft Fabric

Förutsättningar

Läsa in Lakehouse-data i en notebook-fil

Konvertera en Spark DataFrame till en Pandas DataFrame

Läsa och skriva olika filformat

Läsa data från en CSV-fil

Skriva data som en CSV-fil

Läsa data från en Parquet-fil

Skriva data som en Parquet-fil

Läsa data från en Excel-fil

Skriva data som en Excel-fil

Läsa data från en JSON-fil

Skriva data som en JSON-fil

Arbeta med Delta-tabeller

Skapa en Test Delta-tabell

Läsa data från en Delta-tabell

Skriva Pandas DataFrame till en Delta-tabell

Skrivlägen för Delta-tabeller

Relaterat innehåll

Feedback

Ytterligare resurser