Tietojen lukeminen ja kirjoittaminen Pandasin avulla Microsoft Fabricissa

Microsoft Fabric -muistikirjat tukevat saumatonta vuorovaikutusta Lakehouse-tietojen kanssa käyttämällä Pandasia, joka on suosituin Python-kirjasto tietojen tutkimiseen ja käsittelyyn. Muistikirjassa voit nopeasti lukea tietoja Lakehouse-resursseista ja kirjoittaa tietoja takaisin niihin eri tiedostomuodoissa. Tämä opas tarjoaa koodinäytteitä, joiden avulla pääset alkuun omassa muistikirjassasi.

Edellytykset

Hanki Microsoft Fabric -tilaus. Voit myös rekisteröityä ilmaiseen Microsoft Fabric -kokeiluversioon.
Kirjaudu sisään Microsoft Fabriciin.
Vaihda Fabric-tilaan käyttämällä etusivun vasemmassa alakulmassa olevaa kokemuskytkintä.

Suorita vaiheet kohdassa Järjestelmän valmisteleminen datatieteen opetusohjelmia varten , jotta voit luoda uuden muistikirjan ja liittää siihen Lakehousen. Luo tässä artikkelissa uusi muistikirja aiemmin luodun muistikirjan tuomisen sijaan.

Lakehouse-tietojen lataaminen muistikirjaan

Muistiinpano

Tarvitset tietoja Lakehousessasi, jotta voit noudattaa tämän osion ohjeita. Jos sinulla ei ole tietoja, lisää churn.csv tiedosto Lakehouseen noudattamalla kohdan Lataa tietojoukko ja lataa lakehouseen ohjeita.

Kun liität Lakehousen Microsoft Fabric -muistikirjaan, voit tutkia tallennettuja tietoja poistumatta sivulta ja lukea ne muistikirjaan muutamalla vaiheella. Kun valitset minkä tahansa Lakehouse-tiedoston, näkyviin tulee "Lataa tiedot" -vaihtoehdot Spark- tai Pandas DataFrameen. Voit myös kopioida tiedoston koko ABFS-polun tai ystävällisen suhteellisen polun.

Jonkin Lataa tiedot -kehotteen valitseminen luo koodisolun, joka lataa tiedoston muistikirjan tietokehykseen.

Spark DataFramen muuntaminen Pandas DataFrameksi

Tässä komennossa kerrotaan, miten voit muuntaa Spark DataFramen Pandas DataFrame -kehykseksi:

# Replace "spark_df" with the name of your own Spark DataFrame
pandas_df = spark_df.toPandas()

Erilaisten tiedostomuotojen lukeminen ja kirjoittaminen

Muistiinpano

Tietyn paketin version muokkaaminen saattaa rikkoa muut siitä riippuvaiset paketit. Esimerkiksi alentaminen azure-storage-blob voi aiheuttaa ongelmia -, - ja -kirjastojen kanssa Pandas ja monissa muissa kirjastoissa, joiden luotuksena Pandason , , mssparkutilsfsspec_wrapperja notebookutils. Näet esiasennetut paketit ja niiden versiot kullekin suorituspalvelulle täällä.

Nämä koodiesimerkit osoittavat Pandasin toimintoja eri tiedostomuotojen lukemiseen ja kirjoittamiseen. Näitä näytteitä ei ole tarkoitettu suoritettavaksi peräkkäin, kuten opetusohjelmassa, vaan ne on kopioitava ja liitettävä omaan muistikirjaasi tarpeen mukaan.

Muistiinpano

Sinun on korvattava näiden koodimallien tiedostopolut. Pandas tukee sekä suhteellisia polkuja, kuten tässä näkyy, että täydellisiä ABFS-polkuja. Voit noutaa ja kopioida kumpaa tahansa tyyppisiä polkuja käyttöliittymästä edellisten vaiheiden avulla.

Tietojen lukeminen CSV-tiedostosta

import pandas as pd

# Read a CSV file from your Lakehouse into a Pandas DataFrame
# Replace LAKEHOUSE_PATH and FILENAME with your own values
df = pd.read_csv("/LAKEHOUSE_PATH/Files/FILENAME.csv")
display(df)

Tietojen kirjoittaminen CSV-tiedostona

import pandas as pd 

# Write a Pandas DataFrame into a CSV file in your Lakehouse
# Replace LAKEHOUSE_PATH and FILENAME with your own values
df.to_csv("/LAKEHOUSE_PATH/Files/FILENAME.csv")

Tietojen lukeminen Parquet-tiedostosta

import pandas as pd 
 
# Read a Parquet file from your Lakehouse into a Pandas DataFrame
# Replace LAKEHOUSE_PATH and FILENAME with your own values
df = pd.read_parquet("/LAKEHOUSE_PATH/Files/FILENAME.parquet") 
display(df)

Kirjoita tiedot Parquet-tiedostona

import pandas as pd 
 
# Write a Pandas DataFrame into a Parquet file in your Lakehouse
# Replace LAKEHOUSE_PATH and FILENAME with your own values
df.to_parquet("/LAKEHOUSE_PATH/Files/FILENAME.parquet")

Tietojen lukeminen Excel-tiedostosta

import pandas as pd 
 
# Read an Excel file from your Lakehouse into a Pandas DataFrame
# Replace LAKEHOUSE_PATH and FILENAME with your own values
# If the file is in a subfolder, add the correct file path after Files/
# For the default lakehouse attached to the notebook, use: df = pd.read_excel("/lakehouse/default/Files/FILENAME.xlsx") 
df = pd.read_excel("/LAKEHOUSE_PATH/Files/FILENAME.xlsx") 
display(df)

Tietojen kirjoittaminen Excel-tiedostona

import pandas as pd 

# Write a Pandas DataFrame into an Excel file in your Lakehouse
# Replace LAKEHOUSE_PATH and FILENAME with your own values
df.to_excel("/LAKEHOUSE_PATH/Files/FILENAME.xlsx")

Tietojen lukeminen JSON-tiedostosta

import pandas as pd 
 
# Read a JSON file from your Lakehouse into a Pandas DataFrame
# Replace LAKEHOUSE_PATH and FILENAME with your own values
df = pd.read_json("/LAKEHOUSE_PATH/Files/FILENAME.json") 
display(df)

Tietojen kirjoittaminen JSON-tiedostona

import pandas as pd 
 
# Write a Pandas DataFrame into a JSON file in your Lakehouse
# Replace LAKEHOUSE_PATH and FILENAME with your own values
df.to_json("/LAKEHOUSE_PATH/Files/FILENAME.json")

Delta-taulukoiden käyttäminen

Delta-taulukot ovat Microsoft Fabricin oletustaulukkomuoto, ja ne tallennetaan Lakehousen Taulukot-osaan . Toisin kuin tiedostot, Delta-taulukot edellyttävät kaksivaiheista prosessia pandojen kanssa toimimiseen: lue ensin taulukko Spark DataFrameen ja muunna se sitten pandas-tietokehykseksi.

Delta-testitaulukon luominen

Jotta voit noudattaa tämän osion ohjeita, tarvitset Delta-taulukon Lakehousessasi. Lisää churn.csv tiedosto Lakehouseen noudattamalla kohdan Lataa tietojoukko ja lataa lakehouseen ohjeita ja luo sitten testitaulukko churn.csv tiedostosta suorittamalla tämä koodi muistikirjassasi:

import pandas as pd
# Create a test Delta table from the churn.csv file

df = pd.read_csv("/lakehouse/default/Files/churn/raw/churn.csv")
spark_df = spark.createDataFrame(df)
spark_df.write.format("delta").mode("overwrite").saveAsTable("churn_table")

Tämä luo Delta-taulukon nimeltä churn_table , jonka avulla voit testata alla olevia esimerkkejä.

Tietojen lukeminen Delta-taulukosta

# Read a Delta table from your Lakehouse into a pandas DataFrame
# This example uses the churn_table created above
spark_df = spark.read.format("delta").load("Tables/churn_table")
pandas_df = spark_df.toPandas()
display(pandas_df)

Voit myös lukea Delta-taulukoita Spark SQL -syntaksin avulla:

# Alternative method using Spark SQL
spark_df = spark.sql("SELECT * FROM churn_table")
pandas_df = spark_df.toPandas()
display(pandas_df)

Pandas DataFramen kirjoittaminen Delta-taulukkoon

# Convert pandas DataFrame to Spark DataFrame, then save as Delta table
# Replace TABLE_NAME with your desired table name
spark_df = spark.createDataFrame(pandas_df)
spark_df.write.format("delta").mode("overwrite").saveAsTable("TABLE_NAME")

Voit myös tallentaa tietylle polulle Taulukot-osiossa:

# Save to a specific path in the Tables section
spark_df = spark.createDataFrame(pandas_df)
spark_df.write.format("delta").mode("overwrite").save("Tables/TABLE_NAME")

Delta-taulukoiden kirjoitustilat

Kun kirjoitat Delta-taulukoihin, voit määrittää erilaisia tiloja:

# Overwrite the entire table
spark_df.write.format("delta").mode("overwrite").saveAsTable("TABLE_NAME")

# Append new data to existing table
spark_df.write.format("delta").mode("append").saveAsTable("TABLE_NAME")

Muistiinpano

Lakehousen Taulukot-osiossa luodut Delta-taulukot ovat löydettävissä ilman muita rekisteröinti- tai määritysvaiheita, ja niistä voidaan tehdä kyselyjä Spark SQL:n avulla. Ne näkyvät myös Lakehousen resurssienhallinnan käyttöliittymässä (sinun on ehkä päivitettävä Lakehouse-tutkimus, jotta näet viimeisimmät muutokset).

Tietojen puhdistaminen ja valmisteleminen Data Wrangler -toiminnolla
Koneoppimismallien harjoittamisen aloittaminen

Palaute

Onko tästä sivusta apua?

Last updated on 2025-08-30

Tietojen lukeminen ja kirjoittaminen Pandasin avulla Microsoft Fabricissa

Edellytykset

Lakehouse-tietojen lataaminen muistikirjaan

Spark DataFramen muuntaminen Pandas DataFrameksi

Erilaisten tiedostomuotojen lukeminen ja kirjoittaminen

Tietojen lukeminen CSV-tiedostosta

Tietojen kirjoittaminen CSV-tiedostona

Tietojen lukeminen Parquet-tiedostosta

Kirjoita tiedot Parquet-tiedostona

Tietojen lukeminen Excel-tiedostosta

Tietojen kirjoittaminen Excel-tiedostona

Tietojen lukeminen JSON-tiedostosta

Tietojen kirjoittaminen JSON-tiedostona

Delta-taulukoiden käyttäminen

Delta-testitaulukon luominen

Tietojen lukeminen Delta-taulukosta

Pandas DataFramen kirjoittaminen Delta-taulukkoon

Delta-taulukoiden kirjoitustilat

Liittyvä sisältö

Palaute

Lisäresursseja