Parquet-fájlok olvasása az Azure Databricks használatával

Cikk
10/15/2024

Ez a cikk bemutatja, hogyan olvashat adatokat Apache Parquet-fájlokból az Azure Databricks használatával.

Mi az a Parquet?

Az Apache Parquet egy oszlopos fájlformátum, amely optimalizálással felgyorsítja a lekérdezéseket. Hatékonyabb fájlformátum, mint a CSV vagy a JSON.

További információ: Parquet Files.

Beállítások

A támogatott olvasási és írási lehetőségekről az alábbi Apache Spark-referenciacikkek nyújtanak segítséget.

Olvas
- Python
- Scala
Ír
- Python
- Scala

Példa jegyzetfüzetre: Olvasás és írás Parquet-fájlokba

Az alábbi jegyzetfüzet bemutatja, hogyan olvashat és írhat adatokat Parquet-fájlokba.

Parquet-fájlok jegyzetfüzetének olvasása

Jegyzetfüzet beszerzése