Parquet-fájlok olvasása az Azure Databricks használatával
Ez a cikk bemutatja, hogyan olvashat adatokat Apache Parquet-fájlokból az Azure Databricks használatával.
Mi az a Parquet?
Az Apache Parquet egy oszlopos fájlformátum, amely optimalizálással felgyorsítja a lekérdezéseket. Hatékonyabb fájlformátum, mint a CSV vagy a JSON.
További információ: Parquet Files.
Beállítások
A támogatott olvasási és írási lehetőségekről az alábbi Apache Spark-referenciacikkek nyújtanak segítséget.
Példa jegyzetfüzetre: Olvasás és írás Parquet-fájlokba
Az alábbi jegyzetfüzet bemutatja, hogyan olvashat és írhat adatokat Parquet-fájlokba.