Lectura de archivos Parquet mediante Azure Databricks
En este artículo se muestra cómo leer datos de archivos de Apache Parquet con Azure Databricks.
Apache Parquet es un formato de archivo en columnas con optimizaciones para acelerar las consultas. Es un formato de archivo mucho más eficaz que el archivo CSV o JSON.
Para obtener más información, vea Archivos de Parquet.
Consulte los siguientes artículos de referencia de Apache Spark para ver las opciones de lectura y escritura admitidas.
En el cuaderno siguiente se muestra cómo leer y escribir datos en los archivos de Parquet.