Compartir a través de


Lectura de archivos Parquet mediante Azure Databricks

En este artículo se muestra cómo leer datos de archivos de Apache Parquet con Azure Databricks.

¿Qué es Parquet?

Apache Parquet es un formato de archivo en columnas con optimizaciones para acelerar las consultas. Es un formato de archivo mucho más eficaz que el archivo CSV o JSON.

Para obtener más información, vea Archivos de Parquet.

Opciones

Consulte los siguientes artículos de referencia de Apache Spark para ver las opciones de lectura y escritura admitidas.

Ejemplo de cuaderno: lectura y escritura de archivos Parquet

En el cuaderno siguiente se muestra cómo leer y escribir datos en los archivos de Parquet.

Lectura del cuaderno de archivos Parquet

Obtener el cuaderno