Archivo comprimido LZO
Debido a las restricciones de la licencia, el códec de compresión LZO no está disponible de manera predeterminada en los clústeres de Azure Databricks. Para leer un archivo comprimido LZO, debe usar un script de inicialización para instalar el códec en el clúster al iniciarse.
Ejemplo de cuaderno: archivos comprimidos LZO de inicialización
El cuaderno siguiente:
- Compila el códec LZO.
- Crea un script de inicialización que:
- Instala las bibliotecas de compresión LZO y el comando
lzop
, y copia el códec LZO en la ruta de acceso de clase adecuada. - Configura Spark para utilizar el códec de compresión LZO.
- Instala las bibliotecas de compresión LZO y el comando
Cuaderno de archivos comprimidos LZO de inicialización
Ejemplo de cuaderno: lectura de archivos comprimidos LZO
El cuaderno siguiente lee los archivos comprimidos LZO mediante el códec instalado por el script de inicialización: