Resumen
Apache Spark es una tecnología clave que se usa en el análisis de macrodatos; la compatibilidad de Spark en Azure Databricks le permite combinar el procesamiento de macrodatos en Spark con almacenamiento de datos a gran escala.
En este módulo ha aprendido a:
- Describir los elementos clave de la arquitectura de Apache Spark.
- Cree y configure un clúster de Spark.
- Describir los casos de uso de Spark.
- Use Spark para procesar y analizar los datos almacenados en archivos.
- Use Spark para visualizar los datos.