Resumen

Completado

Apache Spark es una tecnología clave que se usa en el análisis de macrodatos; la compatibilidad de Spark en Azure Databricks le permite combinar el procesamiento de macrodatos en Spark con almacenamiento de datos a gran escala.

En este módulo ha aprendido a:

  • Describir los elementos clave de la arquitectura de Apache Spark.
  • Cree y configure un clúster de Spark.
  • Describir los casos de uso de Spark.
  • Use Spark para procesar y analizar los datos almacenados en archivos.
  • Use Spark para visualizar los datos.