Použití Apache Sparku v Microsoft Fabric

Středně pokročilý
Data Analyst
Data Engineer
Microsoft Fabric

Apache Spark je základní technologie pro rozsáhlé analýzy dat. Microsoft Fabric poskytuje podporu pro clustery Spark, které umožňují analyzovat a zpracovávat data ve velkém měřítku v Lakehouse.

Cíle výuky

V tomto modulu:

  • Konfigurace Sparku v pracovním prostoru Microsoft Fabric
  • Identifikace vhodných scénářů pro poznámkové bloky Spark a úlohy Sparku
  • Použití datových rámců Sparku k analýze a transformaci dat
  • Použití Spark SQL k dotazování dat v tabulkách a zobrazeních
  • Vizualizace dat v poznámkovém bloku Sparku

Požadavky

Než začnete s tímto modulem, měli byste být obeznámeni s rozhraním Microsoft Fabric a základními koncepty.