Overzicht van Apache Spark

Apache Spark is de technologie die rekenclusters en SQL-warehouses in Azure Databricks mogelijk maakt.

Deze pagina bevat een overzicht van de documentatie in deze sectie.

Get started

Aan de slag met Apache Spark in Databricks.

Onderwerp	Description
Apache Spark in Azure Databricks	Krijg antwoorden op veelgestelde vragen over Apache Spark in Azure Databricks.
Zelfstudie: Gegevens laden en transformeren met Apache Spark DataFrames	Volg een stapsgewijze handleiding voor het werken met Spark DataFrames in Python, R of Scala voor het laden en transformeren van gegevens.
Basisbeginselen van PySpark	Leer de basisprincipes van het gebruik van PySpark door eenvoudige voorbeelden te doorlopen.

Verken andere Spark-mogelijkheden en -documentatie.

Onderwerp	Description
Spark Connect vergelijken met Spark Classic	Meer informatie over de belangrijkste verschillen tussen Spark Connect en Spark Classic in het uitvoerings- en analysegedrag om onverwacht gedrag en prestatieproblemen bij het migreren van code te voorkomen.
Spark-configuratie-eigenschappen instellen in Azure Databricks	Stel spark-configuratie-eigenschappen in om instellingen in uw rekenomgeving aan te passen en de prestaties te optimaliseren.
Gestructureerd streamen	Lees een overzicht van Structured Streaming, een bijna realtime verwerkingsengine.
Kosten- en prestatieproblemen vaststellen met behulp van de Spark-gebruikersinterface	Meer informatie over het gebruik van de Spark-gebruikersinterface voor het afstemmen van prestaties, foutopsporing en kostenoptimalisatie van Spark-taken.
Apache Spark MLlib gebruiken in Azure Databricks	Gedistribueerde machine learning met Spark MLlib en integratie met populaire ML-frameworks.

Werk met Spark met behulp van de programmeertaal van uw voorkeur.

Onderwerp	Description
Naslaginformatie voor Apache Spark-API's	Overzicht van API-naslaginformatie voor Apache Spark, inclusief koppelingen naar naslaginformatie voor Spark SQL-, DataFrames- en RDD-bewerkingen in ondersteunde talen.
PySpark	Gebruik Python met Spark, waaronder de basisbeginselen van PySpark, aangepaste gegevensbronnen en Python-specifieke optimalisaties.
Pandas-API in Spark	Maak gebruik van vertrouwde pandas-syntaxis met de schaalbaarheid van Spark voor gedistribueerde gegevensverwerking.
R voor Spark	Werk met R en Spark met sparkR en sparklyr voor statistische computing en gegevensanalyse.
Scala voor Spark	Bouw krachtige Spark-toepassingen met behulp van Scala met systeemeigen Spark-API's en typeveiligheid.

Is deze pagina nuttig?