Richtlijnen voor Apache Spark
Dit artikel bevat verschillende richtlijnen voor het gebruik van Apache Spark in Azure HDInsight.
Hoe kan ik Spark-taken uitvoeren of verzenden?
Hoe kan ik Spark-taken bewaken en fouten opsporen?
Optie | Documenten |
---|---|
Azure-toolkit voor IntelliJ | Foutopsporing in Spark-taken met Azure Toolkit voor IntelliJ (preview) |
Azure Toolkit voor IntelliJ via SSH | Lokaal of op afstand fouten opsporen in Apache Spark-toepassingen in een HDInsight-cluster met de Azure-toolkit voor IntelliJ via SSH |
Azure Toolkit voor IntelliJ via VPN | Azure Toolkit voor IntelliJ gebruiken om fouten op te sporen in Apache Spark-toepassingen op afstand in HDInsight via VPN |
Taakgrafiek op Apache Spark History Server | Uitgebreide Apache Spark History Server gebruiken om fouten op te sporen in Apache Spark-toepassingen |
Hoe kan ik mijn Spark-taken efficiƫnter uitvoeren?
Optie | Documenten |
---|---|
IO-cache | Prestaties van Apache Spark-workloads verbeteren met behulp van Azure HDInsight IO Cache (preview) |
Configuratieopties | Apache Spark-taken optimaliseren |
Hoe kan ik verbinding maken met andere Azure-services?
Optie | Documenten |
---|---|
Apache Hive in HDInsight | Apache Spark en Apache Hive integreren met Hive Warehouse Connector |
Apache HBase in HDInsight | Apache Spark gebruiken om Apache HBase-gegevens te lezen en schrijven |
Apache Kafka in HDInsight | Zelfstudie: Apache Spark Structured Streaming gebruiken met Apache Kafka in HDInsight |
Azure Cosmos DB | Azure Synapse Link voor Azure Cosmos DB |
Wat zijn mijn opslagopties?
Optie | Documenten |
---|---|
Azure Data Lake Storage Gen2 | Azure Data Lake Storage Gen2 gebruiken met Azure HDInsight-clusters |
Azure Blob-opslag | Azure-opslag gebruiken met Azure HDInsight-clusters |