Dela via


Problem med Spark-minne

Verifiera ett minnesproblem

Minnesproblem resulterar ofta i felmeddelanden, till exempel följande:

SparkException: Job aborted due to stage failure: Task 3 in stage 0.0 failed 4 times, most recent failure: Lost task 3.3 in stage 0.0 (TID 30) (10.139.64.114 executor 4): ExecutorLostFailure (executor 4 exited caused by one of the running tasks) Reason: Remote RPC client disassociated. Likely due to containers exceeding thresholds, or network issues. Check driver logs for WARN messages.

Dessa felmeddelanden är dock ofta allmänna och kan orsakas av andra problem. Så om du misstänker att du har ett minnesproblem kan du kontrollera problemet genom att fördubbla minnet per kärna för att se om det påverkar ditt problem.

Om du till exempel har en arbetstyp med 4 kärnor och 16 GB per minne kan du prova att byta till en arbetstyp som har 4 kärnor och 32 GB minne. Det ger dig 8 GB per kärna jämfört med de 4 GB per kärna du hade tidigare. Det är förhållandet mellan kärnor och minne som är viktigt här. Om det tar längre tid att misslyckas med det extra minnet eller inte misslyckas alls är det ett gott tecken på att du är på rätt spår.

Om du kan åtgärda problemet genom att öka minnet, bra! Det kanske är lösningen. Om det inte löser problemet, eller om du inte kan bära den extra kostnaden, bör du gå djupare.

Möjliga orsaker

Det finns många möjliga orsaker till minnesproblem: