Partager via


Scénario : L’espace disque est insuffisant sur le nœud de cluster dans Azure HDInsight

Cet article décrit les éventuelles solutions à appliquer pour résoudre les problèmes rencontrés lors d’interactions avec des clusters Azure HDInsight.

Problème

Un travail peut échouer avec un message d’erreur semblable à celui-ci : /usr/hdp/2.6.3.2-14/hadoop/libexec/hadoop-config.sh: fork: No space left on device.

Vous pouvez également recevoir une alerte Apache Ambari similaire à ce qui suit : local-dirs usable space is below configured utilization percentage.

Cause

Le cache d’application Apache Yarn peut avoir consommé tout l’espace disque disponible. Votre application Spark s’exécute probablement de manière inefficace.

Résolution

  1. Utilisez l’interface utilisateur Ambari pour déterminer quel nœud manque d’espace disque.

  2. Déterminez quel dossier du nœud en difficulté contribue à la plus grande partie de l'espace disque. Commencez par exécuter SSH sur le nœud, puis exécutez df pour répertorier l’utilisation du disque pour tous les montages. En général, /mnt est un disque temporaire utilisé par OSS. Vous pouvez entrer dans un dossier, puis taper sudo du -hs pour afficher les tailles de fichiers résumés sous un dossier. Si vous voyez un dossier similaire à /mnt/resource/hadoop/yarn/local/usercache/livy/appcache/application_1537280705629_0007, cette sortie signifie que l’application est toujours en cours d’exécution. Cette sortie peut être due à la persistance RDD ou aux fichiers de lecture aléatoire intermédiaires.

  3. Pour atténuer le problème, arrêtez l’application, qui libérera l’espace disque utilisé par cette application.

  4. Si le problème se produit fréquemment sur les nœuds Worker, vous pouvez régler les paramètres du cache local YARN sur le cluster.

    Ouvrez l’interface utilisateur Ambari, puis accédez YARN --> Configurations --> Avancé.
    Ajoutez les deux propriétés suivantes à la section yarn-site personnalisé du .xml, puis enregistrez :

    yarn.nodemanager.localizer.cache.target-size-mb=2048
    yarn.nodemanager.localizer.cache.cleanup.interval-ms=300000
    
  5. Si la solution ci-dessus ne résout pas définitivement le problème, optimisez votre application.

Étapes suivantes

Si votre problème ne figure pas dans cet article ou si vous ne parvenez pas à le résoudre, utilisez un des canaux suivants pour obtenir de l’aide :

  • Obtenez des réponses de la part d’experts Azure en faisant appel au Support de la communauté Azure.

  • Connectez-vous à @AzureSupport, le compte Microsoft Azure officiel pour améliorer l’expérience client. Connexion de la communauté Azure aux ressources appropriées : réponses, support technique et experts.

  • Si vous avez besoin d’une aide supplémentaire, vous pouvez envoyer une requête de support à partir du Portail Microsoft Azure. Sélectionnez Support dans la barre de menus, ou ouvrez le hub Aide + Support. Pour plus d’informations, consultez Création d’une demande de support Azure. L’accès au support relatif à la gestion et à la facturation des abonnements est inclus avec votre abonnement Microsoft Azure. En outre, le support technique est fourni avec l’un des plans de support Azure.