Partager via


Résoudre les problèmes liés à l’instance SCOM gérée d’Azure Monitor

Cet article décrit les erreurs qui peuvent se produire lorsque vous déployez ou utilisez Instance SCOM gérée d’Azure Monitor, et comment les résoudre.

Scénario : Création/déploiement d’Instance SCOM gérée

Résolution générale des problèmes

  1. Assurez-vous que tous les prérequis sont respectés. Les problèmes de création peuvent survenir en raison de prérequis incorrects/incomplets.
  2. Veillez à lire/vérifier attentivement le message d’erreur. Les messages d’erreur capturent le problème/erreur lors de la création.
  3. Vérifiez le lien Journaux de configuration SCOM fourni dans le message d’erreur. Sélectionnez le lien pour télécharger les journaux de configuration de System Center Operations Manager. Analysez les journaux pour identifier et résoudre les erreurs/échecs.
  4. Si vous ne parvenez pas à identifier le problème avec les étapes ci-dessus, connectez-vous à l’instance Virtual Machine Scale Sets et consultez les journaux sous C:\WindowsAzure\Logs\Plugins\Microsoft.Azure.SCOMMIServer.ScomServerForWindows<version> afin de vous aider à identifier le problème.
  5. Si le problème persiste, créez un ticket de support avec tous les détails pertinents [correlation-id, subscription-id et ainsi de suite].

Problème : Le groupe de ressources %ResourceGroupName% est géré par d’autres ressources Azure

Cause : Se produit lorsque la propriété ManagedBy est définie pour le groupe de ressources.

Résolution : Spécifiez un autre groupe de ressources avec la propriété ManagedBy vierge.

Problème : Le sous-réseau %SubnetName% sélectionné est dédié à un autre service

Cause : Se produit lorsque le sous-réseau a des délégations.

Résolution : Spécifiez un sous-réseau qui n’est pas délégué à un autre service.

Problème : Erreur lorsque Instance SCOM gérée n’est pas en mesure d’atteindre SQL Managed Instance %instance%

Cause : Cette erreur peut être due à l’une des raisons suivantes :

  • Visibilité en ligne de vue manquante du réseau virtuel Instance SCOM gérée vers le point de terminaison SQL Managed Instance.
  • Niveau approprié de règles NSG manquant pour autoriser le trafic sur le point de terminaison public SQL Managed Instance.
  • MSI n’est pas ajouté en tant qu’administrateur Active Directory.
  • Instance SCOM gérée ne dispose peut-être pas des autorisations de lecture sur SQL Managed Instance.
  • Il peut y avoir un problème avec votre réseau virtuel/région.

Résolution :

  • Fournissez l’autorisation de lecture à SQL Managed Instance.
  • MSI doit être ajouté en tant qu’administrateur Active Directory sur SQL Managed Instance.
  • Vérifiez la connectivité entre les réseaux Instance SCOM gérée et SQL Managed Instance. Pour plus d’informations, consultez Créer et configurer une instance SQL Managed Instance.

Problème : Nombre insuffisant de cœurs pour créer %instance% dans la région donnée

Cause : Se produit lorsqu’il n’y a pas suffisamment de cœurs pour créer une instance dans la région donnée.

Résolution : Vérifiez la section sur les quotas dans le portail Azure, et allouez davantage de cœurs de type Standard Ds3v2 dans la région si nécessaire.

Problème : Une clé secrète portant le même nom est déjà présente dans le coffre de clés

Cause : Se produit lorsqu’une autre clé secrète portant le même nom est déjà présente dans le coffre de clés.

Résolution : Modifiez le nom de l’instance.

Problème : La machine virtuelle a signalé un échec lors du traitement de l’extension joindomain pour rejoindre le domaine %DomainName%

Cause : Se produit pour les raisons suivantes :

  1. Visibilité en ligne de vue du serveur Instance SCOM gérée vers le contrôleur de domaine.
  2. Les informations d’identification utilisateur de domaine ne sont pas fournies ou sont incorrectes.
  3. Le chemin d’accès de l’unité d’organisation pour le domaine AD n’est pas fourni.

Résolution : Vérifiez la cause, et essayez de résoudre le problème en conséquence.

Problème : Adresse IP statique déjà utilisée

Cause : Se produit si l’adresse IP statique est utilisée par une autre instance.

Résolution : Utilisez une autre adresse IP statique.

Problème : Type d’identité non valide %identityType%

Cause : Se produit en raison d’une identité managée incorrecte.

Résolution : Fournissez l’un des types d’identité possibles ((None), (SystemAssigned,UserAssigned)) et réessayez.

Problème : L’adresse IP statique privée %LbIpAddr% n’appartient pas à la plage de sous-réseau %subnet%

Cause : Se produit lorsque l’adresse IP n’est pas dans la plage de sous-réseaux.

Résolution : Fournissez une adresse IP disponible comprise dans la plage de sous-réseaux, et réessayez l’opération.

Problème : L’identité n’est pas un administrateur(-trice) système sur l’instance managée SQL : « %instance ».

Cause : Se produit pour les raisons suivantes :

  1. L’identité managée de l’utilisateur n’est pas SQL Admin sur SQL MI.
  2. L’identité managée de l’utilisateur(-trice) est confirmée en tant qu’administrateur(-trice) SQL sur SQL MI, et elle est déployée à l’aide d’ARM, BICEP, Terraform ou d’une autre solution de déploiement.

Résolution : vérifiez que l’identité managée de l’utilisateur(-trice) est déployée à l’aide de l’AppId et non de l’ObjectId. Vous pouvez confirmer si cela s’applique en accédant au volet d’administration SQL MI, Microsoft Entra ID. Vérifiez si le guid répertorié avec l’identité managée de l’utilisateur(-trice) est l’ObjectId ou l’AppId du principal du service. Lorsqu’il s’agit d’ObjectId :

  • Définissez-le à l’aide du portail
  • Redéployez avec votre solution préférée à l’aide de l’AppId.

Scénario : Déployer des rapports sur Power BI

Problème : SQL Managed Instance n’est pas accessible

Cause : Se produit si le point de terminaison public n’est pas activé. Power BI ne pourra pas atteindre SQL Managed Instance.

Résolution : Vérifiez les autorisations utilisateur sur SQL Managed Instance et fournissez les autorisations requises.

Problème : Impossible d’actualiser les informations d’identification du jeu de données

Cause : Se produit si l’utilisateur ne dispose pas des autorisations appropriées sur SQL Managed Instance.

Résolution : Vérifiez les autorisations utilisateur sur SQL Managed Instance et fournissez les autorisations requises.

Problème : Impossible d’actualiser le rapport

Cause : Se produit en raison d’une grande taille de données. Le rapport peut ne pas être actualisé.

Résolution : Si l’espace de travail Power BI est au niveau pro, basculez vers le niveau Premium ou modifiez la capacité de l’espace de travail.

Scénario : Scale-up/down manuel

Problème : Échec du test de connectivité Internet. Les points de terminaison requis ne sont pas accessibles à partir du réseau virtuel

Cause : Problème réseau.

Résolution : Vérifiez qu’Instance SCOM gérée dispose d’un accès Internet sortant et que le groupe de sécurité réseau/pare-feu est correctement configuré pour autoriser l’accès aux points de terminaison requis, comme décrit dans les exigences relatives au pare-feu.

Problème : Quota dépassé

Cause : Se produit s’il n’y a pas de cœurs disponibles pour la mise à l’échelle.

Résolution : Augmentez le nombre de cœurs de l’abonnement.

Vérifiez la section sur les quotas dans le portail Azure, et allouez davantage de cœurs de type Standard Ds3v2 dans la région si nécessaire.

Problème : Erreur d’approvisionnement d’une extension

Cause : Cette erreur peut se produire lors de l’approvisionnement de l’extension System Center Operations Manager ou de l’installation de System Center Operations Manager.

Résolution : Consultez la section Résolution des problèmes généraux, essayez d’identifier le problème et résolvez-le en conséquence.

Problème : Conflit

Cause : Se produit si une mise à jour corrective ou une mise à l’échelle est en cours. Une nouvelle opération ne peut pas être déclenchée.

Résolution : Attendez que le processus en cours se termine et réessayez.

Scénario : Mise à jour corrective

Problème : Échec du test de connectivité Internet. Les points de terminaison requis ne sont pas accessibles à partir du réseau virtuel

Cause : Problème réseau.

Résolution : Vérifiez qu’Instance SCOM gérée dispose d’un accès Internet sortant et que le groupe de sécurité réseau/pare-feu est correctement configuré pour autoriser l’accès aux points de terminaison requis, comme décrit dans les exigences relatives au pare-feu.

Problème : La notification est bloquée à la phase de récupération des mises à jour bien que l’opération de mise à jour soit terminée

Cause : Problème réseau/problème de développement.

Résolution : Essayez d’actualiser les mises à jour. Si le problème persiste, contactez le Support Microsoft.

Problème : L’état de mise à jour n’est pas reflété correctement sur la carte

Cause : Problème réseau/problème de développement.

Résolution : Essayez d’actualiser les mises à jour. Si le problème persiste, contactez le Support Microsoft.

Problème : Incohérence dans les contrôles de la carte

Cause : Problème de cohérence. Par exemple, le bouton de mise à jour est activé alors que le titre de la carte indique SCOM est à jour.

Résolution : Essayez d’actualiser. Si le problème persiste, contactez le Support Microsoft.

Problème : Un message d’avertissement s’affiche pour les mises à jour

Cause : Se produit pour l’une des raisons suivantes :

  1. Une nouvelle mise à jour est disponible et l’utilisateur n’a pas déclenché l’instance de mise à jour ; ou
  2. La dernière mise à jour a échoué et l’utilisateur n’a pas déclenché d’autre instance de mise à jour.

Résolution : Déclenchez une instance de mise à jour.

Problème : La mise à jour échoue après plusieurs nouvelles tentatives

Résolution : Pour résoudre ce problème, contactez le Support Microsoft.

Problème : La mise à jour échoue, et la restauration ne laisse pas d’état incohérent là où le nombre de machines virtuelles sur l’instance Virtual Machine Scale Sets a été modifié

Résolution : Accédez à la console System Center Operations Manager et supprimez les nœuds incohérents.

Problème : La mise à jour échoue, mais la mise à jour de la base de données réussit

Cause : Se produit suite à l’échec d’une mise à jour après la mise à jour réussie de la base de données.

Résolution : Réessayez après un certain temps.

Problème : Après une mise à jour réussie, la console System Center Operations Manager ne fonctionne pas correctement sur l’instance

Cause : Se produit si System Center Operations Manager n’est pas installé correctement ou si un processus est bloqué.

Résolution : Essayez de redémarrer l’instance. Si le problème persiste, contactez le support technique Microsoft.

Problème : La mise à jour prend plus de trois heures et finit par échouer

Cause : Se produit lorsque la mise à jour prend plus de trois heures.

Résolution : Contactez le Support Microsoft.

Problème : Problème intermittent pendant la mise à jour

Cause : Se produit si Service Fabric ou le RP plante ou redémarre.

Résolution : Redémarrez la mise à jour.

Problème : Une mise à l’échelle et une mise à jour corrective sont déclenchées simultanément, et échouent

Cause : Se produit si des demandes de mise à l’échelle et de mise à jour corrective sont envoyées et acceptées en même temps.

Résolution : Si vous avez déclenché une opération de mise à l’échelle, attendez que l’opération se termine avant d’essayer l’opération de mise à jour.

Problème : La mise à jour de l’extension prend plus de temps que prévu, et échoue

Cause : Se produit si SQL Managed Instance et Instance SCOM gérée se trouvent dans différentes régions ; pour cette raison, la mise à jour de l’extension prend plus de temps que prévu et finit par échouer.

Résolution : Placez SQL Managed Instance et Instance SCOM gérée dans la même région.

Problème : Après une mise à jour corrective, les données utilisateur dans la base de données sont modifiées ou ne sont pas conservées correctement

Cause : Se produit si la mise à jour n’a pas été effectuée correctement.

Résolution : Redémarrez la mise à jour.

Problème : Échec de la demande de mise à jour corrective

Cause : Se produit en raison d’un problème de portail ou ARM.

Résolution : Attendez un certain temps et réessayez. Si le problème persiste même après la résolution du problème de portail/ARM, contactez le Support Microsoft.

Problème : L’opération de mise à jour corrective ou de mise à l’échelle est déjà en cours ; réessayez après un certain temps.

Cause : Se produit si une opération de mise à jour corrective ou de mise à l’échelle est déjà en cours.

Résolution : Attendez la fin de l’opération existante et essayez après un certain temps.

Problème : Serveurs d’administration obsolètes visibles sur la console

Cause : Se produit si une opération de mise à jour corrective ou de mise à l’échelle a laissé un état incohérent après l’achèvement.

Résolution : Microsoft Azure Virtual Machine Scale Sets est utilisé pour approvisionner les serveurs d’administration pour les instances SCOM gérées. Pour supprimer le serveur d’administration obsolète du système, effectuez ces étapes :

  1. Accédez à Azure Virtual Machine Scale Sets et connectez-vous à l’un des serveurs d’administration de l’instance SCOM gérée.

  2. Lancez PowerShell en mode administratif et accédez au répertoire suivant.

    C:\Packages\Plugins\Microsoft.Azure.SCOMMIServer.ScomServerForWindows\<version>\bin\troubleshooter

    Remarque

    Pour trouver la version, accédez à C:\Packages\Plugins\Microsoft.Azure.SCOMMIServer.ScomServerForWindows et passez en revue toutes les versions disponibles, puis sélectionnez la dernière version.

  3. Exécutez le script suivant :

    .\RemoveStaleManagementServers.ps1 
    

    Le script est interactif et vous invite à entrer le nom de domaine complet du serveur obsolète.

  4. Fournissez le nom de domaine complet exact du serveur d’administration obsolète que vous souhaitez supprimer.

    Par exemple, nom de domaine complet : SCOMMI2000001.contoso.com.