Felsöka problem med Azure Monitor SCOM Managed Instance
I den här artikeln beskrivs de fel som kan uppstå när du distribuerar eller använder Azure Monitor SCOM Managed Instance och hur du löser dem.
Scenario: Skapa/distribuera SCOM Managed Instance
Allmän felsökning
- Kontrollera att alla krav är uppfyllda. Problem med att skapa kan uppstå på grund av felaktiga/ofullständiga krav.
- Kontrollera att du läser/kontrollerar felmeddelandet noggrant. Felmeddelandena samlar in problemet/felet vid skapandet.
- Kontrollera länken för SCOM-installationsloggar i felmeddelandet. Välj länken för att ladda ned installationsloggarna för System Center Operations Manager. Analysera loggarna för att identifiera och lösa fel/fel.
- Om du inte kan identifiera problemet med stegen ovan loggar du in på vm-skalningsuppsättningarna och kontrollerar loggarna under C:\WindowsAzure\Logs\Plugins\Microsoft.Azure.SCOMMIServer.ScomServerForWindows-versionen<>, vilket hjälper dig att identifiera problemet.
- Om problemet kvarstår skapar du ett supportärende med all relevant information [
correlation-id
,subscription-id
och så vidare]
Problem: Resursgruppen %ResourceGroupName%
hanteras av en annan Azure-resurs
Orsak: Inträffar när egenskapen ManagedBy har angetts för resursgruppen.
Lösning: Ange en annan resursgrupp med egenskapen ManagedBy som tom.
Problem: Det valda undernätet %SubnetName%
är dedikerat till en annan tjänst
Orsak: Inträffar när undernätet har delegeringar.
Lösning: Ange ett undernät som inte delegeras till någon annan tjänst.
Problem: Fel när SCOM Managed Instance inte kan nå SQL Managed Instance %instance%
Orsak: Det här felet kan orsakas av någon av följande orsaker:
- Siktlinjevisning saknas från SCOM Managed Instance VNet till SQL Managed Instance-slutpunkten.
- Saknar rätt nivå av NSG-regler för att tillåta trafik via en offentlig SLUTpunkt för SQL Managed Instance.
- MSI läggs inte till som Active Directory-administratör.
- SCOM Managed Instance kanske inte har läsbehörighet för SQL Managed Instance.
- Det kan finnas ett problem med ditt virtuella nätverk/din region.
Lösning:
- Ge läsbehörighet till SQL Managed Instance.
- MSI måste läggas till som Active Directory-administratör på SQL Managed Instance.
- Kontrollera anslutningen mellan SCOM Managed Instance- och SQL Managed Instance-nätverk. Mer information finns i Skapa och konfigurera en SQL Managed Instance.
Problem: Inte tillräckligt med kärnor för att skapa %instance%
i den angivna regionen
Orsak: Inträffar när det inte finns tillräckligt med kärnor för att skapa en instans i den angivna regionen.
Lösning: Kontrollera kvotavsnittet på Azure Portal och allokera fler kärnor av typen Standard Ds3v2 i regionen om det behövs.
Problem: Hemlig nyckel med samma namn finns redan i nyckelvalvet
Orsak: Inträffar när en annan hemlig nyckel med samma namn redan finns i nyckelvalvet.
Lösning: Ändra namnet på instansen.
Problem: Den virtuella datorn har rapporterat ett fel vid bearbetning av tillägget joindomain
för att ansluta till domänen %DomainName%
Orsak: Inträffar på grund av följande orsaker:
- Siktlinjesynlighet från SCOM Managed Instance Server till Domänkontrollant.
- Autentiseringsuppgifter för domänanvändare anges inte eller är felaktiga.
- Organisationsenhetssökväg för AD-domän tillhandahålls inte.
Lösning: Kontrollera orsaken och försök därför lösa problemet.
Problem: Statisk IP-adress används redan
Orsak: Inträffar om den statiska IP-adressen används av en annan instans.
Lösning: Använd en annan statisk IP-adress.
Problem: Ogiltig identitetstyp %identityType%
Orsak: Inträffar på grund av felaktig hanterad identitet.
Lösning: Ange en av de möjliga identitetstyperna ((Ingen), (SystemAssigned, UserAssigned)) och försök igen.
Problem: Privat statisk IP-adress %LbIpAddr%
tillhör inte undernätets intervall %subnet%
Orsak: Inträffar eftersom IP-adressen inte finns i undernätsintervallet.
Lösning: Ange en tillgänglig IP-adress från undernätsintervallet och försök utföra åtgärden igen.
Problem: Identiteten är inte systemadministratör på SQL Managed Instance: %instance.
Orsak: Inträffar på grund av följande orsaker:
- Användarhanterad identitet är inte SQL-administratör på SQL MI.
- Användarhanterad identitet bekräftas som SQL-administratör på SQL MI och den distribueras med hjälp av ARM, BICEP, Terraform eller någon annan distributionslösning.
Lösning: Se till att den användarhanterade identiteten distribueras med app-ID:t och inte ObjectId. Du kan bekräfta om detta är tillämpligt genom att gå till administrationsfönstret FÖR SQL MI, Microsoft Entra-ID. Kontrollera om guid som visas med användarhanterad identitet är ObjectId eller AppId för tjänstens huvudnamn. När det här är ObjectId:
- Ange det med hjälp av portalen
- Distribuera om med den lösning du föredrar med hjälp av AppId.
Scenario: Distribuera rapporter i Power BI
Problem: SQL Managed Instance kan inte nås
Orsak: Inträffar om den offentliga slutpunkten inte är aktiverad. Power BI kommer inte att kunna nå SQL Managed Instance.
Lösning: Kontrollera användarbehörigheterna för SQL Managed Instance och ange de behörigheter som krävs.
Problem: Det går inte att uppdatera autentiseringsuppgifterna för datauppsättningen
Orsak: Inträffar om användaren inte har rätt behörighet för SQL Managed Instance.
Lösning: Kontrollera användarbehörigheterna för SQL Managed Instance och ange de behörigheter som krävs.
Problem: Det går inte att uppdatera rapporten
Orsak: Inträffar på grund av stor datastorlek. Rapporten kanske inte uppdateras.
Lösning: Om Power BI-arbetsytan är på pro-nivå ändrar du den till premiumnivå eller ändrar arbetsytans kapacitet.
Scenario: Manuell upp-/nedskalning
Problem: Internetanslutningstestet misslyckades. Nödvändiga slutpunkter kan inte nås från det virtuella nätverket
Orsak: Nätverksproblem.
Lösning: Se till att SCOM Managed Instance har utgående Internetåtkomst och att NSG/brandväggen är korrekt konfigurerad för att tillåta åtkomst till de nödvändiga slutpunkterna enligt beskrivningen i brandväggskraven.
Problem: Kvoten har överskridits
Orsak: Inträffar om det inte finns några kärnor tillgängliga för skalning.
Lösning: Öka antalet kärnor i prenumerationen.
Kontrollera kvotavsnittet på Azure Portal och allokera fler kärnor av typen Standard Ds3v2 i regionen om det behövs.
Problem: Tilläggsetableringsfel
Orsak: Det här felet kan inträffa under etableringen av System Center Operations Manager-tillägget eller Installationen av System Center Operations Manager.
Lösning: Kontrollera den allmänna felsökningen, försök att identifiera problemet och åtgärda det i enlighet med detta.
Problem: Konflikt
Orsak: Inträffar om korrigeringar eller skalning pågår. Det går inte att utlösa en ny åtgärd.
Lösning: Vänta tills den pågående processen har slutförts och försök igen.
Scenario: Korrigering
Problem: Internetanslutningstestet misslyckades. Nödvändiga slutpunkter kan inte nås från det virtuella nätverket
Orsak: Nätverksproblem.
Lösning: Se till att SCOM Managed Instance har utgående Internetåtkomst och att NSG/brandväggen är korrekt konfigurerad för att tillåta åtkomst till de nödvändiga slutpunkterna enligt beskrivningen i brandväggskraven.
Problem: Meddelandet har fastnat vid Hämtning av uppdateringar trots att uppdateringsåtgärden är klar
Orsak: Problem med nätverk/utveckling.
Lösning: Prova att uppdatera för uppdateringar. Kontakta Microsofts support om du inte har löst problemet.
Problem: Uppdateringstillståndet återspeglas inte korrekt på kortet
Orsak: Problem med nätverk/utveckling.
Lösning: Prova att uppdatera för uppdateringar. Kontakta Microsofts support om du inte har löst problemet.
Problem: Inkonsekvens i kontrollerna i kortet
Orsak: Konsekvensproblem. Uppdateringsknappen är till exempel aktiverad även om kortets rubrik läser SCOM är uppdaterad.
Lösning: Prova att uppdatera. Kontakta Microsofts support om du inte har löst problemet.
Problem: Varningsmeddelande visas för uppdateringar
Orsak: Inträffar på grund av någon av följande orsaker:
- Ny uppdatering är tillgänglig och användaren har inte utlöst uppdateringsinstansen. eller
- Den senaste uppdateringen misslyckades och användaren har inte utlöst någon annan uppdateringsinstans.
Lösning: Utlös en uppdateringsinstans.
Problem: Uppdateringen misslyckas efter flera återförsök
Lösning: Kontakta Microsofts support för att lösa problemet.
Problem: Uppdateringen misslyckas och återställningen kan inte lämna ett inkonsekvent tillstånd där antalet virtuella datorer på vm-skalningsuppsättningarna har ändrats
Lösning: Gå till System Center Operations Manager-konsolen och ta bort inkonsekventa noder.
Problem: Uppdateringen misslyckas men databasuppdateringen lyckas
Orsak: Inträffar på grund av misslyckad uppdatering efter den lyckade databasuppdateringen.
Lösning: Försök igen efter en stund.
Problem: System Center Operations Manager-konsolen fungerar inte korrekt på instansen efter en lyckad uppdatering
Orsak: Inträffar om System Center Operations Manager inte är korrekt installerat eller om någon process kan ha fastnat.
Lösning: Försök att starta om instansen. Kontakta Microsofts supportavdelning om problemet kvarstår.
Problem: Uppdateringen tar mer än 3 timmar och misslyckas så småningom
Orsak: Inträffar när uppdateringen tar mer än 3 timmar.
Lösning: Kontakta Microsofts support.
Problem: Ett tillfälligt problem under uppdateringen
Orsak: Inträffar om service fabric eller RP kraschar eller startas om.
Lösning: Starta om uppdateringen.
Problem: Skalning och korrigering utlöses samtidigt och misslyckas sedan
Orsak: Inträffar om skalnings- och korrigeringsbegäranden skickas och godkänns samtidigt.
Lösning: Om du har utlöst en skalningsåtgärd väntar du tills åtgärden har slutförts innan du försöker uppdatera åtgärden.
Problem: Tillägget tar längre tid att uppdatera och misslyckas
Orsak: Inträffar om SQL Managed Instance och SCOM Managed Instance finns i olika regioner på grund av vilka tillägget tar mer tid att uppdatera och slutligen misslyckas.
Lösning: Ha SQL Managed Instance och SCOM Managed Instance i samma region.
Problem: Efter korrigeringen ändras användardata i databasen eller behålls inte korrekt
Orsak: Inträffar om uppdateringen inte har utförts korrekt.
Lösning: Starta om uppdateringen.
Problem: Det går inte att korrigera begäran
Orsak: Inträffar på grund av portal- eller ARM-problem.
Lösning: Vänta en stund och försök igen. Om problemet finns även efter att du har åtgärdat portalen/ARM-problemet kontaktar du Microsofts support.
Problem: Korrigerings- eller skalningsåtgärden pågår redan och försök igen efter en tid.
Orsak: Inträffar om en korrigerings- eller skalningsåtgärd redan pågår.
Lösning: Vänta tills den befintliga åtgärden har slutförts och försök efter en stund.
Problem: Inaktuella hanteringsservrar visas i konsolen
Orsak: Inträffar om en korrigerings- eller skalningsåtgärd har lämnat ett inkonsekvent tillstånd efter slutförandet.
Lösning: Microsoft Azure Virtual Machine Scale Sets används för att etablera hanteringsservrarna för SCOM-hanterade instanser. Följ dessa steg för att ta bort den inaktuella hanteringsservern från systemet:
Få åtkomst till Azure Virtual Machine Scale Sets och logga in på en av hanteringsservrarna för SCOM Managed Instance.
Starta PowerShell i administrativt läge och gå till följande katalog.
C:\Packages\Plugins\Microsoft.Azure.SCOMMIServer.ScomServerForWindows\<version>\bin\troubleshooter
Kommentar
Om du vill hitta versionen går du till
C:\Packages\Plugins\Microsoft.Azure.SCOMMIServer.ScomServerForWindows
och granskar alla tillgängliga versioner och väljer sedan den senaste versionen.Kör följande skript:
.\RemoveStaleManagementServers.ps1
Skriptet är interaktivt och du uppmanas att ange det fullständiga domännamnet för den inaktuella servern.
Ange det korrekta fullständiga domännamnet för den inaktuella hanteringsserver som du vill ta bort.
Till exempel FQDN: SCOMMI2000001.contoso.com.