Rozwiązywanie problemów z wystąpieniem zarządzanym SCOM usługi Azure Monitor
W tym artykule opisano błędy, które mogą wystąpić podczas wdrażania lub używania wystąpienia zarządzanego programu Azure Monitor SCOM oraz sposoby ich rozwiązywania.
Scenariusz: tworzenie/wdrażanie wystąpienia zarządzanego programu SCOM
Ogólne wskazówki dotyczące rozwiązywania problemów
- Upewnij się, że zostały spełnione wszystkie wymagania wstępne. Problemy z tworzeniem mogą wystąpić z powodu nieprawidłowych/niekompletnych wymagań wstępnych.
- Upewnij się, że uważnie czytasz/sprawdzasz komunikat o błędzie. Komunikaty o błędach przechwytują problem/błąd podczas tworzenia.
- Sprawdź link Dzienniki instalacji programu SCOM podany w komunikacie o błędzie. Wybierz link, aby pobrać dzienniki instalacji programu System Center Operations Manager. Przeanalizuj dzienniki, aby zidentyfikować i usunąć błędy/błędy.
- Jeśli nie możesz zidentyfikować problemu z powyższymi krokami, zaloguj się do wystąpienia Virtual Machine Scale Sets i sprawdź dzienniki w folderze C:\WindowsAzure\Logs\Plugins\Microsoft.Azure.SCOMMIServer.ScomServerForWindows\1.0.66, co pomaga zidentyfikować problem.
- Jeśli problem będzie się powtarzać, zgłoś bilet pomocy technicznej ze wszystkimi odpowiednimi szczegółami [
correlation-id
,subscription-id
itd.]
Problem: Grupa %ResourceGroupName%
zasobów jest zarządzana przez inny zasób platformy Azure
Przyczyna: występuje, gdy właściwość ManagedBy jest ustawiona dla grupy zasobów.
Rozwiązanie: podaj inną grupę zasobów z właściwością ManagedBy jako pustą.
Problem: Wybrana podsieć %SubnetName%
jest dedykowana innej usłudze
Przyczyna: występuje, gdy podsieć ma delegacje.
Rozwiązanie: podaj podsieć, która nie jest delegowana do żadnej innej usługi.
Problem: Błąd, gdy wystąpienie zarządzane SCOM nie może nawiązać połączenia z SQL Managed Instance %instance%
Przyczyna: Ten błąd może być spowodowany dowolnym z następujących powodów:
- Brak widoczności widoku z sieci wirtualnej wystąpienia zarządzanego SCOM do punktu końcowego SQL Managed Instance.
- Brak odpowiedniego poziomu reguł sieciowej grupy zabezpieczeń w celu zezwolenia na ruch przez publiczny punkt końcowy SQL Managed Instance.
- Tożsamość usługi zarządzanej nie jest dodawana jako administrator usługi Active Directory.
- Wystąpienie zarządzane SCOM może nie mieć uprawnień do odczytu w SQL Managed Instance.
- Może wystąpić problem z siecią wirtualną/regionem.
Rozwiązanie:
- Podaj uprawnienie do odczytu do SQL Managed Instance.
- Tożsamość usługi zarządzanej musi zostać dodana jako administrator usługi Active Directory w SQL Managed Instance.
- Zapewnij łączność między wystąpieniem zarządzanym SCOM i sieciami SQL Managed Instance. Aby uzyskać więcej informacji, zobacz Tworzenie i konfigurowanie SQL Managed Instance.
Problem: Za mało rdzeni do utworzenia %instance%
w danym regionie
Przyczyna: występuje, gdy nie ma wystarczającej liczby rdzeni, aby utworzyć wystąpienie w danym regionie.
Rozwiązanie: Sprawdź sekcję przydziału dla Azure Portal i w razie potrzeby przydziel więcej rdzeni typu Standardowa Ds3v2 w regionie.
Problem: Klucz tajny o tej samej nazwie już istnieje w magazynie kluczy
Przyczyna: występuje, gdy w magazynie kluczy znajduje się już inny klucz tajny o tej samej nazwie.
Rozwiązanie: zmień nazwę wystąpienia.
Problem: Maszyna wirtualna zgłosiła błąd podczas przetwarzania rozszerzenia joindomain
w celu dołączenia do domeny %DomainName%
Przyczyna: Występuje z następujących powodów:
- Widoczność widoku z serwera wystąpienia zarządzanego SCOM do kontrolera domeny.
- Poświadczenia użytkownika domeny nie są podane ani niepoprawne.
- Nie podano ścieżki jednostki organizacyjnej dla domeny usługi AD.
Rozwiązanie: Sprawdź przyczynę i odpowiednio spróbuj rozwiązać problem.
Problem: statyczny adres IP jest już używany
Przyczyna: występuje, jeśli statyczny adres IP jest używany przez inne wystąpienie.
Rozwiązanie: użyj innego statycznego adresu IP.
Problem: Nieprawidłowy typ tożsamości %identityType%
Przyczyna: występuje z powodu nieprawidłowej tożsamości zarządzanej.
Rozwiązanie: podaj jeden z możliwych typów tożsamości ((Brak), (SystemAssigned,UserAssigned)) i spróbuj ponownie.
Problem: Prywatny statyczny adres %LbIpAddr%
IP nie należy do zakresu podsieci %subnet%
Przyczyna: występuje, ponieważ adres IP nie znajduje się w zakresie podsieci.
Rozwiązanie: podaj dostępny adres IP z zakresu podsieci i spróbuj ponownie wykonać operację.
Scenariusz: wdrażanie raportów w usłudze Power BI
Problem: SQL Managed Instance nie jest osiągalny
Przyczyna: występuje, jeśli publiczny punkt końcowy nie jest włączony. Usługa Power BI nie będzie mogła nawiązać połączenia z SQL Managed Instance.
Rozwiązanie: Sprawdź uprawnienia użytkownika w SQL Managed Instance i podaj wymagane uprawnienia.
Problem: Nie można odświeżyć poświadczeń zestawu danych
Przyczyna: występuje, jeśli użytkownik nie ma odpowiednich uprawnień do SQL Managed Instance.
Rozwiązanie: Sprawdź uprawnienia użytkownika w SQL Managed Instance i podaj wymagane uprawnienia.
Problem: Raport nie może odświeżyć
Przyczyna: występuje z powodu dużego rozmiaru danych. Raport może nie zostać odświeżyny.
Rozwiązanie: jeśli obszar roboczy usługi Power BI znajduje się w warstwie Pro , zmień go na warstwę Premium lub zmień pojemność obszaru roboczego.
Scenariusz: Ręczne skalowanie w górę/w dół
Problem: Test łączności z Internetem nie powiódł się. Wymagane punkty końcowe nie są dostępne z sieci wirtualnej
Przyczyna: Problem z siecią.
Rozwiązanie: Upewnij się, że wystąpienie zarządzane programu SCOM ma wychodzący dostęp do Internetu, a sieciowa grupa zabezpieczeń/zapora została prawidłowo skonfigurowana tak, aby zezwalać na dostęp do wymaganych punktów końcowych zgodnie z opisem w wymaganiach zapory.
Problem: Przekroczono limit przydziału
Przyczyna: występuje, jeśli nie ma dostępnych rdzeni do skalowania.
Rozwiązanie: zwiększ liczbę rdzeni w subskrypcji.
Sprawdź sekcję limitu przydziału dla Azure Portal i w razie potrzeby przydziel więcej rdzeni typu Standardowa Ds3v2 w regionie.
Problem: Błąd aprowizacji rozszerzeń
Przyczyna: Ten błąd może wystąpić podczas aprowizacji rozszerzenia programu System Center Operations Manager lub instalacji programu System Center Operations Manager.
Rozwiązanie: Sprawdź ogólne rozwiązywanie problemów, spróbuj zidentyfikować problem i odpowiednio go rozwiązać.
Problem: Konflikt
Przyczyna: występuje, jeśli trwa stosowanie poprawek lub skalowanie. Nie można wyzwolić nowej operacji.
Rozwiązanie: poczekaj na ukończenie trwającego procesu i spróbuj ponownie.
Scenariusz: Stosowanie poprawek
Problem: Test łączności z Internetem nie powiódł się. Wymagane punkty końcowe nie są dostępne z sieci wirtualnej
Przyczyna: Problem z siecią.
Rozwiązanie: Upewnij się, że wystąpienie zarządzane programu SCOM ma wychodzący dostęp do Internetu, a sieciowa grupa zabezpieczeń/zapora została prawidłowo skonfigurowana tak, aby zezwalać na dostęp do wymaganych punktów końcowych zgodnie z opisem w wymaganiach zapory.
Problem: Powiadomienie zostało zablokowane podczas pobierania aktualizacji , mimo że operacja aktualizacji została ukończona
Przyczyna: Problem z siecią/problem z programowaniem.
Rozwiązanie: spróbuj odświeżyć aktualizacje. Jeśli rozwiązanie nie zostanie rozwiązane, skontaktuj się z pomocą techniczną firmy Microsoft.
Problem: Stan aktualizacji nie jest poprawnie odzwierciedlany na karcie
Przyczyna: Problem z siecią/problem z programowaniem.
Rozwiązanie: spróbuj odświeżyć aktualizacje. Jeśli rozwiązanie nie zostanie rozwiązane, skontaktuj się z pomocą techniczną firmy Microsoft.
Problem: Niespójność w kontrolkach na karcie
Przyczyna: Problem ze spójnością. Na przykład przycisk aktualizacji jest włączony, mimo że tytuł karty odczytuje SCOM jest aktualny.
Rozwiązanie: spróbuj odświeżyć. Jeśli rozwiązanie nie zostanie rozwiązane, skontaktuj się z pomocą techniczną firmy Microsoft.
Problem: Pojawia się komunikat ostrzegawczy dotyczący aktualizacji
Przyczyna: Występuje z dowolnego z następujących powodów:
- Dostępna jest nowa aktualizacja, a użytkownik nie wyzwolił wystąpienia aktualizacji; Lub
- Ostatnia aktualizacja nie powiodła się, a użytkownik nie wyzwolił innego wystąpienia aktualizacji.
Rozwiązanie: wyzwalanie wystąpienia aktualizacji.
Problem: Aktualizacja kończy się niepowodzeniem po wielu ponownych próbach
Rozwiązanie: Aby rozwiązać ten problem, skontaktuj się z pomocą techniczną firmy Microsoft.
Problem: Aktualizacja kończy się niepowodzeniem i wycofanie nie może pozostawić niespójnego stanu, w którym liczba maszyn wirtualnych w wystąpieniu Virtual Machine Scale Sets została zmodyfikowana
Rozwiązanie: przejdź do konsoli programu System Center Operations Manager i usuń niespójne węzły.
Problem: Aktualizacja kończy się niepowodzeniem, ale aktualizacja bazy danych zakończyła się pomyślnie
Przyczyna: występuje z powodu nieudanej aktualizacji po pomyślnej aktualizacji bazy danych.
Rozwiązanie: spróbuj ponownie po pewnym czasie.
Problem: Po pomyślnej aktualizacji konsola programu System Center Operations Manager nie działa prawidłowo w wystąpieniu
Przyczyna: występuje, jeśli program System Center Operations Manager nie został poprawnie zainstalowany lub jakiś proces może zostać zablokowany.
Rozwiązanie: spróbuj ponownie uruchomić wystąpienie. Jeśli problem będzie się powtarzał, skontaktuj się z pomocą techniczną firmy Microsoft.
Problem: Aktualizacja trwa dłużej niż 3 godziny i ostatecznie kończy się niepowodzeniem
Przyczyna: występuje, gdy aktualizacja trwa dłużej niż 3 godziny.
Rozwiązanie: Skontaktuj się z pomocą techniczną firmy Microsoft.
Problem: Wystąpił sporadyczne problemy podczas aktualizacji
Przyczyna: występuje w przypadku awarii lub ponownego uruchomienia usługi Service Fabric lub RP.
Rozwiązanie: uruchom ponownie aktualizację.
Problem: Skalowanie i stosowanie poprawek wyzwolone jednocześnie, a następnie kończy się niepowodzeniem
Przyczyna: występuje, jeśli żądania skalowania i stosowania poprawek są wysyłane i akceptowane w tym samym czasie.
Rozwiązanie: w przypadku wyzwolenia operacji skalowania poczekaj na zakończenie operacji, zanim spróbujesz zaktualizować operację.
Problem: Aktualizacja rozszerzenia trwa dłużej i kończy się niepowodzeniem
Przyczyna: występuje, jeśli SQL Managed Instance i wystąpienie zarządzane SCOM znajdują się w różnych regionach, z powodu których aktualizacja rozszerzenia zajmuje więcej czasu i ostatecznie kończy się niepowodzeniem.
Rozwiązanie: mają SQL Managed Instance i wystąpienie zarządzane SCOM w tym samym regionie.
Problem: Po wprowadzeniu poprawek dane użytkowników w bazie danych są zmieniane lub nie są prawidłowo zachowywane
Przyczyna: występuje, jeśli aktualizacja nie została wykonana prawidłowo.
Rozwiązanie: uruchom ponownie aktualizację.
Problem: Żądanie stosowania poprawek kończy się niepowodzeniem
Przyczyna: występuje z powodu problemu z portalem lub usługą ARM.
Rozwiązanie: poczekaj chwilę i ponów próbę. Jeśli problem występuje nawet po rozwiązaniu problemu z portalem/usługą ARM, skontaktuj się z pomocą techniczną firmy Microsoft.
Problem: Operacja stosowania poprawek lub skalowania jest już w toku. Spróbuj ponownie po pewnym czasie.
Przyczyna: występuje, jeśli operacja stosowania poprawek lub skalowania jest już w toku.
Rozwiązanie: poczekaj na zakończenie istniejącej operacji i spróbuj po pewnym czasie.
Problem: Stare serwery zarządzania widoczne w konsoli
Przyczyna: występuje, jeśli operacja stosowania poprawek lub skalowania pozostawiła niespójny stan po zakończeniu.
Rozwiązanie: usługa Microsoft Azure Virtual Machine Scale Sets służy do aprowizowania serwerów zarządzania dla wystąpień zarządzanych programu SCOM. Aby usunąć nieaktywny serwer zarządzania z systemu, wykonaj następujące kroki:
Uzyskaj dostęp do usługi Azure Virtual Machine Scale Sets i zaloguj się do jednego z serwerów zarządzania dla wystąpienia zarządzanego programu SCOM.
Uruchom program PowerShell w trybie administracyjnym i przejdź do następującego katalogu.
C:\Packages\Plugins\Microsoft.Azure.SCOMMIServer.ScomServerForWindows\<version>\bin\troubleshooter
Uwaga
Aby znaleźć wersję, przejdź do
C:\Packages\Plugins\Microsoft.Azure.SCOMMIServer.ScomServerForWindows
strony i przejrzyj wszystkie dostępne wersje, a następnie wybierz najnowszą.Wykonaj następujący skrypt:
.\RemoveStaleManagementServers.ps1
Skrypt jest interaktywny i monituje o nazwę FQDN nieaktualnego serwera.
Podaj dokładną nazwę FQDN nieaktualnego serwera zarządzania, który chcesz usunąć.
Na przykład nazwa FQDN: SCOMMI2000001.contoso.com.
Opinia
https://aka.ms/ContentUserFeedback.
Dostępne już wkrótce: W 2024 r. będziemy stopniowo wycofywać zgłoszenia z serwisu GitHub jako mechanizm przesyłania opinii na temat zawartości i zastępować go nowym systemem opinii. Aby uzyskać więcej informacji, sprawdź:Prześlij i wyświetl opinię dla