Rozwiązywanie problemów z wystąpieniem zarządzanym SCOM usługi Azure Monitor

W tym artykule opisano błędy, które mogą wystąpić podczas wdrażania lub używania wystąpienia zarządzanego programu Azure Monitor SCOM oraz sposoby ich rozwiązywania.

Scenariusz: tworzenie/wdrażanie wystąpienia zarządzanego programu SCOM

Ogólne wskazówki dotyczące rozwiązywania problemów

  1. Upewnij się, że zostały spełnione wszystkie wymagania wstępne. Problemy z tworzeniem mogą wystąpić z powodu nieprawidłowych/niekompletnych wymagań wstępnych.
  2. Upewnij się, że uważnie czytasz/sprawdzasz komunikat o błędzie. Komunikaty o błędach przechwytują problem/błąd podczas tworzenia.
  3. Sprawdź link Dzienniki instalacji programu SCOM podany w komunikacie o błędzie. Wybierz link, aby pobrać dzienniki instalacji programu System Center Operations Manager. Przeanalizuj dzienniki, aby zidentyfikować i usunąć błędy/błędy.
  4. Jeśli nie możesz zidentyfikować problemu z powyższymi krokami, zaloguj się do wystąpienia Virtual Machine Scale Sets i sprawdź dzienniki w folderze C:\WindowsAzure\Logs\Plugins\Microsoft.Azure.SCOMMIServer.ScomServerForWindows\1.0.66, co pomaga zidentyfikować problem.
  5. Jeśli problem będzie się powtarzać, zgłoś bilet pomocy technicznej ze wszystkimi odpowiednimi szczegółami [correlation-id, subscription-iditd.]

Problem: Grupa %ResourceGroupName% zasobów jest zarządzana przez inny zasób platformy Azure

Przyczyna: występuje, gdy właściwość ManagedBy jest ustawiona dla grupy zasobów.

Rozwiązanie: podaj inną grupę zasobów z właściwością ManagedBy jako pustą.

Problem: Wybrana podsieć %SubnetName% jest dedykowana innej usłudze

Przyczyna: występuje, gdy podsieć ma delegacje.

Rozwiązanie: podaj podsieć, która nie jest delegowana do żadnej innej usługi.

Problem: Błąd, gdy wystąpienie zarządzane SCOM nie może nawiązać połączenia z SQL Managed Instance %instance%

Przyczyna: Ten błąd może być spowodowany dowolnym z następujących powodów:

  • Brak widoczności widoku z sieci wirtualnej wystąpienia zarządzanego SCOM do punktu końcowego SQL Managed Instance.
  • Brak odpowiedniego poziomu reguł sieciowej grupy zabezpieczeń w celu zezwolenia na ruch przez publiczny punkt końcowy SQL Managed Instance.
  • Tożsamość usługi zarządzanej nie jest dodawana jako administrator usługi Active Directory.
  • Wystąpienie zarządzane SCOM może nie mieć uprawnień do odczytu w SQL Managed Instance.
  • Może wystąpić problem z siecią wirtualną/regionem.

Rozwiązanie:

  • Podaj uprawnienie do odczytu do SQL Managed Instance.
  • Tożsamość usługi zarządzanej musi zostać dodana jako administrator usługi Active Directory w SQL Managed Instance.
  • Zapewnij łączność między wystąpieniem zarządzanym SCOM i sieciami SQL Managed Instance. Aby uzyskać więcej informacji, zobacz Tworzenie i konfigurowanie SQL Managed Instance.

Problem: Za mało rdzeni do utworzenia %instance% w danym regionie

Przyczyna: występuje, gdy nie ma wystarczającej liczby rdzeni, aby utworzyć wystąpienie w danym regionie.

Rozwiązanie: Sprawdź sekcję przydziału dla Azure Portal i w razie potrzeby przydziel więcej rdzeni typu Standardowa Ds3v2 w regionie.

Problem: Klucz tajny o tej samej nazwie już istnieje w magazynie kluczy

Przyczyna: występuje, gdy w magazynie kluczy znajduje się już inny klucz tajny o tej samej nazwie.

Rozwiązanie: zmień nazwę wystąpienia.

Problem: Maszyna wirtualna zgłosiła błąd podczas przetwarzania rozszerzenia joindomain w celu dołączenia do domeny %DomainName%

Przyczyna: Występuje z następujących powodów:

  1. Widoczność widoku z serwera wystąpienia zarządzanego SCOM do kontrolera domeny.
  2. Poświadczenia użytkownika domeny nie są podane ani niepoprawne.
  3. Nie podano ścieżki jednostki organizacyjnej dla domeny usługi AD.

Rozwiązanie: Sprawdź przyczynę i odpowiednio spróbuj rozwiązać problem.

Problem: statyczny adres IP jest już używany

Przyczyna: występuje, jeśli statyczny adres IP jest używany przez inne wystąpienie.

Rozwiązanie: użyj innego statycznego adresu IP.

Problem: Nieprawidłowy typ tożsamości %identityType%

Przyczyna: występuje z powodu nieprawidłowej tożsamości zarządzanej.

Rozwiązanie: podaj jeden z możliwych typów tożsamości ((Brak), (SystemAssigned,UserAssigned)) i spróbuj ponownie.

Problem: Prywatny statyczny adres %LbIpAddr% IP nie należy do zakresu podsieci %subnet%

Przyczyna: występuje, ponieważ adres IP nie znajduje się w zakresie podsieci.

Rozwiązanie: podaj dostępny adres IP z zakresu podsieci i spróbuj ponownie wykonać operację.

Scenariusz: wdrażanie raportów w usłudze Power BI

Problem: SQL Managed Instance nie jest osiągalny

Przyczyna: występuje, jeśli publiczny punkt końcowy nie jest włączony. Usługa Power BI nie będzie mogła nawiązać połączenia z SQL Managed Instance.

Rozwiązanie: Sprawdź uprawnienia użytkownika w SQL Managed Instance i podaj wymagane uprawnienia.

Problem: Nie można odświeżyć poświadczeń zestawu danych

Przyczyna: występuje, jeśli użytkownik nie ma odpowiednich uprawnień do SQL Managed Instance.

Rozwiązanie: Sprawdź uprawnienia użytkownika w SQL Managed Instance i podaj wymagane uprawnienia.

Problem: Raport nie może odświeżyć

Przyczyna: występuje z powodu dużego rozmiaru danych. Raport może nie zostać odświeżyny.

Rozwiązanie: jeśli obszar roboczy usługi Power BI znajduje się w warstwie Pro , zmień go na warstwę Premium lub zmień pojemność obszaru roboczego.

Scenariusz: Ręczne skalowanie w górę/w dół

Problem: Test łączności z Internetem nie powiódł się. Wymagane punkty końcowe nie są dostępne z sieci wirtualnej

Przyczyna: Problem z siecią.

Rozwiązanie: Upewnij się, że wystąpienie zarządzane programu SCOM ma wychodzący dostęp do Internetu, a sieciowa grupa zabezpieczeń/zapora została prawidłowo skonfigurowana tak, aby zezwalać na dostęp do wymaganych punktów końcowych zgodnie z opisem w wymaganiach zapory.

Problem: Przekroczono limit przydziału

Przyczyna: występuje, jeśli nie ma dostępnych rdzeni do skalowania.

Rozwiązanie: zwiększ liczbę rdzeni w subskrypcji.

Sprawdź sekcję limitu przydziału dla Azure Portal i w razie potrzeby przydziel więcej rdzeni typu Standardowa Ds3v2 w regionie.

Problem: Błąd aprowizacji rozszerzeń

Przyczyna: Ten błąd może wystąpić podczas aprowizacji rozszerzenia programu System Center Operations Manager lub instalacji programu System Center Operations Manager.

Rozwiązanie: Sprawdź ogólne rozwiązywanie problemów, spróbuj zidentyfikować problem i odpowiednio go rozwiązać.

Problem: Konflikt

Przyczyna: występuje, jeśli trwa stosowanie poprawek lub skalowanie. Nie można wyzwolić nowej operacji.

Rozwiązanie: poczekaj na ukończenie trwającego procesu i spróbuj ponownie.

Scenariusz: Stosowanie poprawek

Problem: Test łączności z Internetem nie powiódł się. Wymagane punkty końcowe nie są dostępne z sieci wirtualnej

Przyczyna: Problem z siecią.

Rozwiązanie: Upewnij się, że wystąpienie zarządzane programu SCOM ma wychodzący dostęp do Internetu, a sieciowa grupa zabezpieczeń/zapora została prawidłowo skonfigurowana tak, aby zezwalać na dostęp do wymaganych punktów końcowych zgodnie z opisem w wymaganiach zapory.

Problem: Powiadomienie zostało zablokowane podczas pobierania aktualizacji , mimo że operacja aktualizacji została ukończona

Przyczyna: Problem z siecią/problem z programowaniem.

Rozwiązanie: spróbuj odświeżyć aktualizacje. Jeśli rozwiązanie nie zostanie rozwiązane, skontaktuj się z pomocą techniczną firmy Microsoft.

Problem: Stan aktualizacji nie jest poprawnie odzwierciedlany na karcie

Przyczyna: Problem z siecią/problem z programowaniem.

Rozwiązanie: spróbuj odświeżyć aktualizacje. Jeśli rozwiązanie nie zostanie rozwiązane, skontaktuj się z pomocą techniczną firmy Microsoft.

Problem: Niespójność w kontrolkach na karcie

Przyczyna: Problem ze spójnością. Na przykład przycisk aktualizacji jest włączony, mimo że tytuł karty odczytuje SCOM jest aktualny.

Rozwiązanie: spróbuj odświeżyć. Jeśli rozwiązanie nie zostanie rozwiązane, skontaktuj się z pomocą techniczną firmy Microsoft.

Problem: Pojawia się komunikat ostrzegawczy dotyczący aktualizacji

Przyczyna: Występuje z dowolnego z następujących powodów:

  1. Dostępna jest nowa aktualizacja, a użytkownik nie wyzwolił wystąpienia aktualizacji; Lub
  2. Ostatnia aktualizacja nie powiodła się, a użytkownik nie wyzwolił innego wystąpienia aktualizacji.

Rozwiązanie: wyzwalanie wystąpienia aktualizacji.

Problem: Aktualizacja kończy się niepowodzeniem po wielu ponownych próbach

Rozwiązanie: Aby rozwiązać ten problem, skontaktuj się z pomocą techniczną firmy Microsoft.

Problem: Aktualizacja kończy się niepowodzeniem i wycofanie nie może pozostawić niespójnego stanu, w którym liczba maszyn wirtualnych w wystąpieniu Virtual Machine Scale Sets została zmodyfikowana

Rozwiązanie: przejdź do konsoli programu System Center Operations Manager i usuń niespójne węzły.

Problem: Aktualizacja kończy się niepowodzeniem, ale aktualizacja bazy danych zakończyła się pomyślnie

Przyczyna: występuje z powodu nieudanej aktualizacji po pomyślnej aktualizacji bazy danych.

Rozwiązanie: spróbuj ponownie po pewnym czasie.

Problem: Po pomyślnej aktualizacji konsola programu System Center Operations Manager nie działa prawidłowo w wystąpieniu

Przyczyna: występuje, jeśli program System Center Operations Manager nie został poprawnie zainstalowany lub jakiś proces może zostać zablokowany.

Rozwiązanie: spróbuj ponownie uruchomić wystąpienie. Jeśli problem będzie się powtarzał, skontaktuj się z pomocą techniczną firmy Microsoft.

Problem: Aktualizacja trwa dłużej niż 3 godziny i ostatecznie kończy się niepowodzeniem

Przyczyna: występuje, gdy aktualizacja trwa dłużej niż 3 godziny.

Rozwiązanie: Skontaktuj się z pomocą techniczną firmy Microsoft.

Problem: Wystąpił sporadyczne problemy podczas aktualizacji

Przyczyna: występuje w przypadku awarii lub ponownego uruchomienia usługi Service Fabric lub RP.

Rozwiązanie: uruchom ponownie aktualizację.

Problem: Skalowanie i stosowanie poprawek wyzwolone jednocześnie, a następnie kończy się niepowodzeniem

Przyczyna: występuje, jeśli żądania skalowania i stosowania poprawek są wysyłane i akceptowane w tym samym czasie.

Rozwiązanie: w przypadku wyzwolenia operacji skalowania poczekaj na zakończenie operacji, zanim spróbujesz zaktualizować operację.

Problem: Aktualizacja rozszerzenia trwa dłużej i kończy się niepowodzeniem

Przyczyna: występuje, jeśli SQL Managed Instance i wystąpienie zarządzane SCOM znajdują się w różnych regionach, z powodu których aktualizacja rozszerzenia zajmuje więcej czasu i ostatecznie kończy się niepowodzeniem.

Rozwiązanie: mają SQL Managed Instance i wystąpienie zarządzane SCOM w tym samym regionie.

Problem: Po wprowadzeniu poprawek dane użytkowników w bazie danych są zmieniane lub nie są prawidłowo zachowywane

Przyczyna: występuje, jeśli aktualizacja nie została wykonana prawidłowo.

Rozwiązanie: uruchom ponownie aktualizację.

Problem: Żądanie stosowania poprawek kończy się niepowodzeniem

Przyczyna: występuje z powodu problemu z portalem lub usługą ARM.

Rozwiązanie: poczekaj chwilę i ponów próbę. Jeśli problem występuje nawet po rozwiązaniu problemu z portalem/usługą ARM, skontaktuj się z pomocą techniczną firmy Microsoft.

Problem: Operacja stosowania poprawek lub skalowania jest już w toku. Spróbuj ponownie po pewnym czasie.

Przyczyna: występuje, jeśli operacja stosowania poprawek lub skalowania jest już w toku.

Rozwiązanie: poczekaj na zakończenie istniejącej operacji i spróbuj po pewnym czasie.

Problem: Stare serwery zarządzania widoczne w konsoli

Przyczyna: występuje, jeśli operacja stosowania poprawek lub skalowania pozostawiła niespójny stan po zakończeniu.

Rozwiązanie: usługa Microsoft Azure Virtual Machine Scale Sets służy do aprowizowania serwerów zarządzania dla wystąpień zarządzanych programu SCOM. Aby usunąć nieaktywny serwer zarządzania z systemu, wykonaj następujące kroki:

  1. Uzyskaj dostęp do usługi Azure Virtual Machine Scale Sets i zaloguj się do jednego z serwerów zarządzania dla wystąpienia zarządzanego programu SCOM.

  2. Uruchom program PowerShell w trybie administracyjnym i przejdź do następującego katalogu.

    C:\Packages\Plugins\Microsoft.Azure.SCOMMIServer.ScomServerForWindows\<version>\bin\troubleshooter

    Uwaga

    Aby znaleźć wersję, przejdź do C:\Packages\Plugins\Microsoft.Azure.SCOMMIServer.ScomServerForWindows strony i przejrzyj wszystkie dostępne wersje, a następnie wybierz najnowszą.

  3. Wykonaj następujący skrypt:

    .\RemoveStaleManagementServers.ps1 
    

    Skrypt jest interaktywny i monituje o nazwę FQDN nieaktualnego serwera.

  4. Podaj dokładną nazwę FQDN nieaktualnego serwera zarządzania, który chcesz usunąć.

    Na przykład nazwa FQDN: SCOMMI2000001.contoso.com.