Rozwiązanie Agent Health w usłudze Azure Monitor

Rozwiązanie Agent Health na platformie Azure pomaga zrozumieć, którzy agenci monitorowania nie odpowiadają i przesyłają dane operacyjne. Obejmuje to wszystkich agentów raportujących bezpośrednio do obszaru roboczego usługi Log Analytics w usłudze Azure Monitor lub do grupy zarządzania programu System Center Operations Manager połączonej z usługą Azure Monitor.

Możesz również użyć rozwiązania Agent Health, aby:

  • Śledź liczbę wdrożonych agentów i lokalizację ich dystrybucji geograficznej.
  • Wykonaj inne zapytania, aby zachować świadomość dystrybucji agentów wdrożonych na platformie Azure, w innych środowiskach w chmurze lub lokalnie.

Ważne

Rozwiązanie Agent Health monitoruje tylko kondycję agenta usługi Log Analytics , który znajduje się na ścieżce wycofania. To rozwiązanie nie monitoruje kondycji agenta usługi Azure Monitor.

Wymagania wstępne

Przed wdrożeniem tego rozwiązania upewnij się, że obsługiwani agenci systemu Windows są raportowani do obszaru roboczego usługi Log Analytics lub raportowania do grupy zarządzania programu Operations Manager zintegrowanej z obszarem roboczym.

Pakiety administracyjne

Jeśli grupa zarządzania programu Operations Manager jest połączona z obszarem roboczym usługi Log Analytics, następujące pakiety administracyjne są instalowane w programie Operations Manager. Te pakiety administracyjne są również instalowane na bezpośrednio połączonych komputerach z systemem Windows po dodaniu tego rozwiązania:

  • Microsoft System Center Advisor HealthAssessment Direct Channel Intelligence Pack (Microsoft.IntelligencePacks.HealthAssessmentDirect)
  • Microsoft System Center Advisor HealthAssessment Server Channel Intelligence Pack (Microsoft.IntelligencePacks.HealthAssessmentViaServer)

Nie ma nic do skonfigurowania tych pakietów administracyjnych ani zarządzania nimi. Aby uzyskać więcej informacji na temat aktualizowania pakietów administracyjnych rozwiązania, zobacz artykuł Connect Operations Manager to Log Analytics (Połączenie programu Operations Manager z usługą Log Analytics).

Konfigurowanie

Dodaj rozwiązanie Agent Health do obszaru roboczego usługi Log Analytics przy użyciu procesu opisanego w temacie Dodawanie rozwiązań. Nie trzeba już nic konfigurować.

Obsługiwani agenci

W poniższej tabeli opisano połączone źródła obsługiwane przez to rozwiązanie.

Połączone źródło Obsługiwane Opis
Agenci dla systemu Windows Tak Zdarzenia pulsu są zbierane z bezpośrednich agentów systemu Windows.
Grupa zarządzania programu System Center Operations Manager Tak Zdarzenia pulsu są zbierane z agentów raportujących do grupy zarządzania co 60 sekund, a następnie przekazywane do usługi Azure Monitor. Bezpośrednie połączenie agentów programu Operations Manager z usługą Azure Monitor nie jest wymagane. Dane zdarzenia pulsu są przekazywane z grupy zarządzania do obszaru roboczego usługi Log Analytics.

Korzystanie z rozwiązania

Po dodaniu rozwiązania do obszaru roboczego usługi Log Analytics kafelek Kondycja agenta zostanie dodany do pulpitu nawigacyjnego. Ten kafelek pokazuje całkowitą liczbę agentów oraz liczbę nieodpowiadających agentów w ciągu ostatnich 24 godzin.

Zrzut ekranu przedstawiający kafelek Kondycja agenta na pulpicie nawigacyjnym.

Wybierz kafelek Agent Health , aby otworzyć pulpit nawigacyjny kondycji agenta . Na pulpicie nawigacyjnym znajdują się kolumny wymienione w poniższej tabeli. Każda kolumna zawiera listę 10 najważniejszych zdarzeń według liczby, które spełniają kryteria tej kolumny dla określonego zakresu czasu. Możesz uruchomić wyszukiwanie w dzienniku, które udostępnia całą listę. Wybierz pozycję Zobacz wszystko pod każdą kolumną lub wybierz nagłówek kolumny.

Kolumna Opis
Liczba agentów w miarę upływu czasu Trend liczby agentów w ciągu siedmiu dni dla agentów systemów Linux i Windows
Liczba nieodpowiadających agentów Lista agentów, którzy nie wysłali pulsu w ciągu ostatnich 24 godzin
Rozkład według typu systemu operacyjnego Partycja liczby agentów systemu Windows i Linux w środowisku
Dystrybucja według wersji agenta Partycja wersji agenta zainstalowanych w środowisku i liczba każdej z nich
Dystrybucja według kategorii agentów Partycja kategorii agentów wysyłających zdarzenia pulsu: agentów bezpośrednich, agentów programu Operations Manager lub serwera zarządzania programu Operations Manager
Dystrybucja według grupy zarządzania Partycja grup zarządzania programu Operations Manager w środowisku
Lokalizacja geograficzna agentów Partycja krajów/regionów, w których masz agentów, oraz łączna liczba agentów zainstalowanych w każdym kraju/regionie
Liczba zainstalowanych bram Liczba serwerów z zainstalowaną bramą usługi Log Analytics oraz lista tych serwerów

Zrzut ekranu przedstawiający przykład pulpitu nawigacyjnego rozwiązania Agent Health.

Rekordy dzienników usługi Azure Monitor

Rozwiązanie tworzy jeden typ rekordu w obszarze roboczym usługi Log Analytics: puls. Rekordy pulsu mają właściwości wymienione w poniższej tabeli.

Właściwość Opis
Type Heartbeat
Category Direct Agent, SCOM Agentlub SCOM Management Server
Computer Nazwa komputera
OSType System operacyjny Windows lub Linux
OSMajorVersion Wersja główna systemu operacyjnego
OSMinorVersion Wersja pomocnicza systemu operacyjnego
Version Wersja agenta usługi Log Analytics lub agenta programu Operations Manager
SCAgentChannel Direct i/lub SCManagementServer
IsGatewayInstalled true jeśli brama usługi Log Analytics jest zainstalowana; Inaczej false
ComputerIP Publiczny adres IP maszyny wirtualnej platformy Azure, jeśli jest dostępny; Adres SNAT platformy Azure (nie prywatny adres IP) dla maszyny wirtualnej korzystającej z prywatnego adresu IP
ComputerPrivateIPs Lista prywatnych adresów IP komputera
RemoteIPCountry Lokalizacja geograficzna, w której wdrożono komputer
ManagementGroupName Nazwa grupy zarządzania programu Operations Manager
SourceComputerId Unikatowy identyfikator komputera
RemoteIPLongitude Długość geograficzna lokalizacji geograficznej komputera
RemoteIPLatitude Szerokość geograficzna lokalizacji geograficznej komputera

Każdy agent zgłaszany do serwera zarządzania programu Operations Manager wysyła dwa pulsy. Wartość SCAgentChannel właściwości będzie obejmować zarówno Direct elementy , jak i SCManagementServer, w zależności od źródeł danych i rozwiązań do monitorowania, które zostały włączone w ramach subskrypcji.

Jeśli pamiętasz, dane z rozwiązań są wysyłane:

  • Bezpośrednio z serwera zarządzania programu Operations Manager do usługi Azure Monitor.
  • Bezpośrednio z agenta do usługi Azure Monitor ze względu na ilość danych zebranych na agencie.

W przypadku zdarzeń pulsu, które mają wartość SCManagementServer, wartość jest adresem IP serwera zarządzania, ComputerIP ponieważ faktycznie przekazuje dane. W przypadku pulsów, w których SCAgentChannel ustawiono wartość Direct, jest to publiczny adres IP agenta.

Przykładowe wyszukiwania dzienników

Poniższa tabela zawiera przykładowe wyszukiwanie dzienników dla rekordów zbieranych przez rozwiązanie.

Zapytanie Opis
Puls | distinct Computer Łączna liczba agentów
Puls | summarize LastCall = max(TimeGenerated) by Computer | where LastCall < ago(24h) Liczba nieodpowiadających agentów w ciągu ostatnich 24 godzin
Puls | summarize LastCall = max(TimeGenerated) by Computer | gdzie LastCall < ago(15m) Liczba nieodpowiadających agentów w ciągu ostatnich 15 minut
Puls | where TimeGenerated > ago(24h) i Computer in ((Heartbeat | where TimeGenerated > ago(24h) | distinct Computer)) | summarize LastCall = max(TimeGenerated) by Computer Komputery w trybie online w ciągu ostatnich 24 godzin
Puls | where TimeGenerated > ago(24h) i Computer !in ((Heartbeat | where TimeGenerated > ago(30m) | distinct Computer)) | summarize LastCall = max(TimeGenerated) by Computer Łączna liczba agentów w trybie offline w ciągu ostatnich 30 minut (w ciągu ostatnich 24 godzin)
Puls | summarize AggregatedValue = dcount(Computer) by OSType Trend liczby agentów w czasie według typu systemu operacyjnego
Puls | summarize AggregatedValue = dcount(Computer) by OSType Dystrybucja według typu systemu operacyjnego
Puls | summarize AggregatedValue = dcount(Computer) by Version (Wersja) Dystrybucja według wersji agenta
Puls | summarize AggregatedValue = count() by Category Dystrybucja według kategorii agentów
Puls | summarize AggregatedValue = dcount(Computer) by ManagementGroupName Dystrybucja według grupy zarządzania
Puls | summarize AggregatedValue = dcount(Computer) by RemoteIPCountry Lokalizacja geograficzna agentów
Puls | where iff(isnotnull(toint(IsGatewayInstalled)), IsGatewayInstalled == true, IsGatewayInstalled == "true") == true | distinct Computer Liczba zainstalowanych bram usługi Log Analytics

Następne kroki

Dowiedz się więcej o generowaniu alertów z zapytań dzienników w usłudze Azure Monitor.