Wskazówki dotyczące rozwiązywania problemów z agentem usługi Azure Monitor na maszynach wirtualnych z systemem Linux i zestawami skalowania

Omówienie agenta usługi Azure Monitor

Zanim przejdziesz dalej, musisz zapoznać się z agentem usługi Azure Monitor i regułami zbierania danych.

Terminologia

Nazwa Akronim Opis
Agent usługi Azure Monitor AMA Nowy agent usługi Azure Monitor
Reguły zbierania danych DCR Reguły konfigurowania zbierania danych przez agenta, tj. tego, co należy zbierać, gdzie wysyłać, i nie tylko
Usługa konfiguracji usługi Azure Monitor AMCS Usługa regionalna hostowana na platformie Azure, która kontroluje zbieranie danych dla tego agenta i innych części usługi Azure Monitor. Agent wywołuje tę usługę, aby pobrać kontrolery domeny.
Punkt końcowy dzienników -- Punkt końcowy do wysyłania danych do obszarów roboczych usługi Log Analytics
Punkt końcowy metryk -- Punkt końcowy do wysyłania danych do baz danych metryk usługi Azure Monitor.
Usługa metadanych wystąpienia i usługa hybrydowa IMDS i HIMDS Usługi hostowane na platformie Azure, które zawierają informacje o aktualnie uruchomionych maszynach wirtualnych, zestawach skalowania (za pośrednictwem imDS) i serwerach z obsługą usługi Arc (za pośrednictwem usługi HIMDS) odpowiednio
Obszar roboczy usługi Log Analytics PRAWA Miejsce docelowe w usłudze Azure Monitor, do którego można wysyłać dzienniki zebrane przez agenta
Metryki niestandardowe -- Miejsce docelowe w usłudze Azure Monitor, do którego można wysyłać metryki gościa zebrane przez agenta

Podstawowe kroki rozwiązywania problemów

Wykonaj poniższe kroki, aby rozwiązać problemy z najnowszą wersją agenta usługi Azure Monitor uruchomionego na maszynie wirtualnej z systemem Linux:

  1. Dokładnie zapoznaj się z wymaganiami wstępnymi w tym miejscu.

  2. Sprawdź, czy rozszerzenie zostało pomyślnie zainstalowane i aprowidowane, co powoduje zainstalowanie plików binarnych agenta na maszynie:

    1. Otwórz Azure Portal > wybierz maszynę > wirtualną Otwórz ustawienia: Rozszerzenia i aplikacje z okienka po lewej stronie > "AzureMonitorLinuxAgent" powinny być wyświetlane z komunikatem Stan: "Aprowizowanie powiodło się"
    2. Jeśli nie widzisz rozszerzenia na liście, sprawdź, czy maszyna może uzyskać dostęp do platformy Azure i znajdź rozszerzenie do zainstalowania przy użyciu poniższego polecenia:
      az vm extension image list-versions --location <machine-region> --name AzureMonitorLinuxAgent --publisher Microsoft.Azure.Monitor
      
    3. Poczekaj 10–15 minut, ponieważ rozszerzenie może przejść w stanie przejścia. Jeśli nadal nie jest wyświetlana jak powyżej, odinstaluj i zainstaluj rozszerzenie ponownie.
    4. Sprawdź, czy na maszynie są wyświetlane błędy w dziennikach /var/log/azure/Microsoft.Azure.Monitor.AzureMonitorLinuxAgent/ rozszerzeń
    5. Jeśli żaden z powyższych elementów nie pomoże, utwórz biletz podsumowaniem jako "Nie można zainstalować lub aprowizować rozszerzenia AMA" i typ problemu jako "Potrzebuję pomocy z agentem usługi Azure Monitor dla systemu Linux".
  3. Sprawdź, czy agent jest uruchomiony:

    1. Sprawdź, czy agent emituje dzienniki pulsu do obszaru roboczego usługi Log Analytics, korzystając z poniższego zapytania. Pomiń, jeśli element "Metryki niestandardowe" jest jedynym miejscem docelowym w kontrolerze domeny:
      Heartbeat | where Category == "Azure Monitor Agent" and Computer == "<computer-name>" | take 10
      
    2. Sprawdzanie, czy usługa agenta jest uruchomiona
      systemctl status azuremonitoragent
      
    3. Sprawdź, czy na maszynie są widoczne błędy w podstawowych dziennikach /var/opt/microsoft/azuremonitoragent/log/mdsd.* agenta
    4. Jeśli żaden z powyższych elementów nie pomoże, utwórz biletz podsumowaniem jako "Aprowizowane rozszerzenie AMA, ale nie działa" i typ problemu jako "Potrzebuję pomocy z agentem systemu Linux usługi Azure Monitor".
  4. Sprawdź, czy kontroler domeny istnieje i jest skojarzony z maszyną wirtualną:

    1. Jeśli używasz obszaru roboczego usługi Log Analytics jako miejsca docelowego, sprawdź, czy kontroler domeny istnieje w tym samym regionie fizycznym co obszar roboczy usługi Log Analytics.
    2. Otwórz Azure Portal > wybierz regułę > zbierania danych Otwórz konfigurację: zasoby w okienku po lewej stronie > Powinna zostać wyświetlona maszyna wirtualna wymieniona tutaj.
    3. Jeśli nie ma na liście, kliknij pozycję "Dodaj" i wybierz maszynę wirtualną z selektora zasobów. Powtarzaj wszystkie kontrolery domeny.
    4. Jeśli żaden z powyższych elementów nie pomoże, utwórz biletz podsumowaniem jako "Nie znaleziono lub skojarzone z kontrolerem domeny" i typ problemu jako "Potrzebuję pomocy przy konfigurowaniu zbierania danych z maszyny wirtualnej".
  5. Sprawdź, czy agent mógł pobrać skojarzone kontrolery domeny z usługi AMCS:

    1. Sprawdź, czy w tej lokalizacji jest wyświetlana najnowsza wersja narzędzia DCR /etc/opt/microsoft/azuremonitoragent/config-cache/configchunks/
    2. Jeśli nie, utwórz bilet z podsumowaniem jako "AMA nie można pobrać konfiguracji dcR" i typ problemu jako "Potrzebuję pomocy z agentem usługi Azure Monitor dla systemu Linux".

Problemy ze zbieraniem dziennika systemowego

Aby uzyskać więcej informacji na temat rozwiązywania problemów z dziennikiem systemowym przy użyciu agenta usługi Azure Monitor, zobacz tutaj.

  • Plik /var/opt/microsoft/azuremonitoragent/log/mdsd.qos jakości usług (QoS) zapewnia agregacje w formacie CSV 15-minutowe przetworzonych zdarzeń i zawiera informacje o ilości przetworzonych zdarzeń dziennika systemowego w danym przedziale czasu. Ten plik jest przydatny podczas śledzenia spadków pozyskiwania zdarzeń dziennika systemowego.

    Na przykład poniższy fragment pokazuje, że w ciągu 15 minut poprzedzających 2022-02-28T19:55:23.5432920Z agent otrzymał 77 zdarzeń dziennika systemowego z demonem obiektu i informacjami o poziomie i wysłał 77 wspomnianych zdarzeń do zadania przekazywania. Ponadto zadanie przekazywania agenta odebrało 77 i pomyślnie przekazano wszystkie 77 z tych komunikatów daemon.info.

    #Time: 2022-02-28T19:55:23.5432920Z
    #Fields: Operation,Object,TotalCount,SuccessCount,Retries,AverageDuration,AverageSize,AverageDelay,TotalSize,TotalRowsRead,TotalRowsSent
    ...
    MaRunTaskLocal,daemon.debug,15,15,0,60000,0,0,0,0,0
    MaRunTaskLocal,daemon.info,15,15,0,60000,46.2,0,693,77,77
    MaRunTaskLocal,daemon.notice,15,15,0,60000,0,0,0,0,0
    MaRunTaskLocal,daemon.warning,15,15,0,60000,0,0,0,0,0
    MaRunTaskLocal,daemon.error,15,15,0,60000,0,0,0,0,0
    MaRunTaskLocal,daemon.critical,15,15,0,60000,0,0,0,0,0
    MaRunTaskLocal,daemon.alert,15,15,0,60000,0,0,0,0,0
    MaRunTaskLocal,daemon.emergency,15,15,0,60000,0,0,0,0,0
    ...
    MaODSRequest,https://e73fd5e3-ea2b-4637-8da0-5c8144b670c8_LogManagement,15,15,0,455067,476.467,0,7147,77,77
    

Kroki rozwiązywania problemów

  1. Najpierw zapoznaj się z ogólnymi krokami rozwiązywania problemów z usługą AMA systemu Linux . Jeśli agent emituje pulsy, przejdź do kroku 2.
  2. Przeanalizowana konfiguracja jest przechowywana w lokalizacji /etc/opt/microsoft/azuremonitoragent/config-cache/configchunks/. Sprawdź, czy kolekcja dziennika systemowego jest zdefiniowana, a miejsca docelowe dziennika są takie same jak w formacie JSON interfejsu użytkownika dcR /DCR.
    1. Jeśli tak, przejdź do kroku 3. Jeśli nie, problem występuje w przepływie pracy konfiguracji.
    2. Zbadaj mdsd.errpliki ,mdsd.warnmdsd.info w obszarze /var/opt/microsoft/azuremonitoragent/log pod kątem możliwych błędów konfiguracji.
    3. Jeśli żaden z powyższych elementów nie pomoże, utwórz biletz podsumowaniem jako "Kontroler domeny dziennika systemu jest niedostępny" i typ problemu jako "Potrzebuję pomocy przy konfigurowaniu zbierania danych z maszyny wirtualnej".
  3. Zweryfikuj układ przepływu pracy zbierania dziennika systemowego, aby upewnić się, że wszystkie niezbędne elementy są dostępne i są dostępne:
    1. W przypadku rsyslog użytkowników upewnij się, że /etc/rsyslog.d/10-azuremonitoragent.conf plik jest obecny, nie jest pusty i jest dostępny dla demona rsyslog (użytkownik dziennika systemowego).
      1. Sprawdź konfigurację rsyslog pod adresem /etc/rsyslog.conf i /etc/rsyslog.d/* sprawdź, czy masz jakiekolwiek dane wejściowe powiązane z zestawem reguł innych niż domyślne, ponieważ komunikaty z tych danych wejściowych nie będą przekazywane do agenta usługi Azure Monitor. Na przykład komunikaty z danych wejściowych skonfigurowanych przy użyciu zestawu reguł innych niż domyślne, takie jak input(type="imtcp" port="514" ruleset="myruleset") , nie będą przekazywane dalej.
    2. W przypadku syslog-ng użytkowników upewnij się, że /etc/syslog-ng/conf.d/azuremonitoragent.conf plik jest obecny, nie jest pusty i jest dostępny dla demona syslog-ng (użytkownik dziennika systemowego).
    3. Upewnij się, że plik /run/azuremonitoragent/default_syslog.socket istnieje i jest dostępny odpowiednio przez rsyslog program lub syslog-ng .
    4. Sprawdź odpowiedni spadek liczby przetworzonych zdarzeń dziennika systemowego w pliku /var/opt/microsoft/azuremonitoragent/log/mdsd.qos. Jeśli taki spadek nie jest wskazany w pliku, utwórz bilet z podsumowaniem jako "Dane dziennika systemowego porzucone w potoku" i typ problemu jako "Potrzebuję pomocy z agentem systemu Linux usługi Azure Monitor".
    5. Sprawdź, czy kolejka demona dziennika systemowego nie jest przepełniona, powodując niepowodzenie przekazywania, odwołując się do wskazówek tutaj: dane rsyslog nie zostały przekazane z powodu problemu z pełnym miejscem na dysku w agencie ama Linux
  4. Aby dodatkowo debugować pozyskiwanie zdarzeń dziennika systemowego, możesz dołączyć flagę śledzenia -T 0x2002 na końcu MDSD_OPTIONS w pliku /etc/default/azuremonitoragenti ponownie uruchomić agenta:
    export MDSD_OPTIONS="-A -c /etc/opt/microsoft/azuremonitoragent/mdsd.xml -d -r $MDSD_ROLE_PREFIX -S $MDSD_SPOOL_DIRECTORY/eh -L $MDSD_SPOOL_DIRECTORY/events -e $MDSD_LOG_DIR/mdsd.err -w $MDSD_LOG_DIR/mdsd.warn -o $MDSD_LOG_DIR/mdsd.info -T 0x2002"
    
  5. Po odtworzeniu problemu za pomocą flagi śledzenia znajdziesz więcej informacji debugowania w temacie /var/opt/microsoft/azuremonitoragent/log/mdsd.info. Sprawdź plik pod kątem możliwej przyczyny problemu z zbieraniem dzienników systemowych, takich jak analizowanie/ przetwarzanie / konfiguracja / błędy przekazywania.

    Ostrzeżenie

    Pamiętaj, aby usunąć ustawienie flagi śledzenia -T 0x2002 po sesji debugowania, ponieważ generuje wiele instrukcji śledzenia, które mogą szybciej wypełnić dysk lub utrudnić wizualne analizowanie pliku dziennika.

  6. Jeśli żaden z powyższych elementów nie pomoże, utwórz bilet z podsumowaniem jako "Usługa AMA nie może zebrać zdarzeń dziennika systemowego" i typ problemu jako "Potrzebuję pomocy z agentem systemu Linux usługi Azure Monitor".

Rozwiązywanie problemów na serwerze z obsługą usługi Arc

Jeśli po sprawdzeniu podstawowych kroków rozwiązywania problemów nie widzisz dzienników emitujących dzienniki przez agenta usługi Azure Monitor lub znajdź błąd "Nie można pobrać tokenu MSI z punktu końcowego USŁUGI IMDS" w /var/opt/microsoft/azuremonitoragent/log/mdsd.err pliku dziennika, prawdopodobnie syslog użytkownik nie jest członkiem grupy himds. Dodaj syslog użytkownika do himds grupy użytkowników, jeśli użytkownik nie jest członkiem tej grupy. Utwórz użytkownika syslog i grupę syslog, w razie potrzeby i upewnij się, że użytkownik znajduje się w tej grupie. Aby uzyskać więcej informacji, zapoznaj się z wymaganiami dotyczącymi uwierzytelniania serwera z obsługą usługi Azure Arc tutaj.

Tworzenie biletu

  1. Otwórz regułę zbierania danych i w menu po lewej stronie wybierz pozycję Nowy wniosek o pomoc techniczną. Możesz również otworzyć okienko Pomoc i obsługa techniczna , a następnie wybrać pozycję Utwórz wniosek o pomoc techniczną.
  2. Wybierz pozycję:
    • Typ problemu: Techniczny.
    • Subskrypcja: wybierz subskrypcję, w której znajdują się twoje maszyny.
    • Typ usługi: reguły zbierania danych i agent usługi Azure Monitor.
    • Czy problem jest związany z zasobem?: Tak. Wybierz maszynę przy użyciu selektora zasobów.
  3. Wprowadź ciąg Podsumowanie i Typ problemu zgodnie z instrukcjami rozwiązywania problemów. Dokładne informacje prowadzą do szybszego rozwiązania problemu.
  4. Wybierz pozycję Dalej i przejrzyj zalecane rozwiązania, aby sprawdzić, czy są one pomocne.
  5. Jeśli nie pomogą, wybierz pozycję Dalej i wypełnij następny zestaw szczegółów.
  6. Wybierz pozycję Dalej, przejrzyj szczegóły końcowe, a następnie wybierz pozycję Utwórz.