Wskazówki dotyczące rozwiązywania problemów z agentem usługi Azure Monitor na maszynach wirtualnych z systemem Linux i zestawami skalowania
Omówienie agenta usługi Azure Monitor
Zanim przejdziesz dalej, musisz zapoznać się z agentem usługi Azure Monitor i regułami zbierania danych.
Terminologia
Nazwa | Akronim | Opis |
---|---|---|
Agent usługi Azure Monitor | AMA | Nowy agent usługi Azure Monitor |
Reguły zbierania danych | DCR | Reguły konfigurowania zbierania danych przez agenta, tj. tego, co należy zbierać, gdzie wysyłać, i nie tylko |
Usługa konfiguracji usługi Azure Monitor | AMCS | Usługa regionalna hostowana na platformie Azure, która kontroluje zbieranie danych dla tego agenta i innych części usługi Azure Monitor. Agent wywołuje tę usługę, aby pobrać kontrolery domeny. |
Punkt końcowy dzienników | -- | Punkt końcowy do wysyłania danych do obszarów roboczych usługi Log Analytics |
Punkt końcowy metryk | -- | Punkt końcowy do wysyłania danych do baz danych metryk usługi Azure Monitor. |
Usługa metadanych wystąpienia i usługa hybrydowa | IMDS i HIMDS | Usługi hostowane na platformie Azure, które zawierają informacje o aktualnie uruchomionych maszynach wirtualnych, zestawach skalowania (za pośrednictwem imDS) i serwerach z obsługą usługi Arc (za pośrednictwem usługi HIMDS) odpowiednio |
Obszar roboczy usługi Log Analytics | PRAWA | Miejsce docelowe w usłudze Azure Monitor, do którego można wysyłać dzienniki zebrane przez agenta |
Metryki niestandardowe | -- | Miejsce docelowe w usłudze Azure Monitor, do którego można wysyłać metryki gościa zebrane przez agenta |
Podstawowe kroki rozwiązywania problemów
Wykonaj poniższe kroki, aby rozwiązać problemy z najnowszą wersją agenta usługi Azure Monitor uruchomionego na maszynie wirtualnej z systemem Linux:
Dokładnie zapoznaj się z wymaganiami wstępnymi w tym miejscu.
Sprawdź, czy rozszerzenie zostało pomyślnie zainstalowane i aprowidowane, co powoduje zainstalowanie plików binarnych agenta na maszynie:
- Otwórz Azure Portal > wybierz maszynę > wirtualną Otwórz ustawienia: Rozszerzenia i aplikacje z okienka po lewej stronie > "AzureMonitorLinuxAgent" powinny być wyświetlane z komunikatem Stan: "Aprowizowanie powiodło się"
- Jeśli nie widzisz rozszerzenia na liście, sprawdź, czy maszyna może uzyskać dostęp do platformy Azure i znajdź rozszerzenie do zainstalowania przy użyciu poniższego polecenia:
az vm extension image list-versions --location <machine-region> --name AzureMonitorLinuxAgent --publisher Microsoft.Azure.Monitor
- Poczekaj 10–15 minut, ponieważ rozszerzenie może przejść w stanie przejścia. Jeśli nadal nie jest wyświetlana jak powyżej, odinstaluj i zainstaluj rozszerzenie ponownie.
- Sprawdź, czy na maszynie są wyświetlane błędy w dziennikach
/var/log/azure/Microsoft.Azure.Monitor.AzureMonitorLinuxAgent/
rozszerzeń - Jeśli żaden z powyższych elementów nie pomoże, utwórz biletz podsumowaniem jako "Nie można zainstalować lub aprowizować rozszerzenia AMA" i typ problemu jako "Potrzebuję pomocy z agentem usługi Azure Monitor dla systemu Linux".
Sprawdź, czy agent jest uruchomiony:
- Sprawdź, czy agent emituje dzienniki pulsu do obszaru roboczego usługi Log Analytics, korzystając z poniższego zapytania. Pomiń, jeśli element "Metryki niestandardowe" jest jedynym miejscem docelowym w kontrolerze domeny:
Heartbeat | where Category == "Azure Monitor Agent" and Computer == "<computer-name>" | take 10
- Sprawdzanie, czy usługa agenta jest uruchomiona
systemctl status azuremonitoragent
- Sprawdź, czy na maszynie są widoczne błędy w podstawowych dziennikach
/var/opt/microsoft/azuremonitoragent/log/mdsd.*
agenta - Jeśli żaden z powyższych elementów nie pomoże, utwórz biletz podsumowaniem jako "Aprowizowane rozszerzenie AMA, ale nie działa" i typ problemu jako "Potrzebuję pomocy z agentem systemu Linux usługi Azure Monitor".
- Sprawdź, czy agent emituje dzienniki pulsu do obszaru roboczego usługi Log Analytics, korzystając z poniższego zapytania. Pomiń, jeśli element "Metryki niestandardowe" jest jedynym miejscem docelowym w kontrolerze domeny:
Sprawdź, czy kontroler domeny istnieje i jest skojarzony z maszyną wirtualną:
- Jeśli używasz obszaru roboczego usługi Log Analytics jako miejsca docelowego, sprawdź, czy kontroler domeny istnieje w tym samym regionie fizycznym co obszar roboczy usługi Log Analytics.
- Otwórz Azure Portal > wybierz regułę > zbierania danych Otwórz konfigurację: zasoby w okienku po lewej stronie > Powinna zostać wyświetlona maszyna wirtualna wymieniona tutaj.
- Jeśli nie ma na liście, kliknij pozycję "Dodaj" i wybierz maszynę wirtualną z selektora zasobów. Powtarzaj wszystkie kontrolery domeny.
- Jeśli żaden z powyższych elementów nie pomoże, utwórz biletz podsumowaniem jako "Nie znaleziono lub skojarzone z kontrolerem domeny" i typ problemu jako "Potrzebuję pomocy przy konfigurowaniu zbierania danych z maszyny wirtualnej".
Sprawdź, czy agent mógł pobrać skojarzone kontrolery domeny z usługi AMCS:
- Sprawdź, czy w tej lokalizacji jest wyświetlana najnowsza wersja narzędzia DCR
/etc/opt/microsoft/azuremonitoragent/config-cache/configchunks/
- Jeśli nie, utwórz bilet z podsumowaniem jako "AMA nie można pobrać konfiguracji dcR" i typ problemu jako "Potrzebuję pomocy z agentem usługi Azure Monitor dla systemu Linux".
- Sprawdź, czy w tej lokalizacji jest wyświetlana najnowsza wersja narzędzia DCR
Problemy ze zbieraniem dziennika systemowego
Aby uzyskać więcej informacji na temat rozwiązywania problemów z dziennikiem systemowym przy użyciu agenta usługi Azure Monitor, zobacz tutaj.
Plik
/var/opt/microsoft/azuremonitoragent/log/mdsd.qos
jakości usług (QoS) zapewnia agregacje w formacie CSV 15-minutowe przetworzonych zdarzeń i zawiera informacje o ilości przetworzonych zdarzeń dziennika systemowego w danym przedziale czasu. Ten plik jest przydatny podczas śledzenia spadków pozyskiwania zdarzeń dziennika systemowego.Na przykład poniższy fragment pokazuje, że w ciągu 15 minut poprzedzających 2022-02-28T19:55:23.5432920Z agent otrzymał 77 zdarzeń dziennika systemowego z demonem obiektu i informacjami o poziomie i wysłał 77 wspomnianych zdarzeń do zadania przekazywania. Ponadto zadanie przekazywania agenta odebrało 77 i pomyślnie przekazano wszystkie 77 z tych komunikatów daemon.info.
#Time: 2022-02-28T19:55:23.5432920Z #Fields: Operation,Object,TotalCount,SuccessCount,Retries,AverageDuration,AverageSize,AverageDelay,TotalSize,TotalRowsRead,TotalRowsSent ... MaRunTaskLocal,daemon.debug,15,15,0,60000,0,0,0,0,0 MaRunTaskLocal,daemon.info,15,15,0,60000,46.2,0,693,77,77 MaRunTaskLocal,daemon.notice,15,15,0,60000,0,0,0,0,0 MaRunTaskLocal,daemon.warning,15,15,0,60000,0,0,0,0,0 MaRunTaskLocal,daemon.error,15,15,0,60000,0,0,0,0,0 MaRunTaskLocal,daemon.critical,15,15,0,60000,0,0,0,0,0 MaRunTaskLocal,daemon.alert,15,15,0,60000,0,0,0,0,0 MaRunTaskLocal,daemon.emergency,15,15,0,60000,0,0,0,0,0 ... MaODSRequest,https://e73fd5e3-ea2b-4637-8da0-5c8144b670c8_LogManagement,15,15,0,455067,476.467,0,7147,77,77
Kroki rozwiązywania problemów
- Najpierw zapoznaj się z ogólnymi krokami rozwiązywania problemów z usługą AMA systemu Linux . Jeśli agent emituje pulsy, przejdź do kroku 2.
- Przeanalizowana konfiguracja jest przechowywana w lokalizacji
/etc/opt/microsoft/azuremonitoragent/config-cache/configchunks/
. Sprawdź, czy kolekcja dziennika systemowego jest zdefiniowana, a miejsca docelowe dziennika są takie same jak w formacie JSON interfejsu użytkownika dcR /DCR.- Jeśli tak, przejdź do kroku 3. Jeśli nie, problem występuje w przepływie pracy konfiguracji.
- Zbadaj
mdsd.err
pliki ,mdsd.warn
mdsd.info
w obszarze/var/opt/microsoft/azuremonitoragent/log
pod kątem możliwych błędów konfiguracji. - Jeśli żaden z powyższych elementów nie pomoże, utwórz biletz podsumowaniem jako "Kontroler domeny dziennika systemu jest niedostępny" i typ problemu jako "Potrzebuję pomocy przy konfigurowaniu zbierania danych z maszyny wirtualnej".
- Zweryfikuj układ przepływu pracy zbierania dziennika systemowego, aby upewnić się, że wszystkie niezbędne elementy są dostępne i są dostępne:
- W przypadku
rsyslog
użytkowników upewnij się, że/etc/rsyslog.d/10-azuremonitoragent.conf
plik jest obecny, nie jest pusty i jest dostępny dla demonarsyslog
(użytkownik dziennika systemowego).- Sprawdź konfigurację rsyslog pod adresem
/etc/rsyslog.conf
i/etc/rsyslog.d/*
sprawdź, czy masz jakiekolwiek dane wejściowe powiązane z zestawem reguł innych niż domyślne, ponieważ komunikaty z tych danych wejściowych nie będą przekazywane do agenta usługi Azure Monitor. Na przykład komunikaty z danych wejściowych skonfigurowanych przy użyciu zestawu reguł innych niż domyślne, takie jakinput(type="imtcp" port="514"
ruleset="myruleset"
)
, nie będą przekazywane dalej.
- Sprawdź konfigurację rsyslog pod adresem
- W przypadku
syslog-ng
użytkowników upewnij się, że/etc/syslog-ng/conf.d/azuremonitoragent.conf
plik jest obecny, nie jest pusty i jest dostępny dla demonasyslog-ng
(użytkownik dziennika systemowego). - Upewnij się, że plik
/run/azuremonitoragent/default_syslog.socket
istnieje i jest dostępny odpowiednio przezrsyslog
program lubsyslog-ng
. - Sprawdź odpowiedni spadek liczby przetworzonych zdarzeń dziennika systemowego w pliku
/var/opt/microsoft/azuremonitoragent/log/mdsd.qos
. Jeśli taki spadek nie jest wskazany w pliku, utwórz bilet z podsumowaniem jako "Dane dziennika systemowego porzucone w potoku" i typ problemu jako "Potrzebuję pomocy z agentem systemu Linux usługi Azure Monitor". - Sprawdź, czy kolejka demona dziennika systemowego nie jest przepełniona, powodując niepowodzenie przekazywania, odwołując się do wskazówek tutaj: dane rsyslog nie zostały przekazane z powodu problemu z pełnym miejscem na dysku w agencie ama Linux
- W przypadku
- Aby dodatkowo debugować pozyskiwanie zdarzeń dziennika systemowego, możesz dołączyć flagę śledzenia -T 0x2002 na końcu MDSD_OPTIONS w pliku
/etc/default/azuremonitoragent
i ponownie uruchomić agenta:export MDSD_OPTIONS="-A -c /etc/opt/microsoft/azuremonitoragent/mdsd.xml -d -r $MDSD_ROLE_PREFIX -S $MDSD_SPOOL_DIRECTORY/eh -L $MDSD_SPOOL_DIRECTORY/events -e $MDSD_LOG_DIR/mdsd.err -w $MDSD_LOG_DIR/mdsd.warn -o $MDSD_LOG_DIR/mdsd.info -T 0x2002"
- Po odtworzeniu problemu za pomocą flagi śledzenia znajdziesz więcej informacji debugowania w temacie
/var/opt/microsoft/azuremonitoragent/log/mdsd.info
. Sprawdź plik pod kątem możliwej przyczyny problemu z zbieraniem dzienników systemowych, takich jak analizowanie/ przetwarzanie / konfiguracja / błędy przekazywania.Ostrzeżenie
Pamiętaj, aby usunąć ustawienie flagi śledzenia -T 0x2002 po sesji debugowania, ponieważ generuje wiele instrukcji śledzenia, które mogą szybciej wypełnić dysk lub utrudnić wizualne analizowanie pliku dziennika.
- Jeśli żaden z powyższych elementów nie pomoże, utwórz bilet z podsumowaniem jako "Usługa AMA nie może zebrać zdarzeń dziennika systemowego" i typ problemu jako "Potrzebuję pomocy z agentem systemu Linux usługi Azure Monitor".
Rozwiązywanie problemów na serwerze z obsługą usługi Arc
Jeśli po sprawdzeniu podstawowych kroków rozwiązywania problemów nie widzisz dzienników emitujących dzienniki przez agenta usługi Azure Monitor lub znajdź błąd "Nie można pobrać tokenu MSI z punktu końcowego USŁUGI IMDS" w /var/opt/microsoft/azuremonitoragent/log/mdsd.err
pliku dziennika, prawdopodobnie syslog
użytkownik nie jest członkiem grupy himds
. Dodaj syslog
użytkownika do himds
grupy użytkowników, jeśli użytkownik nie jest członkiem tej grupy. Utwórz użytkownika syslog
i grupę syslog
, w razie potrzeby i upewnij się, że użytkownik znajduje się w tej grupie. Aby uzyskać więcej informacji, zapoznaj się z wymaganiami dotyczącymi uwierzytelniania serwera z obsługą usługi Azure Arc tutaj.
Tworzenie biletu
- Otwórz regułę zbierania danych i w menu po lewej stronie wybierz pozycję Nowy wniosek o pomoc techniczną. Możesz również otworzyć okienko Pomoc i obsługa techniczna , a następnie wybrać pozycję Utwórz wniosek o pomoc techniczną.
- Wybierz pozycję:
- Typ problemu: Techniczny.
- Subskrypcja: wybierz subskrypcję, w której znajdują się twoje maszyny.
- Typ usługi: reguły zbierania danych i agent usługi Azure Monitor.
- Czy problem jest związany z zasobem?: Tak. Wybierz maszynę przy użyciu selektora zasobów.
- Wprowadź ciąg Podsumowanie i Typ problemu zgodnie z instrukcjami rozwiązywania problemów. Dokładne informacje prowadzą do szybszego rozwiązania problemu.
- Wybierz pozycję Dalej i przejrzyj zalecane rozwiązania, aby sprawdzić, czy są one pomocne.
- Jeśli nie pomogą, wybierz pozycję Dalej i wypełnij następny zestaw szczegółów.
- Wybierz pozycję Dalej, przejrzyj szczegóły końcowe, a następnie wybierz pozycję Utwórz.