Memecahkan masalah dengan agen Log Analytics untuk Linux

Artikel ini menyediakan bantuan dalam memecahkan masalah kesalahan yang mungkin Anda alami dengan agen Analitik Log untuk Linux di Azure Monitor.

Alat Pemecahan Masalah Analitik Log

Agen Analitik Log untuk Alat Pemecahan Masalah Linux adalah skrip yang dirancang untuk membantu menemukan dan mendiagnosis masalah pada agen Analitik Log. Hal ini secara otomatis disertakan dengan agen saat penginstalan. Menjalankan alat harus menjadi langkah pertama dalam mendiagnosis masalah.

Menggunakan Alat Pemecahan Masalah

Untuk menjalankan Alat Pemecahan Masalah, tempelkan perintah berikut ke jendela terminal di mesin dengan agen Analitik Log:

sudo /opt/microsoft/omsagent/bin/troubleshooter

Penginstalan manual

Alat Pemecahan Masalah secara otomatis disertakan saat agen Analitik Log diinstal. Jika penginstalan gagal dengan cara apa pun, Anda juga dapat menginstal alat secara manual:

  1. Pastikan bahwa GNU Project Debugger (GDB) telah diinstal pada mesin karena pemecah masalah bergantung padanya.
  2. Salin bundel pemecah masalah ke komputer Anda: wget https://raw.github.com/microsoft/OMS-Agent-for-Linux/master/source/code/troubleshooter/omsagent_tst.tar.gz
  3. Membongkar bundel: tar -xzvf omsagent_tst.tar.gz
  4. Jalankan penginstalan manual: sudo ./install_tst

Skenario tercakup

Alat Pemecahan Masalah memeriksa skenario berikut:

  • Agen tidak sehat, heartbeat tidak berfungsi dengan baik.
  • Agen tidak memulai atau tidak dapat tersambung ke Analitik Log.
  • Syslog agen tidak berfungsi.
  • Agen memiliki penggunaan CPU atau memori yang tinggi.
  • Agen mengalami masalah penginstalan.
  • Log kustom agen tidak berfungsi.
  • Log agen tidak dapat dikumpulkan.

Untuk informasi selengkapnya, lihat Dokumentasi Alat Pemecahan Masalah di GitHub.

Catatan

Jalankan alat Pengumpul Log saat Anda mengalami masalah. Memiliki log dari awal akan sangat membantu tim dukungan kami dalam memecahkan masalah Anda lebih cepat.

Menghapus menyeluruh dan menginstal ulang agen Linux

Penginstalan ulang agen yang bersih akan memperbaiki sebagian besar masalah. Tugas ini mungkin adalah saran pertama dari tim dukungan kami untuk membuat agen dalam status tidak rusak. Menjalankan alat Pemecahan Masalah dan alat Pengumpul Log dan mencoba penginstalan ulang yang bersih akan membantu menyelesaikan masalah lebih cepat.

  1. Unduh skrip pembersihan:

    $ wget https://raw.githubusercontent.com/microsoft/OMS-Agent-for-Linux/master/tools/purge_omsagent.sh

  2. Jalankan skrip pembersihan (dengan izin Sudo):

    $ sudo sh purge_omsagent.sh

Lokasi log penting dan alat Pengumpul Log

File Jalur
Agen Analitik Log untuk file log Linux /var/opt/microsoft/omsagent/<workspace id>/log/omsagent.log
File log konfigurasi agen Analitik Log /var/opt/microsoft/omsconfig/omsconfig.log

Sebaiknya gunakan alat Pengumpul Log kami untuk mengambil log penting untuk pemecahan masalah atau sebelum mengirimkan masalah GitHub. Untuk informasi selengkapnya tentang alat dan cara menjalankannya, lihat Pengumpul Log Agen Linux OMS.

File konfigurasi penting

Kategori Lokasi file
Syslog /etc/syslog-ng/syslog-ng.conf atau /etc/rsyslog.conf atau /etc/rsyslog.d/95-omsagent.conf
Performa, Nagios, Zabbix, output Analitik Log, dan agen umum /etc/opt/microsoft/omsagent/<workspace id>/conf/omsagent.conf
Konfigurasi tambahan /etc/opt/microsoft/omsagent/<workspace id>/conf/omsagent.d/*.conf

Catatan

Mengedit file konfigurasi untuk penghitung kinerja dan Syslog akan ditimpa jika pengumpulan dikonfigurasi dari konfigurasi agen di portal Microsoft Azure untuk ruang kerja Anda. Untuk menonaktifkan konfigurasi untuk semua agen, nonaktifkan pengumpulan dari manajemen agen Warisan. Untuk satu agen, jalankan skrip berikut:

sudo /opt/microsoft/omsconfig/Scripts/OMS_MetaConfigHelper.py --disable && sudo rm /etc/opt/omi/conf/omsconfig/configuration/Current.mof* /etc/opt/omi/conf/omsconfig/configuration/Pending.mof*

Kode kesalahan penginstalan umum

Kode kesalahan Makna
NOT_DEFINED Karena dependensi yang diperlukan tidak terinstal, plug-in auoms auditd tidak akan diinstal. Penginstalan auoms gagal. Menginstal auditd paket.
2 Opsi tidak valid diberikan ke bundel shell. Jalankan sudo sh ./omsagent-*.universal*.sh --help untuk penggunaan.
3 Tidak ada opsi yang disediakan untuk bundel shell. Jalankan sudo sh ./omsagent-*.universal*.sh --help untuk penggunaan.
4 Jenis paket tidak valid atau pengaturan proksi tidak valid. Paket omsagent-rpm.sh hanya dapat diinstal pada sistem berbasis RPM. Paket omsagent-deb.sh hanya dapat diinstal pada sistem berbasis Debian. Sebaiknya Anda menggunakan alat penginstal universal dari rilis terbaru. Tinjau juga untuk memverifikasi pengaturan proksi Anda.
5 Bundel shell harus dijalankan sebagai akar atau ada kesalahan 403 yang dikembalikan selama onboarding. Jalankan perintah Anda dengan menggunakan sudo.
6 Arsitektur paket tidak valid atau ada kesalahan 200 yang dikembalikan saat onboarding. Paket omsagent-*x64.sh hanya dapat diinstal pada sistem 64-bit. Paket omsagent-*x86.sh hanya dapat diinstal pada sistem 32-bit. Unduh paket yang benar untuk arsitektur Anda dari rilis terbaru.
17 Penginstalan paket OMS gagal. Lihat melalui output perintah untuk kegagalan akar.
18 Penginstalan paket OMSConfig gagal. Lihat melalui output perintah untuk kegagalan akar.
19 Penginstalan paket OMI gagal. Lihat melalui output perintah untuk kegagalan akar.
20 Penginstalan paket SCX gagal. Lihat melalui output perintah untuk kegagalan akar.
21 Penginstalan paket kit Penyedia gagal. Lihat melalui output perintah untuk kegagalan akar.
22 Penginstalan bundel paket gagal. Lihat melalui output perintah untuk kegagalan akar
23 Paket SCX atau OMI sudah terpasang. Gunakan --upgrade alih-alih --install untuk memasang bundel shell.
30 Kesalahan bundel internal. Ajukan Masalah GitHub dengan detail dari output.
55 Versi openssl tidak didukung atau tidak dapat tersambung ke Azure Monitor atau dpkg terkunci atau program curl tidak ada.
61 Pustaka ctypes Python tidak tersedia. Pasang pustaka atau paket Python ctypes (python-ctypes).
62 Program tar tidak ada. Instal tar.
63 Program sed tidak ada. Instal sed.
64 Program curl tidak ada. Instal curl.
65 Program gpg tidak ada. Instal gpg.

Kode kesalahan onboarding

Kode kesalahan Makna
2 Opsi tidak valid diberikan untuk skrip omsadmin. Jalankan sudo sh /opt/microsoft/omsagent/bin/omsadmin.sh -h untuk penggunaan.
3 Konfigurasi tidak valid diberikan untuk skrip omsadmin. Jalankan sudo sh /opt/microsoft/omsagent/bin/omsadmin.sh -h untuk penggunaan.
4 Proksi tidak valid diberikan untuk skrip omsadmin. Verifikasi proksi dan lihat dokumentasi kami untuk menggunakan proksi HTTP.
5 Kesalahan 403 HTTP yang diterima dari Azure Monitor. Lihat output lengkap skrip omsadmin untuk detailnya.
6 Kesalahan Non-200 HTTP yang diterima dari Azure Monitor. Lihat output lengkap skrip omsadmin untuk detailnya.
7 Tidak dapat tersambung ke Azure Monitor. Lihat output lengkap skrip omsadmin untuk detailnya.
8 Terjadi kesalahan saat masuk ke ruang kerja Analitik Log. Lihat output lengkap skrip omsadmin untuk detailnya.
30 Kesalahan skrip internal. Ajukan Masalah GitHub dengan detail dari output.
31 Kesalahan saat menghasilkan ID agen. Ajukan Masalah GitHub dengan detail dari output.
32 Kesalahan saat membuat sertifikat. Lihat output lengkap skrip omsadmin untuk detailnya.
33 Kesalahan menghasilkan metakonfigurasi untuk omsconfig. Ajukan Masalah GitHub dengan detail dari output.
34 Skrip pembuatan metakonfigurasi tidak ada. Coba lagi onboarding dengan sudo sh /opt/microsoft/omsagent/bin/omsadmin.sh -w <Workspace ID> -s <Workspace Key>.

Mengaktifkan pengelogan debug

Debug plug-in output OMS

FluentD memungkinkan level pengelogan khusus plug-in yang memungkinkan Anda menentukan level log yang berbeda untuk input dan output. Untuk menentukan tingkat log yang berbeda untuk output OMS, edit konfigurasi agen umum di /etc/opt/microsoft/omsagent/<workspace id>/conf/omsagent.conf.

Di plug-in output OMS, sebelum akhir file konfigurasi, ubah properti log_level dari info menjadi debug:

<match oms.** docker.**>
  type out_oms
  log_level debug
  num_threads 5
  buffer_chunk_limit 5m
  buffer_type file
  buffer_path /var/opt/microsoft/omsagent/<workspace id>/state/out_oms*.buffer
  buffer_queue_limit 10
  flush_interval 20s
  retry_limit 10
  retry_wait 30s
</match>

Pengelogan debug memungkinkan Anda melihat unggahan batch ke Azure Monitor yang dipisahkan oleh jenis, jumlah item data, dan waktu yang dibutuhkan untuk mengirim.

Berikut adalah contoh log berkemampuan debug:

Success sending oms.nagios x 1 in 0.14s
Success sending oms.omi x 4 in 0.52s
Success sending oms.syslog.authpriv.info x 1 in 0.91s

Output verbose

Alih-alih menggunakan plug-in output OMS, Anda juga dapat mengeluarkan item data secara langsung ke stdout, yang terlihat di agen Analitik Log untuk file log Linux.

Dalam file konfigurasi agen umum Analitik log di /etc/opt/microsoft/omsagent/<workspace id>/conf/omsagent.conf, beri komentar pada plug-in output OMS dengan menambahkan # di depan setiap baris:

#<match oms.** docker.**>
#  type out_oms
#  log_level info
#  num_threads 5
#  buffer_chunk_limit 5m
#  buffer_type file
#  buffer_path /var/opt/microsoft/omsagent/<workspace id>/state/out_oms*.buffer
#  buffer_queue_limit 10
#  flush_interval 20s
#  retry_limit 10
#  retry_wait 30s
#</match>

Di bawah plug-in output, batalkan komentar pada bagian berikut dengan menghapus # di depan setiap baris:

<match **>
  type stdout
</match>

Masalah: Tidak dapat terhubung melalui proksi ke Azure Monitor

Kemungkinan penyebabnya

  • Proksi yang ditentukan selama onboard salah.
  • Titik akhir layanan Azure Monitor dan Azure Automation tidak disertakan dalam daftar yang disetujui di pusat data Anda.

Resolusi

  1. Onboarding ulang ke Azure Monitor dengan agen Analitik Log untuk Linux menggunakan perintah berikut dengan opsi -v diaktifkan. Tindakan ini memungkinkan output verbose dari agen yang terhubung melalui proksi ke Azure Monitor: /opt/microsoft/omsagent/bin/omsadmin.sh -w <Workspace ID> -s <Workspace Key> -p <Proxy Conf> -v

  2. Tinjau bagian Pengaturan pembaruan proksi untuk memverifikasi bahwa Anda telah mengonfigurasi agen dengan benar untuk berkomunikasi melalui server proksi.

  3. Periksa kembali apakah titik akhir yang diuraikan dalam daftar persyaratan firewall jaringan Azure Monitor ditambahkan ke daftar yang diizinkan dengan benar. Jika Anda menggunakan Azure Automation, langkah-langkah konfigurasi jaringan yang diperlukan juga ditautkan di atas.

Masalah: Anda menerima kesalahan 403 saat mencoba onboarding

Kemungkinan penyebabnya

  • Kesalahan pada tanggal dan waktu di server Linux.
  • ID ruang kerja dan kunci ruang kerja tidak benar.

Resolusi

  1. Periksa waktu di server Linux Anda dengan tanggal perintah. Jika waktunya +/- 15 menit dari waktu saat ini, maka onboarding gagal. Untuk mengatasi situasi ini, perbarui tanggal dan/atau zona waktu server Linux Anda.
  2. Pastikan Anda telah menginstal versi terbaru agen Analitik Log untuk Linux. Pada versi terbaru, ini memberi tahu Anda jika penyimpangan waktu menyebabkan kegagalan orientasi.
  3. Onboarding ulang menggunakan ID ruang kerja dan kunci ruang kerja yang benar dalam petunjuk penginstalan sebelumnya di artikel ini.

Masalah: Anda melihat kesalahan 500 dan 404 dalam file log tepat setelah onboarding

Hal ini merupakan masalah umum yang terjadi saat unggahan pertama data Linux ke ruang kerja Analitik Log. Masalah ini tidak memengaruhi data yang dikirim atau pengalaman layanan.

Masalah: Anda melihat omiagent menggunakan CPU 100%

Kemungkinan penyebabnya

Regresi dalam paket nss-pem v1.0.3-5.el7 menyebabkan masalah performa yang parah. Kami telah melihat masalah ini muncul banyak dalam distribusi Redhat/CentOS 7.x. Untuk mempelajari masalah ini selengkapnya, lihat 1667121 Regresi performa di libcurl.

Bug terkait performa tidak terjadi sepanjang waktu dan sangat sulit untuk diproduksi ulang. Jika Anda mengalami masalah serupa dengan omiagent, gunakan skrip omiHighCPUDiagnostics.sh, yang akan mengumpulkan jejak tumpukan omiagent saat melebihi abang tertentu.

  1. Unduh skrip:
    wget https://raw.githubusercontent.com/microsoft/OMS-Agent-for-Linux/master/tools/LogCollector/source/omiHighCPUDiagnostics.sh

  2. Jalankan diagnostik selama 24 jam dengan ambang batas CPU 30%:
    bash omiHighCPUDiagnostics.sh --runtime-in-min 1440 --cpu-threshold 30

  3. Callstack akan dicadangkan dalam file omiagent_trace. Jika Anda melihat banyak panggilan fungsi NSS dan curl, ikuti langkah-langkah resolusi ini.

Resolusi

  1. Tingkatkan paket nss-pem ke v1.0.3-5.el7_6.1:
    sudo yum upgrade nss-pem

  2. Jika nss-pem tidak tersedia untuk peningkatan, yang sebagian besar terjadi pada CentOS, turunkan curl ke 7.29.0-46. Jika Anda menjalankan "yum update" secara tidak disengaja, curl akan ditingkatkan ke 7.29.0-51 dan masalah akan terjadi lagi:
    sudo yum downgrade curl libcurl

  3. Mulai ulang OMI:
    sudo scxadmin -restart

Masalah: Anda tidak melihat pesan Syslog yang diteruskan

Kemungkinan penyebabnya

  • Konfigurasi yang diterapkan ke server Linux tidak mengizinkan pengumpulan fasilitas yang dikirimkan atau level log.
  • Syslog tidak diteruskan dengan benar ke server Linux.
  • Jumlah pesan yang diteruskan per detik terlalu banyak untuk ditangani oleh konfigurasi dasar agen Analitik Log untuk Linux.

Resolusi

  • Verifikasi konfigurasi di ruang kerja Analitik Log untuk Syslog memiliki semua fasilitas dan tingkat log yang benar. Tinjau mengonfigurasi pengumpulan Syslog di portal Microsoft Azure.
  • Pastikan daemon olah pesan Syslog asli (rsyslog, syslog-ng) dapat menerima pesan yang diterukan.
  • Periksa pengaturan firewall di server Syslog untuk memastikan bahwa pesan tidak diblokir.
  • Simulasikan pesan Syslog ke Analitik Log menggunakan perintah logger:
    logger -p local0.err "This is my test message"

Masalah: Anda menerima alamat Errno yang sudah digunakan di file log omsagent

Anda melihat [error]: unexpected error error_class=Errno::EADDRINUSE error=#<Errno::EADDRINUSE: Address already in use - bind(2) for "127.0.0.1" port 25224> di omsagent.log.

Kemungkinan penyebabnya

Kesalahan ini menunjukkan bahwa ekstensi diagnostik Linux (LAD) diinstal berdampingan dengan ekstensi VM Linux Analitik Log. Ini menggunakan port yang sama untuk pengumpulan data Syslog sebagai omsagent.

Resolusi

  1. Sebagai akar, jalankan perintah berikut. Perhatikan bahwa 25224 adalah contoh dan mungkin saja Anda akan melihat nomor port yang berbeda yang digunakan LAD di lingkungan Anda.

    /opt/microsoft/omsagent/bin/configure_syslog.sh configure LAD 25229
    
    sed -i -e 's/25224/25229/' /etc/opt/microsoft/omsagent/LAD/conf/omsagent.d/syslog.conf
    

    Anda kemudian perlu mengedit file konfigurasi rsyslogd atau syslog_ng yang benar dan mengubah konfigurasi terkait LAD untuk menulis ke port 25229.

  2. Jika VM menjalankan rsyslogd, file yang akan dimodifikasi adalah /etc/rsyslog.d/95-omsagent.conf (jika ada, selain /etc/rsyslog). Jika VM menjalankan syslog_ng, file yang akan dimodifikasi adalah /etc/syslog-ng/syslog-ng.conf.

  3. Mulai ulang omsagent sudo /opt/microsoft/omsagent/bin/service_control restart.

  4. Mulai ulang layanan Syslog.

Masalah: Anda tidak dapat menghapus instalan omsagen menggunakan opsi hapus menyeluruh

Kemungkinan penyebabnya

  • Ekstensi diagnostik Linux diinstal.
  • Ekstensi diagnostik Linux telah diinstal dan dihapus instalannya, tetapi Anda masih melihat kesalahan tentang omsagen yang digunakan oleh mdsd serta tidak dapat dihapus.

Resolusi

  1. Hapus instalan ekstensi diagnostik Linux.
  2. Hapus file ekstensi diagnostik Linux dari mesin jika file ada di lokasi berikut: /var/lib/waagent/Microsoft.Azure.Diagnostics.LinuxDiagnostic-<version>/ dan /var/opt/microsoft/omsagent/LAD/.

Masalah: Anda tidak dapat melihat data Nagios

Kemungkinan penyebabnya

  • Pengguna Omsagent tidak memiliki izin untuk membaca dari file log Nagios.
  • Sumber dan filter Nagios belum dihapus komentarnya dari file omsagent.conf.

Resolusi

  1. Tambahkan pengguna omsagent untuk membaca dari file Nagios dengan mengikuti instruksi ini.

  2. Dalam file konfigurasi umum agen Analitik Log untuk Linux di /etc/opt/microsoft/omsagent/<workspace id>/conf/omsagent.conf, pastikan bahwa baik sumber dan filter Nagios belum dikomentari.

    <source>
      type tail
      path /var/log/nagios/nagios.log
      format none
      tag oms.nagios
    </source>
    
    <filter oms.nagios>
      type filter_nagios_log
    </filter>
    

Masalah: Anda tidak melihat data Linux apa pun

Kemungkinan penyebabnya

  • Onboarding ke Azure Monitor gagal.
  • Sambungan ke Azure Monitor diblokir.
  • VM di-boot ulang.
  • Paket OMI ditingkatkan secara manual ke versi yang lebih baru dibandingkan dengan yang diinstal oleh agen Analitik Log untuk paket Linux.
  • OMI dibekukan, memblokir agen OMS.
  • Kesalahan kelas tidak ditemukan log sumber daya DSC dalam file log omsconfig.log.
  • Agen Analitik Log untuk data akan dicadangkan.
  • Log DSC Konfigurasi saat ini tidak ada. Jalankan perintah Start-DscConfiguration dengan parameter -Path untuk menentukan file konfigurasi dan membuat konfigurasi saat ini terlebih dahulu. dalam omsconfig.log file log, tetapi tidak ada pesan log tentang PerformRequiredConfigurationChecks operasi.

Resolusi

  1. Instal semua dependensi seperti paket auditd.

  2. Periksa apakah onboarding ke Azure Monitor berhasil dengan memeriksa apakah ada file berikut: /etc/opt/microsoft/omsagent/<workspace id>/conf/omsadmin.conf. Jika tidak, onboarding ulang menggunakan instruksi baris perintah omsadmin.sh.

  3. Jika menggunakan proksi, periksa langkah pemecahan masalah proksi sebelumnya.

  4. Di beberapa sistem distribusi Azure, daemon server OMI omid tidak memulai setelah VM di-boot ulang. Jika demikian, Anda tidak akan melihat data terkait solusi Audit, ChangeTracking, atau UpdateManagement. Solusinya adalah memulai server OMI secara manual dengan menjalankan sudo /opt/omi/bin/service_control restart.

  5. Setelah paket OMI ditingkatkan secara manual ke versi yang lebih baru, paket tersebut harus dihidupkan ulang secara manual agar agen Analitik Log dapat terus berfungsi. Langkah ini diperlukan untuk beberapa distro saat server OMI tidak secara otomatis memulai setelah ditingkatkan. Jalankan sudo /opt/omi/bin/service_control restart untuk menghidupkan ulang OMI.

    Dalam beberapa situasi, OMI bisa membeku. Agen OMS dapat memasuki status terblokir saat menunggu OMI yang akan memblokir semua pengumpulan data. Proses agen OMS akan berjalan tetapi tidak akan ada aktivitas yang dibuktikan dengan tidak adanya baris log baru (seperti heartbeat terkirim) yang ada di omsagent.log. Hidupkan ulang OMI menggunakan sudo /opt/omi/bin/service_control restart untuk memulihkan agen.

  6. Jika Anda melihat kesalahan kelas tidak ditemukan sumber daya DSC di omsconfig.log, jalankan sudo /opt/omi/bin/service_control restart.

  7. Dalam beberapa kasus, ketika agen Analitik Log untuk Linux tidak dapat berkomunikasi dengan Azure Monitor, data pada agen dicadangkan ke ukuran buffer penuh 50 MB. Agen harus dihidupkan ulang dengan menjalankan perintah berikut: /opt/microsoft/omsagent/bin/service_control restart.

    Catatan

    Masalah ini diperbaiki di agen versi 1.1.0-28 atau lebih baru.

    • Jika file log omsconfig.log tidak menunjukkan bahwa operasi PerformRequiredConfigurationChecks berjalan secara berkala pada sistem, mungkin ada masalah dengan layanan/pekerjaan cron. Pastikan pekerjaan cron ada pada /etc/cron.d/OMSConsistencyInvoker. Jika diperlukan, jalankan perintah berikut untuk membuat pekerjaan cron:

      mkdir -p /etc/cron.d/
      echo "*/15 * * * * omsagent /opt/omi/bin/OMSConsistencyInvoker >/dev/null 2>&1" | sudo tee /etc/cron.d/OMSConsistencyInvoker
      
    • Juga, pastikan layanan cron berjalan. Anda dapat menggunakan service cron status dengan Debian, Ubuntu, SUSE, atau service crond status dengan RHEL, CentOS, Oracle Linux untuk memeriksa status layanan ini. Jika layanan tidak ada, Anda dapat menginstal biner dan memulai layanan menggunakan instruksi berikut:

      Ubuntu/Debian

      # To Install the service binaries
      sudo apt-get install -y cron
      # To start the service
      sudo service cron start
      

      SUSE

      # To Install the service binaries
      sudo zypper in cron -y
      # To start the service
      sudo systemctl enable cron
      sudo systemctl start cron
      

      RHEL/CentOS

      # To Install the service binaries
      sudo yum install -y crond
      # To start the service
      sudo service crond start
      

      Oracle Linux

      # To Install the service binaries
      sudo yum install -y cronie
      # To start the service
      sudo service crond start
      

Masalah: Saat mengonfigurasi pengumpulan dari portal untuk penghitung kinerja Linux atau Syslog, pengaturan tidak diterapkan

Kemungkinan penyebabnya

  • Agen Analitik Log untuk Linux belum mengambil konfigurasi terbaru.
  • Pengaturan yang diubah di portal tidak diterapkan.

Resolusi

Latar Belakang:omsconfig adalah agen Analitik Log untuk agen konfigurasi Linux yang mencari konfigurasi sisi portal baru setiap lima menit. Konfigurasi ini kemudian diterapkan ke agen Analitik Log untuk file konfigurasi Linux yang terletak di /etc/opt/microsoft/omsagent/conf/omsagent.conf.

Dalam beberapa kasus, agen Analitik Log untuk agen konfigurasi Linux mungkin tidak dapat berkomunikasi dengan layanan konfigurasi portal. Skenario ini mengakibatkan konfigurasi terbaru tidak diterapkan.

  1. Periksa apakah omsconfig agen telah dipasang dengan menjalankan dpkg --list omsconfig atau rpm -qi omsconfig. Jika tidak terinstal, instal ulang versi terbaru agen Analitik Log untuk Linux.

  2. Periksa apakah agen omsconfig dapat berkomunikasi dengan Azure Monitor dengan menjalankan perintah berikut: sudo su omsagent -c 'python /opt/microsoft/omsconfig/Scripts/GetDscConfiguration.py'. Perintah ini mengembalikan konfigurasi yang diterima agen dari layanan, termasuk pengaturan Syslog, penghitung kinerja Linux, dan log kustom. Jika perintah ini gagal, jalankan perintah berikut: sudo su omsagent -c 'python /opt/microsoft/omsconfig/Scripts/PerformRequiredConfigurationChecks.py'. Perintah ini memaksa agen omsconfig untuk berbicara dengan Azure Monitor dan mengambil konfigurasi terbaru.

Masalah: Anda tidak melihat data log kustom apa pun

Kemungkinan penyebabnya

  • Onboarding ke Azure Monitor gagal.
  • Pengaturan Terapkan konfigurasi berikut ini ke Server Linux saya belum dipilih.
  • omsconfig belum mengambil konfigurasi log kustom terbaru dari layanan.
  • Agen Analitik Log untuk pengguna Linux omsagent tidak dapat mengakses log kustom karena izin atau tidak ditemukan. Anda mungkin melihat kesalahan berikut:
    • [DATETIME] [warn]: file not found. Continuing without tailing it.
    • [DATETIME] [error]: file not accessible by omsagent.
  • Masalah Umum dengan kondisi race yang diperbaiki di agen Analitik Log untuk Linux versi 1.1.0-217.

Resolusi

  1. Pastikan apakah onboarding ke Azure Monitor berhasil dengan memeriksa apakah ada file berikut: /etc/opt/microsoft/omsagent/<workspace id>/conf/omsadmin.conf. Jika tidak, baik:

    1. Onboarding ulang menggunakan instruksi baris perintah omsadmin.sh.
    2. Pada Pengaturan Tingkat Lanjut di portal Azure, pastikan bahwa setelan Terapkan konfigurasi berikut ke Server Linux saya diaktifkan.
  2. Periksa apakah agen omsconfig dapat berkomunikasi dengan Azure Monitor dengan menjalankan perintah berikut: sudo su omsagent -c 'python /opt/microsoft/omsconfig/Scripts/GetDscConfiguration.py'. Perintah ini mengembalikan konfigurasi yang diterima agen dari layanan, termasuk pengaturan Syslog, penghitung kinerja Linux, dan log kustom. Jika perintah ini gagal, jalankan perintah berikut: sudo su omsagent -c 'python /opt/microsoft/omsconfig/Scripts/PerformRequiredConfigurationChecks.py'. Perintah ini memaksa agen omsconfig untuk berbicara dengan Azure Monitor dan mengambil konfigurasi terbaru.

Latar belakang: Alih-alih agen Analitik log untuk Linux berjalan sebagai pengguna istimewa - root, agen berjalan sebagai pengguna omsagent. Dalam kebanyakan kasus, izin eksplisit harus diberikan kepada pengguna ini agar dapat membaca file tertentu. Untuk memberikan izin kepada pengguna omsagent, jalankan perintah berikut:

  1. Menambahkan pengguna omsagent ke grup tertentu: sudo usermod -a -G <GROUPNAME> <USERNAME>.
  2. Memberikan akses baca universal ke file yang diperlukan: sudo chmod -R ugo+rx <FILE DIRECTORY>.

Ada masalah umum terkait kondisi race dengan agen Analitik Log untuk versi Linux lebih lama dari versi 1.1.0-217. Setelah memperbarui ke agen terbaru, jalankan perintah berikut untuk mendapatkan versi terbaru dari plug-in output: sudo cp /etc/opt/microsoft/omsagent/sysconf/omsagent.conf /etc/opt/microsoft/omsagent/<workspace id>/conf/omsagent.conf.

Masalah: Anda mencoba onboarding ulang ke ruang kerja baru

Saat Anda mencoba onboarding ulang agen ke ruang kerja baru, konfigurasi agen Log Analytics perlu dibersihkan sebelum melakukan onboarding ulang. Untuk membersihkan konfigurasi lama dari agen, jalankan bundel shell dengan --purge:

sudo sh ./omsagent-*.universal.x64.sh --purge

Atau

sudo sh ./onboard_agent.sh --purge

Anda dapat melanjutkan onboarding ulang setelah menggunakan opsi --purge.

Masalah: Ekstensi agen Analitik Log di portal Microsoft Azure ditandai dengan status gagal: Provisi gagal

Kemungkinan penyebabnya

  • Agen Analitik Log telah dihapus dari sistem operasi.
  • Layanan agen Analitik Log berhenti, dinonaktifkan, atau tidak dikonfigurasi.

Resolusi

  1. Menghapus ekstensi dari portal Microsoft Azure.
  2. Instal agen dengan mengikuti petunjuk berikut.
  3. Mulai ulang agen dengan menjalankan perintah berikut:
    sudo /opt/microsoft/omsagent/bin/service_control restart.
  4. Tunggu beberapa menit hingga status provisi berubah ke Provisi berhasil.

Masalah: Peningkatan agen Analitik Log sesuai permintaan

Kemungkinan penyebabnya

Paket agen Analitik Log di host sudah usang.

Resolusi

  1. Periksa rilis terbaru di halaman GitHub ini.

  2. Unduh skrip penginstalan (1.4.2-124 adalah versi contoh):

    wget https://github.com/Microsoft/OMS-Agent-for-Linux/releases/download/OMSAgent_GA_v1.4.2-124/omsagent-1.4.2-124.universal.x64.sh
    
  3. Tingkatkan paket dengan mengeksekusi sudo sh ./omsagent-*.universal.x64.sh --upgrade.

Masalah: Penginstalan gagal dilakukan dengan keterangan Python2 tidak dapat mendukung ctypes, meskipun Python3 sedang digunakan

Kemungkinan penyebabnya

Untuk masalah ini, jika bahasa pemrogram VM bukan bahasa Inggris, pemeriksaan akan gagal saat memverifikasi versi Python mana yang sedang digunakan. Masalah ini menyebabkan agen selalu mengasumsikan bahwa Python2 sedang digunakan dan akan gagal jika tidak ada Python2.

Resolusi

Ubah bahasa lingkungan mesin virtual menjadi bahasa Inggris:

export LANG=en_US.UTF-8