Bagikan melalui


Memantau dan memecahkan masalah agen penyerapan Azure Operator Insights

Untuk gambaran umum agen penyerapan, lihat Gambaran umum agen penyerapan.

Jika Anda melihat masalah dengan pengumpulan data dari agen penyerapan Anda, gunakan informasi di bagian ini untuk memperbaiki masalah umum atau membuat paket diagnostik. Anda dapat mengunggah paket diagnostik untuk mendukung tiket yang Anda buat di portal Azure.

Agen penyerapan adalah paket perangkat lunak, sehingga diagnostik terbatas pada fungsi aplikasi. Kami tidak menyediakan OS atau pemantauan sumber daya. Anda dianjurkan untuk menggunakan alat standar seperti snmpd, pengekspor simpul Prometheus, atau alat lain untuk mengirim data, log, dan metrik tingkat OS ke sistem pemantauan Anda sendiri. Memantau komputer virtual dengan Azure Monitor menjelaskan alat yang dapat Anda gunakan jika agen penyerapan Anda berjalan di Azure VM.

Agen menulis log dan metrik ke file di bawah /var/log/az-aoi-ingestion/. Jika agen gagal memulai karena alasan apa pun, seperti kesalahan konfigurasi, file stdout.log berisi log yang dapat dibaca manusia yang menjelaskan masalah tersebut.

Metrik dilaporkan dalam bentuk sederhana yang ramah manusia.

Prasyarat

  • Untuk sebagian besar teknik pemecahan masalah ini, Anda memerlukan koneksi SSH ke VM yang menjalankan agen.

Diagnostik agen penyerapan

Untuk mengumpulkan paket diagnostik, SSH ke Komputer Virtual dan jalankan perintah /usr/bin/microsoft/az-aoi-ingestion-gather-diags. Perintah ini menghasilkan file zip bertanda tanggal di direktori saat ini yang dapat Anda salin dari sistem.

Jika Anda telah mengonfigurasi kumpulan log melalui agen Azure Monitor, Anda dapat melihat log agen penyerapan di tampilan portal ruang kerja Analitik Log Anda, dan mungkin tidak perlu mengumpulkan paket diagnostik untuk men-debug masalah Anda.

Catatan

Dukungan Microsoft mungkin meminta paket diagnostik saat menyelidiki masalah. Paket diagnostik tidak berisi data pelanggan atau nilai kredensial apa pun.

Masalah umum untuk semua sumber

Masalah secara luas termasuk dalam empat kategori.

  • Kesalahan konfigurasi agen, yang mencegah agen memulai.
  • Masalah dengan menerima data dari sumber, biasanya salah konfigurasi, atau konektivitas jaringan.
  • Masalah dengan mengunggah file ke akun penyimpanan input Produk Data, biasanya konektivitas jaringan.
  • Masalah dengan VM tempat agen berjalan.

Agen gagal memulai

Gejala: sudo systemctl status az-aoi-ingestion menunjukkan bahwa layanan dalam keadaan gagal.

  • Pastikan layanan berjalan.
    sudo systemctl start az-aoi-ingestion
    
  • Lihat file /var/log/az-aoi-ingestion/stdout.log dan periksa kesalahan yang dilaporkan. Perbaiki masalah apa pun dengan file konfigurasi dan mulai agen lagi.

Tidak ada data yang muncul di Azure Operator Insights

Gejala: tidak ada data yang muncul di Azure Data Explorer.

  • Periksa konektivitas jaringan dan konfigurasi firewall antara agen penyerapan VM dan akun penyimpanan input Produk Data.
  • Periksa log dari agen penyerapan untuk kesalahan yang diunggah ke Azure. Jika log menunjuk ke masalah autentikasi, periksa apakah konfigurasi agen memiliki pengaturan dan autentikasi sink yang benar untuk Produk Data Anda. Kemudian mulai ulang agen.
  • Periksa apakah agen penyerapan menerima data dari sumbernya. Periksa konektivitas jaringan dan konfigurasi firewall antara jaringan Anda dan agen penyerapan.

Masalah dengan sumber MCC EDR

Bagian ini mencakup masalah khusus untuk sumber MCC EDR.

Anda juga dapat menggunakan diagnostik yang disediakan oleh MCC, atau oleh Wawasan Operator Azure itu sendiri di Azure Monitor, untuk membantu mengidentifikasi dan men-debug masalah penyerapan.

PKS tidak dapat tersambung

Gejala: MCC melaporkan alarm tentang MSF yang tidak tersedia.

  • Periksa apakah agen sedang berjalan.
  • Pastikan bahwa MCC dikonfigurasi dengan IP dan port yang benar.
  • Periksa log dari agen dan lihat apakah itu melaporkan koneksi. Jika tidak, periksa konektivitas jaringan ke VM agen dan verifikasi bahwa firewall tidak memblokir lalu lintas ke port 36001.
  • Kumpulkan pengambilan paket untuk melihat di mana koneksi gagal.

Tidak ada EDR yang muncul di Azure Operator Insights

Gejala: tidak ada data yang muncul di Azure Data Explorer.

  • Periksa apakah PKS sehat dan agen penyerapan berjalan.
  • Periksa log agen penyerapan dalam paket diagnostik untuk kesalahan yang diunggah ke Azure. Jika log menunjuk ke string koneksi yang tidak valid, atau masalah konektivitas, perbaiki konfigurasi, string koneksi, atau token SAS, dan mulai ulang agen.
  • Periksa konektivitas jaringan dan konfigurasi firewall pada akun penyimpanan.

Data hilang atau tidak lengkap

Gejala: Azure Monitor menunjukkan tingkat EDR masuk yang lebih rendah di ADX dari yang diharapkan.

  • Periksa apakah agen berjalan di semua VM dan tidak melaporkan kesalahan dalam log paket diagnostik.
  • Verifikasi bahwa VM agen tidak dikirim lebih dari beban berperingkat.
  • Periksa metrik agen dalam paket diagnostik untuk EDR yang dihilangkan/dihilangkan. Jika metrik tidak menampilkan data yang dihilangkan, maka MCC tidak mengirim data ke agen. Periksa metrik "byte yang diterima" untuk melihat berapa banyak data yang diterima dari PKS.
  • Periksa apakah VM agen tidak kelebihan beban – pantau penggunaan CPU dan memori. Secara khusus, pastikan tidak ada proses lain yang mengambil sumber daya dari VM.

Masalah dengan sumber penarikan SFTP

Bagian ini mencakup masalah khusus untuk sumber penarikan SFTP.

Anda juga dapat menggunakan diagnostik yang disediakan oleh Azure Operator Insights itu sendiri di Azure Monitor untuk membantu mengidentifikasi dan men-debug masalah penyerapan.

Agen tidak dapat tersambung ke server SFTP

Gejala: Tidak ada file yang diunggah ke Azure Operator Insights. File log agen, /var/log/az-aoi-ingestion/stdout.log, berisi kesalahan tentang menyambungkan server SFTP.

  • Verifikasi pengguna dan kredensial SFTP yang digunakan oleh agen valid untuk server SFTP.
  • Periksa konektivitas jaringan dan konfigurasi firewall antara agen dan server SFTP. Secara default, server SFTP harus membuka port 22 untuk menerima koneksi SFTP.
  • known_hosts Periksa apakah file pada agen VM berisi kunci SSH publik yang valid untuk server SFTP:
    • Pada agen VM, jalankan ssh-keygen -l -F *<sftp-server-IP-or-hostname>*.
    • Jika tidak ada output, maka known_hosts tidak berisi entri yang cocok. Ikuti instruksi dalam Menyiapkan agen penyerapan Azure Operator Insights untuk menambahkan known_hosts entri untuk server SFTP.

Tidak ada file yang diunggah ke Azure Operator Insights

Gejala: Tidak ada data yang muncul di Azure Data Explorer. Log kategori Ingestion tidak muncul di data pemantauan Azure Operator Insights atau berisi kesalahan. Metrik kualitas data Jumlah baris yang diserap untuk jenis data yang relevan adalah nol.

  • Periksa apakah agen berjalan di semua VM dan tidak melaporkan kesalahan dalam log.
  • Periksa apakah file ada di lokasi yang benar di server SFTP, dan file tersebut tidak dikecualikan karena konfigurasi sumber file (lihat File hilang).
  • Pastikan bahwa pengguna SFTP yang dikonfigurasi dapat membaca semua direktori di bawah base_path, konfigurasi sumber file mana yang tidak dikecualikan.
  • Periksa konektivitas jaringan dan konfigurasi firewall antara agen penyerapan VM dan akun penyimpanan input Produk Data.

File hilang

Gejala: Data hilang dari Azure Data Explorer. Log kategori Ingestion dalam data pemantauan Azure Operator Insights lebih rendah dari yang diharapkan atau berisi kesalahan. Metrik kualitas data Jumlah baris yang diserap untuk jenis data yang relevan lebih rendah dari yang diharapkan.

  • Periksa apakah agen berjalan di semua VM dan tidak melaporkan kesalahan dalam log. Cari di log paket diagnostik untuk nama file yang hilang untuk menemukan kesalahan yang terkait dengan file tersebut.
  • Periksa apakah file ada di server SFTP dan file tersebut tidak dikecualikan karena konfigurasi sumber file. Periksa konfigurasi sumber file dan konfirmasikan bahwa:
    • File ada di server SFTP di bawah jalur yang ditentukan dalam base_path. Pastikan bahwa tidak ada tautan simbolis di jalur file file yang akan diunggah: agen penyerapan mengabaikan tautan simbolis.
    • Waktu "terakhir diubah" file setidaknya settling_time detik lebih awal dari waktu unggahan terbaru yang dijalankan untuk sumber file ini.
    • Waktu "terakhir diubah" file lebih lambat dari exclude_before_time (jika ditentukan).
    • Jalur file relatif untuk base_path mencocokkan ekspresi reguler yang diberikan oleh include_pattern (jika ditentukan).
    • Jalur file relatif base_pathtidak cocok dengan ekspresi reguler yang diberikan oleh exclude_pattern (jika ditentukan).
  • Jika file terbaru hilang, periksa log agen dalam paket diagnostik untuk mengonfirmasi bahwa agen penyerapan melakukan unggahan yang dijalankan untuk sumber pada waktu yang diharapkan. Parameter cron dalam konfigurasi sumber memberikan jadwal yang diharapkan.
  • Periksa apakah VM agen tidak kelebihan beban – pantau penggunaan CPU dan memori. Secara khusus, pastikan tidak ada proses lain yang mengambil sumber daya dari VM.

File diunggah lebih dari sekali

Gejala: Data duplikat muncul di Azure Operator Insights.

  • Periksa apakah agen penyerapan mengalami kesalahan yang dapat dicoba kembali dalam log paket diagnostik pada unggahan sebelumnya lalu coba lagi yang mengunggah lebih dari 24 jam setelah unggahan terakhir berhasil. Dalam hal ini, agen mungkin mengunggah data duplikat selama upaya coba lagi. Duplikasi data hanya boleh memengaruhi upaya coba lagi.
  • Periksa apakah sumber file yang ditentukan dalam file konfigurasi mengacu pada set file yang tidak tumpang tindih. Jika beberapa sumber file dikonfigurasi untuk menarik file dari lokasi yang sama di server SFTP, gunakan include_pattern bidang konfigurasi dan exclude_pattern untuk menentukan set file berbeda yang harus dipertimbangkan oleh setiap sumber file.
  • Jika Anda menjalankan beberapa instans agen penyerapan SFTP, periksa apakah sumber file yang dikonfigurasi untuk setiap agen tidak tumpang tindih dengan sumber file pada agen lain. Secara khusus, cari konfigurasi sumber file yang secara tidak sengaja disalin dari konfigurasi agen lain.
  • Jika Anda baru-baru ini mengubah alur id untuk sumber file yang dikonfigurasi exclude_before_time , gunakan bidang untuk menghindari file yang dimuat ulang dengan alur idbaru . Untuk petunjuknya, lihat Mengubah konfigurasi untuk agen penyerapan untuk Azure Operator Insights.

Pelajari cara: