Memori dan pengetahuan di Azure SRE Agent

Agen Anda menjadi lebih efektif dari waktu ke waktu dengan mengingat apa yang berhasil dalam insiden sebelumnya dan mereferensikan dokumentasi Anda.

Diagram memperlihatkan SearchMemory mengkueri tiga sumber: insiden sebelumnya, memori pengguna, dan dokumen untuk memberikan respons dasar dengan kutipan.

Cara kerja memori

Ketika Anda mengajukan pertanyaan, agen Anda mencari di semua sumber pengetahuan secara bersamaan.

Sumber Apa yang ditemukannya Paling cocok untuk
Insiden sebelumnya Langkah-langkah yang mengatasi masalah serupa "Bagaimana kita memperbaiki ini sebelumnya?"
Kenangan pengguna Fakta yang Anda simpan secara eksplisit "Ingat penggunaan lingkungan saya..."
Pangkalan pengetahuan Runbook dan dokumen anda yang diunggah "Ikuti prosedur standar kami"

Agen mengembalikan respons yang terstruktur dengan kutipan yang dapat diklik yang menunjukkan dari mana informasi berasal.

Pembelajaran otomatis

Agen Anda belajar dari setiap percakapan. Ini tidak memerlukan pelatihan manual.

Diagram yang menunjukkan agen secara otomatis mengekstrak pembelajaran setelah setiap sesi: gejala, langkah resolusi, akar penyebab, dan perangkap untuk dihindari.

Setelah setiap thread selesai, agen merekam informasi berikut.

Apa Deskripsi
Gejala yang diamati Pesan kesalahan, perilaku, pola
Langkah-langkah yang berhasil Jalur resolusi yang berhasil
Akar masalah Apa yang menyebabkan masalah
Perangkap untuk dihindari Apa yang tidak berhasil, jalan buntu

Proses ini terjadi secara otomatis. Tiga puluh menit setelah utas diam, agen mengevaluasi percakapan dan mengindeks pembelajaran.

Prioritas sumber daya yang sama

Saat menyelidiki masalah sumber daya, agen memprioritaskan sesi sebelumnya pada sumber daya yang sama persis.

"App Service app-prod-01 is returning 503 errors"

Agen Anda pertama-tama memeriksa apakah ia telah melihat masalah pada app-prod-01 sebelumnya. Jika ya, pembelajaran tersebut muncul terlebih dahulu karena mereka yang paling relevan.

Keberlanjutan pengetahuan proaktif

Selain belajar dari utas yang telah selesai, agen AI Anda secara aktif menyimpan apa yang ditemukannya selama sesi percakapan. Ketika agen Anda menemukan sesuatu yang penting (konfigurasi yang sulit, dependensi yang tidak terlihat jelas, atau masalah tak terduga saat penelusuran kesalahan), agen Anda mencatat wawasan dalam file pengetahuan yang persisten yang dibawa melintasi sesi.

Cara kerjanya

Agen Anda menyimpan direktori pengetahuan di memories/synthesizedKnowledge/. Agen secara otomatis memuat file khusus, overview.md, ke dalam prompt sistem di awal setiap percakapan. Pendekatan ini memberi agen Anda akses langsung ke konteks paling penting tentang lingkungan Anda.

Komponen Apa fungsinya
overview.md Ringkasan dan indeks layanan. Selalu dimuat ke dalam konteks (sekitar batas 2.000 karakter).
File topik Catatan terperinci tentang subjek tertentu (misalnya, aks-networking-gotchas.md).
Tautan dari gambaran umum overview.md menautkan ke file topik sehingga agen Anda tahu pengetahuan terperinci yang ada.

Yang disimpan oleh agen Anda

Agen Anda secara proaktif merekam wawasan selama percakapan.

Kategori Examples
Batasan masalah "Layanan ini tidak dapat menskalakan lebih dari 10 replika karena batas kuota."
Strategi yang berhasil "Memulai ulang pod dengan --grace-period=0 menyelesaikan penyebaran yang macet."
Strategi yang gagal "Meningkatkan batas memori tidak membantu. Masalahnya adalah penurunan kecepatan CPU.
Dependensi yang tidak jelas "app-frontend bergantung pada proxy sidecar yang harus dijalankan terlebih dahulu."
Detail konfigurasi "Produksi menggunakan sertifikat TLS kustom yang disimpan di Key Vault."

Organisasi pengetahuan

Agen Anda mengatur pengetahuan secara semantik berdasarkan topik, bukan secara kronologis. Setiap file adalah referensi mandiri.

File Apa yang ditangkapnya
overview.md Ringkasan layanan, tautan kunci, indeks file topik (~2.000 karakter)
team.md Anggota tim, peran, keahlian (~500 karakter)
architecture.md Komponen, koneksi, lingkungan (~1.500 karakter)
logs.md Sumber log, tabel, bidang kunci, kueri yang berguna (~1.500 karakter)
deployment.md Detail alur, pencarian versi, prosedur putar kembali (~1.000 karakter)
auth.md Mekanisme autentikasi, alur identitas (~800 karakter)
debugging.md Masalah umum, panduan pemecahan masalah, tautan runbook (~1.000 karakter)
queries/*.md Kueri yang diekstrak diatur menurut topik (masing-masing~1.000 karakter)

Saat memperbarui pengetahuan yang ada, agen Anda membaca file saat ini, menggabungkan informasi baru, dan menghapus apa pun yang menjadi kedaluarsa atau salah.

Petunjuk

Anda dapat meminta agen Anda untuk menyimpan pengetahuan juga

Di luar persistensi otomatis, Anda dapat secara eksplisit meminta agen Anda untuk menyimpan informasi ke file pengetahuannya:

Save this to your knowledge: our Redis cache uses Premium tier with 6GB,
and failover takes about 90 seconds.

Agen Anda membuat atau memperbarui file pengetahuan yang sesuai dan menautkannya dari overview.md.

Pendekatan ini berbeda dari #remember perintah (dijelaskan di bagian berikutnya), yang menyimpan fakta diskrit ke penyimpanan memori terpisah. File pengetahuan adalah referensi persisten yang disusun dan dikonsultasikan oleh agen Anda di awal setiap percakapan. Kenangan pengguna adalah fakta individual yang dapat dicari melalui #retrieve.

Kenangan pengguna

Di luar apa yang dipelajari dan dipertahankan agen Anda secara otomatis, Anda dapat secara eksplisit menyimpan fakta diskrit untuk diingat agen Anda. Memori pengguna sangat ideal untuk detail khusus lingkungan yang mungkin tidak muncul dalam insiden tetapi penting untuk konteks.

Tabel berikut ini menjelaskan kandidat yang baik untuk memori pengguna.

Kategori Examples
Fakta lingkungan Produksi menggunakan tiga buah kluster AKS di Wilayah Barat AS 2
Preferensi tim "Kami lebih suka CLI daripada portal untuk penyebaran"
Detail arsitektur "app-service-01 tergantung pada sql-prod"
Jalur eskalasi "PagerDuty, lalu saluran Teams, lalu telepon"

Perintah memori

Mengelola memori pengguna dengan menggunakan perintah obrolan ini.

Perintah Apa fungsinya Example
#remember Menyimpan fakta untuk referensi di masa mendatang #remember our Redis cache uses Premium tier
#retrieve Cari kenangan tersimpan Anda #retrieve what's our caching setup?
#forget Menghapus memori yang disimpan #forget the outdated Redis info

Contoh berikut menunjukkan alur kerja memori umum.

Simpan konteks penting:

#remember Production uses 3 AKS clusters in West US 2
#remember Our escalation path: PagerDuty, then Teams channel, then phone
#remember Database failover takes approximately 15 minutes

Ambil nanti:

#retrieve how long does database failover take?

Agen merespons berdasarkan memori yang disimpan: "Kegagalan database membutuhkan waktu sekitar 15 menit."

Dasar pengetahuan

Unggah dokumentasi Anda dan sambungkan sumber eksternal untuk memberi agen Anda pustaka referensi yang lebih luas.

Diagram yang menunjukkan pengetahuan yang berasal dari dokumen yang diunggah dan konektor MCP, semuanya dapat dicari bersama-sama.

Unggah dokumen

Buka Builder>Basis Pengetahuan untuk mengunggah dokumentasi Anda. Untuk detail lengkap tentang format, batas, dan cara agen Anda membuat pengetahuan secara otomatis, lihat Mengunggah dokumen pengetahuan.

Jenis dokumen Bagus untuk
Runbooks Prosedur insiden langkah demi langkah
Panduan arsitektur Memahami lingkungan Anda
Playbook saat panggilan Prosedur eskalasi dan respons
Dokumentasi API Pengetahuan khusus layanan
Prosedur Tim Alur kerja dan dokumen proses

Format yang didukung: Markdown, teks biasa, PDF, Word, PowerPoint, Excel, gambar, dan lainnya. Ukuran maksimum adalah 16 MB per file. Untuk daftar lengkapnya, lihat Mengunggah dokumen pengetahuan.

Menyambungkan sumber eksternal

Akses pengetahuan langsung dari sistem eksternal dengan menggunakan konektor. Untuk daftar lengkap sumber yang didukung, lihat Konektor.

Konektor Apa yang disediakannya
Azure DevOps Mengkueri halaman wiki ADO Anda
GitHub Pencarian repositori, wiki, dan isu
MCP Kustom Sumber pengetahuan apa pun yang Anda konfigurasi

Mengonfigurasi konektor diBuilder>Konektor. Untuk informasi selengkapnya, lihat Konektor.

Menggunakan pengetahuan dalam percakapan

Agen Anda secara otomatis mencari pengetahuan ketika relevan dengan pertanyaan.

How should I handle a database failover?

Jika Anda mengunggah runbook, agen merespons dengan jawaban yang berbasis fakta:

Berdasarkan Database Runbook(tautan referensi), berikut adalah langkah-langkah prosedur failover:

  1. Verifikasi kesehatan replika sekunder...

Pilih tautan kutipan untuk menampilkan dokumen sumber lengkap.

Wawasan sesi

Setelah setiap utas (baik percakapan obrolan sinkron maupun tugas yang dipicu secara otomatis asinkron), agen Anda akan menghasilkan wawasan sesi. Wawasan sesi adalah bagaimana agen Anda menjadi lebih cerdas dari waktu ke waktu.

Apa yang akan ditangkap

Setiap wawasan dari setiap sesi mengekstrak pembelajaran yang terstruktur yang menjadi memori yang bisa dicari.

Komponen Apa yang ditangkapnya Example
Gejala yang diamati Pola kesalahan, perilaku "Error HTTP 503, memori sudah mencapai 95%"
Langkah-langkah resolusi Apa yang berhasil "Meningkatkan SKU App Service"
Akar masalah Mengapa itu terjadi "Kebocoran memori dalam penyebaran v2.3"
Perangkap untuk dihindari Apa yang tidak berhasil "Memulai ulang tidak membantu"

Ketika sistem menghasilkan wawasan

Tabel berikut menjelaskan kapan sistem menghasilkan wawasan sesi.

Jenis benang Kapan Otomatis atau manual
Sinkronkan percakapan 30 menit setelah pesan terakhir Otomatis
Tugas asinkron 30 menit setelah selesai Otomatis
umpan balik pengguna Saat Anda menilai respons Anda memicunya

Lihat wawasan sesi

Buka Monitor>Wawasan Sesi untuk melihat:

  • Garis waktu tindakan agen
  • Skor evaluasi
  • Pembelajaran kunci diekstrak
  • Tautan utas sumber: setiap kartu wawasan ditautkan kembali ke utas yang menghasilkan kartu tersebut, sehingga Anda dapat melacak setiap wawasan ke percakapan aslinya

Untuk metrik dan manajemen terperinci, lihat Pantau penggunaan agen.

Praktik terbaik

Ikuti rekomendasi ini untuk mendapatkan nilai maksimal dari kemampuan memori dan pengetahuan agen Anda.

Pilih apa yang akan diunggah vs. sambungkan

Unggah Menyambungkan melalui konektor
Panduan insiden Halaman wiki langsung (ADO, GitHub)
Diagram arsitektur Repositori kode sumber
Prosedur eskalasi Data pemantauan langsung
Dokumentasi API statis Dokumen yang sering diperbarui

Menjaga pengetahuan tetap terkini

Dokumen yang kedaluarsa menyebabkan respons yang salah. Tinjau pangkalan pengetahuan Anda triwulanan. Untuk melihat dokumen apa yang saat ini dimiliki agen Anda, tanyakan:

What knowledge documents do you have?

Hapus dokumen yang kedaluarsa di Pangkalan Pengetahuan Builder>.

Beri nama dokumen dengan jelas

Gunakan nama file deskriptif untuk membantu agen Anda dan tim Anda menemukan dokumentasi yang tepat dengan cepat.

Jangan gunakan Gunakan sebagai gantinya
doc1.txt production-database-failover.md
runbook.md aks-cluster-scaling-runbook.md
notes.txt prosedur-eskalasi-2026.txt
Sumber Daya Mengapa penting
Mengunggah dokumen pengetahuan Dukungan format file terperinci, batasan, dan pengetahuan yang dihasilkan agen
Konektor Bagaimana konektor membawa data eksternal ke agen Anda
Agen khusus Bagaimana agen kustom menggunakan pengetahuan dalam alur kerja