Bagikan melalui


Sistem memori dalam pratinjau Agen SRE

Sistem memori Agen SRE memberi agen pengetahuan yang mereka butuhkan untuk memecahkan masalah secara efektif. Dengan menambahkan runbook, standar tim, dan konteks khusus layanan, Anda membantu agen memberikan jawaban yang lebih baik selama insiden. Sistem belajar dari setiap sesi untuk meningkatkan dari waktu ke waktu.

Komponen memori

Sistem memori terdiri dari empat komponen pelengkap:

Komponen Tujuan Pengaturan Paling cocok untuk
Memori Pengguna Perintah obrolan cepat untuk pengetahuan tim Pesan Instan (perintah obrolan) Standar tim, konfigurasi layanan, pola alur kerja
Basis Pengetahuan Unggahan langsung dokumen untuk runbook Unggahan file cepat Runbook statis, panduan pemecahan masalah, dokumentasi internal
Konektor dokumentasi Sinkronisasi Azure DevOps otomatis Konfigurasi diperlukan Dokumentasi Aktif, panduan yang sering diperbarui
Wawasan sesi Memori yang dihasilkan agen dari sesi Otomatis Pola pemecahan masalah yang dipelajari, resolusi insiden sebelumnya

Bagaimana agen mengambil kembali memori

Selama percakapan, agen mengambil informasi dari sumber memori melalui alat yang dikonfigurasi.

Diagram perulangan sistem memori Azure SRE Agent.

Konfigurasi alat

Alat ini SearchMemory mengambil kembali semua komponen memori. Ini mencari di seluruh memori pengguna, pangkalan pengetahuan, wawasan sesi, dan konektor dokumentasi secara bersamaan.

  • Agen SRE (default): SearchMemory bawaan
  • Subagen kustom: Tambahkan SearchMemory alat ke konfigurasi Anda

Penting

Jangan menyimpan rahasia, kredensial, kunci API, atau data sensitif dalam komponen memori apa pun. Tim Anda berbagi memori, dan sistem mengindeksnya untuk pencarian.

Parameter pencarian yang disempurnakan

Alat ini SearchNodes mendukung opsi pemfilteran untuk pencarian yang lebih ditargetkan:

Pengaturan Tipe Description
entityType string Memfilter hasil menurut jenis entitas, seperti Incident, , Serviceatau Resource.
includeNeighbors bool Sertakan simpul yang tersambung dalam hasil pencarian.

Example:

Search for all incidents related to "database timeout" and include connected resources

Saat Anda mengatur includeNeighbors ke true, pencarian tidak hanya menampilkan simpul insiden yang cocok tetapi juga yang terhubung dengannya.

  • Resources
  • Services
  • Insiden terkait
  • Dokumen tertaut

Dengan menunjukkan grafik hubungan lengkap sekeliling simpul yang cocok, Anda mendapatkan konteks yang lebih kaya selama penyelidikan.

Memulai dengan Cepat

Mulailah dengan membangun pengetahuan dasar dengan memori pengguna, lalu perluas ke penyimpanan dokumen dan sinkronisasi otomatis saat kebutuhan Anda tumbuh.

1. Mulailah dengan kenangan pengguna

Gunakan perintah obrolan untuk menyimpan pengetahuan tim segera:

#remember Team owns services: app-service-prod, redis-cache-prod, and sql-db-prod

#remember For latency issues, check Redis cache health first

#remember Production deployments happen Tuesdays at 2 PM PST

Fakta-fakta ini sekarang tersedia di semua percakapan.

2. Unggah dokumen kunci

Tambahkan runbook dan panduan penting ke pangkalan pengetahuan:

  1. Buka Agen SRE Anda di portal Microsoft Azure.

  2. Buka Pengaturan>Basis pengetahuan.

  3. Pilih Tambahkan file atau seret dan letakkan file ke area unggahan.

  4. Unggah .md atau .txt file (masing-masing hingga 16 MB).

  5. Sistem mengindeks file dan membuatnya tersedia untuk diambil melalui SearchMemory.

3. Tinjau wawasan sesi

Setelah sesi pemecahan masalah, periksa Pengaturan>Wawasan sesi untuk melihat apa yang berjalan dengan baik dan di mana agen membutuhkan lebih banyak konteks. Gunakan wawasan untuk mengidentifikasi kesenjangan pengetahuan dan menambahkan memori atau dokumentasi yang ditargetkan.

4. Menyambungkan repositori (opsional)

Untuk tim dengan dokumentasi yang ada di Azure DevOps:

  1. Buka Pengaturan>Konektor.

  2. Pilih Tambahkan konektor dan pilih Konektor dokumentasi.

  3. Masukkan URL repositori Azure DevOps Anda dan pilih identitas terkelola.

    Konektor mulai mengindeks secara otomatis.

Kenangan pengguna

Memori pengguna memungkinkan Anda menyimpan fakta, standar, dan konteks tim yang diingat agen di semua percakapan. Dengan menggunakan perintah obrolan sederhana (#remember, #forget, ), #retrieveAnda dapat membangun pangkalan pengetahuan persisten yang secara otomatis meningkatkan respons agen.

Perintah obrolan

Menyimpan informasi dengan menggunakan #remember

Simpan fakta, standar, atau konteks untuk percakapan di masa mendatang.

Sintaks:

#remember [content to save]

Contoh:

#remember Team owns app-service-prod in East US region
#remember For app-service-prod latency issues, check Redis cache health first
#remember Team uses Kusto for logs. Workspace is "myteam-prod-logs"

Sistem menyematkan konten dengan menggunakan OpenAI, menyimpannya di Azure AI Search, dan membuatnya tersedia untuk pengambilan otomatis di semua percakapan. Anda melihat konfirmasi: ✅ Agent Memory saved.

Menghapus memori dengan menggunakan #forget

Hapus memori yang disimpan sebelumnya dengan mencarinya.

Sintaks:

#forget [description of what to forget]

Contoh:

#forget NSG rules information
#forget production environment location

Sistem dengan pencarian semantik mencari data memori Anda untuk kecocokan terbaik, menampilkan kontennya, dan menghapusnya. Anda melihat konfirmasi: ✅ Agent Memory forgotten: [deleted content]

Mengkueri memori dengan menggunakan #retrieve

Cari dan tampilkan memori yang disimpan secara eksplisit tanpa memicu penalaran agen.

Sintaks:

#retrieve [search query]

Contoh:

#retrieve production environment
#retrieve deployment process

Sistem secara semantik mencari kenangan. Ini menggunakan lima kecocokan teratas untuk mensintesis respons. Kenangan individu dan jawaban yang disintesis ditampilkan.

Cakupan dan penyimpanan

  • Dibagikan di seluruh tim: Semua pengguna Agen SRE dapat mengaksesnya.

  • Tetap ada di semua percakapan: Simpan sekali, dan tersedia untuk selalu.

  • Diambil secara otomatis jika relevan: Agen mencari memori secara semantik selama penalaran.

Dasar pengetahuan

Pangkalan pengetahuan menyediakan kemampuan pengunggahan dokumen langsung untuk runbook, panduan pemecahan masalah, dan dokumentasi internal yang dapat diambil agen selama percakapan.

Jenis dan batasan file yang didukung

  • Format: .md (markdown, disarankan), .txt (teks biasa)
  • Per file: maksimum 16 MB (batas Pencarian Azure AI)
  • Per permintaan: Total 100 MB untuk semua file dalam satu unggahan

Unggah dokumen

  1. Buka Pengaturan>Basis Pengetahuan.

  2. Pilih Tambahkan file atau seret dan letakkan file ke area unggahan.

    Portal secara otomatis memvalidasi, mengunggah, dan mengindeks file.

Unggah melalui alat agen

Agen dapat mengunggah dokumen langsung ke pangkalan pengetahuan dengan menggunakan alat ini UploadKnowledgeDocument . Metode ini berguna ketika:

  • Anda ingin mengambil langkah-langkah pemecahan masalah yang ditemukan selama penyelidikan.
  • Anda perlu menambahkan runbook yang dihasilkan dari resolusi insiden.
  • Anda ingin menambahkan dokumentasi secara terprogram tanpa akses UI.

Alat: UploadKnowledgeDocument

Pengaturan Tipe Diperlukan Description
fileName string Yes Nama file dengan ekstensi (misalnya, runbook-database-issues.md). Harus .md atau .txt.
content string Yes Konten dokumen lengkap dalam teks biasa atau format Markdown.
triggerIndexing bool Tidak. Memicu pengindeksan langsung (default: true). Atur ke false untuk unggahan batch.

Contoh penggunaan:

Tanyakan kepada agen:

"Simpan langkah-langkah pemecahan masalah kami untuk masalah batas waktu database ke pangkalan pengetahuan"

Agen menggunakan UploadKnowledgeDocument untuk:

  1. Buat dokumen dengan nama file yang sesuai.
  2. Formatkan konten dalam Markdown.
  3. Unggah dokumen ke Azure Blob Storage.
  4. Memicu pengindeksan untuk pencarian langsung.

Kendala:

  • Ukuran file maksimum: 16 MB.
  • Ekstensi yang didukung: .md dan .txt hanya.
  • Jika sudah ada dokumen dengan nama file yang sama, agen akan menimpanya.

Penanganan kesalahan:

Kesalahan Resolusi
Memori agen dinonaktifkan Aktifkan memori agen dalam konfigurasi.
"Ekstensi file tidak valid" Gunakan .md atau .txt ekstensi saja.
"Konten dokumen melebihi ukuran maksimum" Pisahkan dokumen besar menjadi file yang lebih kecil.

Mengelola dokumen

  • Tampilan: Buka Pengaturan>Pangkalan Pengetahuan untuk melihat semua dokumen yang diunggah.

  • Pembaruan: Untuk mengganti versi sebelumnya, unggah file dengan nama yang sama.

  • Hapus: Pilih dokumen dan gunakan tindakan hapus. Perubahan segera berlaku.

Wawasan sesi

Saat agen menangani insiden Anda, ia mempelajarinya. Wawasan dari sesi mengungkapkan mana yang berhasil dan mana yang tidak, serta pemahaman utama dari setiap sesi. Agen secara otomatis menerapkan pengetahuan tersebut untuk membantu masalah serupa di masa depan.

Peningkatan otomatis

Agen belajar dari setiap sesi tanpa upaya manual:

  • Agen menangani masalah secara otonom atau bekerja dengan Anda secara langsung.
  • Agen menangkap gejala, langkah-langkah resolusi, penyebab utama, dan potensi kesalahan.
  • Wawasan ini menjadi memori yang dapat diakses.
  • Sesi mendatang secara otomatis mengambil wawasan yang relevan dari sesi sebelumnya.

Hasilnya: agen menjadi lebih baik dari waktu ke waktu, menyarankan resolusi yang terbukti dan menghindari jebakan yang diketahui.

Menemukan peluang

Meskipun informasi sesi berfungsi secara otomatis, meninjaunya dapat menampilkan pola berharga yang mungkin ingin Anda tindak lanjuti.

Pola yang mungkin Anda temukan Tindakan potensial
Masalah yang sama terus berulang Memperbaiki kode atau konfigurasi yang mendasar
Agen tidak memiliki konteks tentang layanan Anda Membuat subagen kustom dengan pengetahuan domain
Langkah-langkah pemecahan masalah tidak didokumenkan Memperbarui atau membuat runbook
Kesenjangan telemetri membuat diagnosis lebih sulit Meningkatkan pengelogan atau menambahkan metrik
Pemberitahuan dipicu tetapi tidak dapat ditindaklanjuti Menyetel peringatan atau menambahkan tautan buku panduan operasional

Anggap wawasan dalam sesi sebagai jendela ke dalam proses pembelajaran agen. Anda mungkin menemukan sesuatu yang layak ditindak lanjuti, atau Anda mungkin membiarkan agen menangani masalah yang muncul.

Cara kerjanya

Wawasan sesi menciptakan siklus peningkatan berkelanjutan: agen mengidentifikasi gejala, langkah-langkah, penyebab utama, dan jebakan potensial dari setiap sesi, lalu menarik wawasan dari masa lalu yang relevan ketika masalah serupa muncul. Siklus otomatis ini membantu agen menyelesaikan masalah lebih cepat dari waktu ke waktu.

Diagram perulangan sistem memori Azure SRE Agent.

Apa yang ditangkap agen

Agen mengambil serangkaian poin data dari setiap sesi untuk meningkatkan pemecahan masalah di masa mendatang.

Ditangkap Bagaimana agen menggunakannya
Gejala yang diamati Mengenali pola serupa dalam masalah di masa mendatang
Langkah-langkah yang berhasil Menyarankan jalur resolusi yang terbukti
Akar penyebab ditemukan Langsung ke kemungkinan penyebab lebih cepat
Kesalahan yang ditemui Menghindari kesalahan berulang
Konteks yang Anda berikan Mengingat fakta tentang lingkungan Anda
Sumber daya yang terlibat Menyambungkan masalah sebelumnya pada sumber daya yang sama

Saat wawasan dihasilkan

Sistem menghasilkan wawasan secara otomatis setelah percakapan selesai, atau Anda dapat memintanya sesuai permintaan.

  • Otomatis: Setelah percakapan selesai (berjalan secara berkala, kira-kira setiap 30 menit)
  • Sesuai permintaan: Pilih Hasilkan Insight sesi di footer obrolan untuk hasil langsung (sekitar 30 detik)

Telusuri wawasan

Buka Pengaturan>Wawasan sesi untuk melihat apa yang dipelajari agen:

  • Jumlah total di header
  • Daftar wawasan dengan judul sesi dan tanda waktu
  • Tampilan detail dengan bagian Garis Waktu dan Performa Agen yang dapat diperluas
  • Buka Utas untuk meninjau kembali percakapan asli

Nota

Meskipun penelusuran manual berkala terhadap wawasan dapat menampilkan pola berulang yang layak ditindaklanjuti, agen tetap mendapat manfaat dari wawasan ini, baik Anda meninjaunya maupun tidak.

Struktur wawasan

Setiap wawasan meliputi:

  • Garis waktu: Tonggak kronologis sesi pemecahan masalah (hingga delapan)
  • Kinerja Agen: Apa yang berjalan dengan baik, bidang untuk peningkatan, dan pembelajaran utama
  • Skor kualitas investigasi: Peringkat 1-5 untuk kelengkapan investigasi