Freigeben über


Speicher und Wissen im Azure SRE-Agent

Ihr Agent wird im Laufe der Zeit effektiver, indem er sich merkt, was in früheren Vorfällen funktioniert hat, und auf Ihre Dokumentation verweist.

Diagramm, das zeigt, wie SearchMemory drei Quellen abfragt: vergangene Vorfälle, Benutzererinnerungen und Dokumente, um fundierte Antworten mit Zitaten bereitzustellen.

Funktionsweise des Arbeitsspeichers

Wenn Sie eine Frage stellen, durchsucht Ihr Agent gleichzeitig alle Wissensquellen.

Quelle Was sie findet Am besten geeignet für:
Vergangene Vorfälle Schritte, die ähnliche Probleme behoben haben "Wie haben wir dies zuvor behoben?"
Benutzererinnerungen Fakten, die Sie explizit speichern Denken Sie daran, dass meine Umgebung verwendet...
Wissensdatenbank Ihre hochgeladenen Runbooks und Dokumente "Befolgen Sie unser Standardverfahren"

Der Agent gibt eine geerdete Antwort mit klickbaren Zitaten zurück, die genau zeigen, wo die Informationen stammen.

Automatisches Lernen

Ihr Agent lernt aus jeder Unterhaltung. Es ist keine manuelle Schulung erforderlich.

Diagramm, das den Agenten nach jeder Sitzung automatisch Erkenntnisse extrahieren lässt: Symptome, Lösungsschritte, Ursache des Problems und Fallstricke, die es zu vermeiden gilt.

Nach Abschluss jedes Threads erfasst der Agent die folgenden Informationen.

What Beschreibung
Beobachtete Symptome Fehlermeldungen, Verhaltensweisen, Muster
Schritte, die funktioniert haben Der Lösungspfad, der erfolgreich war
Grundursache Was das Problem verursacht hat
Zu vermeidende Fallstricke Was nicht funktioniert hat, Sackgassen

Dieser Vorgang erfolgt automatisch. Dreißig Minuten nachdem ein Thread still ist, wertet der Agent die Unterhaltung aus und indiziert die Erkenntnisse.

Priorität der gleichen Ressource

Bei der Untersuchung eines Ressourcenproblems priorisiert der Agent frühere Sitzungen auf die gleiche Ressource.

"App Service app-prod-01 is returning 503 errors"

Ihr Agent überprüft zuerst, ob er zuvor Probleme auf app-prod-01 festgestellt hat. Wenn ja, werden diese Erkenntnisse zuerst angezeigt, da sie die höchste Relevanz haben.

Proaktive Wissenspersistenz

Über das Lernen von abgeschlossenen Threads hinaus speichert Ihr Agent aktiv, was er während Unterhaltungen entdeckt. Wenn Ihr Agent auf etwas Wichtiges trifft (eine schwierige Konfiguration, eine nicht offensichtliche Abhängigkeit oder ein Getcha-Debugging), zeichnet er den Einblick in persistente Wissensdateien auf, die über Sitzungen hinweg übertragen werden.

So funktioniert es

Ihr Agent behält ein Wissensverzeichnis bei memories/synthesizedKnowledge/. Der Agent lädt automatisch eine spezielle Datei , overview.mdin die Systemaufforderung zu Beginn jeder Unterhaltung. Dieser Ansatz bietet Ihrem Agent sofortigen Zugriff auf den wichtigsten Kontext ihrer Umgebung.

Bestandteil Was es tut
overview.md Dienstzusammenfassung und -index. Immer in den Kontext geladen (~2.000 Zeichen Budget).
Themendateien Detaillierte Hinweise zu bestimmten Themen (z. B. aks-networking-gotchas.md).
Links aus der Übersicht overview.md Links zu Themendateien, damit Ihr Agent weiß, welche detaillierten Kenntnisse vorhanden sind.

Was Ihr Agent speichert

Ihr Agent zeichnet proaktiv Einblicke während Unterhaltungen auf.

Kategorie Beispiele
Problemeinschränkungen "Dieser Dienst kann aufgrund von Kontingentbeschränkungen nicht über 10 Replikate skaliert werden"
Strategien, die funktioniert haben Das Neustarten des Pods mit --grace-period=0 löste die hängende Bereitstellung.
Strategien, die fehlgeschlagen sind "Das Erhöhen des Speicherlimits hat nicht helfen. Das Problem war die CPU-Drosselung"
Nicht offensichtliche Abhängigkeiten "App-Frontend hängt von einem Sidecar-Proxy ab, der zuerst gestartet werden muss"
Konfigurationsdetails "Die Produktion verwendet benutzerdefinierte TLS-Zertifikate, die im Key Vault gespeichert sind"

Wissensorganisation

Ihr Agent organisiert Wissen semantisch nach Thema, nicht chronologisch. Jede Datei ist ein eigenständiger Verweis.

Datei Was er erfasst
overview.md Dienstzusammenfassung, Schlüssellinks, Index der Themendateien (~2.000 Zeichen)
team.md Teammitglieder, Rollen, Expertise (~500 Zeichen)
architecture.md Komponenten, Verbindungen, Umgebungen (~1.500 Zeichen)
logs.md Protokollquellen, Tabellen, Schlüsselfelder, nützliche Abfragen (~1.500 Zeichen)
deployment.md Pipelinedetails, Versionssuche, Rollbackprozeduren (~1.000 Zeichen)
auth.md Authentifizierungsmechanismen, Identitätsflüsse (~800 Zeichen)
debugging.md Häufige Probleme, Anleitungen zur Problembehandlung, Runbook-Links (~1.000 Zeichen)
queries/*.md Extrahierte Abfragen nach Thema (~1.000 Zeichen)

Beim Aktualisieren vorhandener Kenntnisse liest Ihr Agent die aktuelle Datei, führt neue Informationen zusammen und entfernt alles, was veraltet oder falsch wird.

Tipp

Sie können Ihren Agenten bitten, auch Wissen zu speichern.

Über die automatische Persistenz hinaus können Sie Ihren Agent explizit bitten, Informationen in seinen Wissensdateien zu speichern:

Save this to your knowledge: our Redis cache uses Premium tier with 6GB,
and failover takes about 90 seconds.

Ihr Agent erstellt oder aktualisiert die entsprechende Wissensdatei und verknüpft sie von overview.md.

Dieser Ansatz unterscheidet sich von #remember Befehlen (im nächsten Abschnitt beschrieben), die diskrete Fakten in einem separaten Speicher speichern. Wissensdateien sind strukturierte, dauerhafte Verweise, die Ihr Agent zu Beginn jeder Unterhaltung konsultiert. Benutzerspeicher sind Einzelinformationen, die über #retrieve durchsuchbar sind.

Benutzererinnerungen

Neben dem, was Ihr Agent lernt und automatisch speichert, können Sie explizit bestimmte Fakten speichern, damit sich Ihr Agent diese merken kann. Benutzererinnerungen eignen sich ideal für umgebungsspezifische Details, die möglicherweise nicht in Vorfällen vorkommen, aber für den Kontext wichtig sind.

In der folgenden Tabelle werden gute Kandidaten für Benutzererinnerungen beschrieben.

Kategorie Beispiele
Fakten zur Umwelt "Die Produktion verwendet drei AKS-Cluster in West US 2"
Teameinstellungen "Wir bevorzugen CLI gegenüber portal für Bereitstellungen"
Architekturdetails "app-service-01 hängt von sql-prod ab"
Eskalationspfade "PagerDuty, dann Teams-Kanal, dann Telefon"

Speicherbefehle

Verwalten Sie Benutzererinnerungen mithilfe dieser Chatbefehle.

Befehl Was es tut Beispiel
#remember Speichern einer Tatsache für zukünftige Referenz #remember our Redis cache uses Premium tier
#retrieve Durchsuchen Ihrer gespeicherten Erinnerungen #retrieve what's our caching setup?
#forget Entfernen eines gespeicherten Speichers #forget the outdated Redis info

Das folgende Beispiel zeigt einen typischen Speicherworkflow.

Wichtiger Kontext speichern:

#remember Production uses 3 AKS clusters in West US 2
#remember Our escalation path: PagerDuty, then Teams channel, then phone
#remember Database failover takes approximately 15 minutes

Später abrufen:

#retrieve how long does database failover take?

Der Agent reagiert basierend auf dem gespeicherten Speicher: "Das Datenbankfailover dauert ungefähr 15 Minuten."

Wissensdatenbank

Laden Sie Ihre Dokumentation hoch, und verbinden Sie externe Quellen, um Ihrem Agent eine breitere Referenzbibliothek zu geben.

Diagramm, das Wissen zeigt, das aus hochgeladenen Dokumenten und MCP-Connectors stammt und alle zusammen durchsuchbar sind.

Hochladen von Dokumenten

Wechseln Sie zur Generator > Knowledge Base , um Ihre Dokumentation hochzuladen.

Dokumenttyp Gut für
Runbooks Schritt-für-Schritt-Vorfallverfahren
Architekturhandbücher Grundlegendes zu Ihrer Umgebung
Bereitschafts-Playbooks Eskalations- und Reaktionsverfahren
API-Dokumentation Servicespezifisches Wissen
Teamprozeduren Workflow- und Prozessdokumente

Unterstützte Formate: Markdown (.md), Nur-Text (.txt). Die maximale Dateigröße beträgt 16 MB.

Verbinden externer Quellen

Greifen Sie mithilfe von Connectors direkt von externen Systemen aus auf Wissen zu.

Konnektor Was es bietet
Azure DevOps Abfragen Ihrer ADO-Wiki-Seiten
GitHub Such-Repos, Wikis, Probleme
Microsoft Learn Offizielle Microsoft-Dokumentation
Benutzerdefinierter MCP Alle von Ihnen konfigurierten Wissensquellen

Konfigurieren Sie Connectors in Einstellungen > Connectors. Weitere Informationen finden Sie unter Connectors.

Verwenden von Wissen in Unterhaltungen

Ihr Agent durchsucht automatisch Wissen, wenn es für die Frage relevant ist.

How should I handle a database failover?

Wenn Sie ein Runbook hochladen, antwortet der Agent mit einer fundierten Antwort.

Basierend auf Ihrem Datenbank-Runbook(Zitatlink) sind hier die Failoverschritte:

  1. Überprüfen Sie die Integrität des sekundären Replikats...

Wählen Sie die Zitatlinks aus, um das vollständige Quelldokument anzuzeigen.

Sitzungserkenntnisse

Nach jedem Thread (einer synchronen Chatunterhaltung oder einer asynchronen automatisch ausgelösten Aufgabe) generiert Ihr Agent einen Sitzungserblick. Sitzungserkenntnisse sind, wie Ihr Agent im Laufe der Zeit intelligenter wird.

Was erfasst wird

Jeder Sitzungseinblick extrahiert geordnete Erkenntnisse, die zu durchsuchbarem Speicher werden.

Bestandteil Was er erfasst Beispiel
Beobachtete Symptome Fehlermuster, Verhalten "HTTP 503-Fehler, Arbeitsspeicher bei 95%"
Lösungsschritte Was funktioniert hat "Hochskalierte App Service-SKU"
Grundursache Warum es passiert ist "Speicherleck in der Release v2.3"
Zu vermeidende Fallstricke Was nicht funktioniert hat Der Neustart hat nicht geholfen.

Wenn Einblicke generiert werden

In der folgenden Tabelle wird beschrieben, wann Sitzungserkenntnisse generiert werden.

Threadtyp Wann Auto oder manuell
Chat synchronisieren 30 Minuten nach der letzten Nachricht Automatisch
Asynchrone Aufgaben 30 Minuten nach Abschluss Automatisch
Benutzerfeedback Wenn Sie eine Antwort bewerten Sie lösen es aus

Sitzungseinblicke anzeigen

Wechseln Sie zu "Sitzungserkenntnisse überwachen>", um Folgendes anzuzeigen:

  • Zeitlinie der Agentenaktionen
  • Bewertungsergebnisse
  • Wichtige Erkenntnisse extrahiert
  • Quellthreadlinks: Jede Einsichtskarte verweist zurück zu dem Thread, der sie generiert hat, sodass Sie jeden Einblick bis zur ursprünglichen Unterhaltung zurückverfolgen können.

Ausführliche Metriken und Verwaltung finden Sie unter Überwachen der Agent-Nutzung.

Bewährte Methoden

Befolgen Sie diese Empfehlungen, um den größten Nutzen aus den Speicher- und Wissensfunktionen Ihres Agenten zu erzielen.

Wählen Sie aus, was hochgeladen werden soll, und stellen Sie eine Verbindung her.

Upload Verbinden über Verbinder
Vorfall-Prozessdokumentation Live-Wiki-Seiten (ADO, GitHub)
Architekturdiagramme Quellcode-Repositories
Eskalationsverfahren Echtzeitüberwachungsdaten
Statische API-Dokumente Häufig aktualisierte Dokumente

Wissen auf dem laufenden halten

Veraltete Dokumente verursachen falsche Antworten. Überprüfen Sie Ihre Knowledge Base vierteljährlich. Um zu sehen, welche Dokumente Ihr Agent derzeit hat, fragen Sie Folgendes:

What knowledge documents do you have?

Entfernen Sie veraltete Dokumente in der Generator > Knowledge Base.

Eindeutiges Benennen von Dokumenten

Verwenden Sie beschreibende Dateinamen, damit Ihr Agent und Ihr Team schnell die richtige Dokumentation finden können.

Nicht verwenden Stattdessen verwenden
doc1.txt production-database-failover.md
runbook.md aks-cluster-skalierungs-runbook.md
notes.txt escalation-procedures-2026.txt

Nächster Schritt

  • Connectors: Verbinden Sie externe Wissensquellen mit Ihrem Agent.
  • Subagenten: Erstellen Sie spezialisierte Agents mit fokussierten Funktionen.