Pamięć i wiedza w agencie Azure SRE

Agent staje się bardziej skuteczny w miarę upływu czasu, pamiętając, co działało w poprzednich incydentach i odwołuje się do dokumentacji.

Jak działa pamięć

Podczas zadawania pytania agent wyszukuje wszystkie źródła wiedzy jednocześnie.

Źródło	Co znajdzie	Najlepsze dla
Poprzednie incydenty	Kroki, które rozwiązały podobne problemy	"Jak rozwiązaliśmy ten problem wcześniej?"
Wspomnienia użytkowników	Fakty, które jawnie zapisujesz	"Pamiętaj, że moje środowisko używa..."
Baza wiedzy	Przesłane runbooki i dokumenty	"Postępuj zgodnie z naszą standardową procedurą"

Agent zwraca uzasadnioną na odpowiedź z klikalnymi cytatami, które pokazują dokładnie, skąd pochodzą informacje.

Uczenie automatyczne

Agent uczy się z każdej konwersacji. Nie potrzebuje żadnego ręcznego szkolenia.

Po zakończeniu każdego wątku agent przechwytuje następujące informacje.

What	Opis
Obserwowane objawy	Komunikaty o błędach, zachowania, wzorce
Kroki, które zadziałały	Ścieżka rozwiązania, która zakończyła się pomyślnie
Główna przyczyna	Co spowodowało problem
Pułapki, których należy unikać	Co nie zadziałało, martwe końce

Ten proces odbywa się automatycznie. Trzydzieści minut po tym, jak wątek ucichnie, agent ocenia konwersację i indeksuje wnioski.

Priorytet tego samego zasobu

Podczas badania problemu z zasobem agent ustala priorytety poprzednich sesji na dokładnie tym samym zasobie.

"App Service app-prod-01 is returning 503 errors"

Twój agent najpierw sprawdza, czy wcześniej widział problemy na app-prod-01. Jeśli tak, te informacje pojawiają się jako pierwsze, ponieważ są one najbardziej istotne.

Proaktywna trwałość wiedzy

Poza nauką z ukończonych wątków agent aktywnie zapisuje to, co odnajduje podczas konwersacji. Gdy agent napotka coś ważnego (trudną konfigurację, nieoczywistą zależność lub trudności w debugowaniu), rejestruje szczegółowe informacje w trwałych plikach wiedzy, które są przenoszone między sesjami.

Jak to działa

Agent przechowuje katalog wiedzy pod adresem memories/synthesizedKnowledge/. Agent automatycznie ładuje do monitu systemowego specjalny plikoverview.md na początku każdej rozmowy. Takie podejście zapewnia agentowi natychmiastowy dostęp do najważniejszego kontekstu środowiska.

Składnik	Do czego służy
`overview.md`	Podsumowanie i indeks usługi. Zawsze ładowane do kontekstu (około 2000 znaków limitu).
Pliki tematów	Szczegółowe uwagi dotyczące konkretnych tematów (na przykład `aks-networking-gotchas.md`).
Linki z przeglądu	`overview.md` linki do plików tematów, dzięki czemu agent wie, jaka szczegółowa wiedza istnieje.

Co zapisuje agent

Agent aktywnie rejestruje szczegółowe informacje podczas konwersacji.

Kategoria	Examples
Ograniczenia problemu	Ta usługa nie może być skalowana powyżej 10 replik z uwagi na ograniczenia przydziału.
Strategie, które działały	Ponowne uruchomienie poda `--grace-period=0` rozwiązało problem z zablokowanym wdrożeniem.
Strategie, które zakończyły się niepowodzeniem	"Zwiększenie limitu pamięci nie pomogło. Problem dotyczył ograniczania CPU.
Nieoczywiste zależności	"app-frontend zależy od proxy typu sidecar, który musi uruchomić się jako pierwszy."
Szczegóły konfiguracji	"Środowisko produkcyjne używa niestandardowych certyfikatów TLS przechowywanych w usłudze Key Vault".

Organizacja wiedzy

Agent organizuje wiedzę semantycznie według tematu, a nie chronologicznie. Każdy plik jest samodzielną referencją.

Plik	Co przechwytuje
`overview.md`	Podsumowanie usługi, linki klucza, indeks plików tematu (~2000 znaków)
`team.md`	Członkowie zespołu, role, wiedza (ok. 500 znaków)
`architecture.md`	Składniki, połączenia, środowiska (ok. 1500 znaków)
`logs.md`	Źródła dzienników, tabele, pola klucza, przydatne zapytania (ok. 1500 znaków)
`deployment.md`	Szczegóły potoku, wyszukiwanie wersji, procedury przywracania (~1000 znaków)
`auth.md`	Mechanizmy uwierzytelniania, przepływy tożsamości (ok. 800 znaków)
`debugging.md`	Linki elementów Runbooka, typowe problemy i przewodniki rozwiązywania problemów (~1000 znaków)
`queries/*.md`	Wyodrębnione zapytania uporządkowane według tematu (każdy z nich wynosi ok. 1000 znaków)

Podczas aktualizowania istniejącej wiedzy agent odczytuje bieżący plik, scala nowe informacje i usuwa wszystkie elementy, które stają się nieaktualne lub nieprawidłowe.

Wskazówka

Możesz poprosić agenta o zapisanie wiedzy

Poza automatyczną trwałością możesz jawnie poprosić agenta o zapisanie informacji w swoich bazach wiedzy.

Save this to your knowledge: our Redis cache uses Premium tier with 6GB,
and failover takes about 90 seconds.

Agent tworzy lub aktualizuje odpowiedni plik wiedzy i łączy go z pliku overview.md.

Takie podejście różni się od #remember poleceń (opisanych w następnej sekcji), które zapisują dyskretne fakty w oddzielnym magazynie pamięci. Pliki wiedzy to ustrukturyzowane, trwałe odniesienia, które agent wykorzystuje na początku każdej rozmowy. Wspomnienia użytkownika to pojedyncze fakty, które można przeszukiwać za pośrednictwem elementu #retrieve.

Wspomnienia użytkowników

Poza tym, co agent uczy się i utrzymuje automatycznie, możesz jawnie zapisać dyskretne fakty, które agent ma zapamiętać. Wspomnienia użytkowników są idealne dla szczegółów specyficznych dla środowiska, które mogą nie występować w zdarzeniach, ale są ważne w kontekście.

W poniższej tabeli opisano dobrych kandydatów do pamięci użytkownika.

Kategoria	Examples
Fakty dotyczące środowiska	Produkcja używa trzech klastrów usługi AKS w regionie Zachodnio USA 2
Preferencje zespołu	Preferujemy interfejs wiersza poleceń zamiast portalu dla wdrożeń
Szczegóły architektury	"app-service-01 zależy od sql-prod"
Ścieżki eskalacji	"PagerDuty, a następnie kanał usługi Teams, a następnie telefon"

Polecenia pamięci

Zarządzanie pamięciami użytkowników przy użyciu tych poleceń czatu.

Polecenie	Do czego służy	Przykład
`#remember`	Zapisz informację do przyszłego wykorzystania	`#remember our Redis cache uses Premium tier`
`#retrieve`	Wyszukiwanie zapisanych wspomnień	`#retrieve what's our caching setup?`
`#forget`	Usuwanie zapisanej pamięci	`#forget the outdated Redis info`

W poniższym przykładzie przedstawiono typowy przepływ pracy pamięci.

Zapisz ważny kontekst:

#remember Production uses 3 AKS clusters in West US 2
#remember Our escalation path: PagerDuty, then Teams channel, then phone
#remember Database failover takes approximately 15 minutes

Pobierz później:

#retrieve how long does database failover take?

Agent odpowiada na podstawie zapisanej pamięci: "Przejście bazy danych w tryb failover trwa około 15 minut".

Baza wiedzy

Przekaż dokumentację i połącz źródła zewnętrzne, aby udostępnić agentowi szerszą bibliotekę referencyjną.

Przekaż dokumenty

Przejdź dobazy wiedzy>, aby przekazać dokumentację. Aby uzyskać szczegółowe informacje na temat obsługiwanych formatów, limitów i sposobu automatycznego tworzenia wiedzy przez agenta, zobacz Przekazywanie dokumentów wiedzy.

Rodzaj dokumentu	Dobre dla
Runbooki	Procedury incydentów krok po kroku
Przewodniki dotyczące architektury	Informacje o środowisku
Podręczniki dla dyżurujących	Procedury eskalacji i reagowania
Dokumentacja interfejsu API	Wiedza specyficzna dla usługi
Procedury zespołu	Dokumentacja przepływu pracy i przetwarzania

Obsługiwane formaty: Markdown, zwykły tekst, PDF, Word, PowerPoint, Excel, obrazy i inne. Maksymalny rozmiar to 16 MB na plik. Aby uzyskać pełną listę, zobacz Przekazywanie dokumentów merytorycznych.

Łączenie źródeł zewnętrznych

Uzyskiwanie dostępu do wiedzy bezpośrednio z systemów zewnętrznych przy użyciu łączników. Aby uzyskać pełną listę obsługiwanych źródeł, zobacz Łączniki.

Connector	Co zapewnia
Azure DevOps	Wykonywanie zapytań względem stron typu wiki ADO
GitHub	Repozytoria wyszukiwania, witryny typu wiki, problemy
Niestandardowa umowa MCP	Dowolne skonfigurowane źródło wiedzy

Konfiguruj konektory w Builderze>Connectors. Aby uzyskać więcej informacji, zobacz Łączniki.

Używanie wiedzy w konwersacjach

Agent automatycznie wyszukuje wiedzę, gdy jest to istotne dla pytania.

How should I handle a database failover?

Jeśli prześlesz runbook, agent odpowie dobrze uzasadnioną odpowiedzią.

Na podstawie elementu Runbook bazy danych(link cytatu)poniżej przedstawiono kroki pracy w trybie failover:

Sprawdź kondycję repliki pomocniczej...

Wybierz linki do cytatów, aby wyświetlić pełny dokument źródłowy.

Szczegółowe informacje o sesji

Po każdym wątku (synchronicznej konwersacji czatu lub asynchronicznego zadania autotriggered) agent generuje szczegółowe informacje o sesji. Informacje o sesji to sposób, w jaki agent staje się coraz bardziej inteligentny z czasem.

Co jest przechwytywane

Każda analiza sesji wyodrębnia ustrukturyzowane informacje, które stają się pamięcią z możliwością przeszukiwania.

Składnik	Co przechwytuje	Przykład
Obserwowane objawy	Wzorce błędów, zachowania	"Błędy HTTP 503, pamięć przy 95%"
Kroki umożliwiające rozwiązanie problemów	Co działało	"Skalowana w górę jednostka SKU usługi App Service"
Główna przyczyna	Dlaczego tak się stało	"Wyciek pamięci we wdrożeniu w wersji 2.3"
Pułapki, których należy unikać	Co nie zadziałało	"Ponowne uruchamianie nie pomogło"

Gdy system generuje szczegółowe informacje

W poniższej tabeli opisano, kiedy system generuje szczegółowe informacje o sesji.

Typ wątku	Kiedy	Automatyczne lub ręczne
Synchronizacja czatu	30 minut po ostatniej wiadomości	Automatycznie
Zadania asynchroniczne	30 minut po zakończeniu	Automatycznie
opinii użytkowników	Gdy oceniasz odpowiedź	Wyzwalasz go

Wyświetlanie szczegółowych informacji o sesji

Przejdź do Monitora>Wglądu w sesję, aby zobaczyć:

Oś czasu akcji agenta
Wyniki oceny
Wyodrębnione kluczowe wnioski
Linki wątku źródłowego: każda karta szczegółowych informacji łączy się z wątkami, które je wygenerowały, dzięki czemu można śledzić wszelkie szczegółowe informacje do oryginalnej konwersacji

Aby uzyskać szczegółowe metryki i zarządzanie, zobacz Monitorowanie użycia agenta.

Najlepsze rozwiązania

Postępuj zgodnie z tymi zaleceniami, aby uzyskać największą wartość z możliwości pamięci i wiedzy agenta.

Wybierz, co przesyłać lub połączyć

Prześlij	Nawiązywanie połączenia za pośrednictwem łącznika
Runbooki incydentów	Strony typu wiki na żywo (ADO, GitHub)
Diagramy architektury	Repozytoria kodu źródłowego
Procedury eskalacji	Dane monitorowania w czasie rzeczywistym
Dokumentacja statycznego interfejsu API	Często aktualizowane dokumenty

Utrzymuj aktualną wiedzę

Nieaktualne dokumenty powodują nieprawidłowe odpowiedzi. Przejrzyj swoją bazę wiedzy kwartalnie. Aby zobaczyć, jakie dokumenty ma obecnie agent, zapytaj:

What knowledge documents do you have?

Usuń nieaktualne dokumenty w bazie wiedzy konstruktora>.

Jasno nadaj dokumentom nazwę

Użyj opisowych nazw plików, aby pomóc agentowi i zespołowi szybko znaleźć odpowiednią dokumentację.

Nie używaj	Użyj zamiast tego
doc1.txt	production-database-failover.md
runbook.md	aks-cluster-scaling-runbook.md
notes.txt	escalation-procedures-2026.txt

Resource	Dlaczego ma to znaczenie
Załaduj dokumenty wiedzy	Szczegółowe wsparcie formatu plików, limity i wiedza generowana przez agenta
Łączniki	Jak łączniki łączą dane zewnętrzne z agentem
Agenci niestandardowi	Jak agenci niestandardowi używają wiedzy w przepływach pracy

Opinia

Czy ta strona była pomocna?

Last updated on 2026-03-28