SRE 에이전트 메모리 시스템은 에이전트에게 효과적으로 문제를 해결하는 데 필요한 지식을 제공합니다. Runbook, 팀 표준 및 서비스별 컨텍스트를 추가하면 에이전트가 인시던트 중에 더 나은 답변을 제공할 수 있습니다. 시스템은 시간이 지남에 따라 개선하기 위해 각 세션에서 학습합니다.
메모리 구성 요소
메모리 시스템은 다음 네 가지 보완 구성 요소로 구성됩니다.
| 구성 요소 | 목적 | 설치 프로그램 | 적합한 대상 |
|---|---|---|---|
| 사용자 메모리 | 팀 지식에 대한 빠른 채팅 명령 | 인스턴트(채팅 명령) | 팀 표준, 서비스 구성, 워크플로 패턴 |
| 기술 자료 | Runbook에 대한 직접 문서 업로드 | 빠른(파일 업로드) | 정적 런북, 문제 해결 안내서, 내부 문서 |
| 설명서 커넥터 | 자동화된 Azure DevOps 동기화 | 구성이 필요함 | 생활 설명서, 자주 업데이트되는 가이드 |
| 세션 인사이트 | 세션에서 에이전트에서 생성된 메모리 | 자동 | 학습된 문제 해결 패턴, 과거 인시던트 해결 |
에이전트가 메모리를 검색하는 방법
대화 중에 에이전트는 구성된 도구를 통해 메모리 원본에서 정보를 검색합니다.
도구 구성
도구는 SearchMemory 모든 메모리 구성 요소를 검색합니다. 사용자 기억, 기술 자료, 세션 인사이트 및 설명서 커넥터를 동시에 검색합니다.
- SRE 에이전트(기본값):
SearchMemory기본 제공 - 사용자 지정 서브에이전트: 구성에 도구
SearchMemory을 추가
중요합니다
메모리 구성 요소에 비밀, 자격 증명, API 키 또는 중요한 데이터를 저장하지 마세요. 팀에서 추억을 공유하고 시스템에서 검색을 위해 인덱싱합니다.
향상된 검색 매개 변수
이 도구는 SearchNodes 더 많은 대상 검색에 대한 필터링 옵션을 지원합니다.
| 매개 변수 | 유형 | Description |
|---|---|---|
entityType |
문자열 | 엔터티 형식(예: Incident, Service또는 Resource.)을 기준으로 결과를 필터링합니다. |
includeNeighbors |
bool | 검색 결과에 연결된 노드를 포함합니다. |
Example:
Search for all incidents related to "database timeout" and include connected resources
설정 includeNeighbors을 true로 하면 검색 결과는 일치하는 인시던트 노드뿐만 아니라 관련된 노드도 반환합니다.
- 리소스
- Services
- 관련 인시던트
- 연결된 문서
일치하는 노드에 대한 전체 관계 그래프를 표시하면 조사 중에 더 풍부한 컨텍스트를 얻을 수 있습니다.
빠른 시작
먼저 사용자 추억을 사용하여 기본 지식을 설정한 다음, 요구 사항이 증가함에 따라 문서 스토리지 및 자동화된 동기화로 확장합니다.
1. 사용자 추억으로 시작
채팅 명령을 사용하여 즉각적인 팀 지식을 저장합니다.
#remember Team owns services: app-service-prod, redis-cache-prod, and sql-db-prod
#remember For latency issues, check Redis cache health first
#remember Production deployments happen Tuesdays at 2 PM PST
이러한 사실은 이제 모든 대화에서 사용할 수 있습니다.
2. 키 문서 업로드
기술 자료에 중요한 운영 절차서와 가이드를 추가합니다.
Azure Portal에서 SRE 에이전트를 엽니다.
설정>기술 자료로 이동합니다.
파일 추가를 선택하거나 파일을 업로드 영역으로 끌어서 놓습니다.
업로드
.md또는.txt파일(각각 최대 16MB).시스템은 파일을 인덱싱하여
SearchMemory을 통해 검색할 수 있도록 합니다.
3. 세션 인사이트 검토
세션 문제를 해결한 후 설정>세션 인사이트를 확인하여 무엇이 잘 진행되었는지, 에이전트에 더 많은 컨텍스트가 필요한지 확인합니다. 인사이트를 사용하여 지식 격차를 식별하고 대상 메모리 또는 설명서를 추가합니다.
4. 리포지토리 연결(선택 사항)
Azure DevOps에 기존 설명서가 있는 팀의 경우:
설정>커넥터로 이동합니다.
커넥터 추가를 선택하고 설명서 커넥터를 선택합니다.
Azure DevOps 리포지토리 URL을 입력하고 관리 ID를 선택합니다.
커넥터가 자동으로 인덱싱을 시작합니다.
사용자 메모리
사용자 추억을 통해 에이전트가 모든 대화에서 기억하는 팀 팩트, 표준 및 컨텍스트를 저장할 수 있습니다. 간단한 채팅 명령(#remember, #forget, #retrieve)을 사용하여 에이전트 응답을 자동으로 향상시키는 영구 기술 자료를 빌드할 수 있습니다.
채팅 명령
를 사용하여 정보 저장 #remember
향후 대화를 위해 팩트, 표준 또는 컨텍스트를 저장합니다.
Syntax:
#remember [content to save]
예:
#remember Team owns app-service-prod in East US region
#remember For app-service-prod latency issues, check Redis cache health first
#remember Team uses Kusto for logs. Workspace is "myteam-prod-logs"
시스템은 OpenAI를 사용하여 콘텐츠를 포함하고, Azure AI Search에 저장하며, 모든 대화에서 자동 검색에 사용할 수 있도록 합니다. 확인 메시지가 표시됩니다. ✅ Agent Memory saved.
#forget를 사용하여 메모리를 제거하세요.
이전에 저장한 추억을 검색하여 삭제합니다.
Syntax:
#forget [description of what to forget]
예:
#forget NSG rules information
#forget production environment location
시스템이 여러분의 기억을 의미 기반으로 검색하여 가장 일치하는 항목을 찾아 보여주고, 그것을 삭제합니다. 확인 메시지가 표시됩니다. ✅ Agent Memory forgotten: [deleted content]
**
#retrieve을 사용하여 추억을 쿼리하기
에이전트 추론을 트리거하지 않고 저장된 메모리를 명시적으로 검색하고 표시합니다.
Syntax:
#retrieve [search query]
예:
#retrieve production environment
#retrieve deployment process
시스템은 의미 체계적으로 기억을 검색합니다. 상위 5개의 일치 항목을 사용하여 응답을 합성합니다. 개별 기억과 합성된 답변이 모두 표시됩니다.
범위 및 스토리지
팀 전체에서 공유: SRE 에이전트의 모든 사용자가 액세스할 수 있습니다.
모든 대화에서 유지: 한 번 저장하면 영원히 사용할 수 있습니다.
관련되는 경우 자동으로 검색됨: 에이전트는 추론 중에 의미상 메모리를 검색합니다.
참조 자료
기술 자료는 에이전트가 대화 중에 활용할 수 있는 런북, 문제 해결 가이드 및 내부 문서에 대한 직접 문서 업로드 기능을 제공합니다.
지원되는 파일 형식 및 제한
-
형식:
.md(markdown, 권장),.txt(일반 텍스트) - 파일당: 최대 16MB(Azure AI Search 제한)
- 요청당: 단일 업로드의 모든 파일에 대해 총 100MB
문서 업로드
설정>기술 자료로 이동합니다.
파일 추가를 선택하거나 파일을 업로드 영역으로 끌어서 놓습니다.
포털은 파일의 유효성을 자동으로 검사, 업로드 및 인덱싱합니다.
에이전트 도구를 통해 업로드
에이전트는 UploadKnowledgeDocument 도구를 사용하여 기술 자료에 직접 문서를 업로드할 수 있습니다. 이 메서드는 다음과 같은 경우에 유용합니다.
- 조사 중에 검색된 문제 해결 단계를 캡처하려고 합니다.
- 인시던트 해결 시 생성된 런북을 추가해야 합니다.
- UI 액세스 없이 프로그래밍 방식으로 설명서를 추가하려고 합니다.
도구: UploadKnowledgeDocument
| 매개 변수 | 유형 | 필수 | Description |
|---|---|---|---|
fileName |
문자열 | Yes | 확장명(예: runbook-database-issues.md)이 있는 파일 이름입니다.
.md 또는 .txt이어야 합니다. |
content |
문자열 | Yes | 일반 텍스트 또는 Markdown 형식의 전체 문서 콘텐츠입니다. |
triggerIndexing |
bool | 아니오 | 즉시 인덱싱 트리거(기본값: true). 일괄 업로드를 위해 false로 설정하십시오. |
사용 예:
에이전트에게 다음을 요청합니다.
"데이터베이스 시간 제한 문제에 대한 문제 해결 단계를 기술 자료에 저장"
에이전트 UploadKnowledgeDocument 를 사용하여 다음을 수행합니다.
- 적절한 파일 이름을 사용하여 문서를 만듭니다.
- Markdown에서 콘텐츠의 서식을 지정합니다.
- Azure Blob Storage에 문서를 업로드합니다.
- 즉시 검색을 위해 인덱싱을 트리거합니다.
제약 조건:
- 최대 파일 크기: 16MB
- 지원되는 확장:
.md및.txt전용입니다. - 파일 이름이 같은 문서가 있으면 에이전트가 덮어씁니다.
오류 처리:
| 오류 | 해결 방법 |
|---|---|
| "에이전트 메모리를 사용할 수 없습니다." | 구성에서 에이전트 메모리를 사용하도록 설정합니다. |
| "잘못된 파일 확장자" |
.md 또는 .txt 확장만 사용하십시오. |
| "문서 콘텐츠가 최대 크기를 초과합니다." | 큰 문서를 더 작은 파일로 분할합니다. |
문서 관리
보기: 설정>기술 자료 로 이동하여 업로드된 모든 문서를 확인합니다.
업데이트: 이전 버전을 덮어쓰려면 같은 이름의 파일을 업로드합니다.
삭제: 문서를 선택하고 삭제 작업을 사용합니다. 변경 내용은 즉시 적용됩니다.
세션 인사이트
에이전트가 귀하의 인시던트를 처리함에 따라 학습합니다. 세션 인사이트는 각 세션의 작동된 작업, 수행되지 않은 작업 및 주요 학습을 캡처합니다. 에이전트는 나중에 유사한 문제에 도움이 되도록 해당 지식을 자동으로 적용합니다.
자동 개선
에이전트는 수동 작업 없이 모든 세션에서 학습합니다.
- 에이전트는 문제를 자율적으로 처리하거나 사용자와 직접 협업합니다.
- 에이전트는 증상, 해결 단계, 근본 원인 및 함정을 캡처합니다.
- 이러한 통찰력은 검색 가능한 추억이 됩니다.
- 이후 세션은 관련 과거 인사이트를 자동으로 검색합니다.
결과: 에이전트는 시간이 지남에 따라 개선되어 입증된 해결 방법을 제안하고 알려진 문제를 방지합니다.
기회 발견
세션 인사이트는 자동으로 작동하지만 검토하면 작업할 수 있는 중요한 패턴이 노출될 수 있습니다.
| 검색할 수 있는 패턴 | 잠재적인 조치 |
|---|---|
| 동일한 문제가 계속 되풀이됨 | 기본 코드 또는 구성 수정 |
| 에이전트가 서비스에 대한 맥락이 부족합니다. | 도메인 지식이 있는 사용자 지정 스바겐트 만들기 |
| 문제 해결 단계가 문서화되지 않음 | 실행 문서 업데이트 또는 만들기 |
| 원격 분석 간격으로 인해 진단이 더 어려워졌습니다. | 로깅 개선 또는 메트릭 추가 |
| 경고가 트리거되었지만 실행 가능하지 않음 | 경고를 조정하거나 Runbook 링크를 추가하십시오 |
세션 인사이트를 에이전트가 학습하는 내용의 창으로 생각하세요. 작업할 만한 가치가 있는 항목을 찾거나 에이전트가 표면화된 문제를 처리하도록 할 수 있습니다.
작동 방식
세션 인사이트는 지속적인 개선 루프를 만듭니다. 에이전트는 각 세션에서 증상, 단계, 근본 원인 및 함정을 캡처한 다음 유사한 문제가 발생할 때 관련 과거 인사이트를 검색합니다. 이 자동 주기는 에이전트가 시간에 따라 문제를 더 빠르게 해결하는 데 도움이 됩니다.
에이전트가 캡처하는 내용
에이전트는 향후 문제 해결을 개선하기 위해 각 세션에서 일련의 데이터 요소를 캡처합니다.
| 캡처됨 | 에이전트가 그것을 사용하는 방법 |
|---|---|
| 관찰된 증상 | 향후 문제에서 유사한 패턴을 인식합니다. |
| 효과가 있었던 단계 | 검증된 해결 경로를 제안합니다. |
| 근본 원인 발견 | 잠재적인 원인에 빠르게 접근합니다 |
| 발생한 함정 | 반복 실수를 방지합니다. |
| 제공한 컨텍스트 | 사용자 환경에 대한 사실을 기억합니다. |
| 관련된 리소스 | 동일한 리소스에서 과거의 문제를 연결합니다. |
인사이트가 생성되는 경우
시스템은 대화가 완료된 후 자동으로 인사이트를 생성하거나 주문형으로 요청할 수 있습니다.
- 자동: 대화가 완료된 후(주기적으로 약 30분마다 실행)
- 주문형: 즉각적인 결과를 위해 채팅 바닥글에서 세션 인사이트 생성 선택(약 30초)
인사이트 찾아보기
설정>세션 인사이트로 이동하여 에이전트가 학습한 내용을 확인합니다.
- 헤더의 총 개수
- 세션 제목 및 타임스탬프가 있는 인사이트 목록
- 확장 가능한 타임라인 및 에이전트 성능 섹션이 있는 세부 정보 보기
- 스레드로 이동하여 원래 대화를 다시 살펴보다
비고
주기적인 인사이트 검색은 처리할 가치가 있는 반복 패턴을 표시할 수 있지만 에이전트는 검토 여부에 관계없이 이러한 인사이트를 활용합니다.
인사이트 구조
각 인사이트에는 다음이 포함됩니다.
- 타임라인: 문제 해결 세션의 시간순 마일스톤(최대 8개)
- 에이전트 성능: 잘 진행한 내용, 개선 영역 및 주요 학습
- 조사 품질 점수: 조사 완료도에 대한 1-5 등급