다음을 통해 공유


SRE 에이전트 미리 보기의 메모리 시스템

SRE 에이전트 메모리 시스템은 에이전트에게 효과적으로 문제를 해결하는 데 필요한 지식을 제공합니다. Runbook, 팀 표준 및 서비스별 컨텍스트를 추가하면 에이전트가 인시던트 중에 더 나은 답변을 제공할 수 있습니다. 시스템은 시간이 지남에 따라 개선하기 위해 각 세션에서 학습합니다.

메모리 구성 요소

메모리 시스템은 다음 네 가지 보완 구성 요소로 구성됩니다.

구성 요소 목적 설치 프로그램 적합한 대상
사용자 메모리 팀 지식에 대한 빠른 채팅 명령 인스턴트(채팅 명령) 팀 표준, 서비스 구성, 워크플로 패턴
기술 자료 Runbook에 대한 직접 문서 업로드 빠른(파일 업로드) 정적 런북, 문제 해결 안내서, 내부 문서
설명서 커넥터 자동화된 Azure DevOps 동기화 구성이 필요함 생활 설명서, 자주 업데이트되는 가이드
세션 인사이트 세션에서 에이전트에서 생성된 메모리 자동 학습된 문제 해결 패턴, 과거 인시던트 해결

에이전트가 메모리를 검색하는 방법

대화 중에 에이전트는 구성된 도구를 통해 메모리 원본에서 정보를 검색합니다.

Azure SRE 에이전트 메모리 시스템 루프의 다이어그램.

도구 구성

도구는 SearchMemory 모든 메모리 구성 요소를 검색합니다. 사용자 기억, 기술 자료, 세션 인사이트 및 설명서 커넥터를 동시에 검색합니다.

  • SRE 에이전트(기본값): SearchMemory 기본 제공
  • 사용자 지정 서브에이전트: 구성에 도구SearchMemory을 추가

중요합니다

메모리 구성 요소에 비밀, 자격 증명, API 키 또는 중요한 데이터를 저장하지 마세요. 팀에서 추억을 공유하고 시스템에서 검색을 위해 인덱싱합니다.

향상된 검색 매개 변수

이 도구는 SearchNodes 더 많은 대상 검색에 대한 필터링 옵션을 지원합니다.

매개 변수 유형 Description
entityType 문자열 엔터티 형식(예: Incident, Service또는 Resource.)을 기준으로 결과를 필터링합니다.
includeNeighbors bool 검색 결과에 연결된 노드를 포함합니다.

Example:

Search for all incidents related to "database timeout" and include connected resources

설정 includeNeighborstrue로 하면 검색 결과는 일치하는 인시던트 노드뿐만 아니라 관련된 노드도 반환합니다.

  • 리소스
  • Services
  • 관련 인시던트
  • 연결된 문서

일치하는 노드에 대한 전체 관계 그래프를 표시하면 조사 중에 더 풍부한 컨텍스트를 얻을 수 있습니다.

빠른 시작

먼저 사용자 추억을 사용하여 기본 지식을 설정한 다음, 요구 사항이 증가함에 따라 문서 스토리지 및 자동화된 동기화로 확장합니다.

1. 사용자 추억으로 시작

채팅 명령을 사용하여 즉각적인 팀 지식을 저장합니다.

#remember Team owns services: app-service-prod, redis-cache-prod, and sql-db-prod

#remember For latency issues, check Redis cache health first

#remember Production deployments happen Tuesdays at 2 PM PST

이러한 사실은 이제 모든 대화에서 사용할 수 있습니다.

2. 키 문서 업로드

기술 자료에 중요한 운영 절차서와 가이드를 추가합니다.

  1. Azure Portal에서 SRE 에이전트를 엽니다.

  2. 설정>기술 자료로 이동합니다.

  3. 파일 추가를 선택하거나 파일을 업로드 영역으로 끌어서 놓습니다.

  4. 업로드 .md 또는 .txt 파일(각각 최대 16MB).

  5. 시스템은 파일을 인덱싱하여 SearchMemory을 통해 검색할 수 있도록 합니다.

3. 세션 인사이트 검토

세션 문제를 해결한 후 설정>세션 인사이트를 확인하여 무엇이 잘 진행되었는지, 에이전트에 더 많은 컨텍스트가 필요한지 확인합니다. 인사이트를 사용하여 지식 격차를 식별하고 대상 메모리 또는 설명서를 추가합니다.

4. 리포지토리 연결(선택 사항)

Azure DevOps에 기존 설명서가 있는 팀의 경우:

  1. 설정>커넥터로 이동합니다.

  2. 커넥터 추가를 선택하고 설명서 커넥터를 선택합니다.

  3. Azure DevOps 리포지토리 URL을 입력하고 관리 ID를 선택합니다.

    커넥터가 자동으로 인덱싱을 시작합니다.

사용자 메모리

사용자 추억을 통해 에이전트가 모든 대화에서 기억하는 팀 팩트, 표준 및 컨텍스트를 저장할 수 있습니다. 간단한 채팅 명령(#remember, #forget, #retrieve)을 사용하여 에이전트 응답을 자동으로 향상시키는 영구 기술 자료를 빌드할 수 있습니다.

채팅 명령

를 사용하여 정보 저장 #remember

향후 대화를 위해 팩트, 표준 또는 컨텍스트를 저장합니다.

Syntax:

#remember [content to save]

:

#remember Team owns app-service-prod in East US region
#remember For app-service-prod latency issues, check Redis cache health first
#remember Team uses Kusto for logs. Workspace is "myteam-prod-logs"

시스템은 OpenAI를 사용하여 콘텐츠를 포함하고, Azure AI Search에 저장하며, 모든 대화에서 자동 검색에 사용할 수 있도록 합니다. 확인 메시지가 표시됩니다. ✅ Agent Memory saved.

#forget를 사용하여 메모리를 제거하세요.

이전에 저장한 추억을 검색하여 삭제합니다.

Syntax:

#forget [description of what to forget]

:

#forget NSG rules information
#forget production environment location

시스템이 여러분의 기억을 의미 기반으로 검색하여 가장 일치하는 항목을 찾아 보여주고, 그것을 삭제합니다. 확인 메시지가 표시됩니다. ✅ Agent Memory forgotten: [deleted content]

** #retrieve을 사용하여 추억을 쿼리하기

에이전트 추론을 트리거하지 않고 저장된 메모리를 명시적으로 검색하고 표시합니다.

Syntax:

#retrieve [search query]

:

#retrieve production environment
#retrieve deployment process

시스템은 의미 체계적으로 기억을 검색합니다. 상위 5개의 일치 항목을 사용하여 응답을 합성합니다. 개별 기억과 합성된 답변이 모두 표시됩니다.

범위 및 스토리지

  • 팀 전체에서 공유: SRE 에이전트의 모든 사용자가 액세스할 수 있습니다.

  • 모든 대화에서 유지: 한 번 저장하면 영원히 사용할 수 있습니다.

  • 관련되는 경우 자동으로 검색됨: 에이전트는 추론 중에 의미상 메모리를 검색합니다.

참조 자료

기술 자료는 에이전트가 대화 중에 활용할 수 있는 런북, 문제 해결 가이드 및 내부 문서에 대한 직접 문서 업로드 기능을 제공합니다.

지원되는 파일 형식 및 제한

  • 형식: .md (markdown, 권장), .txt (일반 텍스트)
  • 파일당: 최대 16MB(Azure AI Search 제한)
  • 요청당: 단일 업로드의 모든 파일에 대해 총 100MB

문서 업로드

  1. 설정>기술 자료로 이동합니다.

  2. 파일 추가를 선택하거나 파일을 업로드 영역으로 끌어서 놓습니다.

    포털은 파일의 유효성을 자동으로 검사, 업로드 및 인덱싱합니다.

에이전트 도구를 통해 업로드

에이전트는 UploadKnowledgeDocument 도구를 사용하여 기술 자료에 직접 문서를 업로드할 수 있습니다. 이 메서드는 다음과 같은 경우에 유용합니다.

  • 조사 중에 검색된 문제 해결 단계를 캡처하려고 합니다.
  • 인시던트 해결 시 생성된 런북을 추가해야 합니다.
  • UI 액세스 없이 프로그래밍 방식으로 설명서를 추가하려고 합니다.

도구: UploadKnowledgeDocument

매개 변수 유형 필수 Description
fileName 문자열 Yes 확장명(예: runbook-database-issues.md)이 있는 파일 이름입니다. .md 또는 .txt이어야 합니다.
content 문자열 Yes 일반 텍스트 또는 Markdown 형식의 전체 문서 콘텐츠입니다.
triggerIndexing bool 아니오 즉시 인덱싱 트리거(기본값: true). 일괄 업로드를 위해 false로 설정하십시오.

사용 예:

에이전트에게 다음을 요청합니다.

"데이터베이스 시간 제한 문제에 대한 문제 해결 단계를 기술 자료에 저장"

에이전트 UploadKnowledgeDocument 를 사용하여 다음을 수행합니다.

  1. 적절한 파일 이름을 사용하여 문서를 만듭니다.
  2. Markdown에서 콘텐츠의 서식을 지정합니다.
  3. Azure Blob Storage에 문서를 업로드합니다.
  4. 즉시 검색을 위해 인덱싱을 트리거합니다.

제약 조건:

  • 최대 파일 크기: 16MB
  • 지원되는 확장: .md.txt 전용입니다.
  • 파일 이름이 같은 문서가 있으면 에이전트가 덮어씁니다.

오류 처리:

오류 해결 방법
"에이전트 메모리를 사용할 수 없습니다." 구성에서 에이전트 메모리를 사용하도록 설정합니다.
"잘못된 파일 확장자" .md 또는 .txt 확장만 사용하십시오.
"문서 콘텐츠가 최대 크기를 초과합니다." 큰 문서를 더 작은 파일로 분할합니다.

문서 관리

  • 보기: 설정>기술 자료 로 이동하여 업로드된 모든 문서를 확인합니다.

  • 업데이트: 이전 버전을 덮어쓰려면 같은 이름의 파일을 업로드합니다.

  • 삭제: 문서를 선택하고 삭제 작업을 사용합니다. 변경 내용은 즉시 적용됩니다.

세션 인사이트

에이전트가 귀하의 인시던트를 처리함에 따라 학습합니다. 세션 인사이트는 각 세션의 작동된 작업, 수행되지 않은 작업 및 주요 학습을 캡처합니다. 에이전트는 나중에 유사한 문제에 도움이 되도록 해당 지식을 자동으로 적용합니다.

자동 개선

에이전트는 수동 작업 없이 모든 세션에서 학습합니다.

  • 에이전트는 문제를 자율적으로 처리하거나 사용자와 직접 협업합니다.
  • 에이전트는 증상, 해결 단계, 근본 원인 및 함정을 캡처합니다.
  • 이러한 통찰력은 검색 가능한 추억이 됩니다.
  • 이후 세션은 관련 과거 인사이트를 자동으로 검색합니다.

결과: 에이전트는 시간이 지남에 따라 개선되어 입증된 해결 방법을 제안하고 알려진 문제를 방지합니다.

기회 발견

세션 인사이트는 자동으로 작동하지만 검토하면 작업할 수 있는 중요한 패턴이 노출될 수 있습니다.

검색할 수 있는 패턴 잠재적인 조치
동일한 문제가 계속 되풀이됨 기본 코드 또는 구성 수정
에이전트가 서비스에 대한 맥락이 부족합니다. 도메인 지식이 있는 사용자 지정 스바겐트 만들기
문제 해결 단계가 문서화되지 않음 실행 문서 업데이트 또는 만들기
원격 분석 간격으로 인해 진단이 더 어려워졌습니다. 로깅 개선 또는 메트릭 추가
경고가 트리거되었지만 실행 가능하지 않음 경고를 조정하거나 Runbook 링크를 추가하십시오

세션 인사이트를 에이전트가 학습하는 내용의 창으로 생각하세요. 작업할 만한 가치가 있는 항목을 찾거나 에이전트가 표면화된 문제를 처리하도록 할 수 있습니다.

작동 방식

세션 인사이트는 지속적인 개선 루프를 만듭니다. 에이전트는 각 세션에서 증상, 단계, 근본 원인 및 함정을 캡처한 다음 유사한 문제가 발생할 때 관련 과거 인사이트를 검색합니다. 이 자동 주기는 에이전트가 시간에 따라 문제를 더 빠르게 해결하는 데 도움이 됩니다.

Azure SRE 에이전트 메모리 시스템 루프의 다이어그램.

에이전트가 캡처하는 내용

에이전트는 향후 문제 해결을 개선하기 위해 각 세션에서 일련의 데이터 요소를 캡처합니다.

캡처됨 에이전트가 그것을 사용하는 방법
관찰된 증상 향후 문제에서 유사한 패턴을 인식합니다.
효과가 있었던 단계 검증된 해결 경로를 제안합니다.
근본 원인 발견 잠재적인 원인에 빠르게 접근합니다
발생한 함정 반복 실수를 방지합니다.
제공한 컨텍스트 사용자 환경에 대한 사실을 기억합니다.
관련된 리소스 동일한 리소스에서 과거의 문제를 연결합니다.

인사이트가 생성되는 경우

시스템은 대화가 완료된 후 자동으로 인사이트를 생성하거나 주문형으로 요청할 수 있습니다.

  • 자동: 대화가 완료된 후(주기적으로 약 30분마다 실행)
  • 주문형: 즉각적인 결과를 위해 채팅 바닥글에서 세션 인사이트 생성 선택(약 30초)

인사이트 찾아보기

설정>세션 인사이트로 이동하여 에이전트가 학습한 내용을 확인합니다.

  • 헤더의 총 개수
  • 세션 제목 및 타임스탬프가 있는 인사이트 목록
  • 확장 가능한 타임라인 및 에이전트 성능 섹션이 있는 세부 정보 보기
  • 스레드로 이동하여 원래 대화를 다시 살펴보다

비고

주기적인 인사이트 검색은 처리할 가치가 있는 반복 패턴을 표시할 수 있지만 에이전트는 검토 여부에 관계없이 이러한 인사이트를 활용합니다.

인사이트 구조

각 인사이트에는 다음이 포함됩니다.

  • 타임라인: 문제 해결 세션의 시간순 마일스톤(최대 8개)
  • 에이전트 성능: 잘 진행한 내용, 개선 영역 및 주요 학습
  • 조사 품질 점수: 조사 완료도에 대한 1-5 등급