AI 에이전트 구성 요소
AI 에이전트는 지능형 동작을 사용하도록 설정하기 위해 함께 작동하는 기본 구성 요소 집합에서 빌드됩니다.
에이전트 아키텍처
모든 에이전트는 일반적으로 다음 구성 요소를 공유하지만 구현 및 강조되는 방법은 에이전트의 목적과 복잡성에 따라 달라집니다.
- LLM(기초 모델) : LLM(큰 언어 모델)은 생성 및 추론 기능을 제공합니다. 자연어 이해, 생성 및 컨텍스트 인식을 가능하게 합니다.
- 오케스트레이터: 오케스트레이터는 에이전트의 동작을 조정하여 지식을 검색하거나, 기술을 호출하거나, 인간에게 에스컬레이션할 시기를 결정합니다. 워크플로, 메모리 및 의사 결정 논리를 관리합니다.
- 지식: 에이전트가 해당 환경을 이해하고 결정을 내리는 데 사용하는 정보를 나타냅니다. 여기에는 구조화된 데이터, 구조화되지 않은 콘텐츠, 문서, 데이터베이스 및 실시간 입력을 포함하여 에이전트 및 에이전트가 액세스할 수 있는 접지 데이터에 대해 정의된 지침이 포함됩니다. 에이전트는 이 지식을 사용하여 상황별 관련 응답 및 작업을 제공합니다.
- 기술 및 도구: 에이전트가 메시지 보내기, 데이터베이스 쿼리 또는 자동화된 워크플로 트리거와 같은 작업을 수행하는 데 사용할 수 있는 작업, 기능 및 워크플로입니다. 여기에는 전자 메일 보내기, 데이터 검색, 레코드 업데이트 또는 자동화된 프로세스 트리거가 포함될 수 있습니다. 기술은 종종 에이전트가 작업을 완료하기 위해 호출할 수 있는 API, 서비스 또는 자동화 도구와 연결됩니다.
- 자율성: 에이전트가 정보를 해석하고 작업을 선택하는 방법을 안내하는 논리입니다. 여기에는 의사 결정 프레임워크, 규칙 기반 논리, 자율 기능에 대한 트리거 및 에이전트가 시간이 지남에 따라 적응하고 개선할 수 있는 기계 학습 모델이 포함됩니다.
리플렉션:
자동화하려는 프로세스 또는 작업에 대해 생각해 보세요. 에이전트가 해당 프로세스를 성공적으로 처리할 수 있도록 하는 데 가장 중요한 사용자 지정 구성 요소(지식, 기술, 추론)는 무엇인가요?
LLM 및 AI 에이전트: 차이점은 무엇인가요?
LLM(대규모 언어 모델)은 생성 AI의 핵심 엔진 입니다. 에이전트를 통해 인간과 유사한 언어를 이해하고 생성하고, 콘텐츠를 요약하고, 텍스트를 번역하는 등의 작업을 수행할 수 있습니다.
그러나 LLM만으로는 에이전트가 아닙니다.
AI 에이전트는 추가 구성 요소를 통합하여 LLM의 기능을 확장 합니다.
- 상호 작용 간에 컨텍스트를 유지하기 위한 메모리입니다.
- 실제 작업을 수행하는 기술.
- 복잡한 워크플로를 관리하기 위한 추론 및 오케스트레이션.
- 사용자 및 시스템과 상호 작용하는 인터페이스입니다.
즉, LLM은 인텔리전스를 생성합니다. 에이전트는 목표를 달성하기 위해 해당 인텔리전스를 적용합니다.
AI 에이전트 작동 방식
일반적인 AI 에이전트가 작동하는 방법은 다음과 같습니다.
- 입력: 사용자가 질문을 하거나 작업을 시작합니다.
- 이해: LLM은 입력을 해석하고, 의도를 결정하고, 관련 정보를 추출합니다.
- 계획: 오케스트레이터는 종종 LLM의 도움을 받아 지식 검색, 기술 호출 또는 설명 요청과 같은 수행할 단계를 결정합니다.
- 작업: 에이전트는 계획에 따라 기술 또는 도구를 사용하여 필요한 작업을 수행합니다.
- 응답 생성: LLM은 작업 결과 및 현재 컨텍스트에 따라 자연어 응답을 생성합니다.
- 통신: 에이전트는 선택한 인터페이스를 통해 사용자에게 응답을 전달합니다.
- 학습: 에이전트는 관련 컨텍스트 또는 피드백을 저장하여 향후 상호 작용을 개선합니다.
예제:
한 직원은 에이전트에게 "우리 회사의 여행 정책은 무엇이며 다음 주에 시애틀행 항공편을 예약할 수 있습니까?"라고 묻습니다.
- 에이전트는 조직 지침 및 직원 역할에 대한 이해를 사용하여 내부 설명서 또는 기술 자료 최신 회사 출장 정책을 검색합니다.
- 그런 다음 외부 항공편 예약 API를 호출하여 회사의 여행 정책(예: 기본 항공사, 예산 한도, 승인 요구 사항)을 준수하는 시애틀행 사용 가능한 항공편을 검색합니다.
- 에이전트는 관련 여행 정책, 제안된 항공편 옵션 및 예약 요청이 모두 자연어로 시작되거나 완료되었음을 확인하여 직원에게 응답합니다.
자율 에이전트
자율 요원은 더 큰 독립성으로 운영되며, 종종 인간의 개입을 최소화하면서 여러 단계 또는 세션에 대한 목표를 추구합니다. 자율 에이전트의 핵심 요소는 에이전트가 직접 사용자 입력 없이 작동하도록 요청하는 트리거 이벤트 또는 데이터 변경에 응답하는 기능입니다. 트리거에는 예약된 시간, 데이터 업데이트, 외부 시스템 이벤트 또는 사용자 컨텍스트의 변경 내용이 포함될 수 있습니다.
해당 워크플로는 일반적으로 다음과 같습니다.
- 목표 설정: 에이전트는 사용자 또는 시스템에서 높은 수준의 목표를 받습니다.
- 트리거 모니터링: 에이전트는 최종 기한, 데이터 변경 또는 작업이 필요할 수 있는 외부 이벤트와 같은 관련 트리거를 지속적으로 모니터링합니다.
- 자체 계획: 트리거를 감지하거나 목표를 받으면 에이전트는 목표를 하위 작업으로 자율적으로 세분화하고 계획을 만들고 종종 반복적으로 구체화합니다.
- 반복 작업: 에이전트는 작업을 실행하고, 결과를 모니터링하고, 계획 및 작업을 여러 번 반복하는 필요에 따라 계획을 조정합니다. 이러한 작업에는 워크플로를 트리거하고 자율 동작의 힘을 자동화된 결정적 워크플로와 결합하는 작업이 포함될 수 있습니다.
- 자체 평가: 에이전트는 목표에 대한 진행률을 평가하여 계속할지, 접근 방식을 조정할지 또는 완료를 선언할지 결정합니다.
- 보고/통신: 에이전트는 필요한 경우에만 결과를 요약하거나 입력을 요청합니다.
- 지속적인 학습: 에이전트는 향후 자율성을 개선하기 위해 결과에 따라 메모리 및 전략을 업데이트합니다.
자율 에이전트는 자체 지향 계획, 트리거 기반 실행 및 단계별 사용자 입력에 대한 최소한의 의존도를 강조하여 더 복잡한 다단계 작업을 처리할 수 있도록 합니다.
예제:
금융 organization Copilot Studio 에이전트 흐름으로 빌드된 세금 보정 에이전트를 사용합니다.
- 에이전트는 감사의 필요성을 나타낼 수 있는 변칙에 대한 재무 데이터를 지속적으로 모니터링합니다.
- 변칙이 검색되면 구조화된 감사 워크플로를 자율적으로 트리거하여 필요한 문서를 수집하고 주요 결과를 요약합니다.
- 그런 다음 에이전트는 승인을 위해 적절한 사용자 검토자에게 감사 결과를 라우팅하여 규정 준수 및 투명성을 보장합니다.
- 프로세스 전반에 걸쳐 에이전트는 새로운 데이터 또는 피드백에 따라 작업을 조정하고 자율 의사 결정과 결정적 워크플로를 결합하여 유연성과 규정 준수를 모두 유지합니다.
이 트리거 기반 주기를 통해 에이전트는 동적 환경에서 작동하고, 사용자 요구에 적응하고, 점점 더 개인화되고 효과적인 결과를 제공할 수 있습니다.
AI 에이전트 빌드
AI 에이전트를 빌드하려면 기본 기술, 인프라 및 개발 도구의 조합이 필요할 수 있습니다.
- LLM(기초 모델) : 자연어 이해, 추론 및 생성을 위한 것입니다.
- 오케스트레이션 계층: 작업의 계획, 의사 결정 및 조정을 관리합니다.
- 기술 및 도구: 에이전트가 작업을 완료하기 위해 호출할 수 있는 API, 플러그 인 및 서비스 라이브러리입니다.
- 메모리 및 컨텍스트 저장소: 단기 및 장기 메모리를 유지하려면 개인 설정 및 연속성을 사용하도록 설정합니다.
- 데이터 인프라: 구조화되고 구조화되지 않은 데이터 원본에 대한 안전하고 확장 가능한 액세스입니다.
- 보안 및 거버넌스: ID 관리, 액세스 제어 및 규정 준수 모니터링.
- 배포 환경: 에이전트를 호스트하고 크기를 조정하는 클라우드 네이티브 인프라(예: Azure Kubernetes Service, Azure Functions)입니다.
그러나 이러한 AI 스택 계층에서 필요한 개발 수준은 에이전트의 목적과 복잡성에 따라 크게 달라질 수 있습니다. 검색 및 작업 기반 에이전트 시나리오의 경우 나머지 스택에 대한 기존 인프라를 활용하는 동안 지식, 기술 및 지침을 추가하면 됩니다(예: Microsoft 365 Copilot 확장하는 에이전트 빌드). 고급 및 복잡한 시나리오의 경우 사용자 지정 모델, 오케스트레이션, 논리, 작업, 보안 및 거버넌스를 포함하여 솔루션을 완전히 사용자 지정할 수 있습니다.
Microsoft AI 에이전트 솔루션
Microsoft는 완전한 사용자 지정 AI 스택을 사용하여 솔루션을 빌드하거나 엔터프라이즈 데이터, API 및 비즈니스 논리와 함께 기존 구성 요소를 활용하려는 경우 AI 변환 여정의 역량을 강화하는 다양한 도구와 솔루션을 제공합니다.
- 채택: Microsoft 365 Copilot, Copilot Chat 및 다양한 자사 에이전트는 기본 제공 보안 및 거버넌스 제어를 통해 즉시 AI 기반 생산성을 지원하는 강력한 기능을 제공합니다.
- 확장: copilot의 모델, 오케스트레이터 및 사용자 인터페이스를 활용하지만 비즈니스 프로세스 자동화를 위한 사용자 지정 비즈니스 논리, 데이터 및 시스템에 맞게 조정되는 에이전트를 사용하여 Microsoft 365 Copilot 확장할 수 있습니다.
- 빌드: Copilot Studio, Microsoft 365 에이전트 도구 키트, Microsoft Foundry 등을 비롯한 다양한 Microsoft 도구 및 서비스를 사용하여 고급 또는 복잡한 시나리오를 위한 사용자 지정 에이전트 및 상용 생성 AI 애플리케이션을 빌드할 수 있습니다.
Microsoft는 다음을 포함하여 이 스펙트럼을 따라 사용할 수 있는 AI 에이전트에 가장 적합한 솔루션을 제공합니다.
- Microsoft 365 Copilot 및 라이트 버전의 Copilot Studio: 비즈니스 사용자는 코드 없는 인터페이스에서 자연어를 사용하여 AI 에이전트를 개발할 수 있습니다.
- Copilot Studio(전체): 작성자는 로우 코드 인터페이스를 사용하여 사용자 지정 AI 에이전트를 빌드하고 Microsoft 365 Copilot 확장할 수 있습니다.
- Visual Studio/GitHub/Microsoft Foundry: 개발자는 Microsoft 에이전트 프레임워크, Foundry Agent Service, Microsoft 365 에이전트 SDK 및 Microsoft 365 에이전트 도구 키트와 같은 SDK, 프레임워크 및 서비스와 함께 이러한 프로 코드 도구를 사용하여 엔터프라이즈급 AI 에이전트 솔루션을 설계, 빌드, 사용자 지정, 게시 및 관리할 수 있습니다.