에이전트는 핵심 역량을 확장하는 전문 도구를 장착할 때 더 강력해집니다. Copilot Studio는 세 가지 주요 에이전트 도구 카테고리를 제공합니다:
이 글에서는 각 도구 유형이 어떻게 작동하는지, 언제 사용해야 하는지, 그리고 이들이 어떻게 더 유능하고 효율적인 에이전트를 만드는 데 도움이 되는지 살펴봅니다. 또한 컴퓨터 사용 시나리오에서 호스팅 머신과 직접 가져오는 머신의 차이점, 그리고 전통적인 로봇 프로세스 자동화(RPA)와 에이전트를 이용한 컴퓨터 사용(CUA) 방식 중 선택에 대한 안내도 배웁니다.
AI 프롬프트를 사용해 응답을 생성하세요
AI 프롬프트는 AI 모델로부터 답변을 생성하기 위해 일련의 지시를 사용합니다. 이 지침에 더 많은 텍스트나 문서를 삽입할 수 있는 변수를 포함할 수 있습니다. 출력은 일반적으로 일반 텍스트 또는 JSON 형식으로 제공됩니다. Copilot Studio에 내장되었거나 Microsoft Foundry를 통해 배포된 어떤 AI 모델이든 선택하여 응답을 생성할 수 있습니다.
에이전트 도구로, 또는 주제 내에서 프롬프트를 호출할 수 있습니다. 모든 프롬프트는 프롬프트 라이브러리에 저장되어 애플리케이션 수명주기 관리, 역할 기반 접근 제어 및 공유를 지원합니다.
에이전트가 특정 작업을 수행하도록 프롬프트를 사용하는 방법에 대해 더 알아보세요.
언제 AI 프롬프트를 사용할지 오케스트레이터를 사용할지 판단하세요
Copilot Studio에 구축된 모든 에이전트는 오 케스트레이터 를 사용하여 시스템 지침, 사용자 입력, 맥락 정보를 바탕으로 도구, 주제, 지식을 선택하여 어떻게 대응할지 결정합니다. 오케스트레이터는 생성 오케스트레이션의 엔진으로, 에이전트의 도구와 설명을 사용해 행동을 계획하고 응답을 작성합니다.
오케스트레이터 기반 응답이 AI 프롬프트와 비슷해 보일 수 있지만, 두 기능은 서로 다른 목적을 가지고 있습니다. AI 프롬프트는 독립적인 프롬프트 기반 액션으로, 제작자가 모델 구성을 더 깊이 제어할 수 있게 합니다.
AI 프롬프트는 Microsoft Foundry를 통해 제공되는 모델을 포함해 더 다양한 모델을 지원합니다. 또한 Dataverse 접지, 파일 입력, 코드 인터프리터 등의 기능도 지원합니다.
오케스트레이터는 고정된 시스템 프롬프트와 도구 설명을 사용하여 주어진 요청에 맞는 올바른 빌딩 블록을 선택합니다. 메이커는 오케스트레이터의 시스템 프롬프트를 편집할 수 없지만, 에이전트 지시를 통해 그 동작에 영향을 미칠 수 있습니다.
AI 프롬프트는 형식, 제약 조건, 논리를 완전히 제어할 수 있어, 정밀하거나 구조화된 출력이 필요한 시나리오에 적합한 선택입니다. 예를 들어, 단순한 형식 이상의 스타일 제어가 필요하다면("이 정확한 단어들을 사용해 ABAB 구조로 운율 시를 쓰라"), 프롬프트가 더 적합합니다.
오케스트레이터는 텍스트에서 단일 이름을 추출하는 간단한 작업에 잘 작동합니다. 복잡한 추출 작업에는 AI 프롬프트를 사용하세요. 예를 들어, 긴 보고서에서 여러 엔터티를 추출해 도메인별 관계(예: 보험 보고서에서 여러 이름을 추출해 사고 당사자 중 한 쪽에만 연관된 자동차 수리 서비스 소유자를 식별하는 등)와 연결하는 식입니다.
오케스트레이터와 AI 프롬프트 중 어떤 선택은 필요한 맞춤화 수준에 따라 달라집니다. 모델의 행동이나 출력을 정밀하게 제어하고 싶다면 AI 프롬프트를 선택하세요. 일반적인 추론, 도구 선택, 가벼운 포맷만으로도 충분한 상황에서는 오케스트레이터가 적합합니다.
MCP를 사용하여 에이전트 도구를 통합하세요
모델 컨텍스트 프로토콜(MCP)은 AI 모델이 외부 도구, 데이터 소스, 사용자 환경과 일관되고 확장 가능한 방식으로 상호작용하기 위해 사용하는 보편적 인터페이스입니다.
반면, Power Platform 커넥터는 각 동작과 그 입력값을 설명하고, 새로운 정의가 나올 때마다 이를 업데이트해야 합니다. 각 도구별로 통합을 맞춤화하는 것은 더 복잡하고 확장성이 떨어집니다.
Outlook, Dataverse, GitHub 같은 마이크로소프트 서비스나 Salesforce, JIRA 같은 서드파티 서비스에는 Copilot Studio에 포함된 MCP 서버를 사용하세요. 서비스가 없는 곳에 맞춤형 MCP 서버를 구축하세요.
MCP의 장점은 다음과 같습니다:
- AI 모델의 표준화된 맥락
- Copilot Studio와의 원활한 통합
- 개발자 효율성과 사용자 경험 향상
- 거버넌스, 모니터링 및 확장성
MCP 서버를 구현하기 전에 다음과 같은 제한사항을 고려해야 합니다:
- 도구 설명을 언제 호출해야 하는지에 대한 더 많은 맥락으로 풍부하게 할 수는 없습니다.
- 주제는 MCP 서버를 직접 호출할 수 없습니다.
MCP를 언제 사용해야 하는지 이해하세요
Copilot Studio에서도 여러 통합 방식을 통해 동일한 결과를 달성할 수 있습니다. 모델 컨텍스트 프로토콜(MCP) 서버를 언제 사용할지, 파워 플랫폼 커넥터나 직접 REST API 호출 같은 간단한 옵션을 사용할 때인지 이해하는 것이 중요합니다.
표준화되고 중앙에서 관리되는 방식으로 여러 에이전트에게 도구와 자원을 노출할 수 있는 방법이 필요할 때는 MCP를 사용하세요. MCP 서버는 에이전트가 도구 설명과 입력을 정의하기 때문에 에이전트가 자동으로 발견, 버전 관리, 일관되게 사용할 수 있는 도구와 자원을 공개합니다. 반면, API를 직접 추가할 때는 그 목적을 수동으로 설명하고 에이전트별로 입력을 정의해야 합니다.
MCP는 특히 업스트림 API가 자주 변경될 때 매우 유용합니다. API를 소비하는 모든 에이전트를 업데이트하는 대신, MCP 서버에서 정의를 한 번 수정하면 모든 에이전트가 재게시 없이 자동으로 업데이트된 버전을 사용합니다. MCP 서버가 없거나 빠르게 프로토타이핑 중이라면 API를 직접 호출하는 것이 더 빠르고 전체 MCP 라이프사이클을 도입하는 데 필요한 설정 오버헤드를 피할 수 있습니다.
MCP를 사용하려면 생성 오케스트레이션을 사용하도록 설정해야 합니다. 자세한 내용은 '어떻게 MCP가 작동하는가?'에서 확인하세요.
컴퓨터 사용 도구를 사용해 데스크톱 프로세스를 자동화하세요
컴퓨터 사용 도구를 사용하면 자동화 스크립트나 API 없이 컴퓨터를 조작할 수 있습니다. 스크립트나 API 대신, 프롬프트를 사용해 에이전트를 구성합니다. 에이전트는 목표를 달성하는 최선의 방법을 결정합니다. 과정 중 에이전트는 각 단계에서 스크린샷을 찍고, 이를 분석하여 다음 행동을 결정하고, 그 동작을 실행한 뒤 이 과정을 반복하여 작업이 완료됩니다. 에이전트가 촬영한 스크린샷과 추론 절차는 실행 기록의 일부로 제공됩니다.
에이전트가 컴퓨터 사용 도구로부터 혜택을 볼 수 있는 일반적인 상황은 다음과 같습니다:
- 데이터 입력: 들어오는 CSV 파일의 각 행에 대해 SAP에서 판매 주문을 생성하고 생성된 주문 ID를 파일에 다시 기록하세요.
- 데이터 추출: 각 공급업체 포털에 접속해 나열된 SKU를 검색하고, 가격, 재고, 리드 타임을 추출한 후 타임스탬프가 포함된 결과를 데이터베이스에 삽입합니다.
- 앱 간: 데스크톱 금융 클라이언트에서 당일 거래 내역을 내보내고, QuickBooks를 탐색한 후 각 항목을 올바른 계좌에 게시하세요.
호스팅 머신과 직접 머신을 가져오는 것을 이해하세요
상담원은 Microsoft 호스팅 기기나 BYO(Bring-your-Own) 기기에서 컴퓨터 사용 도구를 호출할 수 있습니다. 호스팅 머신은 IT 구성이나 청구 없이도 즉시 사용할 수 있습니다. 이들은 고객 테넌트에 Entra 조인되지 않은 사전 프로비저닝된 Windows 365 클라우드 PC들의 공유 풀에 속합니다. BYO 기계는 고객의 가상 네트워크 내에서 사전에 프로비저닝되어야 합니다. Power Automate에서 BYO 기기를 등록하고 관리해야 합니다.
생산 시나리오에서는 BYO 기계를 사용하세요. Microsoft Entra ID 지원, Intune 등록 및 웹 및 데스크톱 자동화 사용 사례 모두를 지원합니다. 기능이 제한적이기 때문에 프로토타이핑 용도로만 호스팅 머신을 사용하세요. 사용자당 한 번에 한 대의 클라우드 PC만 사용할 수 있으며, 사용량을 수요에 따라 제한할 수 있습니다.
컴퓨터 사용이 실행되는 위치 구성에서 자세히 알아봅니다.
로봇 프로세스 자동화(RPA) vs. 에이전트를 이용한 컴퓨터 (CUA)
로봇 프로세스 자동화(RPA)는 스크립트를 이용해 컴퓨터를 자동화하는 기술입니다. CUA와 비슷한 여러 상황에 적용할 수 있습니다. 하지만 RPA와 CUA의 차이를 이해하는 것이 중요합니다.
| 측면 | RPA | CUA |
|---|---|---|
| 자동화 유형 | 규칙 기반 | LLM 기반 |
| 상호작용법 | UI 트리 | Vision |
| 저술 | 복잡한 문자 | 자연어 명령어 |
| 의사결정 | 미리 정의된 규칙 | 자율적 시각 기반 의사결정 |
| 유연성 | 제한된 유연성 | 높은 유연성 |
| 오류 처리 | 정적 오류 처리 | 시각적 피드백에 기반한 자기 교정 |
RPA를 사용할 때:
- 일반 이용 가능(GA) 기능만 허용됩니다.
- 사용자 인터페이스는 안정적입니다. 스크린, 필드, 셀렉터는 거의 바뀌지 않습니다.
- 규칙은 명확합니다. 결정 내용을 규칙으로 담을 수 있습니다.
- 속도가 중요합니다. 대량 생산. 매 순간이 중요하다.
- RPA 팀이 소유하고 있습니다. 팀은 기존 RPA 개발 및 관리 지식을 보유하고 있습니다.
CUA를 사용할 때:
- 사용자 인터페이스는 매우 다양하거나 변화가 큽니다. 여러 앱을 다루고 자주 재설계를 해야 합니다.
- 빨리 필요해. RPA 팀의 밀린 업무가 꽉 찼다.
- 사용자 인터페이스는 중요합니다. 이 작업은 화면에 보이는 차트, 색상, 동적 레이아웃 등에 따라 달라집니다.
- 결정은 모호합니다. 에이전트는 논리적으로 판단하고, 다음 단계를 선택하거나, 스스로 수정해야 합니다.