Foundry MCP Server는 API 호출 대신 대화형 프롬프트를 통해 데이터 세트를 관리하고, 평가를 실행하고, 모델을 배포 및 모니터링하는 등의 도구를 제공합니다. 이 참조를 사용하여 각 도구를 탐색하고 사용자 고유의 프로젝트에서 예제 프롬프트를 사용해 보세요.
팁 (조언)
이러한 도구를 사용하기 전에 Foundry MCP Server 설정을 완료합니다.
비고
이 기능은 현재 공개 미리 보기로 제공됩니다. 이 미리 보기는 서비스 수준 계약 없이 제공되며, 프로덕션 워크로드에는 권장되지 않습니다. 특정 기능이 지원되지 않거나 기능이 제한될 수 있습니다. 자세한 내용은 Microsoft Azure Preview에 대한 추가 사용 약관을 참조하세요.
에이전트 관리
agent_get(읽기)
이름으로 특정 에이전트를 얻거나 Foundry 프로젝트의 모든 에이전트를 나열합니다.
프롬프트 예제는 다음과 같습니다.
- "Foundry 프로젝트의 모든 에이전트를 나열합니다."
- "에 대한 세부 정보를 표시합니다
customer-support-agent." - "에이전트
triage-agent에 대한 구성을 가져옵니다."
agent_update(쓰기)
Foundry 프로젝트에서 에이전트를 만들거나 업데이트하거나 복제합니다.
프롬프트 예제는 다음과 같습니다.
- "모델을
faq-agent사용하여 명명된 새 에이전트를 만듭니다gpt-4o-mini." - "청구 문제의 우선 순위를 지정하도록 지침을 업데이트
triage-agent합니다." - "복제
prod-agent하여staging-agent최신 모델로 전환합니다."
agent_delete(쓰기)
Foundry 프로젝트에서 에이전트를 삭제합니다.
프롬프트 예제는 다음과 같습니다.
- "내 프로젝트에서 삭제
old-test-agent합니다." - "마이그레이션이 완료된 지금 제거
deprecated-agent합니다." - "이 프로젝트에서 사용되지 않는 에이전트를 정리합니다."
데이터 세트 관리
evaluation_dataset_create(쓰기 가능)
Foundry 프로젝트에서 데이터 세트 버전을 만들거나 업데이트합니다.
프롬프트 예제는 다음과 같습니다.
- "이 Azure Blob Storage URL에서 고객 지원 Q&A 데이터 세트를 업로드합니다."
- "에 있는 내 학습 데이터에 대한 새 데이터 세트 버전 2.0을 만듭니다
<blob-storage-account-url>." - 내 Blob Storage에서 새 평가 데이터 세트
product-reviews-v1을(를) 등록합니다.
evaluation_dataset_get(읽기)
이름 및 버전별로 데이터 세트를 얻거나 프로젝트의 모든 데이터 세트를 나열합니다.
프롬프트 예제는 다음과 같습니다.
- "Foundry 프로젝트의 모든 데이터 세트 표시"
- "'customer-support-qa' 데이터 세트 버전 2에 대한 세부 정보 가져오기"
- "평가에 사용할 수 있는 모든 사용 가능한 데이터 세트 나열"
평가 작업
evaluation_create(쓰기)
하나 이상의 계산기를 사용하여 데이터 세트에 대한 평가 실행을 만듭니다.
프롬프트 예제는 다음과 같습니다.
- "관련성, 접지성 및 일관성 평가자를 사용하여 내 고객 서비스 데이터 세트에 대한 평가 실행을 만듭니다."
- "데이터 세트-456에 대해 내 챗봇 모델의 평가를 실행할 때, Violence, HateUnfairness, 그리고 ContentSafety 평가자를 사용합니다."
- "테스트 데이터 세트에서 F1Score, BleuScore 및 RougeScore 메트릭을 사용하여 내 QA 모델을 평가합니다."
evaluation_get(읽기)
Foundry 프로젝트에서 평가 목록을 실행합니다.
프롬프트 예제는 다음과 같습니다.
- Foundry 프로젝트에서 모든 평가 실행을 보여 주세요.
- "이번 주에 실행한 최근 평가 나열"
- "내 모든 모델 평가의 상태를 가져옵니다."
evaluation_comparison_create(작성)
그룹 내에서 평가의 비교 결과를 만듭니다.
프롬프트 예제는 다음과 같습니다.
- "내 기준 모델의 성능을 두 개의 새로운 미세 조정된 버전과 비교합니다."
- "평가 eval-456를 위해 run-baseline-123과 처리 실행 run-124, run-125 간의 비교를 만들어 줘."
- "동일한 평가 메트릭에서 모델 A와 모델 B 성능을 비교하려고 합니다."
evaluation_comparison_get(읽기)
그룹 내 평가의 비교 결과를 얻거나 나열합니다.
프롬프트 예제는 다음과 같습니다.
- "비교 인사이트-789의 결과를 가져옵니다."
- "어제 만든 비교 결과를 보여 주세요."
- "내 프로젝트에서 모든 평가 비교 인사이트를 검색합니다."
모델 카탈로그 및 세부 정보
model_catalog_list(읽기)
Foundry 모델 카탈로그의 모델을 나열합니다.
프롬프트 예제는 다음과 같습니다.
- "카탈로그에서 사용할 수 있는 모든 GPT-4 모델을 표시합니다."
- "MIT 라이선스를 사용하여 Microsoft에서 게시한 모든 모델을 나열합니다."
- "놀이터에서 무료로 사용할 수 있는 모델을 찾아보세요."
- "OpenAI에서 텍스트 생성에 사용할 수 있는 모델은 무엇인가요?"
model_details_get(읽기)
Foundry에서 전체 모델 세부 정보 및 코드 샘플을 가져옵니다.
프롬프트 예제는 다음과 같습니다.
- "GPT-4o-mini에 대한 자세한 정보 및 코드 샘플을 가져옵니다."
- "Llama-2-70b 모델의 사양 및 사용 예제를 보여 주세요."
- "text-embedding-ada-002 모델에 대한 설명서와 샘플 코드가 필요합니다."
모델 배포 관리
model_deploy(쓰기)
지정된 Foundry 계정에서 모델 배포를 만들거나 업데이트합니다.
프롬프트 예제는 다음과 같습니다.
- "20개의 용량 단위로 GPT-4o-mini를 'production-chatbot'으로 배포"
- "GPT-4o 모델을 사용하여 'content-generator'라는 새 배포를 만듭니다."
- "내 애플리케이션에 대한 최신 버전의 GPT-4o를 배포합니다."
model_deployment_get(읽기)
Foundry 계정에서 하나 이상의 모델 배포를 가져옵니다.
프롬프트 예제는 다음과 같습니다.
- "현재의 모든 모델 배포를 보여 줘."
- "내 '프로덕션 챗봇' 배포에 대한 세부 정보를 가져옵니다."
- Foundry 계정의 모든 배포를 나열하세요.
model_deployment_delete(쓰기)
이름으로 특정 모델 배포를 삭제합니다.
프롬프트 예제는 다음과 같습니다.
- "더 이상 사용하지 않는 '이전 테스트 배포'를 삭제합니다."
- 스테이징 배포를 제거하여 할당량을 확보하세요.
- 내 Foundry 계정
<account-name>에서 더 이상 사용되지 않는 모델 배포를 정리하세요.
모델 분석 및 권장 사항
model_benchmark_get(읽기)
Foundry 모델에 대한 벤치마크 데이터를 가져옵니다.
프롬프트 예제는 다음과 같습니다.
- "사용 가능한 모든 모델에 대한 벤치마크 데이터를 표시합니다."
- "다양한 모델 패밀리에서 성능 비교를 가져옵니다."
- "다양한 모델에 대한 정확도 및 비용 메트릭을 보고 싶습니다."
model_benchmark_subset_get(읽기)
특정 모델 이름 및 버전 쌍에 대한 벤치마크 데이터를 가져옵니다.
프롬프트 예제는 다음과 같습니다.
- "GPT-4와 GPT-3.5 터보 간의 벤치마크 성능을 비교합니다."
- "Claude-3 및 Llama-2-70b 모델에 대한 벤치마크 데이터를 가져옵니다."
- "고려 중인 특정 모델 버전에 대한 성능 메트릭을 표시합니다."
model_similar_models_get(읽기)
배포 또는 모델 세부 정보를 기반으로 유사한 모델 목록을 반환합니다.
프롬프트 예제는 다음과 같습니다.
- "현재 GPT-4 배포와 유사한 모델을 찾습니다."
- "현재 사용 중인 모델에 대한 대안은 무엇인가요?"
- "프로덕션 배포와 비슷한 기능을 가진 모델을 보여 주세요."
model_switch_recommendations_get(읽기)
벤치마크 데이터를 기반으로 모델 스위치 권장 사항을 가져옵니다.
프롬프트 예제는 다음과 같습니다.
- "현재 배포의 성능에 따라 더 나은 모델을 권장합니다."
- "현재 모델에서 더 비용 효율적인 모델로 전환해야 하나요?"
- "프로덕션 모델 배포에 대한 최적화 권장 사항을 가져옵니다."
- "지금 사용하는 모델보다 품질/비용 비율이 더 좋은 모델은 무엇인가요?"
모델 모니터링 및 작업
model_monitoring_metrics_get(읽기)
모델 배포에 대한 모니터링 메트릭을 가져옵니다.
프롬프트 예제는 다음과 같습니다.
- "프로덕션 챗봇 배포에 대한 요청 메트릭을 표시합니다."
- "지난 주에 GPT-4o 배포에 대한 대기 시간 통계를 가져옵니다."
- "내 텍스트 포함 배포에 대한 할당량 사용량을 확인합니다."
- "콘텐츠 생성기 모델의 오류 비율은 무엇인가요?"
model_deprecation_info_get(읽기)
사용 중단 데이터로 보강된 배포 정보를 가져옵니다.
프롬프트 예제는 다음과 같습니다.
- "프로덕션 배포에서 사용되지 않는 모델 버전을 사용하고 있는지 확인합니다."
- "레거시 챗봇 배포에 대한 사용 중단 정보를 알려 줘."
- 내 현재 배포 중에서 사용 중지될 예정인 것이 있습니까?
model_quota_list(읽기)
지역의 구독에 대해 사용 가능한 배포 할당량 및 사용량을 나열합니다.
프롬프트 예제는 다음과 같습니다.
- "미국 동부 지역에서 사용 가능한 할당량을 확인합니다."
- "서유럽에서 새 배포를 위해 남은 용량은 얼마인가요?"
- "내 구독에 대한 모든 지역의 할당량 사용량을 표시합니다."
예제 워크플로
전체 모델 평가 워크플로:
- "이 Blob Storage URL에서 내 평가 데이터 세트를 업로드합니다."
- "관련성, 접지성 및 안전 평가자를 사용하여 평가를 실행합니다."
- "내 기준 모델을 새 미세 조정된 버전과 비교합니다."
- "통계적 유의를 사용하여 비교 결과를 보여 주세요."
모델 배포 및 최적화:
- "카탈로그에서 사용할 수 있는 모든 GPT-4 모델을 표시합니다."
- "GPT-4o를 '고객 서비스 봇'으로 15개의 용량 단위로 배포합니다."
- "새 배포에 대한 요청 대기 시간을 모니터링합니다."
- "현재 사용량에 따라 보다 비용 효율적인 대안을 권장합니다."
리소스 관리 및 정리:
- "현재 배포 및 사용 현황을 모두 나열합니다."
- "사용되지 않는 모델 버전을 사용하는 배포를 확인합니다."
- "모든 지역에서 할당량 사용량을 표시합니다."
- "사용되지 않는 테스트 배포를 삭제하여 용량 확보."
관련 콘텐츠
- Foundry MCP 서버 사용 시작하기
- 고유한 MCP 서버를 빌드하는 방법 알아보기
- MCP 서버에 대한 보안 모범 사례 검토