다음을 통해 공유


Foundry MCP Server에 사용할 수 있는 도구 및 예제 프롬프트(미리 보기)

Foundry MCP Server는 API 호출 대신 대화형 프롬프트를 통해 데이터 세트를 관리하고, 평가를 실행하고, 모델을 배포 및 모니터링하는 등의 도구를 제공합니다. 이 참조를 사용하여 각 도구를 탐색하고 사용자 고유의 프로젝트에서 예제 프롬프트를 사용해 보세요.

팁 (조언)

이러한 도구를 사용하기 전에 Foundry MCP Server 설정을 완료합니다.

비고

이 기능은 현재 공개 미리 보기로 제공됩니다. 이 미리 보기는 서비스 수준 계약 없이 제공되며, 프로덕션 워크로드에는 권장되지 않습니다. 특정 기능이 지원되지 않거나 기능이 제한될 수 있습니다. 자세한 내용은 Microsoft Azure Preview에 대한 추가 사용 약관을 참조하세요.

에이전트 관리

agent_get(읽기)

이름으로 특정 에이전트를 얻거나 Foundry 프로젝트의 모든 에이전트를 나열합니다.

프롬프트 예제는 다음과 같습니다.

  • "Foundry 프로젝트의 모든 에이전트를 나열합니다."
  • "에 대한 세부 정보를 표시합니다 customer-support-agent."
  • "에이전트 triage-agent에 대한 구성을 가져옵니다."

agent_update(쓰기)

Foundry 프로젝트에서 에이전트를 만들거나 업데이트하거나 복제합니다.

프롬프트 예제는 다음과 같습니다.

  • "모델을 faq-agent사용하여 명명된 새 에이전트를 만듭니다gpt-4o-mini."
  • "청구 문제의 우선 순위를 지정하도록 지침을 업데이트 triage-agent 합니다."
  • "복제 prod-agent 하여 staging-agent 최신 모델로 전환합니다."

agent_delete(쓰기)

Foundry 프로젝트에서 에이전트를 삭제합니다.

프롬프트 예제는 다음과 같습니다.

  • "내 프로젝트에서 삭제 old-test-agent 합니다."
  • "마이그레이션이 완료된 지금 제거 deprecated-agent 합니다."
  • "이 프로젝트에서 사용되지 않는 에이전트를 정리합니다."

데이터 세트 관리

evaluation_dataset_create(쓰기 가능)

Foundry 프로젝트에서 데이터 세트 버전을 만들거나 업데이트합니다.

프롬프트 예제는 다음과 같습니다.

  • "이 Azure Blob Storage URL에서 고객 지원 Q&A 데이터 세트를 업로드합니다."
  • "에 있는 내 학습 데이터에 대한 새 데이터 세트 버전 2.0을 만듭니다 <blob-storage-account-url>."
  • 내 Blob Storage에서 새 평가 데이터 세트 product-reviews-v1을(를) 등록합니다.

evaluation_dataset_get(읽기)

이름 및 버전별로 데이터 세트를 얻거나 프로젝트의 모든 데이터 세트를 나열합니다.

프롬프트 예제는 다음과 같습니다.

  • "Foundry 프로젝트의 모든 데이터 세트 표시"
  • "'customer-support-qa' 데이터 세트 버전 2에 대한 세부 정보 가져오기"
  • "평가에 사용할 수 있는 모든 사용 가능한 데이터 세트 나열"

평가 작업

evaluation_create(쓰기)

하나 이상의 계산기를 사용하여 데이터 세트에 대한 평가 실행을 만듭니다.

프롬프트 예제는 다음과 같습니다.

  • "관련성, 접지성 및 일관성 평가자를 사용하여 내 고객 서비스 데이터 세트에 대한 평가 실행을 만듭니다."
  • "데이터 세트-456에 대해 내 챗봇 모델의 평가를 실행할 때, Violence, HateUnfairness, 그리고 ContentSafety 평가자를 사용합니다."
  • "테스트 데이터 세트에서 F1Score, BleuScore 및 RougeScore 메트릭을 사용하여 내 QA 모델을 평가합니다."

evaluation_get(읽기)

Foundry 프로젝트에서 평가 목록을 실행합니다.

프롬프트 예제는 다음과 같습니다.

  • Foundry 프로젝트에서 모든 평가 실행을 보여 주세요.
  • "이번 주에 실행한 최근 평가 나열"
  • "내 모든 모델 평가의 상태를 가져옵니다."

evaluation_comparison_create(작성)

그룹 내에서 평가의 비교 결과를 만듭니다.

프롬프트 예제는 다음과 같습니다.

  • "내 기준 모델의 성능을 두 개의 새로운 미세 조정된 버전과 비교합니다."
  • "평가 eval-456를 위해 run-baseline-123과 처리 실행 run-124, run-125 간의 비교를 만들어 줘."
  • "동일한 평가 메트릭에서 모델 A와 모델 B 성능을 비교하려고 합니다."

evaluation_comparison_get(읽기)

그룹 내 평가의 비교 결과를 얻거나 나열합니다.

프롬프트 예제는 다음과 같습니다.

  • "비교 인사이트-789의 결과를 가져옵니다."
  • "어제 만든 비교 결과를 보여 주세요."
  • "내 프로젝트에서 모든 평가 비교 인사이트를 검색합니다."

모델 카탈로그 및 세부 정보

model_catalog_list(읽기)

Foundry 모델 카탈로그의 모델을 나열합니다.

프롬프트 예제는 다음과 같습니다.

  • "카탈로그에서 사용할 수 있는 모든 GPT-4 모델을 표시합니다."
  • "MIT 라이선스를 사용하여 Microsoft에서 게시한 모든 모델을 나열합니다."
  • "놀이터에서 무료로 사용할 수 있는 모델을 찾아보세요."
  • "OpenAI에서 텍스트 생성에 사용할 수 있는 모델은 무엇인가요?"

model_details_get(읽기)

Foundry에서 전체 모델 세부 정보 및 코드 샘플을 가져옵니다.

프롬프트 예제는 다음과 같습니다.

  • "GPT-4o-mini에 대한 자세한 정보 및 코드 샘플을 가져옵니다."
  • "Llama-2-70b 모델의 사양 및 사용 예제를 보여 주세요."
  • "text-embedding-ada-002 모델에 대한 설명서와 샘플 코드가 필요합니다."

모델 배포 관리

model_deploy(쓰기)

지정된 Foundry 계정에서 모델 배포를 만들거나 업데이트합니다.

프롬프트 예제는 다음과 같습니다.

  • "20개의 용량 단위로 GPT-4o-mini를 'production-chatbot'으로 배포"
  • "GPT-4o 모델을 사용하여 'content-generator'라는 새 배포를 만듭니다."
  • "내 애플리케이션에 대한 최신 버전의 GPT-4o를 배포합니다."

model_deployment_get(읽기)

Foundry 계정에서 하나 이상의 모델 배포를 가져옵니다.

프롬프트 예제는 다음과 같습니다.

  • "현재의 모든 모델 배포를 보여 줘."
  • "내 '프로덕션 챗봇' 배포에 대한 세부 정보를 가져옵니다."
  • Foundry 계정의 모든 배포를 나열하세요.

model_deployment_delete(쓰기)

이름으로 특정 모델 배포를 삭제합니다.

프롬프트 예제는 다음과 같습니다.

  • "더 이상 사용하지 않는 '이전 테스트 배포'를 삭제합니다."
  • 스테이징 배포를 제거하여 할당량을 확보하세요.
  • 내 Foundry 계정 <account-name>에서 더 이상 사용되지 않는 모델 배포를 정리하세요.

모델 분석 및 권장 사항

model_benchmark_get(읽기)

Foundry 모델에 대한 벤치마크 데이터를 가져옵니다.

프롬프트 예제는 다음과 같습니다.

  • "사용 가능한 모든 모델에 대한 벤치마크 데이터를 표시합니다."
  • "다양한 모델 패밀리에서 성능 비교를 가져옵니다."
  • "다양한 모델에 대한 정확도 및 비용 메트릭을 보고 싶습니다."

model_benchmark_subset_get(읽기)

특정 모델 이름 및 버전 쌍에 대한 벤치마크 데이터를 가져옵니다.

프롬프트 예제는 다음과 같습니다.

  • "GPT-4와 GPT-3.5 터보 간의 벤치마크 성능을 비교합니다."
  • "Claude-3 및 Llama-2-70b 모델에 대한 벤치마크 데이터를 가져옵니다."
  • "고려 중인 특정 모델 버전에 대한 성능 메트릭을 표시합니다."

model_similar_models_get(읽기)

배포 또는 모델 세부 정보를 기반으로 유사한 모델 목록을 반환합니다.

프롬프트 예제는 다음과 같습니다.

  • "현재 GPT-4 배포와 유사한 모델을 찾습니다."
  • "현재 사용 중인 모델에 대한 대안은 무엇인가요?"
  • "프로덕션 배포와 비슷한 기능을 가진 모델을 보여 주세요."

model_switch_recommendations_get(읽기)

벤치마크 데이터를 기반으로 모델 스위치 권장 사항을 가져옵니다.

프롬프트 예제는 다음과 같습니다.

  • "현재 배포의 성능에 따라 더 나은 모델을 권장합니다."
  • "현재 모델에서 더 비용 효율적인 모델로 전환해야 하나요?"
  • "프로덕션 모델 배포에 대한 최적화 권장 사항을 가져옵니다."
  • "지금 사용하는 모델보다 품질/비용 비율이 더 좋은 모델은 무엇인가요?"

모델 모니터링 및 작업

model_monitoring_metrics_get(읽기)

모델 배포에 대한 모니터링 메트릭을 가져옵니다.

프롬프트 예제는 다음과 같습니다.

  • "프로덕션 챗봇 배포에 대한 요청 메트릭을 표시합니다."
  • "지난 주에 GPT-4o 배포에 대한 대기 시간 통계를 가져옵니다."
  • "내 텍스트 포함 배포에 대한 할당량 사용량을 확인합니다."
  • "콘텐츠 생성기 모델의 오류 비율은 무엇인가요?"

model_deprecation_info_get(읽기)

사용 중단 데이터로 보강된 배포 정보를 가져옵니다.

프롬프트 예제는 다음과 같습니다.

  • "프로덕션 배포에서 사용되지 않는 모델 버전을 사용하고 있는지 확인합니다."
  • "레거시 챗봇 배포에 대한 사용 중단 정보를 알려 줘."
  • 내 현재 배포 중에서 사용 중지될 예정인 것이 있습니까?

model_quota_list(읽기)

지역의 구독에 대해 사용 가능한 배포 할당량 및 사용량을 나열합니다.

프롬프트 예제는 다음과 같습니다.

  • "미국 동부 지역에서 사용 가능한 할당량을 확인합니다."
  • "서유럽에서 새 배포를 위해 남은 용량은 얼마인가요?"
  • "내 구독에 대한 모든 지역의 할당량 사용량을 표시합니다."

예제 워크플로

전체 모델 평가 워크플로:

  • "이 Blob Storage URL에서 내 평가 데이터 세트를 업로드합니다."
  • "관련성, 접지성 및 안전 평가자를 사용하여 평가를 실행합니다."
  • "내 기준 모델을 새 미세 조정된 버전과 비교합니다."
  • "통계적 유의를 사용하여 비교 결과를 보여 주세요."

모델 배포 및 최적화:

  • "카탈로그에서 사용할 수 있는 모든 GPT-4 모델을 표시합니다."
  • "GPT-4o를 '고객 서비스 봇'으로 15개의 용량 단위로 배포합니다."
  • "새 배포에 대한 요청 대기 시간을 모니터링합니다."
  • "현재 사용량에 따라 보다 비용 효율적인 대안을 권장합니다."

리소스 관리 및 정리:

  • "현재 배포 및 사용 현황을 모두 나열합니다."
  • "사용되지 않는 모델 버전을 사용하는 배포를 확인합니다."
  • "모든 지역에서 할당량 사용량을 표시합니다."
  • "사용되지 않는 테스트 배포를 삭제하여 용량 확보."