TaskAdherenceEvaluator 클래스
정의
중요
일부 정보는 릴리스되기 전에 상당 부분 수정될 수 있는 시험판 제품과 관련이 있습니다. Microsoft는 여기에 제공된 정보에 대해 어떠한 명시적이거나 묵시적인 보증도 하지 않습니다.
IEvaluator 할당된 작업을 준수할 때 AI 시스템의 효율성을 평가하는 것입니다.
public ref class TaskAdherenceEvaluator sealed : Microsoft::Extensions::AI::Evaluation::IEvaluator
[System.Diagnostics.CodeAnalysis.Experimental("AIEVAL001")]
public sealed class TaskAdherenceEvaluator : Microsoft.Extensions.AI.Evaluation.IEvaluator
public sealed class TaskAdherenceEvaluator : Microsoft.Extensions.AI.Evaluation.IEvaluator
[<System.Diagnostics.CodeAnalysis.Experimental("AIEVAL001")>]
type TaskAdherenceEvaluator = class
interface IEvaluator
type TaskAdherenceEvaluator = class
interface IEvaluator
Public NotInheritable Class TaskAdherenceEvaluator
Implements IEvaluator
- 상속
-
TaskAdherenceEvaluator
- 특성
- 구현
설명
TaskAdherenceEvaluator 는 대화 기록에 있는 지침 및 정의와 함께 제공된 응답의 맞춤, 응답의 정확도 및 명확성, 제공된 도구 정의의 적절한 사용을 검토하여 AI 시스템이 할당된 작업을 얼마나 정확하게 준수하는지 측정합니다 ToolDefinitions.
현재 TaskAdherenceEvaluator 는 s로 AIFunctionDeclaration정의된 도구에 대한 호출만 평가하도록 지원합니다. 통해 ToolDefinitions 제공되는 다른 AITool 모든 정의는 무시됩니다.
TaskAdherenceEvaluator NumericMetric 는 '작업 준수'에 대한 점수를 포함하는 값을 반환합니다. 점수는 1에서 5 사이의 숫자이며, 1은 나쁜 점수를 나타내고 5는 우수한 점수를 나타냅니다.
참고:TaskAdherenceEvaluator 는 AI 모델을 사용하여 평가를 수행하는 AI 기반 평가기입니다. 이 평가자가 평가를 수행하는 데 사용하는 프롬프트는 모델 중립적으로 설계되지만 이 프롬프트의 성능(및 결과 평가)은 사용된 모델에 따라 달라질 수 있으며, 더 작은/로컬 모델을 사용할 때 특히 나빠질 수 있습니다.
사용하는 프롬프트 TaskAdherenceEvaluator 는 다음 모델에 대해 테스트되고 잘 작동하도록 조정되었습니다. 따라서 다음 목록의 모델과 함께 이 계산기를 사용하면 최상의 결과를 생성할 수 있습니다. (사용할 모델은 .를 통해 ChatClient구성할 수 있습니다.)
GPT-4o
생성자
| Name | Description |
|---|---|
| TaskAdherenceEvaluator() |
IEvaluator 할당된 작업을 준수할 때 AI 시스템의 효율성을 평가하는 것입니다. |
속성
| Name | Description |
|---|---|
| EvaluationMetricNames |
에 NameEvaluationMetric의해 생성된 s의 IEvaluators를 가져옵니다. |
| TaskAdherenceMetricName |
에서 Name 반환NumericMetric한 값을 TaskAdherenceEvaluator 가져옵니다. |
메서드
| Name | Description |
|---|---|
| EvaluateAsync(IEnumerable<ChatMessage>, ChatResponse, ChatConfiguration, IEnumerable<EvaluationContext>, CancellationToken) |
제공된 |