TaskAdherenceEvaluator 클래스

정의

IEvaluator 할당된 작업을 준수할 때 AI 시스템의 효율성을 평가하는 것입니다.

public ref class TaskAdherenceEvaluator sealed : Microsoft::Extensions::AI::Evaluation::IEvaluator
[System.Diagnostics.CodeAnalysis.Experimental("AIEVAL001")]
public sealed class TaskAdherenceEvaluator : Microsoft.Extensions.AI.Evaluation.IEvaluator
public sealed class TaskAdherenceEvaluator : Microsoft.Extensions.AI.Evaluation.IEvaluator
[<System.Diagnostics.CodeAnalysis.Experimental("AIEVAL001")>]
type TaskAdherenceEvaluator = class
    interface IEvaluator
type TaskAdherenceEvaluator = class
    interface IEvaluator
Public NotInheritable Class TaskAdherenceEvaluator
Implements IEvaluator
상속
TaskAdherenceEvaluator
특성
구현

설명

TaskAdherenceEvaluator 는 대화 기록에 있는 지침 및 정의와 함께 제공된 응답의 맞춤, 응답의 정확도 및 명확성, 제공된 도구 정의의 적절한 사용을 검토하여 AI 시스템이 할당된 작업을 얼마나 정확하게 준수하는지 측정합니다 ToolDefinitions.

현재 TaskAdherenceEvaluator 는 s로 AIFunctionDeclaration정의된 도구에 대한 호출만 평가하도록 지원합니다. 통해 ToolDefinitions 제공되는 다른 AITool 모든 정의는 무시됩니다.

TaskAdherenceEvaluator NumericMetric 는 '작업 준수'에 대한 점수를 포함하는 값을 반환합니다. 점수는 1에서 5 사이의 숫자이며, 1은 나쁜 점수를 나타내고 5는 우수한 점수를 나타냅니다.

참고:TaskAdherenceEvaluator 는 AI 모델을 사용하여 평가를 수행하는 AI 기반 평가기입니다. 이 평가자가 평가를 수행하는 데 사용하는 프롬프트는 모델 중립적으로 설계되지만 이 프롬프트의 성능(및 결과 평가)은 사용된 모델에 따라 달라질 수 있으며, 더 작은/로컬 모델을 사용할 때 특히 나빠질 수 있습니다.

사용하는 프롬프트 TaskAdherenceEvaluator 는 다음 모델에 대해 테스트되고 잘 작동하도록 조정되었습니다. 따라서 다음 목록의 모델과 함께 이 계산기를 사용하면 최상의 결과를 생성할 수 있습니다. (사용할 모델은 .를 통해 ChatClient구성할 수 있습니다.)

GPT-4o

생성자

Name Description
TaskAdherenceEvaluator()

IEvaluator 할당된 작업을 준수할 때 AI 시스템의 효율성을 평가하는 것입니다.

속성

Name Description
EvaluationMetricNames

NameEvaluationMetric의해 생성된 s의 IEvaluators를 가져옵니다.

TaskAdherenceMetricName

에서 Name 반환NumericMetric한 값을 TaskAdherenceEvaluator 가져옵니다.

메서드

Name Description
EvaluateAsync(IEnumerable<ChatMessage>, ChatResponse, ChatConfiguration, IEnumerable<EvaluationContext>, CancellationToken)

제공된 modelResponse 항목을 평가하고 포함된 하나 이상의 EvaluationResults를 반환 EvaluationMetric 합니다.

확장명 메서드

Name Description
EvaluateAsync(IEvaluator, ChatMessage, ChatConfiguration, IEnumerable<EvaluationContext>, CancellationToken)

제공된 modelResponse 항목을 평가하고 포함된 하나 이상의 EvaluationResults를 반환 EvaluationMetric 합니다.

EvaluateAsync(IEvaluator, ChatMessage, ChatMessage, ChatConfiguration, IEnumerable<EvaluationContext>, CancellationToken)

제공된 modelResponse 항목을 평가하고 포함된 하나 이상의 EvaluationResults를 반환 EvaluationMetric 합니다.

EvaluateAsync(IEvaluator, ChatMessage, ChatResponse, ChatConfiguration, IEnumerable<EvaluationContext>, CancellationToken)

제공된 modelResponse 항목을 평가하고 포함된 하나 이상의 EvaluationResults를 반환 EvaluationMetric 합니다.

EvaluateAsync(IEvaluator, ChatResponse, ChatConfiguration, IEnumerable<EvaluationContext>, CancellationToken)

제공된 modelResponse 항목을 평가하고 포함된 하나 이상의 EvaluationResults를 반환 EvaluationMetric 합니다.

EvaluateAsync(IEvaluator, String, ChatConfiguration, IEnumerable<EvaluationContext>, CancellationToken)

제공된 modelResponse 항목을 평가하고 포함된 하나 이상의 EvaluationResults를 반환 EvaluationMetric 합니다.

EvaluateAsync(IEvaluator, String, String, ChatConfiguration, IEnumerable<EvaluationContext>, CancellationToken)

제공된 modelResponse 항목을 평가하고 포함된 하나 이상의 EvaluationResults를 반환 EvaluationMetric 합니다.

적용 대상