TaskAdherenceEvaluator 클래스

정의

네임스페이스:: Microsoft.Extensions.AI.Evaluation.Quality

어셈블리:: Microsoft.Extensions.AI.Evaluation.Quality.dll

패키지:: Microsoft.Extensions.AI.Evaluation.Quality v10.6.0

Source:: TaskAdherenceEvaluator.cs

중요

일부 정보는 릴리스되기 전에 상당 부분 수정될 수 있는 시험판 제품과 관련이 있습니다. Microsoft는 여기에 제공된 정보에 대해 어떠한 명시적이거나 묵시적인 보증도 하지 않습니다.

IEvaluator 할당된 작업을 준수할 때 AI 시스템의 효율성을 평가하는 것입니다.

public ref class TaskAdherenceEvaluator sealed : Microsoft::Extensions::AI::Evaluation::IEvaluator

[System.Diagnostics.CodeAnalysis.Experimental("AIEVAL001")]
public sealed class TaskAdherenceEvaluator : Microsoft.Extensions.AI.Evaluation.IEvaluator

public sealed class TaskAdherenceEvaluator : Microsoft.Extensions.AI.Evaluation.IEvaluator

[<System.Diagnostics.CodeAnalysis.Experimental("AIEVAL001")>]
type TaskAdherenceEvaluator = class
    interface IEvaluator

type TaskAdherenceEvaluator = class
    interface IEvaluator

Public NotInheritable Class TaskAdherenceEvaluator
Implements IEvaluator

상속: Object
TaskAdherenceEvaluator

특성: ExperimentalAttribute

구현: IEvaluator

설명

TaskAdherenceEvaluator 는 대화 기록에 있는 지침 및 정의와 함께 제공된 응답의 맞춤, 응답의 정확도 및 명확성, 제공된 도구 정의의 적절한 사용을 검토하여 AI 시스템이 할당된 작업을 얼마나 정확하게 준수하는지 측정합니다 ToolDefinitions.

현재 TaskAdherenceEvaluator 는 s로 AIFunctionDeclaration정의된 도구에 대한 호출만 평가하도록 지원합니다. 통해 ToolDefinitions 제공되는 다른 AITool 모든 정의는 무시됩니다.

TaskAdherenceEvaluator NumericMetric 는 '작업 준수'에 대한 점수를 포함하는 값을 반환합니다. 점수는 1에서 5 사이의 숫자이며, 1은 나쁜 점수를 나타내고 5는 우수한 점수를 나타냅니다.

참고:TaskAdherenceEvaluator 는 AI 모델을 사용하여 평가를 수행하는 AI 기반 평가기입니다. 이 평가자가 평가를 수행하는 데 사용하는 프롬프트는 모델 중립적으로 설계되지만 이 프롬프트의 성능(및 결과 평가)은 사용된 모델에 따라 달라질 수 있으며, 더 작은/로컬 모델을 사용할 때 특히 나빠질 수 있습니다.

사용하는 프롬프트 TaskAdherenceEvaluator 는 다음 모델에 대해 테스트되고 잘 작동하도록 조정되었습니다. 따라서 다음 목록의 모델과 함께 이 계산기를 사용하면 최상의 결과를 생성할 수 있습니다. (사용할 모델은 .를 통해 ChatClient구성할 수 있습니다.)

GPT-4o

생성자

Name	Description
TaskAdherenceEvaluator()	IEvaluator 할당된 작업을 준수할 때 AI 시스템의 효율성을 평가하는 것입니다.

속성

Name	Description
EvaluationMetricNames	에 Name EvaluationMetric의해 생성된 s의 IEvaluators를 가져옵니다.
TaskAdherenceMetricName	에서 Name 반환NumericMetric한 값을 TaskAdherenceEvaluator 가져옵니다.

메서드

Name	Description
EvaluateAsync(IEnumerable<ChatMessage>, ChatResponse, ChatConfiguration, IEnumerable<EvaluationContext>, CancellationToken)	제공된 `modelResponse` 항목을 평가하고 포함된 하나 이상의 EvaluationResults를 반환 EvaluationMetric 합니다.

확장명 메서드

Name	Description
EvaluateAsync(IEvaluator, ChatMessage, ChatConfiguration, IEnumerable<EvaluationContext>, CancellationToken)	제공된 `modelResponse` 항목을 평가하고 포함된 하나 이상의 EvaluationResults를 반환 EvaluationMetric 합니다.
EvaluateAsync(IEvaluator, ChatMessage, ChatMessage, ChatConfiguration, IEnumerable<EvaluationContext>, CancellationToken)	제공된 `modelResponse` 항목을 평가하고 포함된 하나 이상의 EvaluationResults를 반환 EvaluationMetric 합니다.
EvaluateAsync(IEvaluator, ChatMessage, ChatResponse, ChatConfiguration, IEnumerable<EvaluationContext>, CancellationToken)	제공된 `modelResponse` 항목을 평가하고 포함된 하나 이상의 EvaluationResults를 반환 EvaluationMetric 합니다.
EvaluateAsync(IEvaluator, ChatResponse, ChatConfiguration, IEnumerable<EvaluationContext>, CancellationToken)	제공된 `modelResponse` 항목을 평가하고 포함된 하나 이상의 EvaluationResults를 반환 EvaluationMetric 합니다.
EvaluateAsync(IEvaluator, String, ChatConfiguration, IEnumerable<EvaluationContext>, CancellationToken)	제공된 `modelResponse` 항목을 평가하고 포함된 하나 이상의 EvaluationResults를 반환 EvaluationMetric 합니다.
EvaluateAsync(IEvaluator, String, String, ChatConfiguration, IEnumerable<EvaluationContext>, CancellationToken)	제공된 `modelResponse` 항목을 평가하고 포함된 하나 이상의 EvaluationResults를 반환 EvaluationMetric 합니다.

적용 대상

피드백

이 페이지가 도움이 되었나요?