다음을 통해 공유


테스트 세트 내에서 테스트 케이스를 수정하기

[이 문서는 시험판 설명서이므로 변경될 수 있습니다.]

테스트 세트를 만드는 중이나 이후에는 질문 문구를 바꾸거나, 다른 테스트 방법을 선택하거나, 필요에 따라 기대되는 답변을 수정하여 테스트 케이스를 편집할 수 있습니다. 각 테스트 사례 옆에 있는 확인란을 선택하여 여러 테스트 사례를 선택하여 대량으로 편집할 수 있습니다.

에이전트의 반응을 평가하기 위해 품질, 유사성, 텍스트 일치 세 가지 테스트 방법, 즉 그레이더(gradeers) 중 선택할 수 있습니다. 다양한 테스트 메서드에 대한 자세한 내용은 테스트 메서드를 참조하세요.

테스트 세트 내 테스트 케이스 편집

  1. 에이전트의 평가 페이지에서 테스트 세트를 선택하세요.

  2. 테스트 집합에서 편집할 테스트 사례를 선택합니다.

테스트 사례 목록을 보여 주는 스크린샷

  1. 오른쪽 창에서 질문 필드의 텍스트를 편집하여 질문 의 문구를 변경합니다.

질문 텍스트 필드를 보여 주는 스크린샷

  1. 사용할 테스트 메서드 를 선택합니다.

테스트 메서드 선택을 보여 주는 스크린샷.

  • 품질:

    • 관련성, 접지성 및 완전성에 따라 답변을 평가하려면 일반 품질을 선택합니다.

    • 예상 응답의 의미를 얼마나 잘 캡처하는지에 따라 응답을 평가하려면 [의미 비교 ]를 선택합니다. 전달 점수에서 답변의 전달 점수를 구성하는 값에 대한 임계값을 설정할 수 있습니다.

      예상 응답 상자에서 테스트 메서드가 에이전트의 대답을 평가하는 응답을 제공합니다.

  • 유사성: Cosine 유사성 메트릭을 사용하여 에이전트의 대답이 예상 응답의 표현 및 의미와 얼마나 유사한지 평가합니다. 0에서 1 사이의 점수를 결정합니다. 여기서 1은 밀접하게 일치하고 0은 전혀 일치하지 않음을 의미합니다. 전달 점수에서 답변의 전달 점수를 구성하는 값에 대한 임계값을 설정할 수 있습니다.

    예상 응답 상자에서 테스트 메서드가 에이전트의 대답을 평가하는 응답을 제공합니다.

  • 텍스트 일치:

    • 정확한 일치를 선택하여 예상 응답에 대해 에이전트의 대답을 평가합니다. 여기서 전달 점수는 에이전트의 대답이 정의된 예상 응답과 정확히 일치했음을 의미합니다.

      예상 응답 상자에서 테스트 메서드가 에이전트의 대답을 평가하는 응답을 제공합니다.

    • 에이전트의 답변을 기대 응답과 비교하기 위해 키워드 매치 를 선택하는데, 합격 점수는 에이전트의 답변에 정의된 기대 응답의 일부 단어나 구문이 포함되어 있음을 의미합니다.

      예상 응답 상자에서 테스트 메서드가 에이전트의 대답을 평가하는 구 또는 키워드를 제공합니다. 여러 키워드 또는 구를 추가하려면 추가를 선택하고, 연산자 또는상자 사이를 선택하고, 키워드 또는 구를 제공합니다.

      키워드를 추가해 기대 응답과 일치하는 방법을 보여주는 스크린샷입니다.

  1. 적용을 선택합니다.

  2. 변경 사항이 끝나면 테스트 세트를 저장하려면 저장을 선택하거나 테스트를 실행하려면 평가를 선택하세요.

테스트 세트에 더 많은 테스트 케이스를 추가하세요

테스트 세트를 생성하거나 편집하는 동안 더 많은 테스트 케이스를 추가할 수 있습니다.

  1. 에이전트의 평가 페이지에서 테스트 세트를 선택하세요.

  2. 테스트 케이스를 생성하거나 수동으로 추가하세요.

테스트 케이스 검토 페이지에서 '질문 10개 더 생성'과 '수동으로 케이스 추가' 버튼을 보여주는 스크린샷입니다.

  1. 새로운 테스트 케이스를 선택하고 편집하여 세부 정보를 추가하세요.