Personalizer 질문과 대답

이 문서에는 Personalizer 서비스 문제 해결에 대해 질문과 대답이 포함되어 있습니다.

단일 지역 데이터 보존

단일 지역 데이터 보존이 있는 지역에서 내 데이터는 어떻게 복제되나요?

Personalizer에서는 고객이 서비스 인스턴스를 배포하는 지역 외부에서 고객 데이터를 저장하거나 처리하지 않습니다.

구성 문제

구성 설정을 변경했는데 루프가 동일한 학습 수준에서 수행되지 않습니다. 무슨 일이 일어났나요?

일부 구성 설정은 모델을 초기화합니다. 설명서를 읽은 후 구성 변경 내용을 신중하게 계획하고 실행해야 합니다.

API를 사용하여 Personalizer를 구성할 때 오류가 발생합니다. 무슨 일이 일어났나요?

단일 API 요청을 사용하여 서비스를 구성하고 학습 동작을 변경하면 오류가 발생합니다. 먼저 서비스를 구성한 다음 학습 동작을 변경하려면 두 개의 API 호출을 별도로 만들어야 합니다.

트랜잭션 오류

서비스에서 HTTP 429(너무 많은 요청) 응답이 발생합니다. 어떻게 해야 합니까?

Personalizer 인스턴스를 만들 때 무료 가격 책정 계층을 선택한 경우에는 허용되는 순위 요청 수에 할당량 제한이 있습니다. API 호출 볼륨이 선택한 계층의 임계값을 초과하여 증가할 것으로 예상되는 경우, Personalizer 리소스에 대한 Azure Portal의 메트릭 창에서 순위 API의 API 호출 속도를 검토하고 가격 계층 창에서 가격 책정 계층을 조정합니다.

순위 또는 보상 API에 대해 5xx 오류가 발생합니다.   어떻게 해야 합니까?

5xx 오류는 일시적인 문제입니다. 문제가 계속 발생하는 경우 Personalizer 리소스에 대한 Azure Portal의 지원 + 문제 해결 섹션에서 새 지원 요청을 선택하여 지원 담당자에게 문의하세요.

학습 루프

실습생 모드에서 학습 루프는 개인화되지 않은(기준) 정책과 100% 일치하지는 않습니다. 이 문제를 해결하려면 어떻게 해야 합니까?

실습생 모드에서의 Personalizer 효과는 애플리케이션 기준에 100% 가까이 가는 경우가 거의 없고 이를 초과할 수도 없습니다. 모범 사례는 100% 달성을 목표로 하지 않습니다. 그러나 사용 사례에 따라 60%~80% 범위를 달성할 수 있어야 합니다. 그러나 학습 성능이 느리거나 60% 미만으로 정체되면 다음과 같은 문제가 발생할 수 있습니다.

  • 순위 API 호출로 전송된 기능이 부족합니다.
  • 전송된 기능 버그(예: 타임스탬프와 같이 집계할 수 없는 기능 데이터를 순위 API로 보냄)
  • 루프 처리 버그(예: 이벤트에 대한 보상 데이터를 보상 API로 보내지 않음)

이러한 문제를 해결하려면 루프에 전송된 기능을 변경하거나 보상 점수가 Rank API 호출에서 반환된 작업의 값을 정확하게 캡처하는지 확인하여 조정해야 할 수 있습니다.

학습 루프가 효과적이거나 빠르게 학습되지 않는 것 같습니다. 이 문제를 해결하려면 어떻게 해야 합니까?

순위 호출에서 효과적으로 우선 순위를 지정하려면 학습 루프에 수천 개의 보상 호출이 필요합니다.

학습 루프가 현재 어떻게 작동하는지 잘 모르는 경우 오프라인 평가를 실행하고 수정된 학습 정책을 적용합니다.

순위 결과가 모든 항목에 대해 동일한 확률로 계속 나타납니다. Personalizer가 학습 중인지 어떻게 알 수 있나요?

Personalizer는 방금 시작되어 모델이 있거나 Personalizer 루프를 초기화했지만 모델이 여전히 모델 업데이트 빈도 기간 내에 있는 경우 순위 API 결과에서 동일한 확률을 반환합니다.

새 업데이트 기간이 시작되면 업데이트된 모델 결과와 함께 확률이 변경되는 것을 볼 수 있습니다.

학습 루프가 학습 중이었지만 더 이상 학습하지 않는 것 같고 순위 결과의 품질이 좋지 않습니다.   어떻게 해야 합니까?

  • 해당 루프에 대해 Azure Portal에서 하나의 평가를 완료하고 적용했는지 확인합니다.
  • 모든 보상이 보상 API를 통해 전송되고 처리되었는지 확인합니다.

학습 루프가 정기적으로 업데이트되고 데이터의 점수를 매기는 데 사용되는지 어떻게 알 수 있나요?

Azure Portal의 모델 및 학습 설정 페이지에서 모델이 마지막으로 업데이트된 시간을 확인할 수 있습니다. 과거 타임스탬프가 표시되는 경우 순위 및 보상 호출을 보내지 않기 때문일 수 있습니다. 서비스에 수신되는 데이터가 없으면 학습이 업데이트되지 않습니다. 학습 루프가 자주 업데이트되지 않는 것으로 나타나는 경우 루프의 모델 업데이트 빈도를 편집할 수 있습니다.

오프라인 평가

오프라인 평가의 기능 중요도는 수백 또는 수천 개의 항목을 포함하는 긴 목록을 반환합니다. 무슨 일이 일어났나요?

이는 일반적으로 타임스탬프, 사용자 ID 또는 기타 일부 세분화된 기능으로 인해 발생합니다.

오프라인 평가를 만들었는데 거의 즉시 성공했습니다. 왜 그럴까요? 결과가 보이지 않습니다.

오프라인 평가에서는 해당 기간에 Rank/Reward API로 전송된 이벤트의 데이터와 학습된 모델을 사용합니다. 애플리케이션이 평가 시작 시간과 종료 시간 사이에 데이터를 보내지 않은 경우 결과 없이 빠르게 완료됩니다.

학습 정책

학습 정책을 가져오려면 어떻게 해야 하나요?

학습 정책 개념 및 새로운 학습 정책을 적용하는 방법에 대해 자세히 알아봅니다. 학습 정책을 선택하지 않으려면 오프라인 평가를 사용하여 현재 이벤트를 기반으로 학습 정책을 제안할 수 있습니다.

보안

Personalizer는 어떤 API 인증 프로토콜을 지원하나요?

Personalizer API는 다양한 인증 및 동기화 프로토콜을 지원하는 Azure AD(Azure Active Directory)를 사용합니다.

루프의 API 키가 손상되었습니다. 어떻게 해야 합니까?

키가 하나인 경우 다른 키를 사용하도록 클라이언트를 바꾼 후 키를 다시 생성할 수 있습니다. 키가 두 개인 경우에는 가동 중지 시간 없이 지연 방식으로 키를 전파할 수 있습니다. 보안을 위해 정기적으로 이 작업을 수행하는 것이 좋습니다.