리프트 차트
데이터 마이닝 디자이너의 마이닝 정확도 차트 탭에 있는 리프트 차트 탭에서 리프트 차트와 수익 차트를 볼 수 있습니다. 리프트 차트는 각 모델의 예측 정확도를 비교하는 반면 수익 차트는 각 모델을 사용하여 얻을 수 있는 이론상의 수익 증가분을 표시합니다.
차트 종류 목록을 사용하여 원하는 차트 종류를 선택할 수 있습니다. 목록에서 수익 차트를 선택하면 수익 차트 설정 대화 상자가 자동으로 열립니다. 이 대화 상자는 설정을 클릭해도 열립니다. 이 대화 상자를 사용하여 수익 차트를 정의하는 매개 변수를 설정할 수 있습니다.
예측 가능한 불연속 특성을 포함하는 마이닝 모델만 리프트 차트에서 비교할 수 있습니다. 마이닝 정확도 차트 탭은 시계열 모델 또는 예측 가능한 연속 특성이 있는 모델에 대해 사용할 수 없습니다.
참조 항목:마이닝 정확도 차트 탭 방법 도움말 항목, 열 매핑(리프트 차트), 데이터 마이닝 모델 유효성 검사
차트 종류
다음 섹션에서는 각 차트 종류에 대해 보다 자세히 설명합니다.
- 리프트 차트 종류
- 수익 차트 종류
리프트 차트 종류
리프트 차트 탭은 마이닝 모델로 인한 리프트의 변경 내용을 그래픽으로 표시합니다. 예를 들어 Adventure Works Cycles의 마케팅 부서에서 대상 메일 캠페인을 만들려고 한다고 가정해 봅니다. 과거 캠페인을 통해 응답률이 일반적으로 10%임을 알아냈습니다. 이 부서의 데이터베이스에는 10,000명의 잠재적인 고객 목록이 테이블에 저장되어 있는데 일반 응답률을 기준으로 이 중 1,000명의 고객이 응답하리라는 것을 예측할 수 있습니다.
이때 프로젝트에 대한 예산이 데이터베이스에 있는 10,000명의 고객에게 연락하는 데 필요한 비용보다 적다고 가정해 봅니다. 예산에 따라 5,000명의 고객에게만 광고 메일을 전송할 수 있는 경우 마케팅 부서에서는 다음과 같이 선택할 수 있습니다.
- 임의로 5,000명의 고객을 대상으로 선택
- 마이닝 모델을 사용하여 응답 가능성이 가장 높은 5,000명의 고객을 대상으로 선택
회사에서 5,000명의 고객을 임의로 선택하는 경우 일반적으로 대상 고객의 10%만 응답하므로 예측한 1,000개의 응답 중 500개의 응답만 받을 수 있습니다. 이 시나리오는 리프트 차트에서 임의 선으로 나타납니다. 그러나 마케팅 부서에서 마이닝 모델을 사용하여 메일 전송 대상을 결정하는 경우 응답률이 가장 높은 고객을 대상으로 선정할 수 있으므로 응답률이 훨씬 높아집니다. 모델이 완벽하여 오류가 전혀 없는 예측을 도출할 수 있는 경우에는 회사가 모델에서 권장하는 1,000명의 잠재적인 고객에게 메일을 전송하여 예측한 1,000개의 응답을 모두 받을 수 있습니다. 이 시나리오는 리프트 차트에서 이상적인 선으로 나타납니다. 실제 상황에서는 마이닝 모델이 이러한 두 가지 극단적인 예측, 즉 임의 추측과 이상적이거나 완벽한 예측 사이에 해당할 가능성이 높습니다. 임의 추측에서 응답률이 향상되는 경우 이는 리프트로 간주됩니다.
예측 가능한 열의 상태를 지정하는 차트 종류와 상태를 지정하지 않는 차트 종류를 만들 수 있습니다.
예측 가능한 열의 상태를 지정하는 경우에는 다음 다이어그램에 표시된 차트 종류를 만들어야 합니다.
차트의 X축은 예측을 비교하는 데 사용되는 테스트 데이터 집합의 비율을 나타냅니다. 차트의 Y축은 지정한 상태로 예측되는 값의 비율을 나타냅니다. 차트에서 빨간색 선은 임의 선을 나타내고 노란색 선은 이상적인 모델을 나타냅니다.
예측 가능한 열의 상태를 지정하지 않은 경우에는 다음 다이어그램에 표시된 차트 종류를 만들어야 합니다.
X축은 예측 가능한 열이 지정된 차트에서와 동일하지만 Y축은 정확한 예측의 비율을 나타냅니다. 이 차트에서 빨간색 선은 이상적인 모델을 나타냅니다.
열 매핑 탭과 리프트 차트 탭 간을 전환하면 차트가 업데이트되어 열 매핑의 변경 내용이 반영됩니다.
맨 위로 이동
수익 차트 종류
수익 차트는 비즈니스 시나리오에서 회사가 연락해야 하는 고객을 결정하는 데 마이닝 모델을 사용함으로써 얻을 수 있는 예상 수익 증가분을 표시합니다. 차트의 Y축은 수익을 나타내고 X축은 회사에서 연락한 모집단의 백분율을 나타냅니다. 일반적인 수익 차트에서는 특정 시점까지는 수익이 증가하고 이 시점 이후에는 연락하는 모집단이 증가할수록 수익이 줄어듭니다.
차트 종류 목록을 사용하여 수익 차트를 표시합니다. 수익 차트를 선택하면 수익 차트 설정 대화 상자가 열립니다. 이 대화 상자를 사용하여 수익 차트를 정의하는 매개 변수를 설정할 수 있습니다. 다음 목록에서는 설정할 수 있는 매개 변수를 설명합니다.
- 모집단
리프트 차트를 만드는 데 사용된 데이터 집합의 사례 수입니다. 잠재적인 고객의 수가 여기에 포함됩니다.
- 고정 비용
비즈니스상의 문제와 관련된 고정 비용입니다. 대상 메일 솔루션에 대한 문제인 경우 전화를 건 횟수 또는 홍보 메일을 전송한 횟수와 같은 변수에 따라 비용이 달라지지 않습니다.
- 개별 비용
고정 비용 외에 각 고객에게 연락하는 데 드는 비용입니다. 홍보 메일을 전송하는 데 드는 비용이나 전화를 거는 데 드는 비용이 여기에 포함됩니다.
- 개인별 수익
성공적인 각 판매와 관련된 수익입니다.
리프트 차트 탭의 설정을 클릭하여 수익 차트 설정 대화 상자를 열 수도 있습니다.
수익 차트에는 차트에서 위치를 클릭하여 이동할 수 있는 회색 세로줄이 포함되어 있습니다. 마이닝 범례에서는 점수, 즉 차트에서의 회색 선의 위치와 관련된 정확한 모집단 및 예측 확률을 표시합니다. 회색 선을 사용하여 차트에서 최대 수익점을 선택하면 예측 확률 값을 사용하여 고객에게 연락할 확률 임계값을 결정할 수 있습니다.
예를 들어 수익 곡선의 최고점이 모집단의 55%이고 관련 예측 확률의 20%인 경우 최대 수익을 얻으려면 응답 가능성이 20% 이상으로 예측되는 고객에게만 연락을 해야 합니다.
맨 위로 이동
참고 항목
개념
열 매핑(리프트 차트)
데이터 마이닝 개념
데이터 마이닝 작업
데이터 마이닝 모델 유효성 검사