교차 유효성 검사 보고서 만들기
이 항목에서는 데이터 마이닝 디자이너에서 정확도 차트 탭을 사용하여 교차 유효성 검사 보고서를 만드는 단계를 안내합니다. 교차 유효성 검사 보고서의 표시 형태 및 해당 보고서에 포함되는 통계 측정값에 대한 일반적인 내용은 교차 유효성 검사(Analysis Services - 데이터 마이닝)를 참조하십시오.
교차 유효성 검사 보고서는 리프트 차트 또는 분류 행렬과 같은 정확도 차트와 근본적으로 다릅니다.
교차 유효성 검사는 모델 또는 구조에 사용되는 데이터의 전체 분포를 평가하므로 테스트 데이터 집합을 지정하지 마십시오. 교차 유효성 검사에서는 항상 모델 또는 마이닝 구조를 학습하는 데 사용된 원본 데이터만 사용합니다.
교차 유효성 검사는 단일 예측 가능한 결과를 기준으로만 수행할 수 있습니다. 구조가 예측 가능한 여러 특성이 있는 모델을 지원하는 경우 각각의 예측 가능한 출력에 대해 별도의 보고서를 만들어야 합니다.
현재 선택한 구조와 관련된 모델만 교차 유효성 검사에 사용할 수 있습니다.
현재 선택되어 있는 구조가 클러스터링 모델과 클러스터링 이외의 모델 조합을 지원하는 경우 결과 가져오기를 클릭하면 교차 유효성 검사 저장 프로시저가 자동으로 동일한 예측 가능한 열이 있는 모델은 로드하고 동일한 예측 가능한 특성을 공유하지 않는 클러스터링 모델은 무시합니다.
마이닝 구조가 다른 예측 가능한 특성을 모두 지원하지 않는 경우에만 예측 가능한 특성이 없는 클러스터링 모델에 대한 교차 유효성 검사 보고서를 만들 수 있습니다.
마이닝 구조 선택
SQL Server Data Tools(SSDT)에서 데이터 마이닝 디자이너를 엽니다.
솔루션 탐색기에서 보고서를 만들려는 구조 또는 모델이 포함된 데이터베이스를 엽니다.
마이닝 구조를 두 번 클릭하여 데이터 마이닝 디자이너에서 구조 및 관련된 모델을 엽니다.
마이닝 정확도 차트 탭을 클릭합니다.
교차 유효성 검사 탭을 클릭합니다.
교차 유효성 검사 옵션 설정
교차 유효성 검사 탭에서 접기 개수에 대해 아래쪽 화살표를 클릭하여 1에서 10 사이의 숫자를 선택합니다. 기본값은 10입니다.
접기 개수는 원본 데이터 집합 내에 만들어지는 파티션의 수를 나타냅니다. 접기 개수를 1로 설정하면 분할 없이 학습 집합이 사용됩니다.
대상 특성에서 아래쪽 화살표를 클릭하고 목록에서 열을 선택합니다. 클러스터링 모델인 경우 #Cluster를 선택하여 모델에 예측 가능한 특성이 없음을 나타냅니다. #Cluster 값은 마이닝 구조가 다른 유형의 예측 가능한 특성을 지원하지 않는 경우에만 사용할 수 있습니다.
보고서별로 예측 가능한 특성을 한 개만 선택할 수 있습니다. 기본적으로 같은 예측 가능한 특성을 가진 모든 관련 모델이 보고서에 포함됩니다.
최대 사례에서 데이터가 지정된 접기 수로 분할될 때 데이터를 대표하는 샘플을 제공할 수 있도록 충분히 큰 수를 입력합니다. 이 수가 모델 학습 집합의 사례 수보다 많을 경우 모든 사례가 사용됩니다.
학습 데이터 집합이 매우 큰 경우 최대 사례 값을 설정하면 처리되는 사례의 수를 제한하여 보고서를 보다 신속하게 완료할 수 있습니다. 단, 최대 사례를 너무 낮게 설정하면 안 됩니다. 너무 낮을 경우 교차 유효성 검사를 위한 데이터가 부족하게 됩니다.
필요에 따라 대상 상태에 모델링하려는 예측 가능한 특성의 값을 입력합니다. 예를 들어 [Bike Buyer] 열에 가능한 값이 1(예)과 2(아니요) 두 개인 경우 값 1을 입력하여 원하는 결과에 대해서만 모델의 정확도를 평가할 수 있습니다.
[!참고]
값을 입력하지 않으면 대상 임계값 옵션을 사용할 수 없으며 모델은 예측 가능한 특성의 모든 가능한 값에 대해 평가됩니다.
필요에 따라 대상 임계값에 0에서 1 사이의 소수를 입력하여 예측이 정확한 것으로 계산되어야 하는 최소 확률을 지정합니다.
확률 임계값을 설정하는 방법에 대한 추가 정보는 교차 유효성 검사 보고서의 측정값를 참조하십시오.
결과 가져오기를 클릭합니다.
교차 유효성 검사 보고서 인쇄
교차 유효성 검사 탭에서 완성된 보고서를 마우스 오른쪽 단추로 클릭합니다.
바로 가기 메뉴에서 인쇄를 선택하거나 인쇄 미리 보기를 선택하여 먼저 보고서를 검토합니다.
Microsoft Excel에서 보고서 복사본 만들기
교차 유효성 검사 탭에서 완성된 보고서를 마우스 오른쪽 단추로 클릭합니다.
바로 가기 메뉴에서 모두 선택를 선택합니다.
선택한 텍스트를 마우스 오른쪽 단추로 클릭한 다음 복사를 선택합니다.
열어 놓은 Excel 통합 문서에 선택한 부분을 붙여 넣습니다. 붙여넣기 옵션을 사용하면 보고서가 HTML로 Excel에 붙여 넣어지며 행과 열 서식이 그대로 유지됩니다. 텍스트 또는 유니코드 텍스트에 대해 선택하여 붙여넣기 옵션을 사용하여 보고서를 붙여 넣으면 보고서는 행으로 구분된 형식으로 붙여 넣어집니다.