모델 정확도 차트용 도구(Analysis Services - 데이터 마이닝)
SQL Server Management Studio 및 Business Intelligence Development Studio 모두에서 사용할 수 있는 마이닝 정확도 차트 탭은 마이닝 모델의 유효성을 검사하는 데 사용할 수 있는 여러 도구를 제공합니다.
리프트 차트, 수익 차트 및 산점도를 모두 리프트 차트 탭에서 볼 수 있습니다. 입력 선택 탭을 사용하여 모델을 선택하고 옵션을 설정한 다음 리프트 차트 탭을 클릭하여 차트 종류 목록에서 원하는 차트 종류를 선택합니다. 모델이 선형 회귀를 나타내는 경우 산점도가 자동으로 표시됩니다.
혼동 테이블이라고 하는 분류 행렬을 입력 선택 탭에서 구성한 다음 분류 행렬 탭에 표시할 수 있습니다.
교차 유효성 검사 보고서를 마이닝 정확도 차트 탭의 교차 유효성 검사 탭에서 구성하고 볼 수 있습니다.
[!참고]
마이닝 정확도 차트 탭은 시계열 모델과 함께 사용할 수 없습니다.
리프트 차트
리프트 차트는 데이터 집합에 있는 예측 가능한 열의 알려진 값과 테스트 데이터 집합의 예측 쿼리 결과를 비교하여 표시합니다. 이 차트는 마이닝 모델의 결과를 이상적인 모델에서 산출되는 결과 및 임의 추측의 결과와 함께 표시합니다. 임의 선 위의 향상률을 리프트라고 하며 리프트가 클수록 모델이 더 효과적입니다. 예측 가능한 불연속 특성을 포함하는 마이닝 모델만 리프트 차트에서 비교할 수 있습니다.
입력 선택 탭을 사용하여 대상 모델을 구성하고 테스트 데이터 집합을 선택하여 리프트 차트를 만들 수 있습니다. 그런 다음 리프트 차트 탭을 클릭하여 완성된 차트를 봅니다.
참조 항목: 리프트 차트(Analysis Services - 데이터 마이닝), 마이닝 정확도 차트 탭: 방법 도움말 항목, 모델 정확도 차트용 도구(Analysis Services - 데이터 마이닝)
수익 차트
수익 차트는 모델이 생성한 예측을 사용하는 데 드는 비즈니스 비용에 대한 정보를 통합하는 리프트 차트의 변형입니다. 우편 요금과 같은 비용 관련 팩트를 입력하면 Analysis Services가 모델이 제공하는 리프트를 보여 주는 곡선을 표시하고 모델 사용 시 투자 수익률을 계산합니다.
입력 선택 탭을 사용하여 대상 모델을 구성하고 테스트 데이터 집합을 선택하여 수익 차트를 만들 수 있습니다. 그런 다음 리프트 차트 탭을 클릭하고 차트 종류 목록에서 수익 차트를 선택합니다. 수익 차트 설정 대화 상자가 자동으로 열립니다. 수익 차트의 고유한 매개 변수를 구성한 후 마이닝 정확도 차트 탭에 표시된 차트는 단위당 수익 및 손실을 표시하기 위해 자동으로 변경됩니다.
참조 항목: 수익 차트(Analysis Services - 데이터 마이닝), 수익 차트 설정 대화 상자(마이닝 정확도 차트 뷰)
산점도
산점도는 연속 특성을 예측하는 모델의 정확도를 차트로 나타내어 각 사례의 실제 값과 예측 값을 비교합니다. 예측 가능한 특성에 연속 값이 있으면 리프트 차트 대신 산점도가 생성됩니다.
필수 예측 가능한 열과 입력 열을 모델에서 지원할 경우 데이터 마이닝 디자이너의 마이닝 정확도 차트 탭에서 산점도를 만들 수 있습니다. 먼저 입력 선택 탭을 사용하여 대상 모델을 구성하고 테스트 데이터 집합을 선택합니다. 그런 다음 리프트 차트 탭을 클릭합니다. 마이닝 정확도 차트 탭에 표시되는 차트는 그래프를 표시하도록 자동으로 변경되며 입력 및 예측된 값 사이의 선형 관계를 표시합니다.
분류 행렬
분류 행렬은 구조에 포함된 마이닝 모델의 정확한 예측 능력을 검사하는 다른 방법입니다. 분류 행렬을 작성하기 위해 Analysis Services는 테스트 데이터 집합에 있는 실제 값을 사용하여 올바른 예측 수와 잘못된 예측 수를 계산합니다. 행렬은 모델이 값을 정확하게 예측한 빈도뿐만 아니라 모델이 잘못 예측한 값도 표시하기 때문에 매우 유용한 도구입니다. 분류 행렬은 예측 가능한 각 특성에 대한 참 긍정, 거짓 긍정, 참 부정 및 거짓 부정의 실제 카운트를 표시합니다.
데이터 마이닝 디자이너의 마이닝 정확도 차트 탭에서 분류 행렬을 만들 수 있습니다. 먼저 입력 선택 탭을 사용하여 대상 모델을 구성하고 테스트 데이터 집합을 선택합니다. 그런 다음 분류 행렬 탭을 클릭합니다. 차트가 자동으로 표시되며 추가 구성은 필요하지 않습니다.
참조 항목:분류 행렬(Analysis Services - 데이터 마이닝), 마이닝 정확도 차트 탭: 방법 도움말 항목, 모델 정확도 차트용 도구(Analysis Services - 데이터 마이닝)
교차 유효성 검사 보고서
교차 유효성 검사는 모델의 유효성을 측정하는 데 도움이 되는 고급 데이터 마이닝 기술입니다. 교차 유효성 검사 보고서를 만들 경우 Analysis Services는 데이터 집합을 여러 교집합 영역으로 구분하고 하위 집합의 여러 모델을 자동으로 생성 및 학습한 다음 모든 모델의 정확도를 계산합니다. 생성되는 통계를 검토하면 모델이 서로 다른 데이터 집합에서 얼마나 잘 일반화되는지 평가하거나 구조의 여러 모델 중 성능이 가장 좋은 모델이 무엇인지 확인할 수 있습니다.
모델이나 구조를 선택한 다음 교차 유효성 검사 탭을 사용해 접기 수, 대상 특성 등에 대한 옵션을 설정하여 데이터 마이닝 디자이너의 마이닝 정확도 차트 탭에서 교차 유효성 검사 보고서를 만들 수 있습니다.
참조 항목: 교차 유효성 검사(Analysis Services - 데이터 마이닝), 교차 유효성 검사 보고서(Analysis Services - 데이터 마이닝)