다음을 통해 공유


분류 마법사(Excel용 데이터 마이닝 추가 기능)

데이터 마이닝 리본의 분류 마법사

분류 마법사를 사용하면 Excel 테이블, Excel 범위 또는 외부 데이터 원본의 기존 데이터를 기반으로 분류 모델을 빌드할 수 있습니다.

분류 모델은 데이터에서 유사성을 나타내는 패턴을 추출하고 값 그룹화에 따라 예측을 수행할 수 있도록 도와줍니다. 예를 들어 분류 모델을 사용하여 소득 또는 지출 패턴에 따라 위험을 예측할 수 있습니다.

분류 마법사 사용

  1. 데이터 마이닝 리본에서 분류를 클릭한 다음 다음을 클릭합니다.

  2. 원본 데이터 선택 페이지에서 분석할 데이터를 선택합니다.

    이 마법사는 Excel 테이블, Excel 범위 및 외부 데이터 원본과 같은 여러 종류의 데이터를 지원합니다. 외부 데이터를 사용하여 Excel에 추가하거나 Analysis Services 데이터 원본에서 테이블 또는 뷰 집합을 선택할 수 있습니다. 테이블을 추가하고 열을 변경하여 임시 데이터 원본을 만들 수도 있습니다.

  3. 분류 페이지에서 분류할 열을 선택합니다.

    목록, 입력 열의 열을 검토하고 고유한 값을 가지므로 ID 번호, 고객 이름 등과 같은 패턴을 만드는 데 유용하지 않은 열의 선택을 취소합니다. 또한 기본적으로 분류 가능한 열을 복제하는 열을 제거해야 합니다.

    예를 들어 제품의 범주를 예측하는 것을 분류하는 경우 알려진 비즈니스 규칙이 있는 경우 하위 범주 필드를 제외해야 합니다. 그렇지 않으면 해당 규칙의 강도로 인해 다른 상관 관계를 검색하지 못할 수 있습니다.

  4. 필요에 따라 매개 변수 를 클릭하여 알고리즘 매개 변수를 변경하고 클러스터링 모델의 동작을 사용자 지정합니다.

  5. 학습 및 테스트 집합으로 데이터 분할 페이지에서 테스트를 위해 보유할 데이터의 양을 지정합니다. 나머지는 항상 모델을 학습하는 데 사용됩니다.

    기본 설정은 30% 테스트 데이터 및 70% 학습 데이터입니다.

  6. 마침 페이지에서 데이터 집합 및 모델에 대한 설명이 포함된 이름을 제공하고 완성된 모델에서 작업하는 방법을 제어하는 다음 옵션을 설정합니다.

    • 모델 검색 이 옵션을 선택하면 마법사가 모델 처리를 마치자마자 결과를 탐색하는 데 도움이 되는 찾아보기 창이 열립니다. 뷰어의 내용은 빌드한 모델 유형에 따라 달라집니다. 자세한 내용은 의사 결정 트리 모델 검색신경망 모델 검색을 참조하세요.

    • 드릴스루를 사용하도록 설정합니다. 완성된 모델에서 기본 데이터를 보려면 이 옵션을 선택합니다. 이 옵션은 의사 결정 트리 모델을 빌드하는 경우에만 사용할 수 있습니다.

    • 임시 모델을 사용합니다. 이 옵션을 선택하면 모델이 서버에 저장되지 않습니다. Excel을 닫으면 임시 모델이 삭제됩니다.

분류 모델에 대한 자세한 정보

알고리즘 매개 변수 대화 상자에서 Analysis Services에 제공된 다음 알고리즘 중에서 분류 방법을 선택할 수도 있습니다.

  • Microsoft 의사 결정 트리

  • Microsoft 로지스틱 회귀

  • Microsoft Naïve Bayes

  • Microsoft 신경망

알고리즘은 비슷한 결과를 얻을 수 있지만 데이터를 다르게 분석하므로 여러 알고리즘을 시도하고 결과를 비교하는 것이 좋습니다. 기본 방법은 Microsoft 의사 결정 트리입니다.

매개 변수 목록에서 선택한 알고리즘의 유형에 따라 고급 옵션을 변경할 수 있습니다. 각 알고리즘에 대한 매개 변수는 SQL Server 온라인 설명서에 자세히 설명되어 있습니다.

Microsoft 의사 결정 트리 알고리즘 기술 참조

Microsoft 로지스틱 회귀 알고리즘 기술 참조

Microsoft Naive Bayes 알고리즘 기술 참조

Microsoft 신경망 알고리즘 기술 참조

요구 사항

분류 마법사를 사용하려면 Analysis Services 데이터베이스에 연결해야 합니다. 연결을 만드는 방법에 대한 자세한 내용은 원본 데이터에 연결(Excel용 데이터 마이닝 클라이언트)을 참조하세요.

또한 참조하십시오

데이터 마이닝 모델 만들기