중간 데이터 마이닝 자습서(Analysis Services - 데이터 마이닝)

Microsoft Analysis Services는 데이터 마이닝 모델을 만들고 작업하기 위한 통합 환경을 제공합니다. 데이터 원본에 쉽게 바인딩하고, 동일한 데이터에서 여러 모델을 만들고 테스트하며, 예측 분석에 사용할 모델을 배포할 수 있습니다.

기본 데이터 마이닝 자습서에서는 SSDT(SQL Server Data Tools)를 사용하여 데이터 마이닝 솔루션을 만드는 방법을 배웠으며, 고객 구매 동작을 분석하고 잠재적 구매자를 대상으로 하는 대상 메일링 캠페인을 지원하는 세 가지 모델을 빌드했습니다.

이 중간 자습서는 해당 환경을 기반으로 하며 예측 및 시장 바구니 분석과 같은 일반적인 비즈니스 요구 사항을 포함하여 몇 가지 새로운 시나리오를 소개합니다. 시계열 모델, 연결 모델 및 시퀀스 클러스터링 모델을 만드는 방법을 알아봅니다. 마지막으로 신경망을 사용하여 데이터의 상관 관계를 탐색하고 예측에 로지스틱 회귀를 사용하는 방법을 알아봅니다.

단원은 독립적이며 별도로 완료할 수 있습니다.

다음 자습서를 완료하려면 데이터 마이닝 도구 및 기본 데이터 마이닝 자습서에 도입된 마이닝 모델 뷰어에 대해 잘 알고 있어야 합니다.

모든 시나리오는 AdventureWorksDW2012 데이터 원본을 사용하지만 다양한 시나리오에 대해 서로 다른 데이터 원본 뷰를 만듭니다. 먼저 데이터 원본을 만드는 한 어떤 순서로든 단원을 수행할 수 있습니다.

단원 시나리오

대상 메일링 캠페인에 성공한 후에는 데이터 마이닝에 대한 지식을 적용하여 비즈니스 계획에 사용할 몇 가지 새로운 모델을 개발하라는 요청을 받았습니다. 여기에는 다음 작업이 포함됩니다.

예측: 시계 열 모델을 만들어 전 세계 여러 지역의 제품 판매를 예측합니다. 각 지역에 대한 개별 모델을 개발하고 교차 예측을 사용하는 방법을 알아봅니다.
시장 바구니 분석: Adventure Works Cycles 전자 상거래 사이트를 방문하는 동안 구매한 제품의 그룹화 분석을 위해 연결 모델을 만듭니다. 이 시장 바구니 모델에 따라 고객에게 제품을 추천할 수 있습니다.
시퀀스 분석: 고객이 제품을 구매하는 순서를 분석하기 위해 시퀀스 클러스터링 모델을 빌드합니다. 이 모델을 기반으로 웹 사이트 디자인 또는 새 제품 제품의 변경 내용을 계획할 수 있습니다.
요소 분석:신경망 모델을 사용하여 콜 센터 데이터에서 서비스 품질 저하의 가능한 원인을 탐색합니다. 예비 모델의 인사이트를 기반으로 로지스틱 회귀 모델을 만들어 고객 환경을 개선하기 위한 전략을 예측합니다.

학습 내용

이 자습서에서는 여러 유형의 데이터 마이닝 알고리즘을 만들고 사용하는 방법을 설명합니다. 이 자습서는 다음 단원으로 이루어져 있습니다.

1단원: 중간 데이터 마이닝 솔루션 만들기(중간 데이터 마이닝 자습서)
이 단원에서는 AdventureWorksDW2012 데이터베이스를 기반으로 하는 새 프로젝트를 만들어 여러 새 데이터 원본 뷰 및 더 많은 마이닝 모델을 지원합니다.

2단원: 예측 시나리오 빌드(중간 데이터 마이닝 자습서)
이 단원에서는 예측 시나리오의 일부로 사용할 수 있는 마이닝 모델을 만듭니다. 또한 Microsoft 시계열 알고리즘을 사용하여 빌드된 마이닝 모델도 탐색합니다.

개별 지역에 대한 모델을 빌드한 다음 교차 예측에 사용할 수 있는 일반 모델을 빌드합니다.

3단원: 시장 바구니 시나리오 빌드(중간 데이터 마이닝 자습서)
이 단원에서는 새 데이터 원본 뷰를 추가하고 중첩된 테이블 및 키를 사용하는 방법을 알아봅니다. 이 데이터를 기반으로 시장 바구니 시나리오의 일부로 사용할 수 있는 마이닝 모델을 만듭니다. Microsoft Association 알고리즘을 사용하여 빌드된 마이닝 모델도 살펴봅합니다.

4단원: 시퀀스 클러스터링 시나리오 빌드(중간 데이터 마이닝 자습서)
이 단원에서는 시퀀스 클러스터링 시나리오의 일부로 사용할 수 있는 마이닝 모델을 만듭니다. Microsoft 시퀀스 클러스터링 알고리즘을 사용하여 빌드된 마이닝 모델을 탐색하는 방법도 알아봅니다.

5단원: 신경망 및 로지스틱 회귀 모델 빌드(중간 데이터 마이닝 자습서)
이 단원에서는 Microsoft 신경망 및 Microsoft 로지스틱 회귀 알고리즘을 사용하여 몇 가지 관련 마이닝 모델을 만듭니다. 또한 데이터 원본 뷰를 사용하여 모델의 기본 데이터를 탐색하는 방법을 알아봅니다.

요구 사항

다음이 설치되어 있는지 확인합니다.

Microsoft SQL Server 2014
Microsoft SQL Server Analysis Services
AdventureWorksDW2012 데이터베이스가 있는 SQL Server.

보안을 위해 예제 데이터베이스는 기본적으로 설치되지 않습니다. Microsoft SQL Server용 공식 데이터베이스를 설치하려면 Microsoft SQL 샘플 데이터베이스 페이지를 방문하여 적절한 버전의 샘플 데이터베이스를 선택합니다.

또한 참조하십시오

기본 데이터 마이닝 자습서
Bike Buyer DMX 자습서
Market Basket DMX 자습서

Last updated on 2017-03-06