다음을 통해 공유


시퀀스 클러스터링 마이닝 모델 구조 만들기(중간 데이터 마이닝 자습서)

시퀀스 클러스터링 마이닝 모델을 만드는 첫 번째 단계는 데이터 마이닝 마법사를 사용하여 Microsoft 시퀀스 클러스터링 알고리즘을 기반으로 새 마이닝 구조 및 마이닝 모델을 만드는 것입니다.

시장 바구니 분석에 사용한 것과 동일한 데이터 원본 뷰를 사용하지만 식별자가 포함된 sequence 열을 추가합니다. 이 시나리오에서 시퀀스는 고객이 장바구니에 항목을 추가한 순서를 의미합니다.

또한 모델 중 하나에서 인구 통계별로 고객을 그룹화하기 위해 사용되는 일부 열을 추가합니다.

시퀀스 클러스터링 구조 및 모델을 만들려면

  1. SSDT(SQL Server Data Tools)의 솔루션 탐색기에서 마이닝 구조를 마우스 오른쪽 단추로 클릭하고 새 마이닝 구조를 선택합니다.

  2. 데이터 마이닝 마법사 시작 페이지에서 다음을 클릭합니다.

  3. 정의 방법 선택 페이지에서 기존 관계형 데이터베이스 또는 데이터 웨어하우스에서 선택되어 있는지 확인하고 다음을 클릭합니다.

  4. 데이터 마이닝 구조 만들기 페이지에서 마이닝 모델을 사용하여 마이닝 구조 만들기 옵션이 선택되어 있는지 확인합니다. 다음으로, 옵션의 드롭다운 목록인 어떤 데이터 마이닝 기술을 사용하시겠습니까?를 클릭하고 Microsoft 시퀀스 클러스터링을 선택합니다. 다음을 클릭합니다.

    데이터 원본 뷰 선택 페이지가 나타납니다. 사용 가능한 데이터 원본 뷰에서 .를 선택합니다Orders.

    주문은 시장 바구니 시나리오에 사용한 것과 동일한 데이터 원본 뷰입니다. 이 데이터 원본 뷰를 만들지 않은 경우 중첩 테이블을 사용하여 데이터 원본 뷰 추가(중간 데이터 마이닝 자습서)를 참조하세요.

  5. 다음을 클릭합니다.

  6. 테이블 형식 지정 페이지에서 vAssocSeqOrders 테이블 옆의 사례 확인란을 선택하고 vAssocSeqLineItems 테이블 옆에 있는 중첩 확인란을 선택합니다. 다음을 클릭합니다.

    비고

    사례 또는 중첩 확인란을 선택할 때 오류가 발생하면 데이터 원본 뷰의 조인이 올바르지 않을 수 있습니다. 중첩 테이블 vAssocSeqLineItems는 사례 테이블 vAssocSeqOrders에 다대일로 연결되어야 합니다. 조인 줄을 마우스 오른쪽 단추로 클릭한 다음 조인 방향을 반대로 클릭하여 관계를 편집할 수 있습니다. 자세한 내용은 관계 만들기 또는 편집 대화 상자(Analysis Services - 다차원 데이터)를 참조하세요.

  7. 학습 데이터 지정 페이지에서 다음과 같이 확인란을 선택하여 모델에서 사용할 열을 선택합니다.

    • IncomeGroup입력 확인란을 선택합니다.

      이 열에는 클러스터링에 사용할 수 있는 고객에 대한 흥미로운 정보가 포함되어 있습니다. 첫 번째 모델에서 사용한 다음 두 번째 모델에서 무시합니다.

    • OrderNumber 확인란을 Key 선택합니다.

      이 필드는 사례 테이블의 Key식별자로 사용됩니다. 일반적으로 키에는 클러스터링에 유용하지 않은 고유 값이 포함되어 있으므로 사례 테이블의 키 필드를 입력으로 사용하면 안 됩니다.

    • 지역입력 확인란을 선택하세요.

      이 열에는 클러스터링에 사용할 수 있는 고객에 대한 흥미로운 정보가 포함되어 있습니다. 첫 번째 모델에서 사용한 다음 두 번째 모델에서 무시합니다.

    • LineNumberKey입력 체크 박스를 선택합니다.

      LineNumber 필드는 중첩 테이블의 식별자로 사용되거나 Sequence Key. 중첩 테이블의 키는 항상 입력에 사용해야 합니다.

    • 모델입력예측 가능한 확인란을 선택합니다.

    선택 영역이 올바른지 확인한 다음 다음을 클릭합니다.

  8. 열의 콘텐츠 및 데이터 형식 지정 페이지에서 다음 표에 표시된 열, 콘텐츠 형식 및 데이터 형식이 그리드에 포함되어 있는지 확인한 다음 다음을 클릭합니다.

    테이블/열(Column) 콘텐츠 형식 데이터 형식
    소득 그룹 불연속 문자 메시지
    주문번호 열쇠 문자 메시지
    지역 불연속 문자 메시지
    vAssocSeqLineItems
    줄 번호 키 시퀀스 길다
    모델 불연속 문자 메시지
  9. 테스트 집합 만들기 페이지에서 테스트할 데이터의 백분율을 20으로 변경한 다음 다음을 클릭합니다.

  10. 마법사 완료 페이지의 마이닝 구조 이름Sequence Clustering with Region를 입력합니다.

  11. 마이닝 모델 이름에 .를 입력합니다Sequence Clustering with Region.

  12. 드릴스루 허용 상자를 선택한 다음 마침을 클릭합니다.

수업의 다음 과제

시퀀스 클러스터링 모델 처리

또한 참조하십시오

데이터 마이닝 디자이너
Microsoft 시퀀스 클러스터링 알고리즘