이 작업에서는 콜 센터 데이터에 액세스하는 데 사용할 데이터 원본 뷰를 추가합니다. 동일한 데이터를 사용하여 탐색을 위한 초기 신경망 모델과 권장 사항을 만드는 데 사용할 로지스틱 회귀 모델을 모두 빌드합니다.
또한 데이터 원본 뷰 디자이너를 사용하여 요일에 대한 열을 추가합니다. 원본 데이터가 날짜별로 콜 센터 데이터를 추적하지만, 해당 환경은 해당 날짜가 주말인지 평일인지에 따라 통화량 및 서비스 품질 측면에서 반복되는 패턴이 있음을 알 수 있기 때문입니다.
절차
데이터 원본 뷰를 추가하려면
솔루션 탐색기에서 데이터 원본 뷰를 마우스 오른쪽 단추로 클릭하고 새 데이터 원본 뷰를 선택합니다.
데이터 원본 뷰 마법사가 열립니다.
데이터 원본 보기 마법사 시작 페이지에서 다음을 클릭합니다.
데이터 원본 선택 페이지의 관계형 데이터 원본 아래에서 Adventure Works DW 다차원 2012 데이터 원본을 선택합니다. 이 데이터 원본이 없는 경우 기본 데이터 마이닝 자습서를 참조하세요. 다음을 클릭합니다.
테이블 및 뷰 선택 페이지에서 다음 표를 선택한 다음 오른쪽 화살표를 클릭하여 데이터 원본 뷰에 추가합니다.
FactCallCenter(dbo)
DimDate
다음을 클릭합니다.
마법사 완료 페이지에서 기본적으로 데이터 원본 뷰의 이름은 Adventure Works DW 다차원 2012입니다. 이름을 CallCenter로 변경한 다음 마침을 클릭합니다.
데이터 원본 뷰 디자이너가 열리면 CallCenter 데이터 원본 뷰가 표시됩니다.
데이터 원본 뷰 창 내부를 마우스 오른쪽 단추로 클릭하고 테이블 추가/제거를 선택합니다. 테이블을 선택하고 DimDate 를 클릭하고 확인을 클릭합니다.
각 테이블의
DateKey열 간에 관계가 자동으로 추가되어야 합니다. 이 관계를 사용하여 DimDate 테이블에서 열인 EnglishDayNameOfWeek을 가져와서 모델에서 사용합니다.데이터 원본 뷰 디자이너에서 테이블 FactCallCenter를 마우스 오른쪽 단추로 클릭하고 새 명명된 계산을 선택합니다.
명명된 계산 만들기 대화 상자에서 다음 값을 입력합니다.
열 이름 DayOfWeek 설명 DimDate 테이블에서 요일 가져오기 표현 (SELECT EnglishDayNameOfWeek AS DayOfWeek FROM DimDate where FactCallCenter.DateKey = DimDate.DateKey)식이 필요한 데이터를 만드는지 확인하려면 FactCallCenter 테이블을 마우스 오른쪽 단추로 클릭한 다음 데이터 탐색을 선택합니다.
데이터 마이닝에서 사용되는 방법을 이해할 수 있도록 사용 가능한 데이터를 검토하는 데 1분 정도 걸릴 수 있습니다.
| 열 이름 | 포함함 |
|---|---|
| 팩트콜센터ID | 데이터를 데이터 웨어하우스로 가져올 때 생성된 임의의 키입니다. 이 열은 고유한 레코드를 식별하며 데이터 마이닝 모델의 사례 키로 사용해야 합니다. |
| 날짜 키 | 정수로 표현된 콜 센터 작업의 날짜입니다. 정수 날짜 키는 데이터 웨어하우스에서 자주 사용되지만 날짜 값별로 그룹화하려는 경우 날짜/시간 형식으로 날짜를 가져올 수 있습니다. 공급업체는 작업일마다 교대 근무마다 별도의 보고서를 제공하기 때문에 날짜는 고유하지 않습니다. |
| 임금 유형 | 날짜가 평일인지, 주말인지 또는 휴일인지를 나타냅니다. 주말과 평일에는 고객 서비스 품질에 차이가 있을 수 있으므로 이 열을 입력으로 사용할 수 있습니다. |
| 변화 | 호출이 기록되는 근무조를 나타냅니다. 이 콜 센터는 근무일을 AM, PM1, PM2 및 자정의 네 가지 교대로 나눕니다. 이러한 변화가 고객 서비스의 품질에 영향을 주므로 이를 입력으로 사용할 수 있습니다. |
| LevelOneOperators | 근무 중인 수준 1 연산자의 수를 나타냅니다. 콜 센터 직원은 수준 1에서 시작하므로 이러한 직원은 경험이 적습니다. |
| LevelTwoOperators | 근무 중인 수준 2 연산자의 수를 나타냅니다. 직원은 수준 2 운영자 자격을 얻으려면 특정 수의 서비스 시간을 기록해야 합니다. |
| TotalOperators | 교대 근무 시 근무하는 총 운영자 수입니다. |
| 호출 | 교대 근무 중에 수신된 호출 수입니다. |
| AutomaticResponses | 자동 통화 처리(대화형 음성 응답 또는 IVR)에 의해 완전히 처리된 호출 수입니다. |
| 주문 | 호출로 인해 발생한 주문 수입니다. |
| 문제제기 | 호출에 의해 생성된 후속 조치가 필요한 문제 수입니다. |
| 문제당 평균 처리 시간 | 들어오는 호출에 응답하는 데 필요한 평균 시간입니다. |
| 서비스 등급 | 전체 교대 근무의 중단률 로 측정된 일반적인 서비스 품질을 나타내는 메트릭입니다. 포기율이 높을수록 고객이 불만족하고 잠재적인 주문이 손실될 가능성이 높습니다. |
데이터에는 단일 날짜 열을 기반으로 하는 네 개의 서로 다른 열, WageType, DayOfWeek, Shift, 및 DateKey이 포함되어 있습니다. 일반적으로 데이터 마이닝에서는 값이 서로 너무 강하게 상호 연결되고 다른 패턴을 모호하게 할 수 있으므로 동일한 데이터에서 파생된 여러 열을 사용하는 것은 좋지 않습니다.
그러나 고유 값이 너무 많기 때문에 모델에서는 사용하지 DateKey 않습니다.
DayOfWeek과 DayOfWeek 사이에 Shift 는 직접적인 관계가 없으며 WageTypeDayOfWeek은 부분적으로만 관련됩니다. 공선성이 걱정되는 경우 사용 가능한 모든 열을 사용하여 구조를 만든 다음 각 모델에서 다른 열을 무시하고 효과를 테스트할 수 있습니다.
수업의 다음 과제
신경망 구조 및 모델 만들기(중간 데이터 마이닝 자습서)