다음을 통해 공유


콜 센터 모델에 대한 예측 만들기(중간 데이터 마이닝 자습서)

교대 근무, 연산자 수, 호출 수 및 서비스 등급 간의 상호 작용에 대해 알아보았습니다. 이제 비즈니스 분석 및 계획에 사용할 수 있는 몇 가지 예측 쿼리를 만들 준비가 되었습니다. 먼저 예비 모델에 대한 몇 가지 예측을 만들어 일부 가정을 테스트합니다. 다음으로 로지스틱 회귀 모델을 사용하여 대량 예측을 만듭니다.

이 단원에서는 예측 쿼리의 개념에 이미 익숙하다고 가정합니다.

신경망 모델을 사용하여 예측 만들기

다음 예제에서는 탐색을 위해 만든 신경망 모델을 사용하여 단일 예측을 만드는 방법을 보여 줍니다. 싱글톤 예측은 모델의 효과를 확인하기 위해 다른 값을 사용해 볼 수 있는 좋은 방법입니다. 이 시나리오에서는 6명의 숙련된 운영자가 근무 중인 경우 자정 교대 근무(지정된 요일 없음)에 대한 서비스 등급을 예측합니다.

신경망 모델을 사용하여 단일 쿼리를 만들려면

  1. SSDT(SQL Server Data Tools)에서 사용하려는 모델이 포함된 솔루션을 엽니다.

  2. 데이터 마이닝 디자이너에서 마이닝 모델 예측 탭을 클릭합니다.

  3. 마이닝 모델 창에서 모델 선택을 클릭합니다.

  4. 마이닝 모델 선택 대화 상자에는 마이닝 구조 목록이 표시됩니다. 마이닝 구조를 확장하여 해당 구조와 연결된 마이닝 모델 목록을 봅니다.

  5. 마이닝 구조 콜 센터 기본값을 확장하고 신경망 모델인 콜 센터 - LR을 선택합니다.

  6. 마이닝 모델 메뉴에서 Singleton 쿼리를 선택합니다.

    단일 쿼리 입력 대화 상자가 나타나고 마이닝 모델의 열에 매핑된 열이 있습니다.

  7. 단일 쿼리 입력 대화 상자에서 Shift의 행을 클릭한 다음 자정을 선택합니다.

  8. Lvl 2 연산자의 행을 클릭하고 다음을 입력합니다 6.

  9. 마이닝 모델 예측 탭의 아래쪽 절반에서 표의 첫 번째 행을 클릭합니다.

  10. 원본 열에서 아래쪽 화살표를 클릭하고 예측 함수를 선택합니다. 필드 열에서 PredictHistogram을 선택합니다.

    이 예측 함수와 함께 사용할 수 있는 인수 목록이 조건/인수 상자에 자동으로 표시됩니다.

  11. 마이닝 모델 창의 열 목록에서 조건/인수 상자로 ServiceGrade 열을 끕니다.

    열 이름이 인수로 자동으로 삽입됩니다. 예측 가능한 특성 열을 선택하여 이 텍스트 상자로 끌 수 있습니다.

  12. 예측 쿼리 작성기의 위쪽 모서리에 있는 쿼리 결과 보기로 전환 단추를 클릭합니다.

예상 결과에는 각 예측에 대한 지원 및 확률 값과 함께 이러한 입력이 제공된 각 서비스 등급에 대해 예측 가능한 값이 포함됩니다. 언제든지 디자인 보기로 돌아가 입력을 변경하거나 입력을 더 추가할 수 있습니다.

로지스틱 회귀 모델을 사용하여 예측 만들기

비즈니스 문제와 관련된 특성을 이미 알고 있는 경우 로지스틱 회귀 모델을 사용하여 일부 특성의 변경 효과를 예측할 수 있습니다. 로지스틱 회귀는 독립적인 변수의 변경 내용을 기반으로 예측을 하는 데 일반적으로 사용되는 통계 방법입니다. 예를 들어 재무 점수 매기기에 사용되어 고객 인구 통계를 기반으로 고객 동작을 예측합니다.

이 작업에서는 예측에 사용할 데이터 원본을 만든 다음 몇 가지 비즈니스 질문에 대답하는 데 도움이 되는 예측을 만드는 방법을 알아봅니다.

대량 예측에 사용되는 데이터 생성

입력 데이터를 제공하는 방법에는 여러 가지가 있습니다. 예를 들어 스프레드시트에서 직원 수준을 가져오고 모델을 통해 해당 데이터를 실행하여 다음 달의 서비스 품질을 예측할 수 있습니다.

이 단원에서는 데이터 원본 뷰 디자이너를 사용하여 명명된 쿼리를 만듭니다. 이 명명된 쿼리는 일정의 각 교대 근무에 대해 직원의 최대 연산자 수, 수신된 최소 호출 및 생성된 평균 문제 수를 계산하는 사용자 지정 Transact-SQL 문입니다. 그런 다음 해당 데이터를 마이닝 모델에 조인하여 일련의 예정된 날짜에 대한 예측을 만듭니다.

대량 예측 쿼리에 대한 입력 데이터를 생성하려면
  1. 솔루션 탐색기에서 데이터 원본 뷰를 마우스 오른쪽 단추로 클릭한 다음 새 데이터 원본 뷰를 선택합니다.

  2. 데이터 원본 뷰 마법사에서 Adventure Works DW 다차원 2012를 데이터 원본으로 선택하고 다음을 클릭합니다.

  3. 테이블 및 뷰 선택 페이지에서 테이블을 선택하지 않고 다음을 클릭합니다.

  4. 마법사 완료 페이지에서 이름을 Shifts입력합니다.

    이 이름은 솔루션 탐색기에 데이터 원본 뷰의 이름으로 표시됩니다.

  5. 빈 디자인 창을 마우스 오른쪽 단추로 클릭한 다음 새 명명된 쿼리를 선택합니다.

  6. 명명된 쿼리 만들기 대화 상자에서 이름에 대해 .를 입력합니다Shifts for Call Center.

    이 이름은 데이터 원본 뷰 디자이너에 명명된 쿼리의 이름으로만 표시됩니다.

  7. 다음 쿼리 문을 대화 상자의 아래쪽 절반에 있는 SQL 텍스트 창에 붙여넣습니다.

    SELECT DISTINCT WageType, Shift,   
    AVG(Orders) as AvgOrders, MIN(Orders) as MinOrders, MAX(Orders) as MaxOrders,  
    AVG(Calls) as AvgCalls, MIN(Calls) as MinCalls, MAX(Calls) as MaxCalls,  
    AVG(LevelTwoOperators) as AvgOperators, MIN(LevelTwoOperators) as MinOperators, MAX(LevelTwoOperators) as MaxOperators,  
    AVG(IssuesRaised) as AvgIssues, MIN(IssuesRaised) as MinIssues, MAX(IssuesRaised) as MaxIssues  
    FROM dbo.FactCallCenter  
    GROUP BY Shift, WageType  
    
  8. 디자인 창에서 테이블, 통화 센터용 Shifts를 마우스 오른쪽 단추로 클릭하고 데이터 탐색 을 선택하여 T-SQL 쿼리에서 반환된 데이터를 미리 봅니다.

  9. Shifts.dsv(디자인) 를 마우스 오른쪽 단추로 클릭한 다음 저장 을 클릭하여 새 데이터 원본 뷰 정의를 저장합니다.

각 교대 근무에 대한 서비스 메트릭 예측

이제 각 교대 근무에 대한 일부 값을 생성했으므로 해당 값을 빌드한 로지스틱 회귀 모델에 대한 입력으로 사용하여 비즈니스 계획에 사용할 수 있는 몇 가지 예측을 생성합니다.

새 DSV를 예측 쿼리에 대한 입력으로 사용하려면
  1. 데이터 마이닝 디자이너에서 마이닝 모델 예측 탭을 클릭합니다.

  2. 마이닝 모델 창에서 모델 선택을 클릭하고 사용 가능한 모델 목록에서 콜 센터 - LR을 선택합니다.

  3. 마이닝 모델 메뉴에서 단일 쿼리 옵션의 선택을 취소합니다. 단일 쿼리 입력이 손실된다는 경고가 표시됩니다. OK를 클릭합니다.

    단일 쿼리 입력 대화 상자가 입력 테이블 선택 대화 상자로 바뀝니다.

  4. 사례 테이블 선택을 클릭합니다.

  5. 테이블 선택 대화 상자의 데이터 원본 목록에서 selectShifts를 선택합니다. 테이블/보기 이름 목록에서 콜 센터용 Shifts(자동으로 선택될 수 있음)를 선택한 다음 확인을 클릭합니다.

    마이닝 모델 예측 디자인 화면은 입력 데이터 및 모델에 있는 열의 이름 및 데이터 형식에 따라 만들어진 매핑을 표시하도록 업데이트됩니다.

  6. 조인 줄 중 하나를 마우스 오른쪽 단추로 클릭한 다음 연결 수정을 선택합니다.

    이 대화 상자에서 매핑된 열과 매핑되지 않은 열을 정확하게 확인할 수 있습니다. 마이닝 모델에는 호출, 주문, IssuesRaised 및 LvlTwoOperators에 대한 열이 포함되어 있습니다. 이 열은 원본 데이터의 이러한 열을 기반으로 만든 집계에 매핑할 수 있습니다. 이 시나리오에서는 평균에 매핑됩니다.

  7. LevelTwoOperators 옆에 있는 빈 셀을 클릭하고 Call Center.AvgOperators의 Shifts를 선택합니다.

  8. 통화 옆의 빈 셀을 클릭하고 Call Center.AvgCalls에 대한 Shifts를 선택합니다. 확인을 클릭합니다.

각 교대를 위한 예측을 생성하려면
  1. 예측 쿼리 작성기의 아래쪽 절반에 있는 표에서 원본 아래의 빈 셀을 클릭한 다음 콜 센터용 Shifts를 선택합니다.

  2. 필드 아래의 빈 셀에서 Shift를 선택합니다.

  3. 표에서 다음 빈 줄을 클릭하고 위에서 설명한 절차를 반복하여 WageType에 대한 다른 행을 추가합니다.

  4. 표에서 다음 빈 줄을 클릭합니다. 원본 열에서 예측 함수를 선택합니다. 필드 열에서 [예측]을 선택합니다.

  5. 마이닝 모델 창에서 ServiceGrade 열을 그리드로 드래그하여, 조건/인수 셀에 놓습니다. 별칭 필드에 예측 서비스 등급을 입력합니다.

  6. 표에서 다음 빈 줄을 클릭합니다. 원본 열에서 예측 함수를 선택합니다. 필드 열에서 PredictProbability를 선택합니다.

  7. 마이닝 모델 창에서 ServiceGrade 열을 그리드로 끌어 조건/인수 셀에 놓습니다. 별칭 필드에 Probability를 입력합니다.

  8. 예측을 보려면 쿼리 결과 보기로 전환을 클릭하십시오.

다음 표에서는 각 교대 근무에 대한 샘플 결과를 보여줍니다.

변화 임금 유형 예측 서비스 등급 확률
오전 휴일 0.165 0.377520666
심야 휴일 0.105 0.364105573
PM1 휴일 0.165 0.40056055
미세먼지 PM2.5 휴일 0.165 0.338532973
오전 평일 0.165 0.370847617
심야 평일 0.08 0.352999173
PM1 평일 0.165 0.317419177
미세먼지 PM2.5 평일 0.105 0.311672027

서비스 등급에 대한 응답 시간 감소의 영향 예측

각 교대조에 대한 평균 값을 생성하고 이러한 값을 로지스틱 회귀 모델에 대한 입력으로 사용했습니다. 그러나 비즈니스 목표가 0.00-0.05 범위 내에서 중단 속도를 유지하는 것이라는 점을 감안할 때 결과는 고무적이지 않습니다.

따라서 서비스 등급에 대한 응답 시간의 강력한 영향을 보여 준 원래 모델을 기반으로 운영 팀은 몇 가지 예측을 실행하여 통화에 응답하는 평균 시간을 줄이면 서비스 품질이 향상될 수 있는지 여부를 평가하기로 결정합니다. 예를 들어 호출 응답 시간을 현재 호출 응답 시간의 90% 또는 심지어 80%로 줄이면 서비스 등급 값은 어떻게 되나요?

각 교대 근무에 대한 평균 응답 시간을 계산하는 DSV(데이터 원본 뷰)를 만든 다음 평균 응답 시간의 80% 또는 90% 계산하는 열을 추가하기 쉽습니다. 그런 다음 DSV를 모델에 대한 입력으로 사용할 수 있습니다.

정확한 단계는 여기에 표시되지 않지만 다음 표에서는 응답 시간을 80% 또는 현재 응답 시간의 90%로 줄일 때 서비스 등급에 미치는 영향을 비교합니다.

이러한 결과에서 서비스 품질을 개선하기 위해 대상 교대 근무 시 응답 시간을 현재 속도의 90%로 줄여야 한다고 결론을 내릴 수 있습니다.

교대 근무, 임금 및 일 현재 평균 응답 시간을 사용하여 예측된 서비스 품질 응답 시간 90% 감소로 예측된 서비스 품질 응답 시간 80% 감소로 예측된 서비스 품질
휴일 아침 0.165 0.05 0.05
휴일 오후 1시 0.05 0.05 0.05
휴일 자정 0.165 0.05 0.05

이 모델에서 만들 수 있는 다양한 다른 예측 쿼리가 있습니다. 예를 들어 특정 서비스 수준을 충족하거나 특정 수의 수신 호출에 응답하는 데 필요한 연산자 수를 예측할 수 있습니다. 로지스틱 회귀 모델에 여러 출력을 포함할 수 있으므로 별도의 여러 모델을 만들지 않고도 다양한 독립 변수 및 결과를 쉽게 실험할 수 있습니다.

비고

Excel 2007용 데이터 마이닝 Add-Ins 로지스틱 회귀 마법사를 제공하여 특정 교대 근무의 대상 수준으로 서비스 등급을 개선하는 데 필요한 수준 2 연산자 수와 같은 복잡한 질문에 쉽게 대답할 수 있습니다. 데이터 마이닝 추가 기능은 무료 다운로드이며 신경망 또는 로지스틱 회귀 알고리즘을 기반으로 하는 마법사를 포함합니다. 자세한 내용은 다음 링크를 참조하십시오.

결론

Microsoft 신경망 알고리즘 및 Microsoft 로지스틱 회귀 알고리즘을 기반으로 하는 마이닝 모델을 만들고, 사용자 지정하고, 해석하는 방법을 배웠습니다. 이러한 모델 형식은 정교하고 분석에서 거의 무한한 다양성을 허용하므로 복잡하고 마스터하기 어려울 수 있습니다.

그러나 이러한 알고리즘은 여러 요소 조합을 반복하고 가장 강력한 상관 관계를 자동으로 식별하여 Transact-SQL 또는 PowerPivot을 사용하여 데이터를 수동으로 탐색하여 검색하기가 매우 어려운 인사이트를 통계적으로 지원할 수 있습니다.

또한 참조하십시오

로지스틱 회귀 모델 쿼리 예제
Microsoft 로지스틱 회귀 알고리즘
Microsoft 신경망 알고리즘
신경망 모델 쿼리 예제