Создание прогнозов для моделей Call Center (учебник по интеллектуальному анализу данных — средний уровень)

Статья
11/18/2015

Когда выявлены некоторые взаимосвязи между сменами, числом операторов, звонками и качеством обслуживания, можно создавать прогнозирующие запросы, которые будут использоваться в бизнес-аналитике и планировании. Вначале будут созданы прогнозы на исследовательской модели, чтобы проверить некоторые предположения. Затем с помощью модели логистической регрессии будут созданы массовые прогнозы.

На этом занятии предполагается, что пользователю уже известно, что такое прогнозирующий запрос.

Создание прогнозов с помощью модели нейронной сети

В следующем примере показано, как создать одноэлементный прогноз с помощью модели нейронной сети, созданной для исследования. Одноэлементные прогнозы служат хорошим способом проверить различные значения, чтобы оценить их воздействие на модель. В этом сценарии будет прогнозироваться уровень обслуживания для полуночной смены (без указания дня недели), если на дежурстве находятся шесть опытных операторов.

Создание одноэлементного запроса с помощью модели нейронной сети

В среде SQL Server Data Tools (SSDT) откройте решение с моделью, которую вы хотите использовать.
В конструкторе интеллектуального анализа данных перейдите на вкладку Прогноз модели интеллектуального анализа данных.
На панели Модель интеллектуального анализа данных нажмите кнопку Выбрать модель.
В диалоговом окне Выбор модели интеллектуального анализа данных представлен список структур интеллектуального анализа данных. Разверните структуру интеллектуального анализа данных, чтобы просмотреть список моделей интеллектуального анализа данных, связанных с этой структурой.
Разверните структуру интеллектуального анализа данных Call Center Default и выберите модель нейронной сети Call Center - LR.
В меню Модель интеллектуального анализа данных выберите пункт Одноэлементный запрос.

Откроется диалоговое окно Ввод одноэлементного запроса, в котором столбцы сопоставлены со столбцами в модели интеллектуального анализа данных.
В диалоговом окне Ввод одноэлементного запроса щелкните строку Shift и выберите параметр midnight.
Щелкните строку для атрибута Lvl 2 Operators и введите значение 6.
В нижней половине вкладки Прогноз модели интеллектуального анализа данных щелкните первую строку в сетке.
В столбце Источник щелкните стрелку вниз и выберите Прогнозирующая функция. В столбце Поле выберите PredictHistogram.

В поле Критерий или аргументы автоматически появится список аргументов, которые можно использовать с этой прогнозирующей функцией.
Перетащите столбец ServiceGrade из списка столбцов на панель Модель интеллектуального анализа данных в поле Критерии/аргументы.

Имя столбца автоматически вставляется в качестве аргумента. В это текстовое поле можно перетащить любой прогнозируемый атрибут.
Нажмите кнопку Переключиться в представление результатов запроса в верхнем углу построителя прогнозирующих запросов.

Ожидаемые результаты содержат возможные прогнозируемые значения для каждого уровня обслуживания при заданных входных данных, а также значения несущего множества и вероятности для каждого прогноза. В любой момент можно вернуться в режим конструктора, чтобы изменить входные данные или добавить дополнительные входные данные.

Создание прогнозов с помощью модели логистической регрессии

Если уже известны атрибуты, относящиеся к бизнес-задаче, можно использовать модель логистической регрессии для прогнозирования эффекта изменения определенных независимых переменных. Логистическая регрессия является статистическим методом, использующимся для основных прогнозов значений независимых переменных. Например, используется в сценариях финансовой оценки, чтобы прогнозировать поведение покупателей на основании их демографических данных.

В этой задаче вы узнаете, как создать источник данных, который будет использоваться для прогнозов, и сделать прогнозы, которые помогут ответить на несколько вопросов для бизнеса.

Создание данных, используемых для массового прогноза

Существует много способов предоставить входные данные. Например, можно импортировать данные об укомплектованности кадрами из электронной таблицы и ввести их в модель, чтобы спрогнозировать качество обслуживания на следующий месяц.

На этом занятии вы будете использовать конструктор представлений источников данных для создания именованного запроса. Этот именованный запрос представляет собой нестандартную инструкцию Transact-SQL, которая вычисляет для каждой смены в графике максимальное число операторов, минимальное количество принятых звонков и среднее количество возникших проблем. Затем эти данные будут присоединены к модели интеллектуального анализа данных для получения прогнозов на ближайшее время.

Создание входных данных для массового прогнозирующего запроса

В обозревателе решений щелкните правой кнопкой мыши элемент Представления источников данных и выберите команду Создать представление источника данных.
В мастере представлений источников данных выберите в качестве источника данных базу Adventure Works DW Multidimensional 2012 и нажмите кнопку Далее.
На странице Выбор таблиц и представлений нажмите кнопку Далее, не выбирая таблиц.
На странице Завершение работы мастера введите имя Shifts.

Это имя будет выводиться в обозревателе решений в качестве имени для представления источника данных.
Щелкните правой кнопкой мыши пустую панель конструктора и выберите команду Создать именованный запрос.
В диалоговом окне Создание именованного запроса введите в поле Имя строку «Shifts for Call Center».

Это имя будет выводиться в качестве имени для именованного запроса только в конструкторе представлений источников данных.

Вставьте следующую инструкцию запроса в текстовую панель SQL в нижней половине диалогового окна.

SELECT DISTINCT WageType, Shift, 
AVG(Orders) as AvgOrders, MIN(Orders) as MinOrders, MAX(Orders) as MaxOrders,
AVG(Calls) as AvgCalls, MIN(Calls) as MinCalls, MAX(Calls) as MaxCalls,
AVG(LevelTwoOperators) as AvgOperators, MIN(LevelTwoOperators) as MinOperators, MAX(LevelTwoOperators) as MaxOperators,
AVG(IssuesRaised) as AvgIssues, MIN(IssuesRaised) as MinIssues, MAX(IssuesRaised) as MaxIssues
FROM dbo.FactCallCenter
GROUP BY Shift, WageType

На панели конструктора щелкните правой кнопкой мыши таблицу Shifts for Call Center и выберите пункт Просмотр данных, чтобы предварительно просмотреть данные, возвращаемые запросом T-SQL.
Щелкните правой кнопкой мыши вкладку Shifts.dsv (конструктор), а затем нажмите кнопку Сохранить, чтобы сохранить новое определение представления источников данных.

Прогнозирование метрик обслуживания для каждой смены

Теперь, когда для каждой смены создано несколько значений, эти значения будут использоваться в качестве входных данных для вашей модели логистической регрессии для получения некоторых прогнозов, необходимых для планирования.

Использование нового представления источников данных в качестве входных данных для прогнозирующего запроса

В конструкторе интеллектуального анализа данных перейдите на вкладку Прогноз модели интеллектуального анализа данных.
На панели Модель интеллектуального анализа данных нажмите кнопку Выбрать модель и выберите Call Center - LR в списке доступных моделей.
В меню Модель интеллектуального анализа данных снимите флажок Одноэлементный запрос. Появится предупреждение о том, что входные данные одноэлементного запроса будут утеряны. Нажмите кнопку ОК.

Вместо диалогового окна Ввод одноэлементного запроса откроется окно Выбор входных таблиц.
Щелкните Выбор таблицы вариантов.
В диалоговом окне Выбор таблицы выберитеShifts в списке источников данных. В списке Имя таблицы или представления выберите Shifts for Call Center (возможно, этот элемент уже выбран автоматически) и нажмите кнопку ОК.

Область конструктора Прогноз модели интеллектуального анализа данных обновится, в результате чего отобразятся сопоставления, созданные на основании имен и типов данных столбцов во входных данных и модели.
Щелкните правой кнопкой мыши одну из линий соединения и выберите команду Изменить соединения.

В этом диалоговом окне можно точно определить, какие столбцы сопоставлены, а какие — нет. Модель интеллектуального анализа данных содержит столбцы Calls, Orders, IssuesRaised и LvlTwoOperators, которые можно сопоставить с любыми статистическими функциями, созданными на основе этих столбцов в исходных данных. В этом сценарии сопоставление будет выполняться со средними значениями.
Щелкните пустую ячейку рядом с LevelTwoOperators и выберите Shifts for Call Center.AvgOperators.
Щелкните пустую ячейку рядом с Calls, выберите Shifts for Call Center.AvgCalls и нажмите кнопку ОК.

Создание прогнозов для каждой смены

В сетке в нижней половине окна Построитель прогнозирующих запросов щелкните пустую ячейку под значением Источник и выберите Shifts for Call Center.
В пустой ячейке под значением Поле выберите Shift.
Щелкните следующую пустую строку в сетке и повторите описанную выше процедуру, чтобы добавить другую строку для WageType.
Щелкните следующую пустую строку в сетке. В столбце Источник выберите пункт Прогнозирующая функция. В столбце Поле выберите Predict.
Перетащите столбец ServiceGrade из области Модель интеллектуального анализа данных в ячейку сетки Критерий/аргумент. В поле Псевдоним введите строку «Прогнозируемый уровень обслуживания».
Щелкните следующую пустую строку в сетке. В столбце Источник выберите пункт Прогнозирующая функция. В столбце Поле выберите PredictProbability.
Перетащите столбец ServiceGrade из области Модель интеллектуального анализа данных в ячейку сетки Критерий/аргумент. В поле Псевдоним введите «Вероятность».
Выберите команду Переключиться в режим просмотра результата запроса, чтобы просмотреть прогнозы.

В следующей таблице показан образец результатов для каждой смены.

Shift	WageType	Прогнозируемый уровень обслуживания	Вероятность
AM	выходной	0.165	0.377520666
midnight	выходной	0.105	0.364105573
PM1	выходной	0.165	0.40056055
PM2	выходной	0.165	0.338532973
AM	weekday	0.165	0.370847617
midnight	weekday	0.08	0.352999173
PM1	weekday	0.165	0.317419177
PM2	weekday	0.105	0.311672027

Прогнозирование влияния уменьшения времени ответа на уровень обслуживания

Для каждой смены были созданы некоторые средние значения, использующиеся в качестве входных данных для модели логистической регрессии. Но учитывая то, что бизнес-задачей является поддержание показателя прекращенных вызовов в диапазоне 0,00–0,05, результаты не впечатляют.

Поэтому на основе исходной модели, которая показала сильное влияние времени ответа на уровень обслуживания, команда операторов принимает решение сделать несколько прогнозов, чтобы определить, может ли уменьшение среднего времени ответа на звонок повысить качество обслуживания. Например, что произойдет с уровнями обслуживания, если снизить время ответа на звонок до 90 процентов или даже до 80 процентов от текущего?

Легко создать представление источника данных, которое вычисляет среднее время ответа для каждой смены, а затем добавить столбцы, которые вычисляют 80 или 90 процентов среднего времени ответа. Затем представление источника данных можно использовать в качестве входных данных для модели.

Хотя конкретные шаги здесь не показаны, в следующей таблице сравниваются изменения в уровне обслуживания в случае уменьшения времени ответа до 80 и 90 процентов от текущего.

Из этих результатов можно сделать вывод, что для повышения качества обслуживания следует уменьшить время ответа для конкретных смен до 90 процентов от текущего.

Смена, ставка и день	Прогнозируемое качество обслуживания с текущим средним временем ответа.	Прогнозируемое качество обслуживания при уменьшении времени ответа до 90 процентов от текущего.	Прогнозируемое качество обслуживания при уменьшении времени ответа до 80 процентов от текущего.
Выходной до полудня	0.165	0.05	0.05
Выходной после полудня 1	0.05	0.05	0.05
Полночь выходного	0.165	0.05	0.05

На основе этой модели можно создать множество других прогнозирующих запросов. Например, можно спрогнозировать количество операторов, требуемое для достижения определенного уровня обслуживания или для ответа на заданное число входящих звонков. Поскольку в модель логистической регрессии можно включить несколько выходных значений, можно легко экспериментировать с различными независимыми переменными и результатами без необходимости создавать множество отдельных моделей.

Замечания

В надстройках интеллектуального анализа данных для Excel 2007 имеются мастера логистической регрессии, которые помогают получить ответы на сложные вопросы, например определение числа операторов второго уровня, требуемого для повышения показателя обслуживания до заданного уровня для определенной смены. Надстройки интеллектуального анализа данных загружаются бесплатно и содержат мастера на базе алгоритмов нейронной сети или логистической регрессии. Дополнительные сведения см. в следующих разделах.

Надстройки интеллектуального анализа данных SQL Server 2005 для Office 2007. Анализ сценария поиска решения и анализ гипотетических вариантов
Надстройки интеллектуального анализа данных SQL Server 2008 для Office 2007. Анализ сценария поиска решения, анализ гипотетических вариантов и калькулятор прогнозов

Заключение

Рассмотрены создание, настройка и интерпретация моделей интеллектуального анализа данных, основанных на алгоритме нейронной сети (Майкрософт) и алгоритме логистической регрессии (Майкрософт). Эти типы моделей являются сложными и дают практически безграничное разнообразие возможностей анализа, поэтому могут оказаться трудны в освоении.

Однако эти алгоритмы позволяют выполнять итерации с множеством комбинаций факторов и автоматически выявляют сильные корреляции, обеспечивая важную статистическую поддержку, которую было бы трудно получить, исследуя данные вручную с помощью Transact-SQL и даже PowerPivot.