Изучение модели Call Center (учебник по интеллектуальному анализу данных — средний уровень)

Статья
11/01/2016

Применимо к: SQL Server 2016 Preview

Когда исследовательская модель построена, ее можно использовать для получения дополнительных сведений о данных с помощью следующих инструментов среды SQL Server Data Tools (SSDT).

Средство просмотра нейронных сетей Microsoft**:** это средство просмотра доступно в средство просмотра модели интеллектуального анализа вкладки конструктора интеллектуального анализа данных и предназначен для работы со взаимосвязями в данных.
Microsoft просмотра деревьев содержимого общего**:** это стандартное средство просмотра предоставляет подробные данные о закономерностях и статистические данные, обнаруженные алгоритмом во время создания модели.

Средство просмотра нейронных сетей (Microsoft)

Средство просмотра содержит три панели — ввода, Выходные данные, и переменных.

С помощью вывода области, можно выбрать различные значения для прогнозируемого атрибута или зависимой переменной. Если модель содержит несколько прогнозируемых атрибутов, можно выбрать атрибут из выходного атрибута списка.

Переменных панели Сравнение двух значений, которые вы выбрали с точки зрения составляющих их атрибутов или переменных. Цветные линии визуально представляют степень влияния переменной на конечные результаты. Также можно просмотреть оценку точности прогноза для переменных. Оценка точности вычисляется различным образом в зависимости от типа используемой модели интеллектуального анализа данных, но обычно сообщает, как улучшается работа модели в случае использования данного атрибута для прогнозирования.

Ввода панели позволяет добавлять факторы влияния для модели, чтобы протестировать различные сценарии.

Использование панели «Выходные данные»

В этой первоначальной модели задачей является изучение влияния различных факторов на уровень обслуживания. Чтобы сделать это, можно выбрать уровень обслуживания из списка выходных атрибутов и затем сравнить различные уровни обслуживания, выбирая диапазоны из раскрывающихся списков для значение 1 и значение 2.

Сравнение самого низкого и самого высокого уровней обслуживания

Для значение 1, выберите диапазон с самыми низкими значениями. Например, диапазон 0-0-0,7 представляет самые низкие показатели вызовов, прекращенных абонентом, что соответствует самому высокому уровню обслуживания.

Примечание

Значения, фактически присутствующие в этом диапазоне, могут различаться в зависимости от конфигурации модели.
Для значение 2, выберите диапазон с самыми высокими значениями. Например, диапазон со значением >=0,12 представляет самый высокий показатель вызовов, прекращенных абонентом, что соответствует самому низкому уровню обслуживания. Другими словами, 12 % клиентов, позвонивших за эту смену, повесили трубку до разговора с представителем компании.

Содержимое переменных панели обновляется, чтобы сравнивать атрибуты, составляющие результирующие значения. Поэтому в левом столбце показаны атрибуты, связанные с самым высоким уровнем обслуживания, а в правом столбце — атрибуты, связанные с самым низким уровнем обслуживания.

Использование панели «Переменные»

В этой модели, оказывается, что Average Time Per Issue является важным фактором. Эта переменная указывает среднее время, затрачиваемое на ответ на звонок, независимо от его типа.

Просмотр и копирование вероятности и оценки точности прогноза для атрибута

В переменных области, наведите указатель мыши на цветную полосу в первой строке.

Это цветная полоса показывает, насколько сильно Average Time Per Issue вклад уровень обслуживания. В подсказке выводится общая оценка, значения вероятности и оценка точности прогноза для каждого сочетания переменной и конечного результата.
В переменных щелкните правой кнопкой мыши любой цветную полосу и выберите копирования.
В электронной таблице Excel, щелкните правой кнопкой мыши любую ячейку и выберите Вставить.

Отчет будет вставлен в виде HTML-таблицы, где показаны только оценки для каждой полосы.
В другом листе Excel, щелкните правой кнопкой мыши любую ячейку и выберите Специальная вставка.

Отчет будет вставлен в текстовом формате, и будут показаны связанные статистические данные, описанные в следующем разделе.

Использование панели «Входные данные»

Предположим, что нужно изучить влияние отдельного фактора, например смены или количества операторов. Можно выбрать отдельную переменную с помощью ввода области и переменных автоматически обновится, чтобы сравнить две ранее выбранные группы по заданной переменной.

Просмотр влияния, оказываемого изменением входных атрибутов на уровень обслуживания

В ввода области для атрибут, выберите «SHIFT».
Для значение, выберите по.

Переменных обновления панели для отображения влияние на модели, если выбрать смену по. При этом сохраняются все остальные выбранные значения, и продолжается сравнение самого низкого и самого высокого уровней обслуживания.
Для значение, выберите PM1.

Переменных панели обновляется для отображения влияние на модели, если меняется Смена.
В ввода панели, щелкните следующую пустую строку под строкой атрибут, и выберите вызовов. Для значение, выберите диапазон, который указывает наибольшее количество вызовов.

В список будет добавлено новое входное условие. Переменных Показать влияние модель для заданной смены при количестве звонков максимальна обновления панели.
Продолжайте изменять значения Shift и Calls, чтобы обнаружить содержательные взаимосвязи между сменой, количеством звонков и уровнем обслуживания.

Примечание

Чтобы очистить ввода области, можно использовать другие атрибуты, выберите Обновить содержимое средства просмотра.

Интерпретация статистических данных, представленных в средстве просмотра

При увеличенном времени ожидания можно уверенно прогнозировать высокий показатель вызовов, прекращенных абонентом во время ожидания, что свидетельствует о низком уровне обслуживания. Такое заключение может показаться самоочевидным, однако модель интеллектуального анализа данных предоставляет также дополнительные статистические данные, позволяющие интерпретировать подобные тренды.

Оценка: значение, которое указывает общую важность данной переменной для определения различий между результатами. Чем выше оценка, тем сильнее влияние переменной на результат.
Вероятность значения 1: процент, который представляет вероятность этого значения для данного результата.
Вероятность значения 2: процент, который представляет вероятность этого значения для данного результата.
Точность прогноза для Value 1 и точность прогноза для Value 2: оценки, которые представляют влияние заданной переменной для прогнозирования результатов Value 1 и значение 2. Чем выше оценка, тем лучше данная переменная подходит для прогнозирования результатов.

В следующей таблице приведены несколько примеров значений для самых важных факторов. Например вероятность значения 1 составляет 60,6% и вероятность значения 2 составляет 8,30%, означающее, что при Average Time Per Issue был в диапазоне 44 – 70 минут, 60,6% вариантов приходилось на смену с самым высоким уровнем обслуживания (значение 1), а 8,30% вариантов приходилось на смену с уровнем обслуживания (значение 2).

По этим данным можно сделать ряд заключений. Меньшее время ответа на звонок (в диапазоне 44–70) сильно влияет на повышение уровня обслуживания (диапазон 0,00–0,07). Оценка (92.35) сообщает, что данная переменная является очень важной.

Однако в списке влияющих факторов присутствуют и другие факторы, воздействие которых менее заметно и более сложно для интерпретации. Например, смена влияет на качество обслуживания, однако оценка точности прогноза и относительные значения вероятности показывают, что смена не является важным фактором.

Attribute	Значение	Подходит < 0,07	Подходит >= 0,12
Средние затраты времени на решение проблемы	89.087 - 120.000		Оценка: 100 Вероятность Value1: % 4,45 Вероятность Value2: 51.94% Точность прогноза для Value1: 0,19 США Точность прогноза для Value2: 1,94
Средние затраты времени на решение проблемы	44.000 - 70.597	Оценка: 92.35 Вероятность Value1: 60.06% Вероятность Value2: 8,30% Точность прогноза для Value1: 2.61 Точность прогноза для Value2: 0,31

В начало

Средство просмотра деревьев содержимого общего вида (Майкрософт)

Это средство просмотра предназначено для вывода еще более подробных сведений, полученных алгоритмом во время обработки модели. Средство просмотра деревьев содержимого MicrosoftGeneric представляет модели интеллектуального анализа данных в виде последовательности узлов, где каждый узел представляет набор известных знаний об обучающих данных. Это средство просмотра может использоваться с любыми моделями, однако содержимое узлов различается в зависимости от типа модели.

Для модели нейронной сети или логистической регрессии, может оказаться узел граничной статистики особенно полезно. Этот узел содержит выведенные статистические сведения о распределении значений в данных. Эти сведения могут быть полезны, если нужно получить сводное представление о данных, не создавая большое количество запросов T-SQL. Диаграмма распределения значений по сегментам в предыдущем разделе была получена из граничного узла статистики.

Получение сводки по значениям данных из модели интеллектуального анализа данных

В конструкторе интеллектуального анализа данных в средство просмотра модели интеллектуального анализа выберите .
Из просмотра выберите Microsoft просмотра деревьев содержимого общего.

Представление модели интеллектуального анализа данных обновится и будет отображать иерархию узлов в левой панели и HTML-таблицу в правой панели.
В заголовок узла панели, щелкните узел с именем 10000000000000000.

Самый верхний узел в любой модели всегда является ее корневым узлом. В модели нейронной сети или логистической регрессии граничный узел статистики расположен непосредственно под корневым узлом.
В сведения об узле области, прокрутите вниз, пока не появится строка NODE_DISTRIBUTION.
Прокрутите таблицу NODE_DISTRIBUTION, чтобы просмотреть распределение значений, вычисленное алгоритмом нейронной сети.

Чтобы использовать эти данные в отчете, можно выделить и скопировать сведения из отдельных строк или использовать следующий запрос расширений интеллектуального анализа данных для извлечения полного содержимого узла.

SELECT *   
FROM [Call Center EQ4].CONTENT  
WHERE NODE_NAME = '10000000000000000'

Также можно использовать иерархию узлов и данные из таблицы NODE_DISTRIBUTION, чтобы пройти по определенным путям в нейронной сети и просмотреть статистику скрытого слоя. Дополнительные сведения см. в разделе Примеры запросов к модели нейронной сети.