Поделиться через


Добавление представления источника данных для данных контактного центра (учебник по интеллектуальному анализу данных среднего уровня)

В этой задаче вы добавите представление источника данных, которое будет использоваться для доступа к данным центра обработки вызовов. Одни и те же данные будут использоваться для создания исходной модели нейронной сети для изучения, а также модели логистической регрессии, которую вы будете использовать для выполнения рекомендаций.

Вы также будете использовать Конструктор представлений источников данных для добавления столбца, соответствующего дню недели. Это связано с тем, что, хотя исходные данные отслеживают данные центра обработки вызовов по датам, ваш опыт говорит вам, что существуют повторяющиеся шаблоны как с точки зрения объема звонков, так и качества обслуживания, в зависимости от того, является ли день выходным или еженедельником.

Процедуры

Добавление представления источника данных

  1. В обозревателе решений щелкните правой кнопкой мыши представления источников данных и выберите "Создать представление источника данных".

    Откроется мастер представления источников данных.

  2. На странице Мастера представления источника данных нажмите кнопку Далее.

  3. На странице "Выбор источника данных " в разделе " Реляционные источники данных" выберите источник данных Adventure Works DW Multidimensional 2012. Если у вас нет этого источника данных, см. руководство по базовому интеллектуальному анализу данных. Нажмите кнопку Далее.

  4. На странице "Выбор таблиц и представлений " выберите следующую таблицу и щелкните стрелку вправо, чтобы добавить ее в представление источника данных:

    • FactCallCenter (dbo)

    • DimDate

  5. Нажмите кнопку Далее.

  6. На странице "Завершение работы мастера " по умолчанию представление источника данных называется Adventure Works DW Multidimensional 2012. Измените имя на CallCenter и нажмите кнопку "Готово".

    Откроется конструктор представлений источников данных для отображения представления источника данных CallCenter .

  7. Щелкните правой кнопкой мыши в области представления источника данных и выберите пункт "Добавить и удалить таблицы". Выберите таблицу, DimDate и нажмите кнопку "ОК".

    Связь должна быть автоматически добавлена между столбцами в каждой DateKey таблице. Вы будете использовать эту связь, чтобы получить столбец , EnglishDayNameOfWeek, из таблицы DimDate и использовать его в модели.

  8. В конструкторе представлений источников данных щелкните правой кнопкой мыши таблицу FactCallCenter и выберите новый именованный расчет.

    В диалоговом окне "Создание именованного вычисления " введите следующие значения:

    Имя столбца ДеньНедели
    Описание Получение дня недели из таблицы DimDate
    выражение (SELECT EnglishDayNameOfWeek AS DayOfWeek FROM DimDate where FactCallCenter.DateKey = DimDate.DateKey)

    Чтобы убедиться, что выражение создает необходимые данные, щелкните правой кнопкой мыши таблицу FactCallCenter и выберите "Просмотреть данные".

  9. Найдите минуту, чтобы просмотреть доступные данные и понять, как они используются в интеллектуальном анализе данных.

Имя столбца Содержит
FactCallCenterID Произвольный ключ, созданный при импорте данных в хранилище данных.

Этот столбец идентифицирует уникальные записи и должен использоваться в качестве ключа случая для модели интеллектуального анализа данных.
КлючДата Дата операции центра обработки вызовов, выраженная как целое число. Целые ключи даты часто используются в хранилищах данных, но может потребоваться получить дату в формате даты и времени, если вы собираетесь сгруппировать значения даты.

Обратите внимание, что даты не уникальны, так как поставщик предоставляет отдельный отчет для каждой смены в каждый день операции.
Тип заработной платы Указывает, был ли день будничным, выходным или праздником.

Возможно, существует разница в качестве обслуживания клиентов в выходные и будние дни, поэтому этот столбец будет использоваться как исходные данные.
Сдвиг Указывает смену, для которой записываются вызовы. Этот центр вызовов делит рабочий день на четыре смены: AM, PM1, PM2 и Полночь.

Возможно, смена влияет на качество обслуживания клиентов, поэтому вы будете использовать это в качестве входных данных.
LevelOneOperators Указывает количество операторов уровня 1 по долгу.

Сотрудники центра обработки вызовов начинаются на уровне 1, поэтому эти сотрудники менее опытны.
LevelTwoOperators Указывает количество операторов второго уровня, находящихся на дежурстве.

Сотрудник должен регистрировать определенное количество часов обслуживания, чтобы квалифицироваться как оператор уровня 2.
TotalOperators Общее количество операторов, присутствующих во время смены.
Вызовы Количество звонков, полученных во время смены.
AutomaticResponses Количество вызовов, которые были полностью обработаны автоматизированной обработкой звонков (интерактивный голосовой ответ или IVR).
Заказы Количество заказов, сделанных по результатам звонков.
ВозникшиеПроблемы Количество проблем, требующих дальнейших действий, возникших из-за вызовов.
Среднее время на задачу Среднее время, необходимое для ответа на входящий вызов.
ServiceGrade Метрика, указывающая общее качество обслуживания, измеряемая как процент отказов за всю смену. Чем выше ставка отказа, тем более вероятно, что клиенты недовольны и что потенциальные заказы теряются.

Обратите внимание, что данные включают четыре разных столбца, основанные на одном столбце дат: WageType, DayOfWeek, Shiftи DateKey. Обычно в интеллектуальном анализе данных не рекомендуется использовать несколько столбцов, производных от одних и того же данных, так как значения коррелируют друг с другом слишком сильно и могут скрывать другие шаблоны.

Однако мы не будем использовать DateKey в модели, так как она содержит слишком много уникальных значений. Нет прямой связи между Shift и DayOfWeek, и WageType и DayOfWeek только частично связаны. Если вы беспокоились о коллинарности, можно создать структуру с помощью всех доступных столбцов, а затем игнорировать различные столбцы в каждой модели и проверить эффект.

Следующая задача на занятии

Создание структуры и модели нейронной сети (учебник по интеллектуальному анализу промежуточных данных)

См. также

Представления источников данных в многомерных моделях