Explorar el modelo de centro de llamadas (Tutorial intermedio de minería de datos)
Ahora que ha creado el modelo de exploración, puede usarlo para obtener más información de los datos mediante las herramientas siguientes que se proporcionan en Business Intelligence Development Studio.
Visor de redes neuronales de Microsoft**:** este visor está disponible en la ficha Visor de modelos de minería de datos del Diseñador de minería de datos y se ha diseñado para servir de ayuda al experimentar con las interacciones de los datos.
Visor de árbol de contenido genérico de Microsoft**:** este visor estándar proporciona detalles precisos sobre los patrones y estadísticas que detecta el algoritmo al generar el modelo.
Diseñador de vistas del origen de datos**:** este visor proporciona tablas, gráficos y tablas y gráficos dinámicos que sirven de ayuda para explorar los datos de origen. Acudir a los datos de origen puede resultar muy útil para entender las tendencias que resalta el modelo.
Visor de redes neuronales de Microsoft
El visor tiene tres paneles: Entrada, Salida y Variables.
En el panel Salida, puede seleccionar valores diferentes para el atributo de predicción o la variable dependiente. Si el modelo contiene varios atributos de predicción, puede seleccionar el que desee en la lista Atributo de salida.
El panel Variables compara los dos resultados que elija en lo que respecta a los atributos participantes, o variables. Las barras coloreadas representan visualmente en qué grado afecta la variable a los resultados buscados. También puede ver las puntuaciones de mejora respecto al modelo predictivo para las variables. Una puntuación de mejora respecto al modelo predictivo se calcula de forma diferente en función de qué tipo de modelo de minería de datos se usa, pero en general indica la mejora en el modelo cuando se usa este atributo para la predicción.
El panel Entrada permite agregar influenciadores al modelo para probar varios escenarios condicionales.
Usar el panel Salida
En este modelo inicial, le interesa ver cómo afectan varios factores al grado de servicio. Para ello, puede seleccionar Grado de servicio en la lista de atributos de salida, y comparar después niveles diferentes de servicio seleccionando intervalos en las listas desplegables correspondientes a Valor 1 y Valor 2.
Para comparar los grados de servicio inferior y superior
En Valor 1, seleccione el intervalo con los valores menores. Por ejemplo, el intervalo 0-0-0.7 representa las tasas menores de abandono y, por lo tanto, el mejor grado de servicio.
Nota
Los valores exactos de este intervalo pueden variar según la configuración del modelo.
En Valor 2, seleccione el intervalo con los valores mayores. Por ejemplo, el intervalo con el valor >=0,12 representa las tasas mayores de abandono y, por lo tanto, el peor grado de servicio. En otras palabras, el 12% de los clientes que llamaron durante este turno colgaron antes de hablar con un agente.
El contenido del panel Variables se actualiza para comparar los atributos que participan en los resultados. Por lo tanto, la columna de la izquierda muestra los atributos asociados al mejor grado de servicio y la columna de la derecha los atributos asociados al peor grado de servicio.
Usar el panel Variables
En este modelo, parece que Average Time Per Issue es un factor importante. Esta variable indica el tiempo promedio que se tarda en responder una llamada, con independencia de su tipo.
Para ver y copiar las puntuaciones de mejora respecto al modelo predictivo y la probabilidad de un atributo
En el panel Variables, pause el mouse sobre la barra coloreada de la primera fila.
Esta barra coloreada muestra en qué grado contribuye Average Time Per Issue en el grado de servicio. La información sobre herramientas muestra una puntuación general, las probabilidades y las puntuaciones de mejora con respecto al modelo predictivo para cada combinación de variable y resultado de destino.
En el panel Variables, haga clic con el botón secundario en una barra coloreada y seleccione Copiar.
En una hoja de cálculo de Excel, haga clic con el botón secundario en una celda y seleccione Pegar.
El informe se pega como una tabla HTML y solo muestra las puntuaciones de cada barra.
En otra hoja de cálculo de Excel, haga clic con el botón secundario en una celda y seleccione Pegado especial.
El informe se pega en formato de texto e incluye las estadísticas relacionadas descritas en la sección siguiente.
Usar el panel Entrada
Suponga que le interesa observar el efecto de un factor determinado, como el turno o el número de operadores. Puede seleccionar una variable concreta usando el panel Entrada y el panel Variables se actualizará automáticamente para comparar los dos grupos seleccionados anteriormente dada la variable especificada.
Para revisar el efecto en el grado de servicio cambiando los atributos de entrada
En el panel Entrada, seleccione Shift como atributo.
En Valor, seleccione AM.
El panel Variables se actualiza para mostrar el efecto en el modelo cuando el turno es AM. Las demás selecciones siguen siendo las mismas, sigue comparando los grados de servicio menor y mayor.
En Valor, seleccione PM1.
El panel Variables se actualiza para mostrar el efecto en el modelo cuando el turno cambia.
En el panel Entrada, haga clic en la siguiente fila en blanco debajo de Atributo y seleccione Calls. En Valor, seleccione el intervalo que indica el mayor número de llamadas.
Se agrega una condición de entrada nueva a la lista. El panel Variables se actualiza para mostrar el efecto en el modelo para un turno en particular cuando el volumen de llamadas es elevado.
Continúe cambiando los valores de Shift y Calls para encontrar correlaciones interesantes entre el turno, el volumen de llamadas y el grado de servicio.
Nota
Para borrar el panel Entrada para que pueda utilizar diferentes atributos, haga clic en Actualizar el contenido del visor.
Interpretar las estadísticas que se proporcionan en el visor
Los tiempos de espera más prolongados son un factor de predicción muy eficaz de una tasa de abandono elevada, lo que significa que el grado de servicio es deficiente. Esto puede parecer una conclusión obvia; sin embargo, el modelo de minería de datos proporciona datos estadísticos adicionales para ayudarle a interpretar estas tendencias.
Puntuación: valor que indica la importancia global de esta variable para discriminar entre los resultados. Cuanto más alta es la puntuación, más intenso es el efecto que la variable tiene en el resultado.
Probabilidad del valor 1: porcentaje que representa la probabilidad de este valor para este resultado.
Probabilidad del valor 2: porcentaje que representa la probabilidad de este valor para este resultado.
Elevación del valor 1 y Elevación del valor 2: puntuaciones que representan el efecto que tiene usar esta variable concreta para predecir los resultados de Valor 1 y Valor 2. Cuanto más alta es la puntuación, mejor es la variable prediciendo los resultados.
La tabla siguiente contiene algunos valores de ejemplo para los influenciadores más importantes. Por ejemplo, la Probabilidad del valor 1 es del 60,6% y la Probabilidad del valor 2 es del 8,30%, lo que significa que cuando el valor de Average Time Per Issue estaba dentro del intervalo 44-70 minutos, el 60,6% de los casos estaban en el turno con los grados de servicio mayores (Valor 1) y el 8,30% de los casos estaban en el turno con los peores grados de servicio (Valor 2).
A partir de esta información puede sacar algunas conclusiones. Un menor tiempo de respuesta de las llamadas (el intervalo 44-70) influye en gran medida en un mejor grado de servicio (el intervalo 0.00-0.07). La puntuación (92,35) le indica que esta variable es muy importante.
Sin embargo, según se sigue mirando la lista de factores que influyen, se ven algunos otros factores con efectos que son más sutiles y más difíciles de interpretar. Por ejemplo, el turno parece influir en el servicio, pero las puntuaciones de mejora con respecto al modelo predictivo y las probabilidades relativas indican que no es un factor importante.
Atributo |
Valor |
Favorece < 0,07 |
Favorece >= 0,12 |
---|---|---|---|
Average Time Per Issue |
89.087 - 120.000 |
|
Puntuación: 100
Probabilidad de valor 1: 4,45 %
Probabilidad de valor 2: 51,94 %
Elevación de valor 1: 0,19
Elevación de valor 2: 1,94
|
Average Time Per Issue |
44.000 - 70.597 |
Puntuación: 92,35
Probabilidad de valor 1: 60,06 %
Probabilidad de valor 2: 8,30 %
Elevación de valor 1: 2,61
Elevación de valor 2: 0,31
|
|
Volver al principio
Visor de árbol de contenido genérico de Microsoft
Este visor se puede usar para ver información incluso más detallada creada por el algoritmo cuando se procesa el modelo. El Visor de árbol de contenido genérico deMicrosoft representa el modelo de minería de datos como una serie de nodos, donde cada nodo representa el conocimiento adquirido acerca de los datos de entrenamiento. Este visor se puede utilizar con todos los modelos, pero el contenido de los nodos es diferente según el tipo de modelo.
En los modelos de red neuronal o de regresión logística, podría encontrar que el marginal statistics node es particularmente útil. Este nodo contiene estadísticas derivadas acerca de la distribución de los valores de los datos. Esta información puede ser de utilidad si desea obtener un resumen de los datos sin tener que escribir muchas consultas de T-SQL. El gráfico de los valores del tema anterior se derivó del nodo de estadísticas marginal.
Para obtener un resumen de los valores de datos del modelo de minería de datos
En el Diseñador de minería de datos en la ficha Visor de modelos de minería de datos, seleccione <nombre del modelo de minería de datos>.
En la lista Visor, seleccione Visor de árbol de contenido genérico de Microsoft.
La vista del modelo de minería de datos se actualiza para mostrar una jerarquía de nodos en el panel izquierdo y una tabla HTML en el panel derecho.
En el panel Título de nodo, haga clic en el nodo que tenga el nombre 10000000000000000.
El nodo superior de cualquier modelo siempre es el nodo raíz. En un modelo de red neuronal o de regresión logística, el nodo que está inmediatamente por debajo es el nodo de estadísticas marginal.
En el panel Detalles de nodo, desplácese hasta que encuentre la fila NODE_DISTRIBUTION.
Desplácese hacia abajo por la tabla NODE_DISTRIBUTION para ver la distribución de valores calculados por el algoritmo de red neuronal.
Para usar estos datos en un informe, podría seleccionar información de filas específicas y copiarla después, o puede usar la siguiente consulta de Extensiones de minería de datos (DMX) para extraer el contenido completo del nodo.
SELECT *
FROM [Call Center EQ4].CONTENT
WHERE NODE_NAME = '10000000000000000'
También puede usar la jerarquía de nodos y los detalles de la tabla NODE_DISTRIBUTION para recorrer rutas individuales de la red neuronal y ver estadísticas del nivel oculto. Para obtener más información, vea Consultar un modelo de red neuronal (Analysis Services - Minería de datos).
Volver al principio
Diseñador de vistas del origen de datos
Este visor se usa al generar una estructura de minería de datos o un cubo, pero también proporciona varias herramientas útiles para entender mejor los datos de origen. Pro ejemplo, si el modelo ha encontrado una tendencia que no entiende por completo, podría ser conveniente que viera las filas individuales de los datos subyacentes o creara resúmenes o gráficos que le ayudaran a entender las correlaciones.
En esta sección se proporciona un ejemplo de cómo se puede usar el diseñador de vistas del origen de datos para explorar las tendencias que revela el modelo sin tener que copiar los datos en Excel o ejecutar varias consultas de T-SQL con el origen de datos.
En este escenario, creará algunos gráficos que muestren visualmente la correlación entre el tiempo de respuesta y el grado de servicio que encontró el modelo.
Para crear un gráfico dinámico que ilustre una tendencia para el modelo de minería de datos
En el Explorador de soluciones, en Vistas del origen de datos, haga doble clic en Call Center.dsv.
En la ficha, Call Center.dsv, haga clic con el botón secundario del mouse en la tabla, FactCallCenter, y seleccione Explorar datos.
Se abre una nueva ficha, Explorar la tabla FactCallCenter. Este ficha contiene cuatro secciones en fichas diferentes: Tabla, Tabla dinámica, Gráfico y Gráfico dinámico.
Haga clic en la ficha Gráfico dinámico.
En la Lista de campos de gráfico, seleccione AverageTimePerIssue y arrástrelo al área del gráfico, en el cuadro denominado Poner campos de categoría aquí.
Dad que el origen de datos procede de una tabla plana, la jerarquía de Lista de campos de gráfico contiene la misma información en el nivel de jerarquía y en el de campo. Sin embargo, si está trabajando con un cubo o una dimensión, la jerarquía podría contener varios miembros. Por ejemplo una jerarquía de fecha podría contener campos como trimestre, mes o día. Puede arrastrar la jerarquía entera o un solo miembro de la misma al gráfico.
En Lista de campos de gráfico, busque ServiceGrade y arrástrelo al centro del área del gráfico.
El gráfico se actualiza para agregar un cuadro denominado Suma de ServiceGrade al principio del gráfico.
En la barra de herramientas, haga clic en el icono de sigma y seleccione Promedio.
El título se actualiza a Promedio de ServiceGrade.
En la Lista de campos de gráfico, seleccione Shift y arrástrelo al área del gráfico, en el cuadro denominado Poner campos de filtro aquí. Arrastre WageType desde Lista de campos de gráfico y colóquelo junto a Shift.
Ahora puede filtrar por el turno para comprobar si la tendencia es diferente según el turno, o dependiendo de si se trata de un día de fiesta o laboral.
Seleccione AverageTimePerIssue al final del gráfico y arrástrelo de nuevo a la Lista de campos de gráfico.
En la Lista de campos de gráfico, seleccione AverageTimePerLevelTwoOperators y arrástrelo al área del gráfico, en el cuadro denominado Poner campos de categoría aquí.
El gráfico se actualiza para mostrar la correlación entre un aumento de operadores y el promedio del grado de servicio. Parece que no hay una relación lineal. Puede continuar experimentando quitando campos nuevos del gráfico y cambiando el tipo de gráfico.
Sin embargo, observe que estos gráficos suelen poder mostrar únicamente unos cuantos atributos a la vez, mientras que el algoritmo de red neuronal analiza muchas interacciones complejas entre varias entradas. Además, el modelo de red neuronal detecta numerosas correlaciones que son demasiado sutiles para expresarse en un gráfico.
Si desea exportar los diagramas o hacer una presentación de un modelo de red neuronal compleja, puede usar también las Plantillas de minería de datos para Visio. Este complemento gratuito de Visio 2007 proporciona diagramas sofisticados y personalizables para los modelos de minería de datos que se pueden usar para las presentaciones o informes. Para obtener más información, vea Complementos de minería de datos de Office 2007 (en inglés).
Volver al principio
Siguiente tarea de la lección
Vea también