Compartir a través de


Explorar el modelo de centro de llamadas (Tutorial intermedio de minería de datos)

Después de haber creado el modelo de exploración, puede usarlo para obtener más información de los datos mediante las herramientas siguientes que se proporcionan en Business Intelligence Development Studio.

  • Visor de redes neuronales de Microsoft**:** este visor está disponible en la ficha Visor de modelos de minería de datos del Diseñador de minería de datos y se ha diseñado para servir de ayuda al experimentar con las interacciones de los datos.

  • Visor de árbol de contenido genérico de Microsoft**:** este visor estándar proporciona detalles precisos sobre los patrones y estadísticas que detecta el algoritmo al generar el modelo.

  • Diseñador de vistas del origen de datos**:** este visor proporciona tablas, gráficos y tablas y gráficos dinámicos que sirven de ayuda para explorar los datos de origen. Acudir a los datos de origen puede resultar muy útil para entender las tendencias que resalta el modelo.

Visor de redes neuronales de Microsoft

El visor tiene tres paneles: Entrada, Salida y Variables.

En el panel Salida, puede seleccionar valores diferentes para el atributo de predicción o la variable dependiente. Si el modelo contiene varios atributos de predicción, puede seleccionar el que desee en la lista Atributo de salida.

El panel Variables compara los dos resultados que elija en lo que respecta a los atributos participantes, o variables. Las barras coloreadas representan visualmente en qué grado afecta la variable a los resultados buscados. También puede ver las puntuaciones de mejora respecto al modelo predictivo para las variables. Una puntuación de mejora respecto al modelo predictivo se calcula de forma diferente en función de qué tipo de modelo de minería de datos se usa, pero en general indica la mejora en el modelo cuando se usa este atributo para la predicción.

El panel Entrada permite agregar influenciadores al modelo para probar varios escenarios condicionales.

Usar el panel Salida

En este modelo inicial, le interesa ver cómo afectan varios factores al grado de servicio. Para ello, puede seleccionar Service Grade en la lista de atributos de salida, y comparar después los diferentes niveles de servicio seleccionando intervalos en las listas desplegables correspondientes a Valor 1 y Valor 2.

Para comparar los grados de servicio inferior y superior

  1. En Valor 1, seleccione el intervalo con los valores menores. Por ejemplo, un intervalo como 0-0-0.7 representa las tasas menores de abandono y, por lo tanto, el mejor grado de servicio.

    [!NOTA]

    Los valores exactos de este intervalo pueden variar según la configuración del modelo.

  2. En Valor 2, seleccione el intervalo con los valores mayores. Por ejemplo, un intervalo con valores como >=0,12 representa las tasas mayores de abandono y, por lo tanto, el peor grado de servicio.

    El contenido del panel Variables se actualiza para comparar los atributos que participan en los resultados. Por lo tanto, la columna de la izquierda muestra los atributos asociados al mejor grado de servicio y la columna de la derecha los atributos asociados al peor grado de servicio.

Usar el panel Variables

Después de haber configurado los resultados que desea comparar utilizando el panel Resultado, puede utilizar la lista Variables para ver cómo contribuye cada variable a ese resultado. En este modelo, los tres factores principales que diferencian entre los grados de servicio mayor y menor son Average Time Per Issue, Orders y Day Of Week. El panel Variables también proporciona estadísticas detalladas sobre la importancia de cada variable que influye.

Para ver y copiar las puntuaciones de mejora respecto al modelo predictivo y la probabilidad de un atributo

  1. En el panel Variables, pause el mouse sobre la barra coloreada de la primera fila.

    Esta barra coloreada muestra en qué grado contribuye Average Time Per Issue en el grado de servicio. La información sobre herramientas muestra una puntuación general, las probabilidades y las puntuaciones de mejora con respecto al modelo predictivo para cada combinación de variable y resultado de destino.

  2. En el panel Variables, haga clic con el botón secundario en una barra coloreada y seleccione Copiar.

  3. En una hoja de cálculo de Excel, haga clic con el botón secundario en una celda y seleccione Pegar.

    El informe se pega como una tabla HTML y solo muestra las puntuaciones de cada barra.

  4. En otra hoja de cálculo de Excel, haga clic con el botón secundario en una celda y seleccione Pegado especial.

    El informe se pega en formato de texto e incluye las estadísticas relacionadas descritas en la sección siguiente.

Usar el panel Entrada

Suponga que le interesa observar el efecto de un factor determinado, como el día de la semana, el turno o el número de pedidos. Puede seleccionar una variable concreta usando el panel Entrada y el panel Variables se actualizará automáticamente para comparar los dos grupos seleccionados anteriormente dada la variable especificada. Puede utilizar esta información para explorar factores que podrían estar influyendo en el resultado. Por ejemplo, la revisión inicial del modelo indicaba que el servicio era mejor los lunes y martes, y tendía a empeorar el jueves, de modo que decide examinar los factores que influyen.

Para revisar el efecto en el grado de servicio cambiando los atributos de entrada

  1. En el panel Entrada, para atributo, seleccione Day Of Week.

  2. En Valor, seleccione Jueves.

    El panel Variables se actualiza para mostrar la influencia de todas las demás variables dado que el día de la semana es jueves. Las demás selecciones siguen siendo las mismas, sigue comparando los grados de servicio menor y mayor.

  3. En Valor, cambie el día de la semana a sábado.

    El panel Variables se actualiza para mostrar las variables que más influyen en el grado de servicio los sábados.

  4. En el panel Entrada, haga clic en la siguiente fila en blanco debajo de Atributo y seleccione Shift. En Valor, seleccione AM.

    Se agrega una condición de entrada nueva a la lista. El panel Variables se actualiza para mostrar el efecto en el modelo para un turno en particular del día de la semana seleccionado.

  5. Continúe cambiando los valores de Shift y Day Of Week para encontrar correlaciones interesantes entre el grado de servicio y estas variables.

[!NOTA]

Para borrar el panel Entrada para que pueda utilizar diferentes atributos, haga clic en Actualizar el contenido del visor.

Interpretar las estadísticas que se proporcionan en el visor

Los tiempos de espera más prolongados son un factor de predicción muy eficaz de una tasa de abandono elevada, lo que significa que el grado de servicio es deficiente. Esto puede parecer una conclusión obvia; sin embargo, el modelo de minería de datos proporciona datos estadísticos adicionales para ayudarle a interpretar estas tendencias.

  • Puntuación: valor que indica la importancia global de esta variable para discriminar entre los resultados. Cuanto más alta es la puntuación, más intenso es el efecto que la variable tiene en el resultado.

  • Probabilidad del valor 1: porcentaje que representa la probabilidad de este valor para este resultado.

  • Probabilidad del valor 2: porcentaje que representa la probabilidad de este valor para este resultado.

  • Elevación del valor 1 y Elevación del valor 2: puntuaciones que representan el efecto que tiene usar esta variable concreta para predecir los resultados de Valor 1 y Valor 2. Cuanto más alta es la puntuación, mejor es la variable prediciendo los resultados.

¿Cómo debería interpretar esta información? Por ejemplo, suponga que estamos comparando los grados de servicio mejores y peores, y examinando la influencia de Average Time Per Issue. El modelo muestra algunos intervalos de valores para Average Time Per Issue, and provides these statistics: Probabilidad de valor 1 es 60,6% y Probabilidad de valor 2 es 8,30%. Esto significa que cuando el valor de Average Time Per Issue estaba dentro del intervalo 44-70 minutos, el 60,6% de los casos estaban en el turno con los mejores grados de servicio (Valor 1) y el 8,30% de los casos estaban en el turno con los peores grados de servicio (Valor 2).

A partir de esta información puede sacar algunas conclusiones. Un menor tiempo de respuesta de las llamadas (el intervalo 44-70) influye en gran medida en un mejor grado de servicio (el intervalo 0.00-0.07). La puntuación (92,35) le indica que esta variable es muy importante.

Sin embargo, otros factores tienen efectos que son más sutiles y más difíciles interpretar. Por ejemplo, el turno parece influir en el servicio, pero varía según el día de la semana; además, las puntuaciones de mejora con respecto al modelo predictivo y las probabilidades relativas indican que no es un factor importante.

El valor de un modelo de red neuronal es el que expone relaciones muy sutiles que serían difíciles de detectar mediante análisis estándar. Debe tomarse algún tiempo en explorar el modelo e interpretar las relaciones según su conocimiento del problema comercial.

Volver al principio

Visor de árbol de contenido genérico de Microsoft

Este visor se puede usar para ver información incluso más detallada creada por el algoritmo cuando se procesa el modelo. El Visor de árbol de contenido genérico de Microsoft representa el modelo de minería de datos como una serie de nodos, donde cada nodo representa el conocimiento adquirido acerca de los datos de entrenamiento. Este visor se puede utilizar con todos los modelos, pero el contenido de los nodos es diferente según el tipo de modelo.

En los modelos de red neuronal o de regresión logística, podría encontrar que el marginal statistics node es particularmente útil. Este nodo contiene estadísticas derivadas acerca de la distribución de los valores de los datos. Esta información puede ser de utilidad si desea obtener un resumen de los datos sin tener que escribir muchas consultas de T-SQL. El gráfico de los valores del tema anterior se derivó del nodo de estadísticas marginal.

Para obtener un resumen de los valores de datos del modelo de minería de datos

  1. En el Diseñador de minería de datos en la ficha Visor de modelos de minería de datos, seleccione <nombre del modelo de minería de datos>.

  2. En la lista Visor, seleccione Visor de árbol de contenido genérico de Microsoft.

    La vista del modelo de minería de datos se actualiza para mostrar una jerarquía de nodos en el panel izquierdo y una tabla HTML en el panel derecho.

  3. En el panel Título de nodo, haga clic en el nodo que tenga el nombre 10000000000000000.

    El nodo superior de cualquier modelo siempre es el nodo raíz. En un modelo de red neuronal o de regresión logística, el nodo que está inmediatamente por debajo es el nodo de estadísticas marginal.

  4. En el panel Detalles de nodo, desplácese hasta que encuentre la fila NODE_DISTRIBUTION.

  5. Desplácese por la tabla NODE_DISTRIBUTION para ver la distribución de valores calculados por el algoritmo de red neuronal.

    Para usar estos datos en un informe, podría seleccionar información de filas específicas y copiarla después, o puede usar la siguiente consulta de Extensiones de minería de datos (DMX) para extraer el contenido completo del nodo.

    SELECT * 
    FROM [Call Center Binned NN].CONTENT
    WHERE NODE_NAME = '10000000000000000'
    

También puede usar la jerarquía de nodos y los detalles de la tabla NODE_DISTRIBUTION para recorrer rutas individuales de la red neuronal y ver estadísticas del nivel oculto. Para obtener más información, vea Consultar un modelo de red neuronal (Analysis Services - Minería de datos).

Volver al principio

Diseñador de vistas del origen de datos

Este visor se usa al generar una estructura de minería de datos o un cubo, pero también proporciona varias herramientas útiles para entender mejor los datos de origen. Pro ejemplo, si el modelo ha encontrado una tendencia que no entiende por completo, podría ser conveniente que viera las filas individuales de los datos subyacentes o creara resúmenes o gráficos que le ayudaran a entender las correlaciones.

En esta sección se proporciona un ejemplo de cómo se puede usar el diseñador de vistas del origen de datos para explorar las tendencias que revela el modelo sin tener que copiar los datos en Excel o ejecutar varias consultas de T-SQL con el origen de datos.

En este escenario, creará algunos gráficos que muestren visualmente la correlación entre el tiempo de respuesta y el grado de servicio que encontró el modelo.

Para crear un gráfico dinámico que ilustre una tendencia para el modelo de minería de datos

  1. En el Explorador de soluciones, en Vistas del origen de datos, haga doble clic en Call Center.dsv.

  2. En la ficha Call Center.dsv haga clic con el botón secundario en la tabla FactCallCenter y seleccione Explorar datos.

    Se abre una nueva ficha, Explorar la tabla FactCallCenter. Este ficha contiene cuatro secciones en fichas diferentes: Tabla, Tabla dinámica, Gráfico y Gráfico dinámico.

  3. Haga clic en la ficha Gráfico dinámico.

  4. En la Lista de campos de gráfico, seleccione AverageTimePerIssue y arrástrelo hasta el área del gráfico, en el cuadro denominado Poner campos de categoría aquí.

    Dad que el origen de datos procede de una tabla plana, la jerarquía de Lista de campos de gráfico contiene la misma información en el nivel de jerarquía y en el de campo. Sin embargo, si está trabajando con un cubo o una dimensión, la jerarquía podría contener varios miembros. Por ejemplo una jerarquía de fecha podría contener campos como trimestre, mes o día. Puede arrastrar la jerarquía entera o un solo miembro de la misma hasta el gráfico.

  5. En la Lista de campos de gráfico, busque ServiceGrade y arrástrelo hasta el centro del área del gráfico.

    El gráfico se actualiza para agregar un cuadro denominado Suma de ServiceGrade al principio del gráfico.

  6. En la barra de herramientas, haga clic en el icono de sigma y seleccione Promedio.

    El título se actualiza a Promedio de ServiceGrade.

  7. En la Lista de campos de gráfico, seleccione Shift y, a continuación, arrástrelo al área del gráfico, en el cuadro denominado Poner campos de filtro aquí. Arrastre WageType desde la Lista de campos de gráfico y colóquelo junto a Shift.

    Ahora puede filtrar por turno para comprobar si la tendencia es diferente dependiendo del turno, o de si se trata de un día festivo o laborable.

  8. Seleccione AverageTimePerIssue al final del gráfico y arrástrelo de nuevo hasta la Lista de campos de gráfico.

  9. En la Lista de campos de gráfico, seleccione AverageTimePerLevelTwoOperators y arrástrelo hasta el área del gráfico, en el cuadro denominado Poner campos de categoría aquí.

    El gráfico se actualiza para mostrar la correlación entre un aumento de operadores y el promedio del grado de servicio. Parece que no hay una relación lineal. Puede continuar experimentando quitando campos nuevos del gráfico y cambiando el tipo de gráfico.

Sin embargo, observe que estos gráficos suelen poder mostrar únicamente unos cuantos atributos a la vez, mientras que el algoritmo de red neuronal analiza muchas interacciones complejas entre varias entradas. Además, el modelo de red neuronal detecta numerosas correlaciones que son demasiado sutiles para expresarse en un gráfico.

Si desea exportar el diagrama de red de dependencia o un modelo de red neuronal, puede usar también las Plantillas de minería de datos para Visio. Este complemento gratuito de Visio 2007 proporciona diagramas sofisticados y personalizables para los modelos de minería de datos que se pueden usar para las presentaciones o informes. Para obtener más información, vea Data Mining Add-ins for Office 2007.

Volver al principio

Historial de cambios

Contenido actualizado

Se han corregido los nombres del modelo de minería de datos en las predicciones y las instrucciones DDL para que coincidan con el escenario actualizado.

Se ha actualizado el modelo para que incluya el día de la semana; se ha eliminado la tabla de estadísticas relacionada con el modelo anterior. Se han descrito los efectos del día de semana.