Compartir vía


Configurar modelo Los usuarios que compraron esto también compraron (versión preliminar)

Importante

Algunas o todas estas funciones están disponibles como parte de una versión preliminar. El contenido y la funcionalidad están sujetos a cambios.

Después de implementar correctamente los productos comprados juntos con frecuencia, tiene que configurar el modelo para generar información sobre los datos disponibles en el almacén de lago.

Configurar el modelo para generar información

El cuaderno consta de las siguientes celdas que cuentan la historia de cómo se procesan los datos para proporcionar el resultado requerido.

Precaución

Las siguientes celdas se utilizan en la secuencia específica recomendada. Si se usan en una secuencia diferente, el cuaderno falla.

Paso 1. Importar bibliotecas

Este paso importa las bibliotecas necesarias para el cuaderno. En este paso no tiene que hacer ningún cambio.

Paso 2. Inicializar las configuraciones de Spark, el registrador y el puntero de control

Este paso inicializa las configuraciones de Spark, el registrador y los objetos de puntero de control que se utilizan para la ejecución del cuaderno.

Puede inicializar el registrador de dos maneras diferentes:

  • Configure para escribir registros en las salidas de la celda del cuaderno. Este es el comportamiento predeterminado.

  • Configure para escribir registros en un espacio de trabajo de Microsoft Azure Application Insights. Para este enfoque, necesita la cadena de conexión del espacio de trabajo de Application Insights. El sistema genera un id. de ejecución y luego lo muestra en la salida de la celda. Puede utilizar el id. de ejecución para consultar registros en el espacio de trabajo de Application Insights.

Puede utilizar el puntero de control para sincronizar la implementación de Spark y evitar la posible generación de claves duplicadas. Debe proporcionar una ruta que planea utilizar como directorio de trabajo. El nombre de la variable es checkpoint_dir. El directorio debe estar dentro de la sección de archivos de almacén de lago, es decir, debe comenzar con "Archivos/".

Paso 3. Conectarse a Lakehouse y leer las tablas de entrada

Este paso se conecta a Lakehouse y lee las tablas de entrada necesarias para el modelo. Puede leer las tablas de entrada desde una de las siguientes tres opciones:

  • El Lakehouse anclado del cuaderno, que contiene los datos de muestra. Esta es la opción predeterminada.

  • Almacenes de lago que están conectados al cuaderno. Puede seleccionar el almacén de lago en un menú desplegable.

  • Otro Lakehouse no conectado al cuaderno. Debe proporcionar la ruta completa al Lakehouse.

Para obtener detalles sobre las tablas de entrada, consulte Datos de entrada para Comprados juntos con frecuencia.

Paso 4. Definir los períodos de análisis para el modelo

El cuaderno le permite ejecutar el modelo en múltiples períodos de tiempo, lo que puede ayudarlo a capturar la estacionalidad y los cambios en el comportamiento del cliente, la cartera de productos y el posicionamiento de los productos a lo largo del tiempo. También puede comparar los resultados de diferentes períodos de tiempo utilizando el panel de control listo para usar.

Para definir un período de tiempo, utilice la función add_analysis_period. Asegúrese de definir los períodos de análisis dentro de la duración de los datos de entrada. La duración de los datos de entrada (marca de tiempo de transacciones máxima y mínima) se registra en la salida de la celda. Puede definir hasta cinco períodos de tiempo. Las claves de referencia para los períodos se almacenan en la tabla TimePeriods.

Paso 5. Preprocesar los datos de entrada

Este paso une los marcos de datos de entrada para crear un conjunto de datos de PDV, que el modelo utiliza para generar información. En este paso no tiene que hacer ningún cambio.

El resultado de este paso incluye los siguientes marcos de datos:

  • compras : el marco de datos POS de compras contiene información sobre las compras que realizan los clientes, como el id. de entidad minorista, el id. de producto, el importe del precio de lista de productos, la cantidad y la marca de tiempo de visita. Puede crear este marco de datos uniendo las tablas Visit, ShopperSession, ShopperSessionTransaction y TransactionLineItem.

  • time_periods: este marco de datos contiene los períodos de análisis que definió en el paso anterior. Puede utilizar estos períodos para dividir los datos y ejecutar el modelo en cada período.

  • retail_entities: este marco de datos contiene los identificadores de las entidades minoristas y su información. Una entidad minorista puede ser una tienda individual o un minorista. Puede utilizar estas entidades para ejecutar el modelo en un nivel de tienda o de minorista.

Paso 6. Definir los parámetros del modelo y ejecutar el modelo

Se pueden configurar los siguientes parámetros del modelo para ajustar los resultados del modelo:

  • Nombre del parámetro: min_itemset_frequency

    • Descripción: número mínimo de compras de conjuntos de artículos (colección de dos productos comprados juntos) a considerar en el análisis del modelo.

    • Tipo de valor: entero

    • Valor predeterminado: 3

    • Requerido: verdadero.

    • Valores permitidos: >=1

  • Nombre del parámetro: max_basket_size

    • Descripción: Número máximo de artículos en una cesta. Si el número de artículos en la cesta excede el valor predeterminado, la cesta se recorta. El producto con menores ventas en conjunto de datos se recorta primero.

    • Tipo de valor: entero

    • Valor predeterminado: 20

    • Requerido: verdadero.

    • Valores permitidos: >=1

  • Nombre del parámetro: chi_2_alpha

    • Descripción: Parámetro de significación estadística. Se utiliza para determinar si un par de productos asociados entre sí es significativo y estadísticamente significativo. Si un par de productos obtiene una puntuación inferior al valor del parámetro, se marcan en el campo Chi2IsSignificant de la tabla RuleAttributes.

    • Tipo de valor: float

    • Requerido: falso

    • Valor predeterminado: 0,05 percentil

    • Rango de valores permitidos: 0-1

Tras la ejecución, los datos se escriben en las tablas de salida. Tiene tres opciones para definir a qué Lakehouse escribir.

Paso 7: Crear tablas de panel de Power BI

En este paso, creará tablas de panel de Power BI. Similar a Conéctese a Lakehouse y lea la sección de tablas de entrada, existen tres métodos para escribir resultados en Fabric.

Captura de pantalla del botón Ejecutar para crear tablas de panel.

Una vez que termine de crear las tablas de panel de Power BI, el sistema escribe datos en almacén de lago. Para más información, consulte tablas de datos de salida

Paso 8: Crear una vista solo con "Excelente asociación"

"Excelente asociación" es una clasificación que sugiere una relación fuerte y estadísticamente significativa entre los productos según los criterios establecidos en el código SQL. "Excelente asociación" se deriva de la columna StrengthOfAssociation que se rellena en función de declaraciones condicionales en el código SQL. Esta lógica clasifica la fuerza de la asociación entre productos según los valores de las columnas RuleQualityCategoryId y IsSignificant en la tabla FBT.

"Excelente asociación" se refiere a casos en los que RuleQualityCategoryId es 2 (lo que podría significar una regla de asociación de alta calidad) y IsSignificant es 1 (lo que podría indicar que la asociación es estadísticamente significativa).

Si IsSignificant es 0, significa que aunque la categoría de regla podría considerarse excelente, la importancia podría ser limitada debido a datos insuficientes.

En este paso, crea una vista solo con "Excelente asociación". Este paso hace que los productos sean simétricos. Básicamente, si Producto1=A y Producto2=B, entonces necesita crear un registro simétrico como Producto1=B y Producto2=A. Debe consultar A y B por separado.

Paso 9: Parámetros de tabla de panel de Power BI

Puede utilizar el parámetro num_top_associated_products para configurar el número de productos asociados principales que se mostrarán en el panel de Power BI para cada producto.

  • Descripción:: número máximo de productos asociados para cada producto que se mostrará en el panel Power BI. Devuelve los productos principales que el campo Categoría de combinación ordena.

  • Tipo de valor:: entero

  • Requerido:: falso

  • Valor predeterminado: 5

  • Rango de valores permitidos:: 1-10

Paso 10: Crear vistas

Puede crear vistas a partir de la información anterior, donde calcula los importes de compra y las cantidades como promedios semanales.

Este paso replica los datos de cada criterio o grupo de productos que desee ver por separado. Puede completar este paso clasificando cada tienda o minorista, período de tiempo y moneda.

  • Todos los artículos (si se compran con frecuencia junto con otro artículo)

  • Los 10 ingresos más elevados de Los usuarios que compraron este artículo también compraron (principal + Los usuarios que compraron este artículo también compraron)

  • Los 10 ingresos más bajos de Los usuarios que compraron este artículo también compraron (principal + Los usuarios que compraron este artículo también compraron)

  • Mejor vendedor en ingresos por producto principal

  • Vendedor menor en ingresos por producto principal

La vista representa los artículos principales (Producto1) para cada tienda/minorista, período de tiempo, moneda y criterios de producto con sus ingresos semanales, cantidad y suma de todos los ingresos de todos los productos comprados juntos con frecuencia.

Paso 11: Crear una tabla que consume el panel de Power BI

La tabla que crea en este último paso es directamente consumible sin necesidad de crear otras medidas o columnas calculadas de Power BI.

Existen tres tipos de registros según TableColProductGroupType:

  • Tipo=1: TableColProductGroup="Grupo N": este registro representa el artículo principal que forma parte de la tabla del panel de control Los usuarios que compraron este artículo también compraron.

  • Tipo=2: TableColProductGroup="Producto principal": este registro también representa el artículo principal que forma parte de la tabla del panel de control Los usuarios que compraron este artículo también compraron como otro registro.

  • Tipo=3: TableColProductGroup="Producto de FBT": este registro representa el artículo asociado con el producto principal.

Ahora ha completado la limpieza de datos y ha creado el informe de Power BI con los filtros adecuados utilizando el cuaderno. También puede usar este informe para derivar información procesable.