Normalizar datos del registro de eventos

Completado

Al transformar los datos del registro de eventos, puede facilitar su uso durante el esfuerzo de análisis de minería de procesos. Si los datos del registro de eventos tienen menos de 1 o 2 GB de datos, usar Power Query es una buena opción. Sin embargo, si trabaja con archivos de datos de registro más grandes, la realización de las transformaciones fuera de la minería de procesos puede resultar más eficiente.

En las siguientes secciones se revisan algunas transformaciones comunes que puede realizar antes de ingerir datos en la minería de procesos.

Cambiar el nombre de las columnas

El sistema asigna columnas de los datos del registro de eventos en la minería de procesos, pero los nombres de las columnas pasan y luego el sistema los usa durante los esfuerzos del análisis del proceso. Hable con su equipo para acordar las convenciones de nomenclatura con antelación y luego implementar esos nombres como parte de la transformación. Por ejemplo, podría utilizar "c_" como prefijo para todos los atributos de nivel de caso. Este enfoque puede ayudarle a reconocer con rapidez datos en el nivel de caso. Por lo general, recomendamos utilizar una combinación de mayúsculas y minúsculas (camelCase) y evitar el uso de guiones bajos (_) en los nombres, por ejemplo, ResourceHourlyRate en lugar de resource_hourly_rate.

Además, asegúrese de que el nombre de la columna aclare su contenido. Por ejemplo, llamar a una columna Timestamp1 y Timestamp2 no sería tan evidente como llamarlas StartTimestamp y EndTimestamp.

Desde Power Query, puede implementar su nuevo esquema de nomenclatura haciendo doble clic en el encabezado y cambiando el nombre de la columna.

Captura de pantalla de la columna a la que se ha cambiado el nombre

Cuando se implementan nombres de columnas claros y coherentes, el uso de los datos es más eficiente en la fase de análisis de los datos.

Cambiar tipo de columna

Asegúrese de revisar el tipo de datos y la configuración regional de cada columna en el registro de eventos para asegurarse de que sea correcto. A menudo, el registro de eventos infiere el tipo de datos y no lo representa de manera adecuada. Puede cambiar el tipo de datos y, si corresponde, puede indicar su configuración regional.

Captura de pantalla del cuadro de diálogo Cambiar el tipo de columna con la configuración regional

Reemplazar valores

Los datos extraídos del sistema de registro podrían incluir campos de código que, si bien son eficientes para el almacenamiento, no lo son para que los humanos los utilicen en el análisis de un proceso. Por ejemplo, una columna de estado de pedido podría tener un valor de 2277333, que el sistema conoce como Enviado. Al utilizar la característica Reemplazar valores de Power Query, puede actualizar estas columnas para que tengan datos significativos.

Captura de pantalla de la opción Reemplazar valores

Otras transformaciones habituales

Power Query es un motor de transformación eficaz que puede utilizar para manejar muchos de los desafíos que encuentre con los datos del registro de eventos. Para obtener más información, consulte la referencia sobre Power Query, que describe las operaciones disponibles para la transformación de datos.

Entre otras transformaciones habituales del registro de eventos que podrías realizar se incluyen:

  • Dividir datos en varias columnas. Por ejemplo, si tiene un número de cuenta que contiene la oficina y un identificador único, es posible que desee dividir el id. de la oficina.

  • Combinar datos de varias columnas. Por ejemplo, es posible que desee combinar el nombre de la actividad con el nombre del sistema de origen.

  • Utilice la capacidad Rellenar valores para rellenar una columna que tenga algunos valores nulos y luego aplicar un valor predeterminado a esas filas.

La transformación de los datos del registro de eventos es un paso importante para la obtención de los datos más limpios posibles para la ingesta en la minería de procesos. Tener un registro de eventos adecuadamente preparado puede acelerar el proceso de análisis de los datos.