Sincronización del origen de datos de Excel con Dataverse mediante un flujo de datos
Uno de los escenarios comunes que se producen cuando se integran datos en Dataverse es mantenerlo sincronizado con el origen. Con el flujo de datos estándar, puede cargar datos en Dataverse. En este artículo se explica cómo mantener los datos sincronizados con el sistema de origen.
La importancia de la columna de clave
Si usted utiliza un sistema de base de datos relacional como origen, normalmente tiene columnas de clave en las tablas y los datos tienen un formato adecuado para cargarse en Dataverse. Sin embargo, los datos de los archivos de Excel no siempre están limpios. A menudo usted tendrá un archivo de Excel con hojas de datos sin ninguna columna de clave. En Consideraciones de asignación de campos para flujos de datos estándar, puede ver si hay alguna columna de clave en el origen, que se podrá utilizar fácilmente como clave alternativa en la asignación de campos del flujo de datos.
Tener una columna de clave es importante para la tabla de Dataverse. La columna de clave es el identificador de fila; esta columna contiene valores únicos en cada fila. Tener una columna de clave ayuda a evitar filas duplicadas y también a sincronizar los datos con el sistema de origen. Si se quita una fila del sistema de origen, tener una columna de clave resulta útil tanto para encontrarla como para quitarla de Dataverse.
Crear una columna de clave
Si no tiene ninguna columna de clave en el origen de datos (Excel, archivo de texto o cualquier otro origen), puede generar una con el método siguiente:
Limpie los datos.
El primer paso para crear la columna de clave es quitar todas las filas innecesarias, limpiar los datos y quitar las filas vacías y los posibles duplicados.
Agregar una columna de índice.
Después de limpiar los datos, el siguiente paso consiste en asignar una columna de índice. Para hacerlo, puede utilizar Agregar columna de índice de la pestaña Agregar columna.
Al agregar la columna de índice, tiene algunas opciones para personalizarla, como por ejemplo, personalizaciones en el número inicial o el número de valores que se van a saltar cada vez. El valor de inicio predeterminado es cero e incrementa un valor cada vez.
Utilizar la columna de clave como clave alternativa
Ahora que tiene las columnas de clave, puede asignar la asignación de campos del flujo de datos a la Clave alternativa.
La configuración es sencilla, solo tiene que establecer la clave alternativa. Sin embargo, si tiene varios archivos o tablas, hay otro paso que debe tener en cuenta.
Si tiene varios archivos
Si solo tiene un archivo de Excel (u hoja o tabla), los pasos del procedimiento anterior son suficientes para establecer la clave alternativa. No obstante, si tiene varios archivos (u hojas o tablas) con la misma estructura (pero con datos diferentes), puede anexarlos juntos.
Si obtiene datos de varios archivos de Excel, la opción Combinar archivos de Power Query anexará automáticamente todos los datos y la salida tendrá un aspecto similar a la siguiente imagen.
Como se muestra en la imagen anterior, además del resultado anexado, Power Query también incluye la columna Source.Name, que contiene el nombre de archivo. El valor de índice de cada archivo puede ser único, pero no es único en varios archivos. Sin embargo, la combinación de la columna de índice y la columna Source.Name es una combinación única. Elija una clave alternativa compuesta para este escenario.
Eliminar filas que ya no existen en la salida de la consulta
El último paso es seleccionar Eliminar las filas que ya no existen en la salida de la consulta. Esta opción compara los datos de la tabla de Dataverse con los datos procedentes del origen en función de la clave alternativa (que podría ser una clave compuesta) y quita las filas que ya no existen. Como resultado, los datos de Dataverse siempre se sincronizarán con el origen de datos.