Compartir a través de


Sincronización del origen de datos de Excel con Dataverse mediante un flujo de datos

Uno de los escenarios comunes al integrar datos en Dataverse es mantenerlos sincronizados con el origen. Con el flujo de datos estándar, puede cargar datos en Dataverse. En este artículo se explica cómo mantener los datos sincronizados con el sistema de origen.

Importancia de la columna clave

Si usa un sistema de base de datos relacional como origen, normalmente tiene columnas clave en las tablas y los datos tienen un formato adecuado para cargarse en Dataverse. Sin embargo, los datos de los archivos de Excel no siempre están limpios. A menudo tiene un archivo de Excel con hojas de datos sin tener ninguna columna de clave. En Consideraciones de asignación de campos para flujos de datos estándar, puede ver que si hay una columna de clave en el origen, se puede usar fácilmente como clave alternativa en la asignación de campos del flujo de datos.

Configuración de clave alternativa.

Tener una columna de clave es importante para la tabla de Dataverse. La columna de clave es el identificador de fila; esta columna contiene valores únicos en cada fila. Tener una columna de clave ayuda a evitar filas duplicadas y también ayuda a sincronizar los datos con el sistema de origen. Si se quita una fila del sistema de origen, tener una columna de clave resulta útil para encontrarla y quitarla también de Dataverse.

Creación de una columna clave

Si no tiene una columna de clave en el origen de datos (Excel, archivo de texto o cualquier otro origen), puede generar una mediante el método siguiente:

  1. Limpie los datos.

    El primer paso para crear la columna de clave es quitar todas las filas innecesarias, limpiar los datos, quitar filas vacías y quitar los posibles duplicados.

    limpiar datos.

  2. Agregue una columna de índice.

    Después de limpiar los datos, el siguiente paso consiste en asignarle una columna de clave. Puede usar Agregar columna de índice desde la pestaña Agregar columna para este propósito.

    Agregar columna de índice.

Al agregar la columna de índice, tendrás varias opciones para personalizarla, como el número inicial o cuántos valores saltar cada vez. El valor de inicio predeterminado es cero e incrementa un valor cada vez.

Usar la columna de clave como clave alternativa

Ahora que tiene las columnas clave, puede asignar el mapeo de campos del flujo de datos a la Clave Alternativa.

Establecer los campos de clave alternativa.

La configuración es sencilla, solo tiene que establecer la clave alternativa. Sin embargo, si tiene varios archivos o tablas, tiene otro paso que se debe tener en cuenta.

Si tiene varios archivos

Si solo tiene un archivo de Excel (o hoja o tabla), los pasos del procedimiento anterior son suficientes para establecer la clave alternativa. Sin embargo, si tiene varios archivos (o hojas o tablas) con la misma estructura (pero con datos diferentes), puede anexarlos juntos.

Si obtiene datos de varios archivos de Excel, la opción Combinar archivos de Power Query anexará automáticamente todos los datos y la salida tendrá un aspecto similar a la siguiente imagen.

Imagen que muestra varios archivos que se han anexado juntos.

Como se muestra en la imagen anterior, además del resultado anexado, Power Query también incluye la columna Source.Name, que contiene el nombre de archivo. El valor index de cada archivo puede ser único, pero no es único en varios archivos. Sin embargo, la combinación de la columna Index y la columna Source.Name es una combinación única. Elija una clave alternativa compuesta para este escenario.

clave compuesta.

Eliminar filas que ya no existen en la salida de la consulta

El último paso es seleccionar la opción Eliminar filas que ya no aparecen en el resultado de la consulta. Esta opción compara los datos de la tabla Dataverse con los datos procedentes del origen en función de la clave alternativa (que podría ser una clave compuesta) y quita las filas que ya no existen. Como resultado, los datos de Dataverse siempre se sincronizarán con el origen de datos.

eliminar filas ya no existe.