Información general de los orígenes de datos
Para configurar Dynamics 365 Customer Insights - Data, primero ingrese los datos de origen para su procesamiento. Customer Insights - Data proporciona varios tipos de conectores de datos para conectarse e ingerir datos de un amplio conjunto de fuentes.
Este artículo describe opciones que pueden afectar el rendimiento de la ingesta de datos.
Formato Delta
El formato de datos Delta es el formato de procesamiento nativo utilizado por Customer Insights – Data. Si puede proporcionar datos de origen en formato Delta, existen muchas ventajas.
- Mejor eficiencia con Customer Insights - Data: el formato delta lo utiliza internamente Customer Insights - Data.
- Ingestión de datos más rápida: el formato delta proporciona una compresión superior para transferencias de datos más rápidas.
- Unificación más rápida: con la función de viaje en el tiempo Delta, Customer Insights – Data unifica solo los datos modificados en lugar de reprocesar todo el conjunto de datos. La unificación incremental requiere que todas las entradas de datos para la unificación estén en formato Delta.
- Reducción de los problemas de corrupción de datos: reduce las particiones corruptas y los problemas comunes de corrupción de datos causados por formatos más antiguos como CSV.
- Diseño de gestión de datos más fiable: el formato delta no requiere actualizaciones manuales de manifiestos, esquemas y archivos de partición.
- Mayor validez de datos: el formato delta proporciona transacciones de atomicidad, coherencia, aislamiento, durabilidad (ACID) y niveles de aislamiento en Spark.
Puede usar el formato Delta con los conectores siguientes:
Delta es un término introducido con Delta Lake, la base para almacenar datos y tablas en Databricks Lakehouse Platform. Delta Lake es una capa de almacenamiento de código abierto que aporta transacciones ACID (atomicidad, coherencia, aislamiento y durabilidad) a cargas de trabajo de big data. Para obtener más información, consulte la página de la documentación de Delta Lake.
Origen de datos adjuntar o importar
Una consideración clave al elegir cómo ingerir sus datos es si el conector se adjunta a los datos o hace copias de los datos. Customer Insights - Data recomienda adjuntar datos porque se accede directamente a los datos cuando llega el momento de procesarlos. Copiar los datos provoca retrasos cuando se actualizan los datos.
Los siguientes conectores de datos se conectan a sus datos.
- Tablas Delta de Azure Data Lake
- Tablas Azure Data Lake Storage Common Data Model
- Microsoft Dataverse
- Azure Synapse Analytics (versión preliminar)
Si no puede utilizar uno de los conectores adjuntos, copie los datos con uno de los Conectores de Power Query. Power Query proporciona una forma útil de transformar los datos.
Generación de perfiles de datos
Cuando se ingieren datos, Customer Insights – Data realiza algunos perfiles de datos básicos, como la frecuencia de valores repetidos en una columna. Puede utilizar los datos del perfil para comprender sus datos y abordar problemas. Por ejemplo, si coincide en la columna FullName, el perfil de datos puede ayudarle a detectar que aparece un valor predeterminado de "Ingrese su nombre" en 10.000 filas. Hacer coincidir este valor provocaría que coincidieran 10.000 filas que no deberían coincidir. Puede habilitar la creación de perfiles de datos para más columnas cuando agrega orígenes de datos de Azure Data Lake, tablas Delta o Azure Synapse.
Después de ingerir los datos, vea los resultados de la creación de perfiles de datos:
Vaya a Datos>Tablas y seleccione una tabla. Seleccione el icono Resumen para un campo, como Fecha de nacimiento.
Vea los detalles de cualquier error o valor faltante.
Página Orígenes de datos
La página Orígenes de datos enumera los orígenes de datos en dos secciones:
- Administrado por mi: flujos de datos de Power Platform creados y que solo usted puede administrar. Otros usuarios solo pueden ver estos flujos de datos, pero no editarlos, actualizarlos ni eliminarlos.
- Administrados por otros: flujos de datos de Power Platform creados por otros administradores. Usted solo puedes verlos. Enumera al propietario del flujo de datos para contactar en caso de necesitar asistencia.
Nota
Otros usuarios pueden ver y utilizar todas las tablas. Si bien los orígenes de datos son propiedad del usuario que los creó, las talbas resultantes de la ingesta de datos pueden ser utilizadas por todos los usuarios de Customer Insights - Data.