Поделиться через


Обзор источников данных

Чтобы настроить Dynamics 365 Customer Insights - Data, сначала добавьте исходные данные для обработки. Customer Insights - Data предоставляет несколько типов соединителей данных для подключения и приема данных из широкого набора источников.

В этой статье описаны параметры, которые могут повлиять на производительность приема данных.

Формат Delta

Формат данных Delta — это собственный формат обработки, используемый Customer Insights – Data. Если вы можете предоставить исходные данные в формате Delta, это имеет множество преимуществ.

  • Повышенная эффективность с Customer Insights - Data: формат Delta используется внутри Customer Insights - Data.
  • Более быстрый прием данных: формат Delta обеспечивает превосходное сжатие для более быстрой передачи данных.
  • Более быстрая унификация: благодаря функции перемещения во времени Delta Customer Insights – Data объединяет только измененные данные, а не выполняет повторную обработку всего набора данных. Инкрементная унификация требует, чтобы все входные данные для унификации были в формате Delta.
  • Уменьшение количества проблем с повреждением данных: уменьшает количество поврежденных разделов и распространенных проблем с повреждением данных, вызванных старыми форматами, такими как CSV.
  • Более надежная конструкция управления данными: формат Delta не требует ручного обновления файлов манифестов, схем и разделов.
  • Более высокая достоверность данных: формат Delta обеспечивает атомарность, согласованность, изоляцию, надежность (ACID) транзакций и уровни изоляции в Spark.

Формат Delta можно использовать в следующих соединителях:

Дельта — это термин, введенный с Delta Lake, основой для хранения данных и таблиц на платформе Databricks Lakehouse. Delta Lake — это слой хранения с открытым исходным кодом, который обеспечивает транзакции ACID (атомарность, согласованность, изоляция и надежность) для рабочих нагрузок больших данных. Дополнительные сведения см. на странице документации по Delta Lake.

Вложение или импорт источника данных

Ключевым моментом при выборе способа приема данных является то, присоединяется ли соединитель к данным или создает копии данных. Customer Insights - Data рекомендует прикрепляться к данным, поскольку к данным осуществляется прямой доступ, когда приходит время их обрабатывать. Копирование данных приводит к задержкам при обновлении данных.

Следующие соединители данных подключаются к вашим данным.

Если вы не можете использовать один из подключенных соединителей, скопируйте данные с помощью одного из соединителей Power Query. Power Query предоставляет полезный способ преобразования данных.

Профилирование данных

При приеме данных Customer Insights – Data выполняет базовое профилирование данных, например вычисляет частоту повторения значений в столбце. Вы можете использовать данные профиля, чтобы понять свои данные и решить проблемы. Например, если вы сопоставляете столбец «Полное имя», профиль данных может помочь вам обнаружить, что значение по умолчанию «Введите свое имя» появляется в 10 тысячах строк. Сопоставление этого значения приведет к совпадению 10000 строк, чего не должно быть. Вы можете включить профилирование данных для большего количества столбцов при добавлении Azure Data Lake, таблиц Delta или источников данных Azure Synapse.

После приема данных просмотрите результаты профилирования данных:

Перейдите в раздел Данные>Таблицы и выберите таблицу. Выберите значок Сводка для поля, например DateOfBirth.

Страница таблиц со значком сводки, выделенным на DateOfBirth.

Просмотрите сведения о любых ошибках или отсутствующих значениях.

Сводный график для DateOfBirth.

Страница «Источники данных»

На странице Источники данных перечисляются источники данных в двух разделах:

  • Управляется мной: потоки данных Power Platform создаются и управляются только вами. Другие пользователи могут только просматривать эти потоки данных, но не могут редактировать, обновлять и удалять их.
  • Управляется другими: потоки данных Power Platform, созданные другими администраторами. Вы можете только просматривать их. В нем указан владелец потока данных, к которому можно обратиться за помощью.

Заметка

Все таблицы могут быть просмотрены и использованы другими пользователями. Хотя источники данных принадлежат создавшему их пользователю, результирующие таблицы, полученные в результате приема данных, могут использоваться каждым пользователем Customer Insights - Data.

Снимок экрана источников данных.

Следующие шаги