Огляд джерел даних
Щоб налаштувати Dynamics 365 Customer Insights - Data, спочатку внесіть вихідні дані для обробки. Customer Insights - Data Надає кілька типів з’єднувачів даних для підключення та отримання даних із широкого набору джерел.
У цій статті описано параметри, які можуть вплинути на ефективність прийому даних.
Дельта-формат
Формат даних Delta – це власний формат обробки, який використовується Customer Insights – Data. Якщо ви можете надати вихідні дані у форматі Delta, є багато переваг.
- Краща ефективність з Customer Insights - Data: формат Delta використовується всередині Customer Insights - Data.
- Швидший прийом даних: формат Delta забезпечує чудове стиснення для швидшої передачі даних.
- Швидша уніфікація: завдяки функції подорожей учасі Delta Customer Insights – Data об’єднує лише змінені дані, а не повторно обробляє весь набір даних. Поступова уніфікація вимагає, щоб усі вхідні дані для уніфікації були у форматі Delta.
- Зменшення кількості проблем із пошкодженням даних: зменшує кількість пошкоджених розділів і поширені проблеми з пошкодженням даних, спричинені старими форматами, такими як CSV.
- Більш надійний дизайн Керування даними: формат Delta не вимагає ручного оновлення маніфестів, схем і файлів розділів.
- Вища валідність даних: формат Delta забезпечує атомарність, стабільність, ізоляцію, довговічність (ACID) транзакції та рівень ізоляції в Spark.
Ви можете використовувати формат Delta з наступними конекторами:
Delta – це термін, введений разом з Delta Lake, основою для зберігання даних і таблиць на платформі Databricks Lakehouse. Delta Lake — це шар сховища з відкритим вихідним кодом, який забезпечує транзакції ACID (атомарність, послідовність, ізоляція та довговічність) до робочих навантажень великих даних. Для отримання додаткової інформації дивіться сторінку документації Delta Lake.
Джерело даних вкладення або імпорт
Ключовим фактором при виборі способу отримання даних є те, чи приєднується з’єднувач до даних або робить їх копії. Customer Insights - Data рекомендує прикріплювати до даних, оскільки доступ до даних здійснюється безпосередньо, коли настає час їх обробки. Копіювання даних спричиняє затримки під час оновлення даних.
Наведені нижче з’єднувачі даних підключаються до ваших даних.
- Azure Data Lake Delta tables
- Azure Data Lake Storage Загальні таблиці моделей даних
- Microsoft Dataverse
- Azure Synapse Analytics (підготовча версія)
Якщо ви не можете використовувати один із приєднаних з’єднувачів, скопіюйте дані за допомогою одного з з’єднувачів Power Query . Power Query надає корисний спосіб перетворення даних.
Профілювання даних
Коли дані надходять всередину, Customer Insights – Data виконує деякі базові профілювання даних, наприклад частоту повторюваних значень у стовпці. Ви можете використовувати дані профілю, щоб аналізувати свої дані та вирішувати проблеми. Наприклад, якщо ви збігаєтеся в стовпці Повне ім’я, профіль даних може допомогти виявити, що значення "Введіть своє ім’я" відображається в 10 тисячах рядків. Збіг за цим значенням призведе до того, що 10 тисяч рядків збігатимуться, чого не повинно. Ви можете ввімкнути профілювання даних для більшої кількості стовпців, додаючи Azure Data Lake, Delta таблиці або Azure Synapse джерела даних.
Після того, як ви отримали дані, перегляньте результати профілювання даних:
Перейдіть до розділу>Таблиці даних і виберіть таблицю. Виберіть піктограму «Підсумок » для поля, наприклад «ДатаНародження».
Перегляньте докладні відомості про будь-які помилки або відсутні значення.
Сторінка джерел даних
На сторінці «Джерела даних» джерела даних відображаються у двох розділах:
- Керував я: потоки даних створені та керовані лише вами Power Platform . Інші користувачі можуть лише переглядати ці потоки даних, але не редагувати, оновлювати та видаляти їх.
- Керується іншими:потоками даних, Power Platform створеними іншими адміністраторами. Ви можете лише переглядати їх. У ньому вказано власника потоку даних, до якого можна звернутися за будь-якою допомогою.
Нотатка
Всі таблиці можуть бути переглянуті і використані іншими користувачами. У той час як джерела даних належать користувачеві, який їх створив, отримані таблиці в результаті прийому даних можуть бути використані кожним користувачем Customer Insights - Data.