Общ преглед на източниците на данни
За да конфигурирате Dynamics 365 Customer Insights - Data, първо въведете изходни данни за обработка. Customer Insights - Data Предоставя няколко типа конектори за данни за свързване и приемане на данни от широк набор от източници.
В тази статия са описани опциите, които могат да повлияят на ефективността на приемане на данни.
Делта формат
Форматът на данните Delta е естественият формат за обработка, използван от Customer Insights – Data. Ако можете да предоставите изходни данни във формат Delta, има много предимства.
- По-добра ефективност с Customer Insights - Data: Delta форматът се използва вътрешно от Customer Insights - Data.
- По-бързо поглъщане на данни: Delta форматът осигурява превъзходна компресия за по-бърз трансфер на данни.
- По-бързо обединяване: С функцията за пътуване във времето Delta, Customer Insights – Data обединява само променените данни, вместо да обработва повторно целия набор от данни. Постепенното обединяване изисква всички входни данни за унификация да бъдат във формат Делта.
- Намаляване на проблемите с повредата на данните: Намалява повредените дялове и често срещаните проблеми с повредата на данните, причинени от по-стари формати като CSV.
- По-надежден дизайн за управление на данни: Делта форматът не изисква ръчни актуализации на манифести, схеми и дялови файлове.
- По-висока валидност на данните: Delta форматът осигурява атомарност, последователност, изолация, издръжливост (ACID) транзакции и нива на изолация в Spark.
Можете да използвате Delta формат със следните конектори:
Делта е термин, въведен с Delta Lake, основата за съхранение на данни и таблици в платформата Databricks Lakehouse. Delta Lake е слой за съхранение с отворен код, който носи ACID (атомарност, последователност, изолация и издръжливост) транзакции към работни натоварвания с големи данни. За повече информация вижте страницата с документация на Delta Lake.
източник на данни прикачване или импортиране
Ключово съображение при избора на начина на поглъщане на вашите данни е дали конекторът се свързва с данните или прави копия на данните. Customer Insights - Data препоръчва прикачване към данни, тъй като данните са директно достъпни, когато дойде време да ги обработите. Копирането на данните води до забавяне при актуализирането на данните.
Следните конектори за данни се прикачват към вашите данни.
- Делта таблици на Azure Data Lake
- Azure Data Lake Storage Таблици на общ модел на данни
- Microsoft Dataverse
- Azure Synapse Analytics (преглед)
Ако не можете да използвате един от прикачените конектори, копирайте Power Query данни с един от конекторите. Power Query предоставя полезен начин за трансформиране на данните.
Профилиране на данни
Когато данните се поглъщат, Customer Insights – Data извършва някои основни профили на данни, като честотата на повтарящите се стойности в колона. Можете да използвате данните от потребителския си профил, за да разберете данните си и да разрешите проблеми. Например, ако съвпадате в колоната FullName, профилът на данните може да ви помогне да откриете, че стойността по подразбиране "Въведете вашето име" се показва на 10 хиляди реда. Съвпадението на тази стойност ще доведе до съвпадение на 10 хиляди реда, които не трябва. Можете да разрешите профилиране на данни за повече колони, когато добавите вашите Azure Data Lake, делта таблици или Azure Synapse източници на данни.
След като погълнете данните, прегледайте резултатите от профилирането на данни:
Отидете на Таблици>с данни и изберете таблица. Изберете иконата Резюме за поле, като например DateOfBirth.
Вижте подробностите за грешки или липсващи стойности.
Страница с източници на данни
Страницата Източници на данни изброява източниците на данни в две секции:
- Управлявано от мен: Power Platform потоци от данни, създадени и управлявани само от вас. Други потребители могат само да преглеждат тези потоци от данни, но не и да ги редактират, обновяват или изтриват.
- Управлявани от други: Power Platform потоци от данни, създадени от други администратори. Можете само да ги преглеждате. Той изброява собственика на потока от данни, с когото да се свърже за помощ.
Бележка
Всички таблици могат да се разглеждат и използват от други потребители. Докато източниците на данни са собственост на потребителя, който ги е създал, получените таблици от поглъщането на данни могат да бъдат използвани от всеки потребител. Customer Insights - Data