Tổng quan về nguồn dữ liệu
Để cấu hình Dynamics 365 Customer Insights - Data, trước tiên hãy đưa dữ liệu nguồn vào để xử lý. Customer Insights - Data cung cấp nhiều loại trình kết nối dữ liệu để kết nối và thu thập dữ liệu từ nhiều nguồn khác nhau.
Bài viết này mô tả các tùy chọn có thể ảnh hưởng đến hiệu suất thu thập dữ liệu.
Định dạng Delta
Định dạng dữ liệu Delta là định dạng xử lý gốc được Customer Insights – Data sử dụng. Nếu bạn có thể cung cấp dữ liệu nguồn theo định dạng Delta thì sẽ có nhiều lợi thế.
- Hiệu quả tốt hơn với Customer Insights - Data: Định dạng Delta được sử dụng nội bộ bởi Customer Insights - Data.
- Thu thập dữ liệu nhanh hơn: Định dạng Delta cung cấp khả năng nén vượt trội giúp truyền dữ liệu nhanh hơn.
- Thống nhất nhanh hơn: Với tính năng du hành thời gian Delta, Customer Insights – Data chỉ thống nhất dữ liệu đã thay đổi thay vì xử lý lại toàn bộ tập dữ liệu. Thống nhất gia tăng yêu cầu tất cả dữ liệu đầu vào để thống nhất phải ở định dạng Delta.
- Giảm thiểu các vấn đề hỏng dữ liệu: Giảm thiểu các phân vùng bị hỏng và các vấn đề hỏng dữ liệu thường gặp do các định dạng cũ như CSV gây ra.
- Thiết kế Quản lý dữ liệu đáng tin cậy hơn: Định dạng Delta không yêu cầu cập nhật thủ công cho các tệp kê khai, lược đồ và phân vùng.
- Tính hợp lệ dữ liệu cao hơn: Định dạng Delta cung cấp các giao dịch có tính nguyên tử, tính nhất quán, tính cô lập, độ bền (ACID) và mức độ cô lập trong Spark.
Bạn có thể sử dụng định dạng Delta với các đầu nối sau:
Delta là thuật ngữ được giới thiệu cùng với Delta Lake, nền tảng lưu trữ dữ liệu và bảng trong Nền tảng Databricks Lakehouse. Delta Lake là một kho lưu trữ mã nguồn mở tầng mang các giao dịch ACID (tính nguyên tử, tính nhất quán, tính cô lập và tính bền vững) vào khối lượng công việc dữ liệu lớn. Để biết thêm thông tin, hãy xem Trang tài liệu về Hồ Delta.
Nguồn dữ liệu tệp đính kèm hoặc nhập
Một cân nhắc quan trọng khi lựa chọn cách thu thập dữ liệu là liệu trình kết nối có kết nối với dữ liệu hay tạo bản sao của dữ liệu hay không. Customer Insights - Data khuyến nghị đính kèm vào dữ liệu vì dữ liệu có thể được truy cập trực tiếp khi cần xử lý. Việc sao chép dữ liệu sẽ gây ra sự chậm trễ khi dữ liệu được cập nhật.
Các đầu nối dữ liệu sau đây sẽ gắn vào dữ liệu của bạn.
- Bảng Azure Data Lake Delta
- Azure Data Lake Storage Bảng mô hình dữ liệu chung
- Microsoft Dataverse
- Azure Synapse Analytics (bản xem trước)
Nếu bạn không thể sử dụng một trong các đầu nối được đính kèm, hãy sao chép dữ liệu bằng một trong các đầu nối Power Query . Power Query cung cấp một cách hữu ích để chuyển đổi dữ liệu.
Phân tích chất lượng dữ liệu
Khi dữ liệu được thu thập, Customer Insights – Data sẽ thực hiện một số phân tích dữ liệu cơ bản như tần suất các giá trị lặp lại trong một cột. Bạn có thể sử dụng dữ liệu hồ sơ để hiểu dữ liệu của mình và giải quyết vấn đề. Ví dụ, nếu bạn đang so khớp trên cột FullName, hồ sơ dữ liệu có thể giúp bạn phát hiện giá trị mặc định "Nhập tên của bạn" xuất hiện trên 10.000 hàng. Việc khớp với giá trị này sẽ khiến 10.000 hàng khớp với giá trị không mong muốn. Bạn có thể bật tính năng lập hồ sơ dữ liệu cho nhiều cột hơn khi thêm Azure Data Lake, bảng Delta hoặc Azure Synapse nguồn dữ liệu.
Sau khi bạn nhập dữ liệu, hãy xem kết quả phân tích dữ liệu:
Đi tới Dữ liệu>Bảng và chọn một bảng. Chọn biểu tượng Tóm tắt cho một trường, chẳng hạn như Ngày sinh.
Xem thông tin chi tiết về bất kỳ lỗi hoặc giá trị bị thiếu nào.
Trang nguồn dữ liệu
Trang Nguồn dữ liệu liệt kê các nguồn dữ liệu thành hai phần:
- Được tôi quản lý: Power Platform luồng dữ liệu chỉ do bạn tạo và quản lý. Những người dùng khác chỉ có thể xem các luồng dữ liệu này nhưng không thể chỉnh sửa, làm mới hoặc xóa chúng.
- Được quản lý bởi người khác: Power Platform luồng dữ liệu được tạo bởi người quản trị khác. Bạn chỉ có thể xem chúng. Nó liệt kê chủ sở hữu luồng dữ liệu để liên hệ khi cần hỗ trợ.
Lưu ý
Tất cả các bảng đều có thể được người dùng khác xem và sử dụng. Trong khi nguồn dữ liệu thuộc sở hữu của người dùng tạo ra chúng, các bảng kết quả từ quá trình thu thập dữ liệu có thể được mọi người dùng của Customer Insights - Data sử dụng.