ภาพรวมของแหล่งข้อมูล
หากต้องการกำหนดค่า Dynamics 365 Customer Insights - Data ให้นำข้อมูลต้นทางมาประมวลผลก่อน Customer Insights - Data มีตัวเชื่อมต่อข้อมูลหลายชนิดที่จะเชื่อมต่อและนำเข้าข้อมูลจากแหล่งข้อมูลที่หลากหลาย
บทความนี้จะอธิบายตัวเลือกที่อาจส่งผลต่อประสิทธิภาพการนำเข้าข้อมูล
รูปแบบเดลต้า
รูปแบบข้อมูลเดลต้าเป็นรูปแบบการประมวลผลดั้งเดิมที่ใช้โดย Customer Insights – Data หากคุณสามารถให้ข้อมูลต้นทางในรูปแบบเดลต้าได้ ก็มีข้อดีหลายประการ
- ประสิทธิภาพที่ดีขึ้นด้วย Customer Insights - Data: รูปแบบเดลต้าถูกใช้ภายในโดย Customer Insights - Data
- การนำเข้าข้อมูลที่เร็วขึ้น: รูปแบบเดลต้าให้การบีบอัดที่เหนือกว่าเพื่อการถ่ายโอนข้อมูลที่รวดเร็วยิ่งขึ้น
- การรวมที่รวดเร็วยิ่งขึ้น: ด้วย คุณลักษณะการเดินทางของเวลาเดลต้า Customer Insights – Data จะรวมเฉพาะข้อมูลที่เปลี่ยนแปลง แทนที่จะประมวลผลชุดข้อมูลทั้งหมดใหม่ การรวมส่วนเพิ่มจำเป็นต้องป้อนข้อมูลทั้งหมดเพื่อรวมให้อยู่ในรูปแบบเดลต้า
- การลดปัญหาความเสียหายของข้อมูล: ลดพาร์ติชันที่เสียหายและปัญหาความเสียหายของข้อมูลทั่วไปที่เกิดจากรูปแบบเก่า เช่น CSV
- การออกแบบการจัดการข้อมูลที่เชื่อถือได้มากขึ้น: รูปแบบเดลต้าไม่จำเป็นต้องอัปเดตไฟล์รายการ สคีมา และพาร์ติชันด้วยตนเอง
- ความถูกต้องของข้อมูลที่สูงขึ้น: รูปแบบเดลต้าให้ลักษณะหน่วยย่อย ความสอดคล้อง การแยก ธุรกรรมความทนทาน (ACID) และระดับการแยกใน Spark
คุณสามารถใช้รูปแบบเดลต้ากับตัวเชื่อมต่อต่อไปนี้:
Delta เป็นคำที่ใช้กับ Delta Lake ซึ่งเป็นรากฐานสำหรับการจัดเก็บข้อมูลและตารางใน Databricks Lakehouse Platform Delta Lake เป็นเลเยอร์การจัดเก็บข้อมูลแบบโอเพ่นซอร์สที่นำธุรกรรม ACID (อะตอมมิกซิตี ความสม่ำเสมอ การแยกตัว และความทนทาน) มาสู่ปริมาณงานข้อมูลขนาดใหญ่ สำหรับข้อมูลเพิ่มเติม โปรดดู หน้าเอกสาร Delta Lake
ไฟล์แนบแหล่งข้อมูลหรือนำเข้า
ข้อควรพิจารณาที่สำคัญเมื่อเลือกวิธีการนำเข้าข้อมูลของคุณคือ ตัวเชื่อมต่อจะเชื่อมต่อกับข้อมูลหรือทำสำเนาข้อมูลหรือไม่ Customer Insights - Data แนะนำให้แนบข้อมูลเพราะข้อมูลจะเข้าถึงได้โดยตรงเมื่อถึงเวลาประมวลผล การคัดลอกข้อมูลทำให้เกิดความล่าช้าเมื่ออัปเดตข้อมูล
ตัวเชื่อมต่อข้อมูลต่อไปนี้แนบกับข้อมูลของคุณ
- ตาราง Azure Data Lake Delta
- ตาราง Azure Data Lake Storage Common Data Model
- Microsoft Dataverse
- Azure Synapse Analytics (พรีวิว)
หากคุณไม่สามารถใช้ตัวเชื่อมต่อที่ต่ออยู่ตัวใดตัวหนึ่งได้ ให้คัดลอกข้อมูลด้วยหนึ่งใน ตัวเชื่อมต่อ Power Query Power Query มอบวิธีที่เป็นประโยชน์ในการแปลงข้อมูล
การทำแฟ้มประวัติข้อมูล
เมื่อมีการนำเข้าข้อมูล Customer Insights – Data จะดำเนินการจัดทำโปรไฟล์ข้อมูลพื้นฐานบางอย่าง เช่น ความถี่ของค่าที่ซ้ำกันในคอลัมน์ คุณสามารถใช้ข้อมูลโปรไฟล์เพื่อทำความเข้าใจข้อมูลและแก้ไขปัญหาของคุณได้ ตัวอย่างเช่น หากคุณจับคู่ในคอลัมน์ FullName โปรไฟล์ข้อมูลสามารถช่วยให้คุณตรวจพบว่าค่าเริ่มต้น "ป้อนชื่อของคุณ" ปรากฏบน 10,000 แถว การจับคู่ค่านี้จะทำให้มี 10,000 แถวที่ตรงกันซึ่งไม่ควรจับคู่ คุณสามารถเปิดใช้งานการจัดทำโปรไฟล์ข้อมูลสำหรับคอลัมน์เพิ่มเติมได้เมื่อคุณเพิ่ม Azure Data Lake, ตารางเดลต้า หรือแหล่งข้อมูล Azure Synapse
หลังจากที่คุณนำเข้าข้อมูล ให้ดูผลลัพธ์ของการจัดทำโปรไฟล์ข้อมูล:
ไปที่ ข้อมูล>ตาราง และเลือกตาราง เลือกไอคอน สรุป สำหรับฟิลด์ เช่น DateOfBirth
ดูรายละเอียดข้อผิดพลาดหรือค่าที่หายไป
หน้าแหล่งข้อมูล
หน้า แหล่งข้อมูล แสดงรายการแหล่งข้อมูลในสองส่วน:
- จัดการโดยฉัน: กระแสข้อมูล Power Platform ที่สร้างและมีเฉพาะคุณเท่านั้นที่จัดการได้ ผู้ใช้คนอื่นๆ สามารถดูกระแสข้อมูลเหล่านี้ได้อย่างเดียว แต่ไม่สามารถแก้ไข รีเฟรช หรือลบได้
- จัดการโดยบุคคลอื่น: กระแสข้อมูล Power Platform ที่สร้างโดยผู้ดูแลระบบรายอื่น คุณสามารถดูได้เท่านั้น โดยจะแสดงรายการเจ้าของกระแสข้อมูลที่จะติดต่อขอความช่วยเหลือใดๆ
หมายเหตุ
ผู้ใช้รายอื่นสามารถดูและใช้งานตารางทั้งหมดได้ แม้ว่าแหล่งข้อมูลจะเป็นเจ้าของโดยผู้ใช้ที่สร้างแหล่งข้อมูล แต่ตารางที่เป็นผลลัพธ์จากการนำเข้าข้อมูลจะสามารถใช้งานได้โดยผู้ใช้ Customer Insights - Data ทุกคน