หมายเหตุ
การเข้าถึงหน้านี้ต้องได้รับการอนุญาต คุณสามารถลองลงชื่อเข้าใช้หรือเปลี่ยนไดเรกทอรีได้
การเข้าถึงหน้านี้ต้องได้รับการอนุญาต คุณสามารถลองเปลี่ยนไดเรกทอรีได้
กระแสข้อมูลเป็นเทคโนโลยีการเตรียมข้อมูลแบบบริการตนเอง ระบบคลาวด์ และระบบคลาวด์ ในบทความนี้ คุณสร้างกระแสข้อมูลแรกของคุณ รับข้อมูลสําหรับกระแสข้อมูลของคุณ จากนั้นแปลงข้อมูลและเผยแพร่กระแสข้อมูล
ข้อกำหนดเบื้องต้น
คุณจําเป็นต้องมีข้อกําหนดเบื้องต้นต่อไปนี้ก่อนที่คุณจะเริ่มต้น:
- บัญชีผู้เช่า Microsoft Fabric ที่มีการสมัครใช้งานที่ใช้งานอยู่ สร้างบัญชีฟรี
- ตรวจสอบให้แน่ใจว่า คุณมีพื้นที่ทํางานที่เปิดใช้งาน Microsoft Fabric: สร้างพื้นที่ทํางาน
สร้างกระแสข้อมูล
ในส่วนนี้ คุณกําลังสร้างกระแสข้อมูลแรกของคุณ
รับ ข้อมูล
เรามาดูข้อมูลบางอย่างกัน! ในตัวอย่างนี้ คุณกําลังได้รับข้อมูลจากบริการ OData ใช้ขั้นตอนต่อไปนี้เพื่อรับข้อมูลในกระแสข้อมูลของคุณ
ในตัวแก้ไขกระแสข้อมูล เลือก รับข้อมูล จากนั้นเลือก เพิ่มเติม
ในเลือกแหล่งข้อมูล เลือกดูเพิ่มเติม
ในแหล่งข้อมูลใหม่ เลือก เป็นแหล่งข้อมูล
ป้อน URL
https://services.odata.org/v4/northwind/northwind.svc/จากนั้นเลือก ถัดไป
เลือกตาราง คําสั่งซื้อ และ ลูกค้า จากนั้นเลือก สร้าง
คุณสามารถเรียนรู้เพิ่มเติมเกี่ยวกับประสบการณ์การใช้งานข้อมูลและฟังก์ชันการทํางานใน ภาพรวมข้อมูล
ใช้การแปลงข้อมูลและเผยแพร่
คุณโหลดข้อมูลของคุณลงในกระแสข้อมูลแรกแล้ว ยินดีด้วย! ในตอนนี้ได้เวลาใช้การแปลงสองอย่างเพื่อนําข้อมูลนี้ไปใช้ในรูปร่างที่เราต้องการ
คุณแปลงข้อมูลในตัวแก้ไข Power Query คุณสามารถค้นหาภาพรวมโดยละเอียดของตัวแก้ไข Power Query ได้ที่ ส่วนติดต่อผู้ใช้ Power Query แต่ส่วนนี้จะแนะนําคุณผ่านขั้นตอนพื้นฐาน:
ตรวจสอบให้แน่ใจว่า เครื่องมือการสร้างโพรไฟล์ข้อมูล เปิดอยู่ ไปที่ตัวเลือก>หน้าแรก>ตัวเลือกส่วนกลาง จากนั้นเลือกตัวเลือกทั้งหมดภายใต้ โปรไฟล์คอลัมน์
นอกจากนี้ ตรวจสอบให้แน่ใจว่าคุณเปิดใช้งาน มุมมองไดอะแกรม โดยใช้การกําหนดค่าเค้าโครงภายใต้แท็บ มุมมอง ในริบบอนตัวแก้ไข Power Query หรือโดยการเลือกไอคอนมุมมองไดอะแกรมที่ด้านขวาล่างของหน้าต่าง Power Query
ภายในตารางคําสั่งซื้อ ให้คํานวณจํานวนคําสั่งซื้อทั้งหมดต่อลูกค้า: เลือกคอลัมน์ CustomerID ในตัวอย่างข้อมูล จากนั้นเลือก จัดกลุ่มตาม ภายใต้แท็บ แปลง ในริบบอน
คุณดําเนินการนับจํานวนแถวเป็นการรวมภายในจัดกลุ่มตาม คุณสามารถเรียนรู้เพิ่มเติมเกี่ยวกับความสามารถของ จัดกลุ่มตามในการจัดกลุ่มหรือการสรุปแถว
หลังจากจัดกลุ่มข้อมูลในตาราง Orders แล้ว เราจะได้รับตารางแบบสองคอลัมน์ที่มี CustomerID และ Count เป็นคอลัมน์
ถัดไป คุณต้องการรวมข้อมูลจากตารางลูกค้าด้วยจํานวนคําสั่งซื้อต่อลูกค้า: เลือกคิวรี Customers ในมุมมองแผนภาพ และใช้เมนู "⋮" เพื่อเข้าถึงผสานคิวรีเป็นการแปลงใหม่
กําหนดค่า การดําเนินการผสาน โดยการเลือก CustomerID เป็นคอลัมน์ที่ตรงกันในทั้งสองตาราง จากนั้นเลือก ตกลง
ภาพหน้าจอของหน้าต่างผสาน ที่มีตารางด้านซ้ายสําหรับการผสานที่ตั้งค่าเป็นตารางลูกค้าและตารางด้านขวาสําหรับผสานที่ตั้งค่าเป็นตาราง Orders คอลัมน์ CustomerID ถูกเลือกสําหรับทั้งตารางลูกค้าและคําสั่งซื้อ นอกจากนี้ ชนิดการรวม ยังถูกตั้งค่าเป็นภายนอกด้านซ้าย ตัวเลือกอื่นๆ ทั้งหมดจะถูกตั้งค่าเป็นค่าเริ่มต้น
ในตอนนี้ มีคิวรีใหม่ที่มีคอลัมน์ทั้งหมดจากตาราง Customers และหนึ่งคอลัมน์ที่มีข้อมูลที่ซ้อนกันจากตาราง Orders
เราโฟกัสเพียงไม่กี่คอลัมน์จากตารางลูกค้า เมื่อต้องการทําเช่นนี้ ให้เปิดมุมมอง Schema โดยเลือกปุ่มมุมมอง Schema ที่มุมล่างขวาของตัวแก้ไขกระแสข้อมูล
ในมุมมอง Schema คุณจะเห็นคอลัมน์ทั้งหมดในตารางของคุณ เลือก CustomerID, CompanyName และ Orders (2) จากนั้นไปที่แท็บ เครื่องมือ Schema เลือก ลบคอลัมน์ และเลือก ลบคอลัมน์อื่น ซึ่งจะเก็บเฉพาะคอลัมน์ที่คุณต้องการเท่านั้น
คอลัมน์ Orders (2) เก็บรายละเอียดเพิ่มเติมจากขั้นตอนการผสาน เมื่อต้องการดูและใช้ข้อมูลนี้ ให้เลือกปุ่ม แสดงข้อมูล ที่มุมขวาล่าง ถัดจาก แสดงมุมมอง Schema จากนั้นในส่วนหัวของคอลัมน์ Orders (2) ให้เลือกไอคอนขยายคอลัมน์ และเลือกคอลัมน์ Count ซึ่งจะเพิ่มจํานวนคําสั่งซื้อสําหรับลูกค้าแต่ละรายลงในตารางของคุณ
ตอนนี้เรามาจัดอันดับลูกค้าของคุณตามจํานวนคําสั่งซื้อที่พวกเขาทํา เลือกคอลัมน์ นับจํานวน จากนั้นไปที่แท็บ เพิ่มคอลัมน์ และเลือก คอลัมน์การจัดอันดับ การดําเนินการนี้จะเพิ่มคอลัมน์ใหม่ที่แสดงอันดับของลูกค้าแต่ละรายตามจํานวนคําสั่งซื้อของพวกเขา
เก็บการตั้งค่าเริ่มต้นใน คอลัมน์การจัดอันดับ จากนั้นเลือก ตกลง เพื่อนําการแปลงนี้ไปใช้
ตอนนี้เปลี่ยนชื่อคิวรีที่เป็นผลลัพธ์เป็น ลูกค้า จัดอันดับ โดยใช้บานหน้าต่าง การตั้งค่า คิวรี ทางด้านขวาของหน้าจอ
คุณพร้อมที่จะตั้งค่าตําแหน่งที่ข้อมูลของคุณไป ในบานหน้าต่างการตั้งค่าคิวรี ให้เลื่อนไปด้านล่างและเลือก เลือกปลายทางข้อมูล
คุณสามารถส่งผลลัพธ์ของคุณไปยังเลคเฮ้าส์ถ้าคุณมีหรือข้ามขั้นตอนนี้ถ้าคุณไม่ได้ ที่นี่ คุณสามารถเลือกเลคเฮ้าส์และตารางที่จะใช้สําหรับข้อมูลของคุณ และเลือกว่าจะเพิ่มข้อมูลใหม่ (ผนวก) หรือแทนที่ข้อมูลที่มีอยู่ (แทนที่)
กระแสข้อมูลของคุณพร้อมแล้วที่จะเผยแพร่แล้ว ตรวจสอบคิวรีในมุมมองไดอะแกรม จากนั้นเลือก เผยแพร่
เลือก เผยแพร่ ที่มุมขวาล่างเพื่อบันทึกกระแสข้อมูลของคุณ คุณจะกลับไปยังพื้นที่ทํางานของคุณที่ไอคอนรูปสปินเนอร์ที่อยู่ถัดจากชื่อกระแสข้อมูลของคุณแสดงว่ามีการเผยแพร่ เมื่อแกนหมุนหายไป กระแสข้อมูลของคุณก็พร้อมที่จะรีเฟรชแล้ว!
สำคัญ
ครั้งแรกที่คุณสร้างกระแสข้อมูล Gen2 ในพื้นที่ทํางาน Fabric ได้ตั้งค่ารายการพื้นหลังบางอย่าง (เลคเฮ้าส์และคลัง) ที่ช่วยให้กระแสข้อมูลของคุณทํางาน รายการเหล่านี้จะถูกแชร์โดยกระแสข้อมูลทั้งหมดในพื้นที่ทํางานและคุณไม่ควรลบออก ซึ่งไม่ได้มีไว้เพื่อใช้โดยตรง และมักจะมองไม่เห็นในพื้นที่ทํางานของคุณ แต่คุณอาจเห็นได้ในตําแหน่งอื่น ๆ เช่น สมุดบันทึกหรือการวิเคราะห์ SQL ค้นหาชื่อที่ขึ้นต้นด้วย
DataflowStagingเพื่อจุดเหล่านั้นในพื้นที่ทํางานของคุณ เลือกไอคอนกําหนดการรีเฟรช
เปิดการรีเฟรชตามกําหนดการ เลือก เพิ่มเวลาอื่น และกําหนดค่าการรีเฟรชดังที่แสดงในภาพหน้าจอต่อไปนี้
สกรีนช็อตของตัวเลือกการรีเฟรชตามกําหนดการที่เปิดใช้งานการรีเฟรชตามกําหนดการความถี่ในการรีเฟรชที่ตั้งค่าเป็นรายวันโซนเวลาจะตั้งค่าเป็นเวลามาตรฐานสากลและเวลาที่กําหนดเป็น 4:00 น. ปุ่มเปิด การเลือกเพิ่มเวลาอื่น เจ้าของกระแสข้อมูล และปุ่มนําไปใช้จะถูกเน้นทั้งหมด
ล้างแหล่งข้อมูล
หากคุณไม่ต้องการใช้กระแสข้อมูลนี้ต่อไป ให้ลบกระแสข้อมูลโดยใช้ขั้นตอนต่อไปนี้:
นําทางไปยังพื้นที่ทํางาน Microsoft Fabric ของคุณ
เลือกจุดไข่ปลาแนวตั้งถัดจากชื่อของกระแสข้อมูลของคุณ จากนั้นเลือกลบ
เลือก ลบ เพื่อยืนยันการลบกระแสข้อมูลของคุณ
เนื้อหาที่เกี่ยวข้อง
กระแสข้อมูลในตัวอย่างนี้แสดงวิธีการโหลดและแปลงข้อมูลในกระแสข้อมูล Gen2 คุณได้เรียนรู้วิธีการ:
- สร้าง กระแสข้อมูล Gen2
- แปลงข้อมูล
- กําหนดค่าการตั้งค่าปลายทางสําหรับข้อมูลที่ถูกแปลง
- เรียกใช้และกําหนดเวลาไปป์ไลน์ของคุณ
ไปยังบทความถัดไปเพื่อเรียนรู้วิธีสร้างไปป์ไลน์แรกของคุณ