แชร์ผ่าน


เริ่มต้นใช้งานด่วน: สร้างกระแสข้อมูลแรกของคุณเพื่อรับและแปลงข้อมูล

กระแสข้อมูลเป็นเทคโนโลยีการเตรียมข้อมูลแบบบริการตนเอง ระบบคลาวด์ และระบบคลาวด์ ในบทความนี้ คุณสร้างกระแสข้อมูลแรกของคุณ รับข้อมูลสําหรับกระแสข้อมูลของคุณ จากนั้นแปลงข้อมูลและเผยแพร่กระแสข้อมูล

ข้อกำหนดเบื้องต้น

คุณจําเป็นต้องมีข้อกําหนดเบื้องต้นต่อไปนี้ก่อนที่คุณจะเริ่มต้น:

สร้างกระแสข้อมูล

ในส่วนนี้ คุณกําลังสร้างกระแสข้อมูลแรกของคุณ

  1. สลับไปยังประสบการณ์การใช้งาน โรงงาน ข้อมูล

    Screenshot with the data factory experience emphasized.

  2. นําทางไปยังพื้นที่ทํางาน Microsoft Fabric ของคุณ

    Screenshot of the workspaces window where you navigate to your workspace.

  3. เลือก สร้าง จากนั้นเลือก กระแสข้อมูล Gen2

    Screenshot with the Dataflow Gen2 selection emphasized.

รับ ข้อมูล

เรามาดูข้อมูลบางอย่างกัน! ในตัวอย่างนี้ คุณกําลังได้รับข้อมูลจากบริการ OData ใช้ขั้นตอนต่อไปนี้เพื่อรับข้อมูลในกระแสข้อมูลของคุณ

  1. ในตัวแก้ไขกระแสข้อมูล เลือก รับข้อมูล จากนั้นเลือก เพิ่มเติม

    Screenshot with the Get Data option selected and More emphasized in the drop-down box.

  2. ในเลือกแหล่งข้อมูล เลือกดูเพิ่มเติม

    Screenshot of Get data source with View more emphasized.

  3. ในแหล่งข้อมูลใหม่ เลือก OData อื่น>เป็นแหล่งข้อมูล

    Screenshot of Get data source with the Other category and the OData connector emphasized.

  4. ป้อน URL https://services.odata.org/v4/northwind/northwind.svc/จากนั้นเลือก ถัดไป

    Screenshot of the OData data source where you enter the data URL.

  5. เลือกตาราง คําสั่งซื้อ และ ลูกค้า จากนั้นเลือก สร้าง

    Screenshot of the Power Query navigator with the Customers and Orders tables emphasized.

คุณสามารถเรียนรู้เพิ่มเติมเกี่ยวกับประสบการณ์การใช้งานข้อมูลและฟังก์ชันการทํางานได้ที่ การรับภาพรวมข้อมูล

ใช้การแปลงข้อมูลและเผยแพร่

ตอนนี้คุณได้โหลดข้อมูลของคุณลงในกระแสข้อมูลแรกของคุณแล้ว ขอแสดงความยินดี! ในตอนนี้ได้เวลาใช้การแปลงสองอย่างเพื่อนําข้อมูลนี้ไปใช้ในรูปร่างที่ต้องการ

คุณกําลังจะทํางานนี้จากตัวแก้ไข Power Query คุณสามารถค้นหาภาพรวมโดยละเอียดของตัวแก้ไข Power Query ได้ที่ ส่วนติดต่อผู้ใช้ Power Query

ทําตามขั้นตอนเหล่านี้เพื่อใช้การแปลงและเผยแพร่:

  1. ตรวจสอบให้แน่ใจว่าเครื่องมือการสร้างโพรไฟล์ข้อมูลเปิดใช้งานโดยไปยังตัวเลือก>หน้าแรก>ตัวเลือกส่วนกลาง

    Screenshot of Global options with the Column profile selections emphasized.

    นอกจากนี้ ตรวจสอบให้แน่ใจว่าคุณได้เปิดใช้งาน มุมมอง ไดอะแกรมโดยใช้ตัวเลือกภายใต้ แท็บ มุมมอง ในริบบอนตัวแก้ไข Power Query หรือโดยการเลือกไอคอนมุมมองไดอะแกรมที่ด้านขวาล่างของหน้าต่าง Power Query

    Screenshot of the overall look of Power Query diagram view.

  2. ภายในตาราง Orders คุณคํานวณจํานวนคําสั่งซื้อทั้งหมดต่อลูกค้า เพื่อให้บรรลุเป้าหมายนี้ ให้เลือก คอลัมน์รหัส ลูกค้าในตัวอย่างข้อมูล จากนั้นเลือก จัดกลุ่มตาม ภายใต้แท็บ แปลง ในริบบิ้น

    Screenshot showing the Orders table selected, and Group by emphasized in the Transform tab.

  3. คุณดําเนินการนับจํานวนแถวเป็นการรวมภายในจัดกลุ่มตาม คุณสามารถเรียนรู้เพิ่มเติมเกี่ยวกับความสามารถของ จัดกลุ่มตาม ได้ที่ การจัดกลุ่มหรือการสรุปแถว

    Screenshot of Group by, with the Count rows operation selected.

  4. หลังจากจัดกลุ่มข้อมูลในตาราง Orders แล้ว เราจะได้รับตารางแบบสองคอลัมน์ที่มี CustomerID และ Count เป็นคอลัมน์

    Screenshot of the two column table.

  5. ถัดไป คุณต้องการรวมข้อมูลจากตารางลูกค้าด้วยจํานวนคําสั่งซื้อต่อลูกค้า เมื่อต้องการรวมข้อมูล ให้เลือกคิวรี Customers ในมุมมองไดอะแกรม และใช้เมนู "⋮" เพื่อเข้าถึงผสานคิวรีเป็นการแปลงใหม่

    Screenshot of the dataflow editor, with the vertical ellipsis of the Customers table and Merge queries as new emphasized.

  6. กําหนดค่าการดําเนินการผสานดังที่แสดงในภาพหน้าจอต่อไปนี้โดยการเลือก CustomerID เป็นคอลัมน์ที่ตรงกันในทั้งสองตาราง จากนั้นเลือก ตกลง

    Screenshot of the Merge window.

    ภาพหน้าจอของหน้าต่างผสาน ที่มีตารางด้านซ้ายสําหรับการผสานที่ตั้งค่าเป็นตารางลูกค้าและตารางด้านขวาสําหรับผสานที่ตั้งค่าเป็นตาราง Orders คอลัมน์ CustomerID ถูกเลือกสําหรับทั้งตารางลูกค้าและคําสั่งซื้อ นอกจากนี้ ชนิดการรวม ยังถูกตั้งค่าเป็นภายนอกด้านซ้าย ตัวเลือกอื่นๆ ทั้งหมดจะถูกตั้งค่าเป็นค่าเริ่มต้น

  7. เมื่อดําเนินการ ผสานคิวรีเป็นการดําเนินการใหม่ คุณจะได้รับคิวรีใหม่ที่มีคอลัมน์ทั้งหมดจากตาราง Customers และคอลัมน์หนึ่งที่มีข้อมูลที่ซ้อนกันจากตาราง Orders

    Screenshot of the dataflows editor with the new Merge query added to the right of the Customers and Orders tables.

  8. ในตัวอย่างนี้ คุณสนใจเฉพาะชุดย่อยของคอลัมน์ในตาราง ลูกค้า คุณเลือกคอลัมน์เหล่านั้นโดยใช้มุมมอง Schema เปิดใช้งานมุมมอง Schema ภายในปุ่มสลับที่มุมล่างขวาของตัวแก้ไขกระแสข้อมูล

    Screenshot of the dataflows editor with the schema view button emphasized in the bottom-right corner.

  9. มุมมอง Schema มีมุมมองที่มุ่งเน้นลงในข้อมูลเค้าร่างของตาราง รวมถึงชื่อคอลัมน์และชนิดข้อมูล มุมมอง Schema มีชุดของเครื่องมือ Schema ที่พร้อมใช้งานผ่านแท็บ ribbon ตามบริบท ในสถานการณ์นี้ คุณเลือก คอลัมน์ CustomerID, CompanyName และ Orders (2) จากนั้นเลือก ปุ่ม เอาคอลัมน์ ออก จากนั้นเลือก ลบคอลัมน์ อื่น ใน แท็บ เครื่องมือ Schema

    Screenshot of the schema view showing all of the available column names, with the CustomerID, CompanyName, and Orders (2) columns emphasized.

    Screenshot of the schema tools menu with Remove other columns emphasized.

  10. คอลัมน์ Orders (2) ประกอบด้วยข้อมูลที่ซ้อนกันซึ่งเป็นผลมาจากการผสานที่คุณดําเนินการเมื่อสองสามขั้นตอนก่อน ตอนนี้ ให้สลับกลับไปยังมุมมองข้อมูลโดยการเลือก ปุ่ม แสดงข้อมูล ที่อยู่ถัดจาก ปุ่ม แสดงมุมมอง Schema ที่มุมขวาล่างของ UI จากนั้นใช้การแปลงขยายคอลัมน์ในส่วนหัวของคอลัมน์ Orders (2) เพื่อเลือกคอลัมน์ Count

    Screenshot for using data view.

  11. ในการดําเนินการสุดท้าย คุณต้องการจัดอันดับลูกค้าของคุณตามจํานวนคําสั่งซื้อของพวกเขา เลือกคอลัมน์ นับจํานวน จากนั้นเลือกปุ่ม คอลัมน์การจัดอันดับ ภายใต้แท็บ เพิ่มคอลัมน์ ในริบบอน

    Screenshot of the dataflows editor with the Count column selected.

  12. เก็บการตั้งค่าเริ่มต้นใน คอลัมน์การจัดอันดับ จากนั้นเลือก ตกลง เพื่อนําการแปลงนี้ไปใช้

    Screenshot of the Rank window with all default settings displayed.

  13. ตอนนี้เปลี่ยนชื่อคิวรีที่เป็นผลลัพธ์เป็น ลูกค้า จัดอันดับ โดยใช้บานหน้าต่าง การตั้งค่า คิวรี ทางด้านขวาของหน้าจอ

    Screenshot of the dataflows editor with the Ranked Customers name emphasized under the query settings properties.

  14. คุณแปลงและรวมข้อมูลของคุณเสร็จแล้ว ดังนั้น ตอนนี้คุณกําหนดค่าการตั้งค่าปลายทางผลลัพธ์แล้ว เลือก เลือกปลายทาง ข้อมูล ที่ด้านล่างของบานหน้าต่าง การตั้งค่า คิวรี

    Screenshot of the dataflows editor with the location of the Data destination selection emphasized.

  15. สําหรับขั้นตอนนี้ คุณสามารถกําหนดค่าเอาต์พุตไปยัง lakehouse ของคุณถ้ามีหรือข้ามขั้นตอนนี้ถ้าคุณไม่มี ภายในประสบการณ์นี้ คุณสามารถกําหนดค่า lakehouse ปลายทางและตารางสําหรับผลลัพธ์คิวรีของคุณ นอกเหนือจากวิธีการอัปเดต (ผนวกหรือแทนที่)

    Screenshot of the Connect to data destination window with lakehouse selected.

    Screenshot of the Choose destination settings window.

  16. กระแสข้อมูลของคุณพร้อมแล้วที่จะเผยแพร่แล้ว ตรวจสอบคิวรีในมุมมองไดอะแกรม จากนั้นเลือก เผยแพร่

    Screenshot of the dataflows editor with the Publish button on the lower-right side emphasized.

    ตอนนี้คุณกลับไปยังพื้นที่ทํางานแล้ว ไอคอนสปินเนอร์ที่อยู่ถัดจากชื่อกระแสข้อมูลของคุณระบุว่ากําลังดําเนินการเผยแพร่อยู่ เมื่อการเผยแพร่เสร็จสมบูรณ์แล้ว กระแสข้อมูลของคุณก็พร้อมที่จะรีเฟรช!

    สำคัญ

    เมื่อกระแสข้อมูล Gen2 แรกถูกสร้างขึ้นในพื้นที่ทํางาน รายการ Lakehouse และ Warehouse ถูกเตรียมใช้งานพร้อมกับจุดสิ้นสุดการวิเคราะห์ SQL ที่เกี่ยวข้องและแบบจําลองความหมาย รายการเหล่านี้จะถูกแชร์โดยกระแสข้อมูลทั้งหมดในพื้นที่ทํางานและจําเป็นต้องใช้กระแสข้อมูล Gen2 เพื่อทํางาน ไม่ควรถูกลบและไม่ได้ตั้งใจที่จะใช้โดยตรงโดยผู้ใช้ รายการคือรายละเอียดการใช้งานของ กระแสข้อมูล Gen2 รายการจะไม่สามารถมองเห็นได้ในพื้นที่ทํางาน แต่อาจสามารถเข้าถึงได้ในประสบการณ์การใช้งานอื่น ๆ เช่น ประสบการณ์การใช้งานสมุดบันทึก จุดสิ้นสุดการวิเคราะห์ SQL, Lakehouse และ Warehouse คุณสามารถจดจํารายการได้จากคํานําหน้าในชื่อ คํานําหน้าของรายการคือ 'DataflowsStaging'

  17. ในพื้นที่ทํางานของคุณ เลือกไอคอนกําหนดการรีเฟรช

    Screenshot of the workspace with the schedule refresh icon emphasized.

  18. เปิดการรีเฟรชตามกําหนดการ เลือก เพิ่มเวลาอื่น และกําหนดค่าการรีเฟรชดังที่แสดงในภาพหน้าจอต่อไปนี้

    Screenshot showing how to select another time.

    สกรีนช็อตของตัวเลือกการรีเฟรชตามกําหนดการที่เปิดใช้งานการรีเฟรชตามกําหนดการความถี่ในการรีเฟรชที่ตั้งค่าเป็นรายวันโซนเวลาจะตั้งค่าเป็นเวลามาตรฐานสากลและเวลาที่กําหนดเป็น 4:00 น. ปุ่มเปิด การเลือกเพิ่มเวลาอื่น เจ้าของกระแสข้อมูล และปุ่มนําไปใช้จะถูกเน้นทั้งหมด

ล้างแหล่งข้อมูล

หากคุณไม่ต้องการใช้กระแสข้อมูลนี้ต่อไป ให้ลบกระแสข้อมูลโดยใช้ขั้นตอนต่อไปนี้:

  1. นําทางไปยังพื้นที่ทํางาน Microsoft Fabric ของคุณ

    Screenshot of the workspaces window where you navigate to your workspace.

  2. เลือกจุดไข่ปลาแนวตั้งถัดจากชื่อของกระแสข้อมูลของคุณ จากนั้นเลือกลบ

    Screenshot with the three vertical dots and the delete option in the drop-down menu emphasized.

  3. เลือก ลบ เพื่อยืนยันการลบกระแสข้อมูลของคุณ

    Screenshot of the Delete dataflow window, with the Delete button emphasized.

กระแสข้อมูลในตัวอย่างนี้แสดงวิธีการโหลดและแปลงข้อมูลในกระแสข้อมูล Gen2 คุณได้เรียนรู้วิธีการ:

  • สร้าง กระแสข้อมูล Gen2
  • แปลงข้อมูล
  • กําหนดค่าการตั้งค่าปลายทางสําหรับข้อมูลที่ถูกแปลง
  • เรียกใช้และกําหนดเวลาไปป์ไลน์ข้อมูลของคุณ

ไปยังบทความถัดไปเพื่อเรียนรู้วิธีการสร้างไปป์ไลน์ข้อมูลแรกของคุณ