หมายเหตุ
การเข้าถึงหน้านี้ต้องได้รับการอนุญาต คุณสามารถลองลงชื่อเข้าใช้หรือเปลี่ยนไดเรกทอรีได้
การเข้าถึงหน้านี้ต้องได้รับการอนุญาต คุณสามารถลองเปลี่ยนไดเรกทอรีได้
ในการเริ่มต้นใช้งานด่วนนี้ คุณจะได้เรียนรู้วิธีที่กระแสข้อมูลและไปป์ไลน์ทํางานร่วมกันเพื่อสร้างโซลูชัน Data Factory ที่มีประสิทธิภาพ คุณจะล้างข้อมูลด้วยกระแสข้อมูลและย้ายด้วยไปป์ไลน์
ข้อกําหนดเบื้องต้น
ก่อนที่คุณจะเริ่ม คุณต้อง:
- บัญชีผู้เช่าที่มีการสมัครใช้งานที่ใช้งานอยู่ สร้างบัญชีฟรี
- พื้นที่ทํางานที่เปิดใช้งาน Microsoft Fabric: ตั้งค่าพื้นที่ทํางาน ที่ไม่ใช่พื้นที่ทํางานของฉันเริ่มต้น
- ฐานข้อมูล Azure SQL ที่มีข้อมูลตาราง
- บัญชีที่เก็บข้อมูล Blob
เปรียบเทียบกระแสข้อมูลและไปป์ไลน์
Dataflow Gen2 มีอินเทอร์เฟซแบบ low-code พร้อมข้อมูล 300+ รายการและการแปลงโดยใช้ AI คุณสามารถล้าง เตรียม และแปลงข้อมูลได้อย่างง่ายดายด้วยความยืดหยุ่น ไปป์ไลน์มีความสามารถในการประสานข้อมูลที่หลากหลายเพื่อเขียนเวิร์กโฟลว์ข้อมูลที่ยืดหยุ่นซึ่งตรงกับความต้องการขององค์กรของคุณ
ในไปป์ไลน์ คุณสามารถสร้างการจัดกลุ่มเชิงตรรกะของกิจกรรมที่ทํางานได้ ซึ่งอาจรวมถึงการเรียกกระแสข้อมูลเพื่อล้างและเตรียมข้อมูลของคุณ แม้ว่าจะมีฟังก์ชันการทํางานบางอย่างที่ทับซ้อนกันระหว่างทั้งสอง แต่ตัวเลือกของคุณขึ้นอยู่กับว่าคุณต้องการความสามารถเต็มรูปแบบของไปป์ไลน์หรือสามารถใช้ความสามารถที่ง่ายกว่าของกระแสข้อมูลได้ สําหรับข้อมูลเพิ่มเติม โปรดดู คู่มือการตัดสินใจ Fabric
แปลงข้อมูลด้วยกระแสข้อมูล
ทําตามขั้นตอนเหล่านี้เพื่อตั้งค่ากระแสข้อมูลของคุณ
สร้างกระแสข้อมูล
เลือกพื้นที่ทํางานที่เปิดใช้งาน Fabric ของคุณ จากนั้นเลือก สร้าง และเลือก กระแสข้อมูล Gen2
ในตัวแก้ไขกระแสข้อมูล ให้เลือก นําเข้าจาก SQL Server
รับ ข้อมูล
ในกล่องโต้ตอบ เชื่อมต่อกับแหล่งข้อมูล ให้ป้อนรายละเอียดฐานข้อมูล Azure SQL ของคุณ แล้วเลือก ถัดไป ใช้ฐานข้อมูลตัวอย่าง AdventureWorksLT จากข้อกําหนดเบื้องต้น
เลือกข้อมูลที่จะแปลง เช่น SalesLT.Customer และใช้ เลือกตารางที่เกี่ยวข้อง เพื่อรวมตารางที่เกี่ยวข้อง จากนั้น เลือก สร้าง
แปลงข้อมูลของคุณ
เลือก มุมมองไดอะแกรม จากแถบสถานะหรือเมนู มุมมอง ในตัวแก้ไข Power Query
เลือกคิวรีลูกค้า SalesLT ของคุณขวา หรือเลือกจุดไข่ปลาแนวตั้งทางด้านขวาของคิวรี จากนั้นเลือก ผสานคิวรี
กําหนดค่าการผสานด้วย SalesLTOrderHeader เป็นตารางด้านขวา CustomerID เป็นคอลัมน์การรวม และ Left outer เป็นชนิดการรวม เลือก ตกลง
เพิ่มปลายทางข้อมูลโดยการเลือกสัญลักษณ์ฐานข้อมูลด้วยลูกศร เลือก ฐานข้อมูล Azure SQL เป็นชนิดปลายทาง
ระบุรายละเอียดสําหรับการเชื่อมต่อฐานข้อมูล Azure SQL ของคุณซึ่งจะเผยแพร่คิวรีผสาน ในตัวอย่างนี้ เราใช้ฐานข้อมูล AdventureWorksLT ที่เราใช้เป็นแหล่งข้อมูลสําหรับปลายทางด้วย
เลือกฐานข้อมูลเพื่อจัดเก็บข้อมูล และใส่ชื่อตาราง จากนั้นเลือก ถัดไป
ยอมรับการตั้งค่าเริ่มต้นในกล่องโต้ตอบเลือกการตั้งค่าปลายทาง แล้วเลือกบันทึกการตั้งค่า
เลือก เผยแพร่ ในตัวแก้ไขกระแสข้อมูล เพื่อเผยแพร่กระแสข้อมูล
ย้ายข้อมูลด้วยไปป์ไลน์
เมื่อคุณได้สร้างกระแสข้อมูล Gen2 แล้ว คุณสามารถดําเนินการกับกระแสข้อมูลในไปป์ไลน์ได้ ในตัวอย่างนี้ คุณคัดลอกข้อมูลที่สร้างขึ้นจากกระแสข้อมูลลงในรูปแบบข้อความในบัญชี Azure Blob Storage
สร้างไปป์ไลน์ใหม่
ในพื้นที่ทํางานของคุณ ให้เลือก สร้าง จากนั้นเลือก ไปป์ไลน์
ตั้งชื่อไปป์ไลน์ของคุณแล้วเลือก สร้าง
กําหนดค่ากระแสข้อมูลของคุณ
เพิ่มกิจกรรมกระแสข้อมูลไปยังไปป์ไลน์ของคุณโดยเลือก กระแสข้อมูล ในแท็บ กิจกรรม
เลือกกระแสข้อมูลบนพื้นที่ทํางานไปป์ไลน์ ไปที่แท็บ การตั้งค่า และเลือกกระแสข้อมูลที่คุณสร้างไว้ก่อนหน้านี้
เลือก บันทึก จากนั้น เรียกใช้ เพื่อเติมข้อมูลตารางคิวรีที่ผสาน
เพิ่มกิจกรรมการคัดลอก
เลือก คัดลอกข้อมูลบนพื้นที่ทํางาน หรือใช้ผู้ช่วยคัดลอกจากแท็บ กิจกรรม
เลือก ฐานข้อมูล Azure SQL เป็นแหล่งข้อมูล และเลือก ถัดไป
สร้างการเชื่อมต่อไปยังแหล่งข้อมูลของคุณโดยการเลือก สร้างการเชื่อมต่อใหม่ กรอกข้อมูลการเชื่อมต่อที่จําเป็นบนแผงและป้อน AdventureWorksLT สําหรับฐานข้อมูลที่เราสร้างคิวรีผสานในกระแสข้อมูล จากนั้นเลือก ถัดไป
เลือกตารางที่คุณสร้างขึ้นในขั้นตอนกระแสข้อมูลก่อนหน้านี้ จากนั้นเลือก ถัดไป
สําหรับปลายทางของคุณ ให้เลือก Azure Blob Storage
จากนั้นเลือก ถัดไป
สร้างการเชื่อมต่อไปยังปลายทางของคุณโดยการเลือก สร้างการเชื่อมต่อใหม่ ระบุรายละเอียดสําหรับการเชื่อมต่อของคุณ จากนั้นเลือก ถัดไป
เลือก เส้นทางโฟลเดอร์
และใส่ชื่อไฟล์ จากนั้นเลือก ถัดไป
เลือก ถัดไป อีกครั้งเพื่อยอมรับรูปแบบไฟล์เริ่มต้น ตัวคั่นคอลัมน์ ตัวคั่นแถว และชนิดการบีบอัด โดยเลือกรวมส่วนหัว
เสร็จสิ้นการตั้งค่าของคุณ จากนั้นให้ตรวจสอบและเลือก บันทึก + เรียกใช้ เพื่อเสร็จสิ้นกระบวนการ
ออกแบบไปป์ไลน์ของคุณและบันทึกเพื่อเรียกใช้และโหลดข้อมูล
หากต้องการเรียกใช้กิจกรรม
คัดลอก หลังจากกิจกรรม กระแสข้อมูลให้ลากจากกิจกรรม สําเร็จแล้ว กระแสข้อมูล ไปยังกิจกรรมคัดลอก กิจกรรม คัดลอก จะทํางานเฉพาะหลังจากที่กิจกรรม กระแสข้อมูล ประสบความสําเร็จเท่านั้น
เลือก บันทึก เพื่อบันทึกไปป์ไลน์ของคุณ จากนั้นเลือก เรียกใช้ เพื่อเรียกใช้ไปป์ไลน์ของคุณและโหลดข้อมูลของคุณ
กําหนดการดําเนินการไปป์ไลน์
เมื่อคุณพัฒนาและทดสอบไปป์ไลน์ของคุณเสร็จแล้ว คุณสามารถกําหนดเวลาให้ทํางานโดยอัตโนมัติได้
บนแท็บ หน้าแรก ของหน้าต่างตัวแก้ไขไปป์ไลน์
ให้เลือก กําหนดเวลา
กําหนดค่ากําหนดการตามความจําเป็น ตัวอย่างที่นี่จัดกําหนดการไปป์ไลน์ให้ทํางานทุกวันเวลา 20:00 น. จนถึงสิ้นปี
เนื้อหาที่เกี่ยวข้อง
ตัวอย่างนี้แสดงวิธีการสร้างและกําหนดค่ากระแสข้อมูล Gen2 เพื่อสร้างคิวรีแบบผสานและเก็บไว้ในฐานข้อมูล Azure SQL จากนั้นคัดลอกข้อมูลจากฐานข้อมูลลงในไฟล์ข้อความใน Azure Blob Storage คุณได้เรียนรู้วิธีการ:
- สร้างกระแสข้อมูล
- แปลงข้อมูลด้วยกระแสข้อมูล
- สร้างไปป์ไลน์โดยใช้กระแสข้อมูล
- จัดลําดับการดําเนินการของขั้นตอนในไปป์ไลน์
- คัดลอกข้อมูลด้วยคัดลอกผู้ช่วย
- เรียกใช้และกําหนดเวลาไปป์ไลน์ของคุณ
ถัดไป ล่วงหน้าเพื่อเรียนรู้เพิ่มเติมเกี่ยวกับการตรวจสอบการเรียกใช้ไปป์ไลน์ของคุณ