แชร์ผ่าน


เริ่มต้นใช้งานด่วน: สร้างโซลูชันเพื่อย้ายและแปลงข้อมูล

ในการเริ่มต้นใช้งานด่วนนี้ คุณจะได้เรียนรู้วิธีที่กระแสข้อมูลและไปป์ไลน์ทํางานร่วมกันเพื่อสร้างโซลูชัน Data Factory ที่มีประสิทธิภาพ คุณจะล้างข้อมูลด้วยกระแสข้อมูลและย้ายด้วยไปป์ไลน์

ข้อกําหนดเบื้องต้น

ก่อนที่คุณจะเริ่ม คุณต้อง:

เปรียบเทียบกระแสข้อมูลและไปป์ไลน์

Dataflow Gen2 มีอินเทอร์เฟซแบบ low-code พร้อมข้อมูล 300+ รายการและการแปลงโดยใช้ AI คุณสามารถล้าง เตรียม และแปลงข้อมูลได้อย่างง่ายดายด้วยความยืดหยุ่น ไปป์ไลน์มีความสามารถในการประสานข้อมูลที่หลากหลายเพื่อเขียนเวิร์กโฟลว์ข้อมูลที่ยืดหยุ่นซึ่งตรงกับความต้องการขององค์กรของคุณ

ในไปป์ไลน์ คุณสามารถสร้างการจัดกลุ่มเชิงตรรกะของกิจกรรมที่ทํางานได้ ซึ่งอาจรวมถึงการเรียกกระแสข้อมูลเพื่อล้างและเตรียมข้อมูลของคุณ แม้ว่าจะมีฟังก์ชันการทํางานบางอย่างที่ทับซ้อนกันระหว่างทั้งสอง แต่ตัวเลือกของคุณขึ้นอยู่กับว่าคุณต้องการความสามารถเต็มรูปแบบของไปป์ไลน์หรือสามารถใช้ความสามารถที่ง่ายกว่าของกระแสข้อมูลได้ สําหรับข้อมูลเพิ่มเติม โปรดดู คู่มือการตัดสินใจ Fabric

แปลงข้อมูลด้วยกระแสข้อมูล

ทําตามขั้นตอนเหล่านี้เพื่อตั้งค่ากระแสข้อมูลของคุณ

สร้างกระแสข้อมูล

  1. เลือกพื้นที่ทํางานที่เปิดใช้งาน Fabric ของคุณ จากนั้นเลือก สร้าง และเลือก กระแสข้อมูล Gen2

    สกรีนช็อตของการเริ่มต้นกระแสข้อมูล Gen2

  2. ในตัวแก้ไขกระแสข้อมูล ให้เลือก นําเข้าจาก SQL Server

    สกรีนช็อตของตัวแก้ไขกระแสข้อมูล

รับ ข้อมูล

  1. ในกล่องโต้ตอบ เชื่อมต่อกับแหล่งข้อมูล ให้ป้อนรายละเอียดฐานข้อมูล Azure SQL ของคุณ แล้วเลือก ถัดไป ใช้ฐานข้อมูลตัวอย่าง AdventureWorksLT จากข้อกําหนดเบื้องต้น

    สกรีนช็อตของการเชื่อมต่อกับฐานข้อมูล Azure SQL

  2. เลือกข้อมูลที่จะแปลง เช่น SalesLT.Customer และใช้ เลือกตารางที่เกี่ยวข้อง เพื่อรวมตารางที่เกี่ยวข้อง จากนั้น เลือก สร้าง

    สกรีนช็อตของการเลือกข้อมูลที่จะแปลง

แปลงข้อมูลของคุณ

  1. เลือก มุมมองไดอะแกรม จากแถบสถานะหรือเมนู มุมมอง ในตัวแก้ไข Power Query

    สกรีนช็อตของการเลือกมุมมองไดอะแกรม

  2. เลือกคิวรีลูกค้า SalesLT ของคุณขวา หรือเลือกจุดไข่ปลาแนวตั้งทางด้านขวาของคิวรี จากนั้นเลือก ผสานคิวรี

    สกรีนช็อตของตัวเลือก ผสานคิวรี

  3. กําหนดค่าการผสานด้วย SalesLTOrderHeader เป็นตารางด้านขวา CustomerID เป็นคอลัมน์การรวม และ Left outer เป็นชนิดการรวม เลือก ตกลง

    สกรีนช็อตของหน้าจอการกําหนดค่าผสาน

  4. เพิ่มปลายทางข้อมูลโดยการเลือกสัญลักษณ์ฐานข้อมูลด้วยลูกศร เลือก ฐานข้อมูล Azure SQL เป็นชนิดปลายทาง

    สกรีนช็อตของปุ่ม เพิ่มปลายทางข้อมูล

  5. ระบุรายละเอียดสําหรับการเชื่อมต่อฐานข้อมูล Azure SQL ของคุณซึ่งจะเผยแพร่คิวรีผสาน ในตัวอย่างนี้ เราใช้ฐานข้อมูล AdventureWorksLT ที่เราใช้เป็นแหล่งข้อมูลสําหรับปลายทางด้วย

    สกรีนช็อตของกล่องโต้ตอบเชื่อมต่อกับปลายทางข้อมูล

  6. เลือกฐานข้อมูลเพื่อจัดเก็บข้อมูล และใส่ชื่อตาราง จากนั้นเลือก ถัดไป

    สกรีนช็อตของหน้าต่าง เลือกเป้าหมายปลายทาง

  7. ยอมรับการตั้งค่าเริ่มต้นในกล่องโต้ตอบเลือกการตั้งค่าปลายทาง แล้วเลือกบันทึกการตั้งค่า

    สกรีนช็อตของกล่องโต้ตอบ เลือกการตั้งค่าปลายทาง

  8. เลือก เผยแพร่ ในตัวแก้ไขกระแสข้อมูล เพื่อเผยแพร่กระแสข้อมูล

    สกรีนช็อตที่เน้นปุ่ม เผยแพร่ บนตัวแก้ไข dataflow gen2

ย้ายข้อมูลด้วยไปป์ไลน์

เมื่อคุณได้สร้างกระแสข้อมูล Gen2 แล้ว คุณสามารถดําเนินการกับกระแสข้อมูลในไปป์ไลน์ได้ ในตัวอย่างนี้ คุณคัดลอกข้อมูลที่สร้างขึ้นจากกระแสข้อมูลลงในรูปแบบข้อความในบัญชี Azure Blob Storage

สร้างไปป์ไลน์ใหม่

  1. ในพื้นที่ทํางานของคุณ ให้เลือก สร้าง จากนั้นเลือก ไปป์ไลน์

    สกรีนช็อตของการสร้างไปป์ไลน์ใหม่

  2. ตั้งชื่อไปป์ไลน์ของคุณแล้วเลือก สร้าง

    สกรีนช็อตที่แสดงพรอมต์การสร้างไปป์ไลน์ใหม่ที่มีชื่อไปป์ไลน์ตัวอย่าง

กําหนดค่ากระแสข้อมูลของคุณ

  1. เพิ่มกิจกรรมกระแสข้อมูลไปยังไปป์ไลน์ของคุณโดยเลือก กระแสข้อมูล ในแท็บ กิจกรรม

    สกรีนช็อตของการเพิ่มกิจกรรมกระแสข้อมูล

  2. เลือกกระแสข้อมูลบนพื้นที่ทํางานไปป์ไลน์ ไปที่แท็บ การตั้งค่า และเลือกกระแสข้อมูลที่คุณสร้างไว้ก่อนหน้านี้

    สกรีนช็อตของการเลือกกระแสข้อมูล

  3. เลือก บันทึก จากนั้น เรียกใช้ เพื่อเติมข้อมูลตารางคิวรีที่ผสาน

    สกรีนช็อตที่แสดงตําแหน่งที่จะเลือกเรียกใช้

เพิ่มกิจกรรมการคัดลอก

  1. เลือก คัดลอกข้อมูลบนพื้นที่ทํางาน หรือใช้ผู้ช่วยคัดลอกจากแท็บ กิจกรรม

    สกรีนช็อตที่แสดงสองวิธีในการเข้าถึงตัวช่วยสร้างสําเนา

  2. เลือก ฐานข้อมูล Azure SQL เป็นแหล่งข้อมูล และเลือก ถัดไป

    สกรีนช็อตที่แสดงตําแหน่งที่จะเลือกแหล่งข้อมูล

  3. สร้างการเชื่อมต่อไปยังแหล่งข้อมูลของคุณโดยการเลือก สร้างการเชื่อมต่อใหม่ กรอกข้อมูลการเชื่อมต่อที่จําเป็นบนแผงและป้อน AdventureWorksLT สําหรับฐานข้อมูลที่เราสร้างคิวรีผสานในกระแสข้อมูล จากนั้นเลือก ถัดไป

    สกรีนช็อตที่แสดงตําแหน่งที่จะสร้างการเชื่อมต่อใหม่

  4. เลือกตารางที่คุณสร้างขึ้นในขั้นตอนกระแสข้อมูลก่อนหน้านี้ จากนั้นเลือก ถัดไป

    สกรีนช็อตที่แสดงวิธีการเลือกจากตารางที่พร้อมใช้งาน

  5. สําหรับปลายทางของคุณ ให้เลือก Azure Blob Storage จากนั้นเลือก ถัดไป

    สกรีนช็อตที่แสดงปลายทางข้อมูล Azure Blob Storage

  6. สร้างการเชื่อมต่อไปยังปลายทางของคุณโดยการเลือก สร้างการเชื่อมต่อใหม่ ระบุรายละเอียดสําหรับการเชื่อมต่อของคุณ จากนั้นเลือก ถัดไป

    สกรีนช็อตที่แสดงวิธีการสร้างการเชื่อมต่อ

  7. เลือก เส้นทางโฟลเดอร์ และใส่ชื่อไฟล์ จากนั้นเลือก ถัดไป

    สกรีนช็อตที่แสดงวิธีการเลือกเส้นทางโฟลเดอร์และชื่อไฟล์

  8. เลือก ถัดไป อีกครั้งเพื่อยอมรับรูปแบบไฟล์เริ่มต้น ตัวคั่นคอลัมน์ ตัวคั่นแถว และชนิดการบีบอัด โดยเลือกรวมส่วนหัว

    สกรีนช็อตที่แสดงตัวเลือกการกําหนดค่าสําหรับไฟล์ในที่เก็บข้อมูล Azure Blob

  9. เสร็จสิ้นการตั้งค่าของคุณ จากนั้นให้ตรวจสอบและเลือก บันทึก + เรียกใช้ เพื่อเสร็จสิ้นกระบวนการ

    สกรีนช็อตที่แสดงวิธีการตรวจสอบการตั้งค่าการคัดลอกข้อมูล

ออกแบบไปป์ไลน์ของคุณและบันทึกเพื่อเรียกใช้และโหลดข้อมูล

  1. หากต้องการเรียกใช้กิจกรรม คัดลอก หลังจากกิจกรรม กระแสข้อมูล ให้ลากจากกิจกรรม สําเร็จแล้ว กระแสข้อมูล ไปยังกิจกรรม คัดลอก กิจกรรม คัดลอก จะทํางานเฉพาะหลังจากที่กิจกรรม กระแสข้อมูล ประสบความสําเร็จเท่านั้น

    สกรีนช็อตที่แสดงวิธีการทําให้การเรียกใช้กระแสข้อมูลเกิดขึ้นหลังจากกิจกรรมการคัดลอก

  2. เลือก บันทึก เพื่อบันทึกไปป์ไลน์ของคุณ จากนั้นเลือก เรียกใช้ เพื่อเรียกใช้ไปป์ไลน์ของคุณและโหลดข้อมูลของคุณ

    สกรีนช็อตที่แสดงตําแหน่งที่จะเลือกบันทึกและเรียกใช้

กําหนดการดําเนินการไปป์ไลน์

เมื่อคุณพัฒนาและทดสอบไปป์ไลน์ของคุณเสร็จแล้ว คุณสามารถกําหนดเวลาให้ทํางานโดยอัตโนมัติได้

  1. บนแท็บ หน้าแรก ของหน้าต่างตัวแก้ไขไปป์ไลน์ ให้เลือก กําหนดเวลา

    สกรีนช็อตของปุ่ม กําหนดการ บนเมนูของแท็บ หน้าแรก ในตัวแก้ไขไปป์ไลน์

  2. กําหนดค่ากําหนดการตามความจําเป็น ตัวอย่างที่นี่จัดกําหนดการไปป์ไลน์ให้ทํางานทุกวันเวลา 20:00 น. จนถึงสิ้นปี

    สกรีนช็อตที่แสดงการกําหนดค่ากําหนดการสําหรับไปป์ไลน์เพื่อเรียกใช้ทุกวันเวลา 20:00 น. จนถึงสิ้นปี

ตัวอย่างนี้แสดงวิธีการสร้างและกําหนดค่ากระแสข้อมูล Gen2 เพื่อสร้างคิวรีแบบผสานและเก็บไว้ในฐานข้อมูล Azure SQL จากนั้นคัดลอกข้อมูลจากฐานข้อมูลลงในไฟล์ข้อความใน Azure Blob Storage คุณได้เรียนรู้วิธีการ:

  • สร้างกระแสข้อมูล
  • แปลงข้อมูลด้วยกระแสข้อมูล
  • สร้างไปป์ไลน์โดยใช้กระแสข้อมูล
  • จัดลําดับการดําเนินการของขั้นตอนในไปป์ไลน์
  • คัดลอกข้อมูลด้วยคัดลอกผู้ช่วย
  • เรียกใช้และกําหนดเวลาไปป์ไลน์ของคุณ

ถัดไป ล่วงหน้าเพื่อเรียนรู้เพิ่มเติมเกี่ยวกับการตรวจสอบการเรียกใช้ไปป์ไลน์ของคุณ