โมดูล 1: สร้างไปป์ไลน์ด้วย Data Factory
โมดูลนี้ใช้เวลา 10 นาที การนําเข้าข้อมูลดิบจากที่จัดเก็บต้นทางลงในตารางทองแดงของ data Lakehouse โดยใช้กิจกรรมคัดลอกในไปป์ไลน์
ขั้นตอนระดับสูงในโมดูล 1 มีดังนี้:
- สร้างไปป์ไลน์ข้อมูล
- ใช้ กิจกรรมการคัดลอก ในไปป์ไลน์เพื่อโหลดข้อมูลตัวอย่างลงใน data Lakehouse
สร้างไปป์ไลน์ข้อมูล
จําเป็นต้องมีบัญชีผู้เช่า Microsoft Fabric ที่มีการสมัครใช้งานที่ใช้งานอยู่ สร้างบัญชีฟรี
ตรวจสอบให้แน่ใจว่า คุณมีพื้นที่ทํางานที่เปิดใช้งาน Microsoft Fabric: สร้างพื้นที่ทํางาน
ลงชื่อเข้าใช้ Power BI
เลือกไอคอน Power BI เริ่มต้นที่ด้านล่างซ้ายของหน้าจอ และสลับไปยังประสบการณ์ Data Factory
เลือก ไปป์ไลน์ ข้อมูลและใส่ชื่อไปป์ไลน์ จากนั้น เลือก สร้าง
ใช้กิจกรรมการคัดลอกในไปป์ไลน์เพื่อโหลดข้อมูลตัวอย่างไปยัง data Lakehouse
ขั้นตอนที่ 1: ใช้ผู้ช่วยคัดลอกเพื่อกําหนดค่ากิจกรรมการคัดลอก
เลือก คัดลอกข้อมูล เพื่อเปิดเครื่องมือตัวช่วยคัดลอก
ขั้นตอนที่ 2: กําหนดการตั้งค่าของคุณในตัวช่วยสร้างการคัดลอก
กล่องโต้ตอบ คัดลอกข้อมูล จะแสดงด้วยขั้นตอนแรก เลือกแหล่งข้อมูล ที่เน้น เลื่อนลงถ้าจําเป็นไปยังส่วนแหล่งข้อมูล และเลือกชนิดแหล่งข้อมูล Azure Blob Storage จากนั้นเลือก ถัดไป
ในขั้นตอนถัดไป เลือกสร้างการเชื่อมต่อใหม่ แล้วใส่ URL สําหรับที่เก็บข้อมูล blob ที่โฮสต์ข้อมูลตัวอย่างที่ระบุไว้สําหรับบทช่วยสอนนี้ ที่
https://nyctaxisample.blob.core.windows.net/sample
ชนิดของการรับรองความถูกต้องเป็นแบบไม่ระบุชื่อ เลือก ถัดไป หลังจากใส่ URLขั้นตอนเชื่อมต่อไปยังแหล่งข้อมูลปรากฏขึ้น และในตอนแรก คุณจะเห็นข้อผิดพลาด ไม่สามารถแสดงรายการแฟ้ม เนื่องจากสิทธิ์ได้ถูกมอบให้กับโฟลเดอร์ตัวอย่างในที่เก็บข้อมูล blob เท่านั้น ใส่ชื่อโฟลเดอร์ ตัวอย่าง และเลือก ลองอีกครั้ง
หมายเหตุ
โฟลเดอร์ที่เก็บข้อมูล blob คํานึงถึงตัวพิมพ์ใหญ่-เล็กทั้งหมด
เบราว์เซอร์ที่เก็บข้อมูล blob ปรากฏขึ้นถัดไป เลือก ไฟล์ NYC-Taxi-Green-2015-01.parquet และรอให้ตัวอย่างข้อมูลปรากฏขึ้น จากนั้นเลือก ถัดไป
สําหรับขั้นตอน เลือกปลายทางข้อมูล ของผู้ช่วยคัดลอก ให้เลือกเลคเฮ้าส์ แล้วเลือก ถัดไป
เลือก สร้างเลคเฮ้าส์ ใหม่บนหน้าการกําหนดค่าปลายทางข้อมูลที่ปรากฏขึ้น และป้อนชื่อสําหรับ Lakehouse ใหม่ จากนั้นเลือก ถัดไป อีกครั้ง
ตอนนี้ กําหนดค่ารายละเอียดปลายทางของ Lakehouse ของคุณบนหน้าเลือกและแมปไปยังเส้นทางโฟลเดอร์หรือตาราง เลือกตารางสําหรับโฟลเดอร์รูท ใส่ชื่อตาราง และเลือกการดําเนินการเขียนทับ อย่าทําเครื่องหมายใน ช่องเปิดใช้งานพาร์ติชัน ที่ปรากฏขึ้นหลังจากที่คุณเลือก การดําเนินการเขียนทับ ตาราง
สุดท้าย บนหน้า ตรวจสอบ + บันทึก ของตัวช่วยคัดลอกข้อมูล ให้ตรวจสอบการกําหนดค่า สําหรับบทช่วยสอนนี้ ให้ยกเลิกการเลือกกล่องกา เครื่องหมาย เริ่มการถ่ายโอนข้อมูลทันที เนื่องจากเราเรียกใช้กิจกรรมด้วยตนเองในขั้นตอนถัดไป จากนั้นเลือก ตกลง
ขั้นตอนที่ 3: เรียกใช้และดูผลลัพธ์ของกิจกรรมการคัดลอกของคุณ
เลือก แท็บเรียกใช้ ในตัวแก้ไขไปป์ไลน์ จากนั้นเลือกปุ่ม เรียกใช้ จากนั้น บันทึกและเรียกใช้ ที่พร้อมท์เพื่อเรียกใช้กิจกรรมการคัดลอก
คุณสามารถตรวจสอบการเรียกใช้และตรวจสอบผลลัพธ์บนแท็บ ผลลัพธ์ ด้านล่างพื้นที่ทํางานของไปป์ไลน์ เลือกปุ่มรายละเอียดการเรียกใช้ (ไอคอน "แว่นตา" ที่ปรากฏขึ้นเมื่อคุณโฮเวอร์เหนือการเรียกใช้ไปป์ไลน์) เพื่อดูรายละเอียดการเรียกใช้
รายละเอียดการเรียกใช้แสดง 1,508,501 แถวที่อ่านและเขียน
ขยายส่วนการแบ่งระยะเวลาเพื่อดูระยะเวลาของแต่ละขั้นตอนของกิจกรรมการคัดลอก หลังจากตรวจทานรายละเอียดการคัดลอกแล้ว ให้เลือก ปิด
เนื้อหาที่เกี่ยวข้อง
ในมอดูลแรกนี้สําหรับบทช่วยสอนแบบ end-to-end ของเราสําหรับการรวมข้อมูลครั้งแรกของคุณโดยใช้ Data Factory ใน Microsoft Fabric คุณได้เรียนรู้วิธีการ:
- สร้างไปป์ไลน์ข้อมูล
- เพิ่มกิจกรรมคัดลอกไปยังไปป์ไลน์ของคุณ
- ใช้ข้อมูลตัวอย่างและสร้าง data Lakehouse เพื่อจัดเก็บข้อมูลลงในตารางใหม่
- เรียกใช้ไปป์ไลน์และดูรายละเอียดและการแบ่งระยะเวลา
ไปต่อยังส่วนถัดไปตอนนี้เพื่อสร้างกระแสข้อมูลของคุณ