แชร์ผ่าน


โมดูล 1: สร้างไปป์ไลน์ด้วย Data Factory

โมดูลนี้ใช้เวลา 10 นาที การนําเข้าข้อมูลดิบจากที่จัดเก็บต้นทางลงในตารางทองแดงของ data Lakehouse โดยใช้กิจกรรมคัดลอกในไปป์ไลน์

ขั้นตอนระดับสูงในโมดูล 1 มีดังนี้:

  1. สร้างไปป์ไลน์ข้อมูล
  2. ใช้ กิจกรรมการคัดลอก ในไปป์ไลน์เพื่อโหลดข้อมูลตัวอย่างลงใน data Lakehouse

สร้างไปป์ไลน์ข้อมูล

  1. จําเป็นต้องมีบัญชีผู้เช่า Microsoft Fabric ที่มีการสมัครใช้งานที่ใช้งานอยู่ สร้างบัญชีฟรี

  2. ตรวจสอบให้แน่ใจว่า คุณมีพื้นที่ทํางานที่เปิดใช้งาน Microsoft Fabric: สร้างพื้นที่ทํางาน

  3. ลงชื่อเข้าใช้ Power BI

  4. เลือกไอคอน Power BI เริ่มต้นที่ด้านล่างซ้ายของหน้าจอ และสลับไปยังประสบการณ์ Data Factory

    Screenshot showing the selection of the Data Factory experience.

  5. เลือก ไปป์ไลน์ ข้อมูลและใส่ชื่อไปป์ไลน์ จากนั้น เลือก สร้าง

    Screenshot of the Data Factory start page with the button to create a new data pipeline selected.

    Screenshot showing the dialog to give the new pipeline a name.

ใช้กิจกรรมการคัดลอกในไปป์ไลน์เพื่อโหลดข้อมูลตัวอย่างไปยัง data Lakehouse

ขั้นตอนที่ 1: ใช้ผู้ช่วยคัดลอกเพื่อกําหนดค่ากิจกรรมการคัดลอก

เลือก คัดลอกข้อมูล เพื่อเปิดเครื่องมือตัวช่วยคัดลอก

Screenshot showing the selection of the Copy data activity from the new pipeline start page.

ขั้นตอนที่ 2: กําหนดการตั้งค่าของคุณในตัวช่วยสร้างการคัดลอก

  1. กล่องโต้ตอบ คัดลอกข้อมูล จะแสดงด้วยขั้นตอนแรก เลือกแหล่งข้อมูล ที่เน้น เลื่อนลงถ้าจําเป็นไปยังส่วนแหล่งข้อมูล และเลือกชนิดแหล่งข้อมูล Azure Blob Storage จากนั้นเลือก ถัดไป

    Screenshot showing the selection of the Azure Blob Storage data source type in the copy assistant on the Choose data source tab.

  2. ในขั้นตอนถัดไป เลือกสร้างการเชื่อมต่อใหม่ แล้วใส่ URL สําหรับที่เก็บข้อมูล blob ที่โฮสต์ข้อมูลตัวอย่างที่ระบุไว้สําหรับบทช่วยสอนนี้ ที่https://nyctaxisample.blob.core.windows.net/sample ชนิดของการรับรองความถูกต้องเป็นแบบไม่ระบุชื่อ เลือก ถัดไป หลังจากใส่ URL

    Screenshot showing the creation of a new Azure Blob Storage connection with the URL for the sample data in the tutorial.

  3. ขั้นตอนเชื่อมต่อไปยังแหล่งข้อมูลปรากฏขึ้น และในตอนแรก คุณจะเห็นข้อผิดพลาด ไม่สามารถแสดงรายการแฟ้ม เนื่องจากสิทธิ์ได้ถูกมอบให้กับโฟลเดอร์ตัวอย่างในที่เก็บข้อมูล blob เท่านั้น ใส่ชื่อโฟลเดอร์ ตัวอย่าง และเลือก ลองอีกครั้ง

    Screenshot showing the Unable to list files error with the folder name Sample provided.

    หมายเหตุ

    โฟลเดอร์ที่เก็บข้อมูล blob คํานึงถึงตัวพิมพ์ใหญ่-เล็กทั้งหมด

  4. เบราว์เซอร์ที่เก็บข้อมูล blob ปรากฏขึ้นถัดไป เลือก ไฟล์ NYC-Taxi-Green-2015-01.parquet และรอให้ตัวอย่างข้อมูลปรากฏขึ้น จากนั้นเลือก ถัดไป

    Screenshot showing the preview data for the NYC-Taxi-Green-2015-01.parquet file.

  5. สําหรับขั้นตอน เลือกปลายทางข้อมูล ของผู้ช่วยคัดลอก ให้เลือกเลคเฮ้าส์ แล้วเลือก ถัดไป

    Screenshot showing the selection of the Lakehouse destination on the Choose data destination tab of the Copy data assistant.

  6. เลือก สร้างเลคเฮ้าส์ ใหม่บนหน้าการกําหนดค่าปลายทางข้อมูลที่ปรากฏขึ้น และป้อนชื่อสําหรับ Lakehouse ใหม่ จากนั้นเลือก ถัดไป อีกครั้ง

    Screenshot showing the data destination configuration page of the Copy assistant, choosing the Create new Lakehouse option and providing a Lakehouse name.

  7. ตอนนี้ กําหนดค่ารายละเอียดปลายทางของ Lakehouse ของคุณบนหน้าเลือกและแมปไปยังเส้นทางโฟลเดอร์หรือตาราง เลือกตารางสําหรับโฟลเดอร์รูท ใส่ชื่อตาราง และเลือกการดําเนินการเขียนทับ อย่าทําเครื่องหมายใน ช่องเปิดใช้งานพาร์ติชัน ที่ปรากฏขึ้นหลังจากที่คุณเลือก การดําเนินการเขียนทับ ตาราง

    Screenshot showing the Connect to data destination tab of the Copy data assistant, on the Select and map to folder path or table step.

  8. สุดท้าย บนหน้า ตรวจสอบ + บันทึก ของตัวช่วยคัดลอกข้อมูล ให้ตรวจสอบการกําหนดค่า สําหรับบทช่วยสอนนี้ ให้ยกเลิกการเลือกกล่องกา เครื่องหมาย เริ่มการถ่ายโอนข้อมูลทันที เนื่องจากเราเรียกใช้กิจกรรมด้วยตนเองในขั้นตอนถัดไป จากนั้นเลือก ตกลง

    Screenshot showing the Copy data assistant on the Review + save page.

ขั้นตอนที่ 3: เรียกใช้และดูผลลัพธ์ของกิจกรรมการคัดลอกของคุณ

  1. เลือก แท็บเรียกใช้ ในตัวแก้ไขไปป์ไลน์ จากนั้นเลือกปุ่ม เรียกใช้ จากนั้น บันทึกและเรียกใช้ ที่พร้อมท์เพื่อเรียกใช้กิจกรรมการคัดลอก

    Screenshot showing the pipeline Run tab with the Run button highlighted.

    Screenshot showing the Save and run dialog with the Save and run button highlighted.

  2. คุณสามารถตรวจสอบการเรียกใช้และตรวจสอบผลลัพธ์บนแท็บ ผลลัพธ์ ด้านล่างพื้นที่ทํางานของไปป์ไลน์ เลือกปุ่มรายละเอียดการเรียกใช้ (ไอคอน "แว่นตา" ที่ปรากฏขึ้นเมื่อคุณโฮเวอร์เหนือการเรียกใช้ไปป์ไลน์) เพื่อดูรายละเอียดการเรียกใช้

    Screenshot showing the run details button in the pipeline Output tab.

  3. รายละเอียดการเรียกใช้แสดง 1,508,501 แถวที่อ่านและเขียน

    Screenshot of the Copy data details for the pipeline run.

  4. ขยายส่วนการแบ่งระยะเวลาเพื่อดูระยะเวลาของแต่ละขั้นตอนของกิจกรรมการคัดลอก หลังจากตรวจทานรายละเอียดการคัดลอกแล้ว ให้เลือก ปิด

    Screenshot showing the duration breakdown of the Copy activity run.

ในมอดูลแรกนี้สําหรับบทช่วยสอนแบบ end-to-end ของเราสําหรับการรวมข้อมูลครั้งแรกของคุณโดยใช้ Data Factory ใน Microsoft Fabric คุณได้เรียนรู้วิธีการ:

  • สร้างไปป์ไลน์ข้อมูล
  • เพิ่มกิจกรรมคัดลอกไปยังไปป์ไลน์ของคุณ
  • ใช้ข้อมูลตัวอย่างและสร้าง data Lakehouse เพื่อจัดเก็บข้อมูลลงในตารางใหม่
  • เรียกใช้ไปป์ไลน์และดูรายละเอียดและการแบ่งระยะเวลา

ไปต่อยังส่วนถัดไปตอนนี้เพื่อสร้างกระแสข้อมูลของคุณ