แชร์ผ่าน


ตัวควบคุมแหล่งข้อมูลของสมุดบันทึกและการปรับใช้

บทความนี้อธิบายวิธีการทํางานของการรวม Git และไปป์ไลน์การปรับใช้สําหรับสมุดบันทึกใน Microsoft Fabric เรียนรู้วิธีการตั้งค่าการเชื่อมต่อกับที่เก็บของคุณ จัดการสมุดบันทึกของคุณ และปรับใช้ในสภาพแวดล้อมที่แตกต่างกัน

การรวมสมุดบันทึก Git

สมุดบันทึกผ้านําเสนอการรวม Git สําหรับการควบคุมแหล่งข้อมูลด้วย Azure DevOps ด้วยการรวม Git คุณสามารถสํารองและกําหนดเวอร์ชันของสมุดบันทึกของคุณ แปลงกลับเป็นขั้นตอนก่อนหน้าได้ตามต้องการ ทํางานร่วมกัน หรือทํางานคนเดียวโดยใช้สาขา Git และจัดการวงจรชีวิตเนื้อหาของสมุดบันทึกของคุณทั้งหมดภายใน Fabric

หมายเหตุ

เริ่มจากเดือนตุลาคม 2024 การรวม git ของสมุดบันทึกสนับสนุนการคงความสัมพันธ์ของการแมปของสภาพแวดล้อมที่แนบมาเมื่อซิงค์กับพื้นที่ทํางานใหม่ ซึ่งหมายความว่าเมื่อคุณยอมรับสมุดบันทึกและสภาพแวดล้อมที่แนบร่วมกันกับ git repo และซิงค์กับพื้นที่ทํางานอื่น สมุดบันทึกและสภาพแวดล้อมที่สร้างขึ้นใหม่จะถูกผูกเข้าด้วยกัน การอัปเกรดนี้จะมีผลกระทบต่อสมุดบันทึกที่มีอยู่และสภาพแวดล้อมแบบขึ้นต่อกันที่มีการกําหนดเวอร์ชันใน git ID ทางกายภาพของสภาพแวดล้อมที่แนบมาในเนื้อหาเมตาดาต้าของสมุดบันทึกจะถูกแทนที่ด้วย ID ตรรกะ การเปลี่ยนแปลงจะปรากฏบนมุมมอง diff

ตั้งค่าการเชื่อมต่อ

จากการตั้งค่าพื้นที่ทํางานของคุณ คุณสามารถตั้งค่าการเชื่อมต่อไปยัง repo ของคุณเพื่อบันทึกและซิงค์การเปลี่ยนแปลงได้อย่างง่ายดาย หากต้องการตั้งค่าการเชื่อมต่อ โปรดดู เริ่มต้นใช้งานการรวม Git เมื่อเชื่อมต่อแล้ว รายการของคุณรวมถึงสมุดบันทึกจะปรากฏในแผงควบคุมแหล่งข้อมูล

สกรีนช็อตของแผงควบคุมแหล่งที่มาของพื้นที่ทํางาน

หลังจากที่คุณยอมรับอินสแตนซ์ของสมุดบันทึกไปยังที่เก็บ Git เรียบร้อยแล้ว คุณจะเห็นโครงสร้างโฟลเดอร์สมุดบันทึกในที่เก็บ

ขณะนี้คุณสามารถดําเนินการในอนาคตได้ เช่น สร้างคําขอดึงข้อมูล

การแสดงสมุดบันทึกใน Git

รูปต่อไปนี้เป็นตัวอย่างของโครงสร้างไฟล์ของรายการสมุดบันทึกแต่ละรายการในที่เก็บ:

สกรีนช็อตของโครงสร้างไฟล์ Git repo ของสมุดบันทึก

เมื่อคุณบันทึกรายการสมุดบันทึกไปยังที่เก็บ Git รหัสสมุดบันทึกจะถูกแปลงเป็นรูปแบบซอร์สโค้ด แทนที่จะเป็นไฟล์ .ipynb มาตรฐาน ตัวอย่างเช่น สมุดบันทึก PySpark จะแปลงเป็นไฟล์ notebook-content.py วิธีนี้ช่วยให้สามารถตรวจสอบโค้ดได้ง่ายขึ้นโดยใช้คุณลักษณะ diff ที่มีอยู่ภายใน

ในไฟล์แหล่งข้อมูลเนื้อหารายการ เมตาดาต้า (รวมถึง lakehouse ค่าเริ่มต้นและสภาพแวดล้อมที่แนบมา) เซลล์ Markdown และเซลล์โค้ดจะถูกเก็บรักษาและโดดเด่น วิธีการนี้สนับสนุนการกู้คืนที่แม่นยําเมื่อคุณซิงค์กลับไปยังพื้นที่ทํางาน Fabric

ไม่มีเอาต์พุตเซลล์ของสมุดบันทึกเมื่อซิงค์กับ Git

ภาพหน้าจอของรูปแบบเนื้อหาที่เก็บ Git ของสมุดบันทึก

หมายเหตุ

  • ในขณะนี้ ไฟล์ใน แหล่งข้อมูล สมุดบันทึกไม่ได้มอบหมายให้กับที่เก็บ บันทึกไฟล์เหล่านี้ได้รับการสนับสนุนในรุ่นถัดไป
  • เราขอแนะนําให้คุณจัดการสมุดบันทึกและสภาพแวดล้อมที่ขึ้นต่อกันในพื้นที่ทํางานเดียวกัน และใช้ git เพื่อควบคุมทั้งรายการสมุดบันทึกและ สภาพแวดล้อม Fabric Git จะจัดการความสัมพันธ์ของการทําแผนที่เมื่อซิงค์สมุดบันทึกและสภาพแวดล้อมที่แนบมากับพื้นที่ทํางานใหม่
  • ID ของเลคเฮ้าส์เริ่มต้นยังคงอยู่ในสมุดบันทึกเมื่อคุณซิงค์จาก repo ไปยังพื้นที่ทํางาน Fabric ถ้าคุณบันทึกสมุดบันทึกที่มี lakehouse เริ่มต้น คุณต้องอ้างอิงรายการ lakehouse ที่สร้างขึ้นใหม่ด้วยตนเอง สําหรับข้อมูลเพิ่มเติม ดู การรวมของ Lakehouse Git

สมุดบันทึกในไปป์ไลน์การปรับใช้

คุณยังสามารถใช้ไปป์ไลน์การปรับใช้เพื่อปรับใช้รหัสสมุดบันทึกของคุณในสภาพแวดล้อมที่แตกต่างกัน เช่น การพัฒนา การทดสอบ และการผลิต คุณลักษณะนี้สามารถช่วยให้คุณปรับปรุงกระบวนการพัฒนาของคุณ ตรวจสอบให้แน่ใจว่ามีคุณภาพและความสม่ําเสมอ และลดข้อผิดพลาดด้วยตนเองด้วยการดําเนินงานที่มีน้ําหนักเบาและมีรหัสต่ํา คุณยังสามารถใช้กฎการปรับใช้เพื่อกําหนดลักษณะการทํางานของสมุดบันทึกของคุณเมื่อมีการปรับใช้ เช่น การเปลี่ยนเลคเฮาส์เริ่มต้นของสมุดบันทึก

หมายเหตุ

  • คุณกําลังใช้การออกแบบใหม่ของไปป์ไลน์การปรับใช้ในขณะนี้ สามารถเข้าถึง UI เก่าได้โดยการปิด 'ไปป์ไลน์การปรับใช้ใหม่'
  • เริ่มจากเดือนตุลาคม โน้ตบุ๊ค Fabric รองรับฟีเจอร์การผูกอัตโนมัติซึ่งจะผูกกับ lakehouse ค่าเริ่มต้นและสภาพแวดล้อมที่แนบมาภายในพื้นที่ทํางานเดียวกันเมื่อปรับใช้กับขั้นตอนถัดไป การเปลี่ยนแปลงจะมีผลกระทบต่อสมุดบันทึกที่มีอยู่ในไปป์ไลน์การปรับใช้
    • Lakehouse ค่าเริ่มต้นและสภาพแวดล้อมที่แนบมา (เมื่อรายการที่เกี่ยวข้องทั้งหมดอยู่ในพื้นที่ทํางานเดียวกัน) จะถูกแทนที่ด้วยรายการที่สร้างขึ้นใหม่ในพื้นที่ทํางานเป้าหมาย การเปลี่ยนแปลงเมตาดาต้าของสมุดบันทึกจะถูกเน้นในมุมมอง diff ในการปรับใช้ในขั้นตอนถัดไป
    • คุณสามารถตั้งค่ากฎการปรับใช้สําหรับเลคเฮ้าส์ตามค่าเริ่มต้นเพื่อแทนที่เลคเฮ้าส์ที่ผูกโดยอัตโนมัติได้
  • ปัญหาที่ทราบแล้ว: สถานะเซลล์แช่แข็งในสมุดบันทึกจะหายไปในระหว่างการปรับใช้ ขณะนี้เรากําลังทํางานที่เกี่ยวข้อง

ใช้ขั้นตอนต่อไปนี้เพื่อทําให้การปรับใช้สมุดบันทึกของคุณเสร็จสมบูรณ์โดยใช้ไปป์ไลน์การปรับใช้

  1. สร้างไปป์ไลน์การปรับใช้งานใหม่หรือเปิดไปป์ไลน์การปรับใช้งานที่มีอยู่ (สําหรับข้อมูลเพิ่มเติม โปรดดู เริ่มต้นใช้งานไปป์ไลน์การปรับใช้)

  2. กําหนดพื้นที่ทํางานให้กับขั้นตอนที่แตกต่างกันตามเป้าหมายการปรับใช้ของคุณ

  3. เลือก ดู และเปรียบเทียบรายการ รวมถึงสมุดบันทึกระหว่างขั้นตอนต่างๆ ดังที่แสดงในตัวอย่างต่อไปนี้ ป้ายที่เน้นจะแสดงจํานวนรายการที่เปลี่ยนแปลงระหว่างขั้นตอนก่อนหน้าและขั้นตอนปัจจุบัน

    สกรีนช็อตของสมุดบันทึกในไปป์ไลน์การปรับใช้

  4. เลือก ปรับใช้ เพื่อปรับใช้สมุดบันทึกของคุณในขั้นตอน การพัฒนา การทดสอบ และการผลิต

    สกรีนช็อตของรายการที่เลือกและปรับใช้

    สกรีนช็อตของ pop-up.png ปรับใช้เนื้อหา

  5. (ไม่บังคับ) คุณสามารถเลือก กฎ การปรับใช้ เพื่อสร้างกฎการปรับใช้สําหรับกระบวนการปรับใช้ได้ รายการกฎการปรับใช้อยู่ในขั้นตอนเป้าหมายสําหรับกระบวนการปรับใช้

    สกรีนช็อตของรายการกฎการปรับใช้

    ผ้ารองรับการกําหนดพารามิเตอร์ของเลคเฮ้าส์เริ่มต้นสําหรับแต่ละอินสแตนซ์ของโน้ตบุ๊คเมื่อปรับใช้ด้วยกฎการปรับใช้ มีสามตัวเลือกในการระบุเป้าหมายของเลคเฮ้าส์: เหมือนกับ lakehouse ต้นฉบับ, N / A (ไม่มีเลคเฮ้าส์ค่าเริ่มต้น) และเลคเฮ้าส์อื่น ๆ

    สกรีนช็อตของการตั้งค่าเริ่มต้นของ lakehouse

    คุณสามารถทําการแยกข้อมูลที่ปลอดภัยได้โดยการตั้งค่ากฎนี้ เลคเฮ้าส์ตามค่าเริ่มต้นของสมุดบันทึกของคุณจะถูกแทนที่ด้วยค่าที่คุณระบุเป็นเป้าหมายในระหว่างการปรับใช้

    หมายเหตุ

    เมื่อตั้งค่า lakehouse ตามค่าเริ่มต้นในกฎ การปรับใช้ Lakehouse ID จะต้องเป็น คุณสามารถรับ id ของเลคเฮ้าส์ได้จากลิงก์ URL ของรายการ กฎการปรับใช้มีลําดับความสําคัญสูงกว่าการผูกอัตโนมัติ lakehouse ที่ผูกโดยอัตโนมัติจะถูกเขียนทับเมื่อมีการกําหนดค่ากฎการปรับใช้

  6. ตรวจสอบสถานะการปรับใช้จาก ประวัติการปรับใช้