ตัวควบคุมแหล่งข้อมูลของสมุดบันทึกและการปรับใช้

บทความนี้อธิบายวิธีการทํางานของการรวม Git และไปป์ไลน์การปรับใช้สําหรับสมุดบันทึกใน Microsoft Fabric เรียนรู้วิธีการตั้งค่าการเชื่อมต่อกับที่เก็บของคุณ จัดการสมุดบันทึกของคุณ และปรับใช้ในสภาพแวดล้อมที่แตกต่างกัน

การรวมสมุดบันทึก Git

สมุดบันทึกผ้านําเสนอการรวม Git สําหรับการควบคุมแหล่งข้อมูลด้วย Azure DevOps ด้วยการรวม Git คุณสามารถสํารองและกําหนดเวอร์ชันของสมุดบันทึกของคุณ แปลงกลับเป็นขั้นตอนก่อนหน้าได้ตามต้องการ ทํางานร่วมกัน หรือทํางานคนเดียวโดยใช้สาขา Git และจัดการวงจรชีวิตเนื้อหาของสมุดบันทึกของคุณทั้งหมดภายใน Fabric

สำคัญ

คุณลักษณะนี้อยู่ในตัวอย่าง

ตั้งค่าการเชื่อมต่อ

จากการตั้งค่าพื้นที่ทํางานของคุณ คุณสามารถตั้งค่าการเชื่อมต่อไปยัง repo ของคุณเพื่อบันทึกและซิงค์การเปลี่ยนแปลงได้อย่างง่ายดาย หากต้องการตั้งค่าการเชื่อมต่อ โปรดดู เริ่มต้นใช้งานการรวม Git เมื่อเชื่อมต่อแล้ว รายการของคุณรวมถึงสมุดบันทึกจะปรากฏในแผงควบคุมแหล่งข้อมูล

Screenshot of workspace source control panel.

หลังจากที่คุณยอมรับอินสแตนซ์ของสมุดบันทึกไปยังที่เก็บ Git เรียบร้อยแล้ว คุณจะเห็นโครงสร้างโฟลเดอร์สมุดบันทึกในที่เก็บ

ขณะนี้คุณสามารถดําเนินการในอนาคตได้ เช่น สร้างคําขอดึงข้อมูล

การแสดงสมุดบันทึกใน Git

รูปต่อไปนี้เป็นตัวอย่างของโครงสร้างไฟล์ของรายการสมุดบันทึกแต่ละรายการในที่เก็บ:

Screenshot of notebook Git repo file structure.

เมื่อคุณบันทึกรายการสมุดบันทึกไปยังที่เก็บ Git รหัสสมุดบันทึกจะถูกแปลงเป็นรูปแบบซอร์สโค้ด แทนที่จะเป็นไฟล์ .ipynb มาตรฐาน ตัวอย่างเช่น สมุดบันทึก PySpark จะแปลงเป็นไฟล์ notebook-content.py วิธีนี้ช่วยให้สามารถตรวจสอบโค้ดได้ง่ายขึ้นโดยใช้คุณลักษณะ diff ที่มีอยู่ภายใน

ในไฟล์แหล่งข้อมูลเนื้อหารายการ เมตาดาต้า (รวมถึง lakehouse ค่าเริ่มต้นและสภาพแวดล้อมที่แนบมา) เซลล์ Markdown และเซลล์โค้ดจะถูกเก็บรักษาและโดดเด่น วิธีการนี้สนับสนุนการกู้คืนที่แม่นยําเมื่อคุณซิงค์กลับไปยังพื้นที่ทํางาน Fabric

ไม่มีเอาต์พุตเซลล์ของสมุดบันทึกเมื่อซิงค์กับ Git

Screenshot of notebook Git repo content format.

หมายเหตุ

  • ในขณะนี้ ไฟล์ใน แหล่งข้อมูล สมุดบันทึกไม่ได้มอบหมายให้กับที่เก็บ บันทึกไฟล์เหล่านี้ได้รับการสนับสนุนในรุ่นถัดไป
  • สภาพแวดล้อมที่แนบมายังคงอยู่ในสมุดบันทึกเมื่อคุณซิงค์จาก repo ไปยังพื้นที่ทํางาน Fabric ในขณะนี้ ยังไม่รองรับสภาพแวดล้อมการอ้างอิงข้ามพื้นที่ทํางาน คุณต้องแนบเข้ากับสภาพแวดล้อมใหม่หรือการตั้งค่าเริ่มต้นของพื้นที่ทํางานใน เพื่อเรียกใช้สมุดบันทึกด้วยตนเอง
  • ID ของเลคเฮ้าส์เริ่มต้นยังคงอยู่ในสมุดบันทึกเมื่อคุณซิงค์จาก repo ไปยังพื้นที่ทํางาน Fabric ถ้าคุณบันทึกสมุดบันทึกที่มี lakehouse เริ่มต้น คุณต้องอ้างอิงรายการ lakehouse ที่สร้างขึ้นใหม่ด้วยตนเอง สําหรับข้อมูลเพิ่มเติม ดู การรวมของ Lakehouse Git

สมุดบันทึกในไปป์ไลน์การปรับใช้

คุณยังสามารถใช้ไปป์ไลน์การปรับใช้เพื่อปรับใช้รหัสสมุดบันทึกของคุณในสภาพแวดล้อมที่แตกต่างกัน เช่น การพัฒนา การทดสอบ และการผลิต คุณลักษณะนี้สามารถช่วยให้คุณปรับปรุงกระบวนการพัฒนาของคุณ ตรวจสอบให้แน่ใจว่ามีคุณภาพและความสม่ําเสมอ และลดข้อผิดพลาดด้วยตนเองด้วยการดําเนินงานที่มีน้ําหนักเบาและมีรหัสต่ํา คุณยังสามารถใช้กฎการปรับใช้เพื่อกําหนดลักษณะการทํางานของสมุดบันทึกของคุณเมื่อมีการปรับใช้ เช่น การเปลี่ยนเลคเฮาส์เริ่มต้นของสมุดบันทึก

สำคัญ

คุณลักษณะนี้อยู่ในตัวอย่าง

ใช้ขั้นตอนต่อไปนี้เพื่อทําให้การปรับใช้สมุดบันทึกของคุณเสร็จสมบูรณ์โดยใช้ไปป์ไลน์การปรับใช้

  1. สร้างไปป์ไลน์การปรับใช้งานใหม่หรือเปิดไปป์ไลน์การปรับใช้งานที่มีอยู่ (สําหรับข้อมูลเพิ่มเติม โปรดดู เริ่มต้นใช้งานไปป์ไลน์การปรับใช้)

  2. กําหนดพื้นที่ทํางานให้กับขั้นตอนที่แตกต่างกันตามเป้าหมายการปรับใช้ของคุณ

  3. เลือก ดู และเปรียบเทียบรายการ รวมถึงสมุดบันทึกระหว่างขั้นตอนต่างๆ ดังที่แสดงในตัวอย่างต่อไปนี้

    Screenshot of notebook in deployment pipeline.

  4. เลือก ปรับใช้ เพื่อปรับใช้สมุดบันทึกของคุณในขั้นตอน การพัฒนา การทดสอบ และการผลิต

  5. (ไม่บังคับ) คุณสามารถเลือก กฎ การปรับใช้ เพื่อสร้างกฎการปรับใช้สําหรับกระบวนการปรับใช้ได้ รายการกฎการปรับใช้อยู่ในขั้นตอนเป้าหมายสําหรับกระบวนการปรับใช้

    Screenshot of deployment rules entry.

    ผ้ารองรับการกําหนดพารามิเตอร์ของเลคเฮ้าส์เริ่มต้นสําหรับแต่ละอินสแตนซ์ของโน้ตบุ๊คเมื่อปรับใช้ด้วยกฎการปรับใช้ มีสามตัวเลือกในการระบุเป้าหมายของเลคเฮ้าส์: เหมือนกับเลคเฮ้าส์แหล่งที่มา, N / A และเลคเฮ้าส์อื่น ๆ

    Screenshot of set default lakehouse.

    คุณสามารถทําการแยกข้อมูลที่ปลอดภัยได้โดยการตั้งค่ากฎนี้ เลคเฮ้าส์ตามค่าเริ่มต้นของสมุดบันทึกของคุณจะถูกแทนที่ด้วยค่าที่คุณระบุเป็นเป้าหมายในระหว่างการปรับใช้

    หมายเหตุ

    เมื่อคุณเลือกที่จะใช้เลคเฮาส์อื่น ๆ ในสภาพแวดล้อม เป้าหมาย Lakehouse ID เป็นสิ่งที่ต้องมี คุณสามารถค้นหา ID ของเลคเฮ้าส์ได้จากลิงก์ URL ของเลคเฮ้าส์

  6. ตรวจสอบสถานะการปรับใช้จาก ประวัติการปรับใช้