แชร์ผ่าน


วิธีใช้สมุดบันทึก Microsoft Fabric

สมุดบันทึก Microsoft Fabric เป็นรายการรหัสหลักสําหรับการพัฒนางาน Apache Spark และการทดลองการเรียนรู้ของเครื่อง ซึ่งเป็นพื้นผิวแบบโต้ตอบบนเว็บที่ใช้โดยนักวิทยาศาสตร์ข้อมูลและวิศวกรข้อมูลในการเขียนโค้ดซึ่งได้รับประโยชน์จากการแสดงภาพและข้อความ Markdown ที่หลากหลาย วิศวกรข้อมูลเขียนโค้ดสําหรับการนําเข้าข้อมูล การเตรียมข้อมูล และการแปลงข้อมูล นักวิทยาศาสตร์ข้อมูลยังใช้สมุดบันทึกเพื่อสร้างโซลูชันการเรียนรู้ของเครื่อง รวมถึงการสร้างการทดลองและแบบจําลอง การติดตามแบบจําลอง และการปรับใช้

ด้วยโน้ตบุ๊ค Fabric คุณสามารถ:

  • เริ่มต้นใช้งานด้วยความพยายามในการตั้งค่าเป็นศูนย์
  • สํารวจและประมวลผลข้อมูลได้อย่างง่ายดายด้วยประสบการณ์การใช้งานรหัสต่ําที่ใช้งานง่าย
  • รักษาข้อมูลให้ปลอดภัยอยู่เสมอด้วยคุณลักษณะการรักษาความปลอดภัยระดับองค์กรที่มีอยู่ภายใน
  • วิเคราะห์ข้อมูลในรูปแบบดิบ (CSV, txt, JSON ฯลฯ) รูปแบบไฟล์ที่ประมวลผล (parquet, Delta Lake ฯลฯ) โดยใช้ความสามารถ Spark ที่มีประสิทธิภาพ
  • ทํางานอย่างมีประสิทธิภาพด้วยความสามารถในการเขียนที่ปรับปรุงประสิทธิภาพแล้วและการแสดงภาพข้อมูลที่มีอยู่ภายใน

บทความนี้อธิบายวิธีการใช้สมุดบันทึกในวิทยาศาสตร์ข้อมูลและประสบการณ์ด้านวิศวกรรมข้อมูล

บริบทความปลอดภัยของการเรียกใช้สมุดบันทึก

การดําเนินการของโน้ตบุ๊คสามารถทริกเกอร์ได้โดยสามลักษณะที่แตกต่างกันใน Fabric ด้วยความยืดหยุ่นเต็มที่เพื่อตอบสนองสถานการณ์ที่แตกต่างกัน:

  • การเรียกใช้แบบโต้ตอบ: ผู้ใช้ทริกเกอร์การดําเนินการด้วยตนเองผ่านรายการ UX ที่แตกต่างกันหรือเรียกใช้ REST API การดําเนินการจะทํางานภายใต้บริบทความปลอดภัยของผู้ใช้ปัจจุบัน
  • เรียกใช้เป็นกิจกรรมไปป์ไลน์: การดําเนินการจะถูกทริกเกอร์จาก Fabric Data Factory pipeline คุณสามารถค้นหาขั้นตอนรายละเอียดใน กิจกรรมสมุดบันทึก การดําเนินการจะทํางานภายใต้บริบทความปลอดภัยของเจ้าของไปป์ไลน์
  • ตัวจัดกําหนดการ: การดําเนินการถูกทริกเกอร์จากแผนตัวจัดกําหนดการ การดําเนินการจะทํางานภายใต้บริบทความปลอดภัยของผู้ใช้ที่ตั้งค่า/อัปเดตแผนตัวจัดกําหนดการ

ความยืดหยุ่นของตัวเลือกการดําเนินการเหล่านี้ที่มีบริบทความปลอดภัยที่แตกต่างกันช่วยให้คุณสามารถตอบสนองสถานการณ์และข้อกําหนดต่าง ๆ ได้ แต่ต้องการให้คุณทราบถึงบริบทความปลอดภัยเมื่อคุณออกแบบและพัฒนาสมุดบันทึกของคุณ มิฉะนั้นอาจทําให้เกิดลักษณะการทํางานที่ไม่คาดคิดและแม้แต่ปัญหาด้านความปลอดภัยบางอย่าง

ในครั้งแรกเมื่อสร้างสมุดบันทึก ข้อความเตือนจะปรากฏขึ้นเพื่อเตือนให้คุณทราบถึงความเสี่ยงในการเรียกใช้โค้ดโดยไม่ต้องตรวจทาน

สกรีนช็อตที่แสดงคําเตือนของการเรียกใช้สมุดบันทึก

ต่อไปนี้คือแนวทางปฏิบัติที่ดีที่สุดเพื่อช่วยให้คุณหลีกเลี่ยงปัญหาด้านความปลอดภัย:

  • ก่อนที่คุณจะเรียกใช้สมุดบันทึกด้วยตนเอง ให้เปิดการตั้งค่าสมุดบันทึก และตรวจสอบส่วนรายละเอียดภายใต้แผง เกี่ยวกับ สําหรับการอัปเดตการปรับเปลี่ยน ตรวจสอบให้แน่ใจว่าคุณได้เปลี่ยนแปลงล่าสุดแล้ว
  • ก่อนที่คุณเพิ่มกิจกรรมของสมุดบันทึกไปยังไปป์ไลน์ เปิดการตั้งค่าสมุดบันทึก และตรวจสอบส่วนรายละเอียดภายใต้แผงเกี่ยวกับสําหรับการอัปเดตการปรับเปลี่ยน ตรวจสอบให้แน่ใจว่าคุณตกลงกับการเปลี่ยนแปลงล่าสุด ถ้าคุณไม่แน่ใจเกี่ยวกับการเปลี่ยนแปลงล่าสุด ให้เปิดสมุดบันทึกเพื่อตรวจสอบการเปลี่ยนแปลงก่อนที่คุณจะเพิ่มลงในไปป์ไลน์
  • ก่อนที่คุณอัปเดตแผนกําหนดการ เปิดการตั้งค่าสมุดบันทึก และตรวจสอบส่วนรายละเอียดภายใต้แผงเกี่ยวกับการอัปเดตการปรับเปลี่ยน ตรวจสอบให้แน่ใจว่าคุณตกลงกับการเปลี่ยนแปลงล่าสุด ถ้าคุณไม่แน่ใจเกี่ยวกับการเปลี่ยนแปลงล่าสุด ให้เปิดสมุดบันทึกเพื่อตรวจสอบการเปลี่ยนแปลงก่อนที่คุณจะอัปเดตแผนตัวจัดกําหนดการ
  • แยกพื้นที่ทํางานออกเป็นขั้นตอนที่แตกต่างกัน (พัฒนา ทดสอบ ผลิตภัณฑ์) และควบคุมการเข้าถึงขั้นตอนที่แตกต่างกันเพื่อหลีกเลี่ยงปัญหาด้านความปลอดภัย เพิ่มผู้ใช้ที่คุณเชื่อถือในลําดับขั้นผลิตภัณฑ์เท่านั้น

สร้างสมุดบันทึก

คุณสามารถสร้างสมุดบันทึกใหม่ หรือนําเข้าสมุดบันทึกที่มีอยู่ก็ได้

สร้างสมุดบันทึกใหม่

เช่นเดียวกับกระบวนการสร้างรายการ Fabric มาตรฐานอื่น ๆ คุณสามารถสร้างสมุดบันทึกใหม่ได้อย่างง่ายดายจากหน้าแรกของ Fabric วิศวกรข้อมูล ตัวเลือกพื้นที่ทํางานใหม่ หรือ Create Hub

นําเข้าสมุดบันทึกที่มีอยู่

คุณสามารถนําเข้าสมุดบันทึกที่มีอยู่อย่างน้อยหนึ่งรายการจากคอมพิวเตอร์ของคุณไปยังพื้นที่ทํางาน Fabric จากวิศวกรข้อมูลหรือโฮมเพจ Data Science ได้ โน้ตบุ๊คผ้าจดจําไฟล์ Jupyter Notebook .ipynb มาตรฐานและไฟล์ต้นฉบับเช่น.py .scala และ.sql และสร้างรายการสมุดบันทึกใหม่ตามลําดับ

สกรีนช็อตแสดงตําแหน่งที่จะค้นหาตัวเลือกสมุดบันทึกบนเมนูใหม่

ส่งออกสมุดบันทึก

คุณสามารถส่งออกสมุดบันทึกของคุณเป็นรูปแบบมาตรฐานอื่นๆ ได้ สามารถส่งออกสมุดบันทึก Synapse ลงใน:

  • ไฟล์สมุดบันทึกมาตรฐาน (.ipynb) ที่ใช้สําหรับสมุดบันทึก Jupyter
  • ไฟล์ HTML (.html) ที่สามารถเปิดจากเบราว์เซอร์ได้โดยตรง
  • ไฟล์ Python (.py)
  • ไฟล์ยาง (.tex)

สกรีนช็อตแสดงตําแหน่งที่จะส่งออกสมุดบันทึก

บันทึกสมุดบันทึก

ใน Fabric สมุดบันทึกจะบันทึกโดยอัตโนมัติหลังจากที่คุณเปิดและแก้ไขตามค่าเริ่มต้น คุณไม่ต้องกังวลเกี่ยวกับการสูญเสียการเปลี่ยนแปลงรหัส คุณยังสามารถใช้ บันทึกสําเนา เพื่อโคลนสําเนาอื่นในพื้นที่ทํางานปัจจุบันหรือในพื้นที่ทํางานอื่นได้

สกรีนช็อตแสดงตําแหน่งที่จะบันทึกสําเนา

ถ้าคุณต้องการบันทึกสมุดบันทึกด้วยตนเอง คุณสามารถสลับไปยัง ตัวเลือก บันทึกด้วยตนเอง เพื่อให้มีสาขาภายในเครื่องของรายการสมุดบันทึกของคุณ จากนั้นใช้ บันทึก หรือ CTRL+ s เพื่อบันทึกการเปลี่ยนแปลงของคุณ

สกรีนช็อตแสดงตําแหน่งที่จะสลับการบันทึกด้วยตนเอง

คุณยังสามารถสลับเป็นโหมดบันทึกด้วยตนเองโดยเลือก แก้ไข ->บันทึก ตัวเลือก ->แมนวล เมื่อต้องการเปิดใช้งานสาขาภายในเครื่องของสมุดบันทึกของคุณ แล้วบันทึกด้วยตนเอง เลือกบันทึกหรือใช้แป้นพิมพ์ลัด Ctrl + s

เชื่อมต่อเลคเฮ้าส์และโน้ตบุ๊ค

โน้ตบุ๊คผ้ารองรับการโต้ตอบแบบปิดกับเลคเฮ้าส์แล้วในขณะนี้ คุณสามารถเพิ่มเลคเฮ้าส์ใหม่หรือที่มีอยู่ได้อย่างง่ายดายจาก Lakehouse explorer

คุณสามารถนําทางไปยังเลคเฮ้าส์ต่างๆ ใน Lakehouse explorer และตั้งค่าให้เลคเฮ้าส์หนึ่งเป็นค่าเริ่มต้นได้โดยการปักหมุด ค่าเริ่มต้นของคุณจะถูกนําไปใช้กับไดเรกทอรีการทํางานรันไทม์และคุณสามารถอ่านหรือเขียนไปยัง lakehouse ค่าเริ่มต้นโดยใช้เส้นทางท้องถิ่น

สกรีนช็อตแสดงตําแหน่งที่จะปักหมุดเลคเฮ้าส์ตามค่าเริ่มต้น

หมายเหตุ

คุณต้องรีสตาร์ทเซสชันหลังจากปักหมุดเลคเฮาส์ใหม่หรือเปลี่ยนชื่อเลคเฮ้าส์เริ่มต้น

เพิ่มหรือลบเลคเฮ้าส์

การเลือก ไอคอน X ที่อยู่ข้างชื่อเลคเฮ้าส์จะลบออกจากแท็บสมุดบันทึก แต่รายการในเลคเฮ้าส์ยังคงมีอยู่ในพื้นที่ทํางาน

เลือก เพิ่มเลคเฮ้าส์ เพื่อเพิ่มเลคเฮาส์ลงในสมุดบันทึกโดยเพิ่มโรงเก็บของที่มีอยู่ หรือสร้างเลคเฮ้าส์ใหม่

สํารวจไฟล์ของเลคเฮ้าส์

โฟลเดอร์ย่อยและไฟล์ภายใต้ ส่วน ตาราง และ ไฟล์ ของ มุมมอง Lake จะปรากฏในพื้นที่เนื้อหาระหว่างรายการเลคเฮ้าส์และเนื้อหาของสมุดบันทึก เลือกโฟลเดอร์ ที่แตกต่างกันในส่วนตาราง และ ไฟล์ เพื่อรีเฟรชพื้นที่เนื้อหา

การดําเนินการโฟลเดอร์และไฟล์

หากคุณเลือกไฟล์ (.csv, .parquet, .txt, .jpg, .png ฯลฯ) ด้วยการคลิกเมาส์ขวา คุณสามารถใช้ Spark หรือ Pandas API เพื่อโหลดข้อมูลได้ เซลล์รหัสใหม่จะถูกสร้างขึ้นและแทรกภายใต้เซลล์โฟกัส

คุณสามารถคัดลอกเส้นทางด้วยรูปแบบที่แตกต่างจากไฟล์หรือโฟลเดอร์ที่เลือกและใช้เส้นทางที่สอดคล้องกันในโค้ดของคุณ

สกรีนช็อตที่แสดงเมนูบริบทของไฟล์ในเลคเฮ้าส์

แหล่งข้อมูลสมุดบันทึก

ตัวสํารวจทรัพยากรสมุดบันทึกมีระบบแฟ้มที่เหมือนกับ Unix เพื่อช่วยให้คุณจัดการโฟลเดอร์และแฟ้มของคุณได้ ซึ่งมีพื้นที่ระบบไฟล์ที่สามารถเขียนได้ ซึ่งคุณสามารถจัดเก็บไฟล์ขนาดเล็ก เช่น โมดูลโค้ด แบบจําลองความหมาย และรูปภาพ คุณสามารถเข้าถึงได้อย่างง่ายดายด้วยรหัสในสมุดบันทึกราวกับว่าคุณกําลังทํางานกับระบบไฟล์ภายในเครื่องของคุณ

GIF แบบเคลื่อนไหวของทรัพยากรสมุดบันทึก

โฟลเดอร์ที่มีอยู่ภายในนี้คือโฟลเดอร์ที่กําหนดไว้ล่วงหน้าของระบบสําหรับแต่ละอินสแตนซ์ของสมุดบันทึก โดยจะเก็บรักษาที่เก็บข้อมูลได้ สูงสุด 500MB เพื่อจัดเก็บการขึ้นต่อกันของสมุดบันทึกปัจจุบัน ต่อไปนี้คือความสามารถสําคัญของทรัพยากรสมุดบันทึก:

  • คุณสามารถใช้การดําเนินการทั่วไป เช่น สร้าง/ลบ อัปโหลด/ดาวน์โหลด ลาก/วาง เปลี่ยนชื่อ ทําสําเนา และค้นหาผ่าน UI
  • คุณสามารถใช้เส้นทางสัมพัทธ์เช่น builtin/YourData.txt สําหรับการสํารวจอย่างรวดเร็ว เม mssparkutils.nbResPath ธอด ช่วยให้คุณเขียนเส้นทางแบบเต็ม
  • คุณสามารถย้ายข้อมูลที่คุณผ่านการตรวจสอบไปยังเลคเฮ้าส์ผ่านตัวเลือกเขียนไปยังเลคเฮ้าส์ Fabric ได้ฝังส่วนย่อยของโค้ดที่สมบูรณ์สําหรับไฟล์ประเภททั่วไปเพื่อช่วยให้คุณเริ่มต้นใช้งานได้อย่างรวดเร็ว
  • แหล่งข้อมูลเหล่านี้จะพร้อมใช้งานในกรณีเรียกใช้สมุดบันทึกอ้างอิงผ่านmssparkutils.notebook.run()

หมายเหตุ

  • ในขณะนี้ Fabric รองรับการอัปโหลดไฟล์บางชนิดผ่าน UI รวมถึงไฟล์ .py .whl .jar .txt .json .yml .xml .csv .html .png .jpg และ.xlsx คุณสามารถเขียนไปยังโฟลเดอร์ที่มีอยู่ภายในด้วยชนิดไฟล์ที่ไม่ได้อยู่ในรายการผ่านโค้ด อย่างไรก็ตาม สมุดบันทึก Fabric ไม่สนับสนุนการสร้างส่วนย่อยของโค้ดในไฟล์ประเภทที่ไม่รองรับ
  • ไฟล์แต่ละขนาดต้องมีขนาดน้อยกว่า 50MB และโฟลเดอร์ที่มีอยู่ภายในอนุญาตให้มีอินสแตนซ์ไฟล์/โฟลเดอร์สูงสุด 100 รายการ
  • เมื่อใช้ mssparkutils.notebook.run()ให้ใช้ mssparkutils.nbResPath คําสั่ง เพื่อเข้าถึงทรัพยากรสมุดบันทึกเป้าหมาย เส้นทางสัมพัทธ์ "builtin/" จะชี้ไปยังโฟลเดอร์ภายในสมุดบันทึกรากเสมอ

ทํางานร่วมกันในสมุดบันทึก

สมุดบันทึก Fabric เป็นรายการการทํางานร่วมกันที่สนับสนุนผู้ใช้หลายคนที่แก้ไขสมุดบันทึกเดียวกัน

เมื่อคุณเปิดสมุดบันทึก คุณเข้าสู่โหมดการแก้ไขร่วมตามค่าเริ่มต้น และการแก้ไขสมุดบันทึกทั้งหมดจะถูกบันทึกโดยอัตโนมัติ ถ้าเพื่อนร่วมงานของคุณเปิดสมุดบันทึกเดียวกันในเวลาเดียวกัน คุณจะเห็นโปรไฟล์ของพวกเขา เรียกใช้เอาต์พุต ตัวบ่งชี้เคอร์เซอร์ ตัวบ่งชี้การเลือก และการแก้ไขการติดตาม ด้วยการใช้คุณลักษณะการทํางานร่วมกัน คุณสามารถทําการเขียนโปรแกรมคู่ การดีบักระยะไกล และสถานการณ์กวดวิชาได้อย่างง่ายดาย

สกรีนช็อตที่แสดงเซลล์โค้ดพร้อมการแก้ไขของผู้ใช้อื่น

แชร์สมุดบันทึก

การแชร์สมุดบันทึกเป็นวิธีที่สะดวกสําหรับคุณในการทํางานร่วมกับสมาชิกในทีม บทบาทพื้นที่ทํางานที่ได้รับอนุญาตสามารถดูหรือแก้ไข/เรียกใช้สมุดบันทึกได้ตามค่าเริ่มต้น คุณสามารถแชร์สมุดบันทึกด้วยสิทธิ์ที่ระบุที่ได้รับ

  1. เลือก แชร์ บนแถบเครื่องมือสมุดบันทึก

    สกรีนช็อตแสดงตําแหน่งที่จะเลือกแชร์

  2. เลือกประเภทที่สอดคล้องกันของ บุคคลที่สามารถดูสมุดบันทึกนี้ คุณสามารถเลือกแชร์ แก้ไข หรือเรียกใช้สิทธิ์สําหรับผู้รับได้

    สกรีนช็อตแสดงตําแหน่งที่จะเลือกสิทธิ์

  3. หลังจากที่คุณเลือก นําไปใช้ คุณสามารถส่งสมุดบันทึกโดยตรงหรือคัดลอกลิงก์ไปยังผู้อื่นได้ จากนั้นผู้รับสามารถเปิดสมุดบันทึกที่มีมุมมองที่สอดคล้องกันซึ่งได้รับจากระดับสิทธิ์ของพวกเขา

    สกรีนช็อตแสดงตําแหน่งที่จะสร้างและส่งลิงก์

  4. เมื่อต้องการจัดการสิทธิ์ของสมุดบันทึกของคุณเพิ่มเติม ให้เลือก รายการ>พื้นที่ทํางาน ตัวเลือกเพิ่มเติม จากนั้นเลือก จัดการสิทธิ์ จากหน้าจอนั้น คุณสามารถอัปเดตการเข้าถึงและสิทธิ์การเข้าถึงสมุดบันทึกที่มีอยู่

    สกรีนช็อตแสดงตําแหน่งที่จะจัดการสิทธิ์ในพื้นที่ทํางาน

ใส่ความคิดเห็นในเซลล์โค้ด

การแสดงข้อคิดเห็นเป็นอีกคุณลักษณะหนึ่งที่มีประโยชน์สําหรับสถานการณ์การทํางานร่วมกัน ในขณะนี้ Fabric สนับสนุนการเพิ่มข้อคิดเห็นระดับเซลล์

  1. เลือกปุ่ม ข้อคิดเห็น บนแถบเครื่องมือสมุดบันทึก หรือตัวบ่งชี้ข้อคิดเห็นเซลล์ เพื่อเปิดบานหน้าต่างข้อคิดเห็น

    สกรีนช็อตแสดงตําแหน่งที่จะเลือกข้อคิดเห็น

  2. เลือกโค้ดในเซลล์โค้ด เลือก ใหม่ ในบานหน้าต่าง ข้อคิดเห็น เพิ่มข้อคิดเห็น จากนั้นเลือก โพสต์ข้อคิดเห็น เพื่อบันทึก

    สกรีนช็อตแสดงตําแหน่งที่จะเลือกใหม่

  3. หากคุณต้องการให้ค้นหาแก้ไขความคิดเห็นแก้ไขเธรดและลบตัวเลือกเธรดโดยการเลือกตัวเลือกเพิ่มเติมถัดจากความคิดเห็นของคุณ

การแท็กผู้อื่นในข้อคิดเห็น

"การแท็ก" หมายถึงการกล่าวถึงและแจ้งให้ผู้ใช้ทราบในเธรดความคิดเห็น ซึ่งช่วยเพิ่มประสิทธิภาพการทํางานร่วมกันอย่างมีประสิทธิภาพเกี่ยวกับข้อมูลจําเพาะ

  1. เลือกส่วนของโค้ดในเซลล์และเธรดข้อคิดเห็นใหม่

  2. ป้อนชื่อผู้ใช้และเลือกชื่อผู้ใช้ที่ถูกต้องในรายการคําแนะนําถ้าคุณต้องการกล่าวถึงบุคคลสําหรับการสนทนาเกี่ยวกับบางส่วน

  3. แชร์ข้อมูลเชิงลึกของคุณและโพสต์

  4. การแจ้งเตือนทางอีเมลจะถูกทริกเกอร์ และผู้ใช้คลิกที่ ลิงก์เปิดข้อคิดเห็น เพื่อค้นหาเซลล์นี้อย่างรวดเร็ว

  5. นอกจากนี้ ให้อนุญาตและกําหนดค่าสิทธิ์สําหรับผู้ใช้เมื่อแท็กบุคคลที่ไม่สามารถเข้าถึงเพื่อให้แน่ใจว่าแอสเซทโค้ดของคุณได้รับการจัดการอย่างดี

GIF แบบเคลื่อนไหวของการแท็กผู้อื่นในข้อคิดเห็น

หมายเหตุ

สําหรับรายการข้อคิดเห็น ผู้ใช้ที่ถูกแท็กจะไม่ได้รับการแจ้งเตือนทางอีเมลอีกต่อไปถ้าคุณอัปเดตข้อคิดเห็นภายในหนึ่งชั่วโมง แต่จะส่งการแจ้งเตือนทางอีเมลไปยังผู้ใช้ที่ถูกแท็กใหม่

สลับโหมดสมุดบันทึก

สมุดบันทึกผ้ารองรับโหมดสองโหมดที่คุณสามารถสลับได้อย่างง่ายดาย: โหมดการแก้ไขและโหมดการดู

สกรีนช็อตแสดงตําแหน่งที่โหมดสลับ

  • โหมดการแก้ไข: คุณสามารถแก้ไขและเรียกใช้เซลล์ และทํางานร่วมกับผู้อื่นบนสมุดบันทึกได้
  • โหมดการดู: คุณสามารถดูเฉพาะเนื้อหาของเซลล์ ผลลัพธ์ และข้อคิดเห็นของสมุดบันทึกได้ การดําเนินการทั้งหมดที่ทําการเปลี่ยนแปลงสมุดบันทึกถูกปิดใช้งาน