แชร์ผ่าน


ใช้ประสบการณ์ Python บนสมุดบันทึก

สมุดบันทึก Python เป็นประสบการณ์การใช้งานใหม่ที่สร้างขึ้นบนโน้ตบุ๊ค Fabric เป็นเครื่องมืออเนกประสงค์และโต้ตอบที่ออกแบบมาสําหรับการวิเคราะห์ข้อมูล การแสดงภาพ และการเรียนรู้ของเครื่อง ซึ่งให้ประสบการณ์การพัฒนาที่ราบรื่นสําหรับการเขียนและดําเนินการโค้ด Python ความสามารถนี้ทําให้เป็นเครื่องมือที่จําเป็นสําหรับนักวิทยาศาสตร์ข้อมูล นักวิเคราะห์ และนักพัฒนา BI โดยเฉพาะอย่างยิ่งสําหรับงานการสํารวจที่ไม่จําเป็นต้องมีข้อมูลขนาดใหญ่และการประมวลผลแบบกระจาย

ด้วย Python notebook คุณสามารถรับ:

  • เคอร์เนล python ในตัวหลายตัว: สมุดจด Python นําเสนอสภาพแวดล้อมการเข้ารหัส Python ที่บริสุทธิ์โดยไม่มี Spark โดยมีเคอร์เนล Python สองเวอร์ชัน - Python 3.10 และ 3.11 พร้อมใช้งานตามค่าเริ่มต้นและคุณสมบัติ ipython ดั้งเดิมที่รองรับเช่น iPyWidget คําสั่งมายากล

  • คุ้มค่า: โน้ตบุ๊ก Python ใหม่ให้ประโยชน์ในการประหยัดต้นทุนโดยทํางานบนคลัสเตอร์โหนดเดียวที่มีหน่วยความจํา 2vCores/16GB ตามค่าเริ่มต้น การตั้งค่านี้ช่วยให้มั่นใจได้ว่าการใช้ทรัพยากรมีประสิทธิภาพสําหรับโครงการสํารวจข้อมูลที่มีขนาดข้อมูลที่เล็กลง

  • Lakehouse & Resources มีให้ใช้งานแบบดั้งเดิม: The Fabric Lakehouse พร้อมกับฟังก์ชันการทํางานเต็มรูปแบบของ Notebook ในตัวมีให้ใช้งานในสมุดบันทึก Python คุณลักษณะนี้ช่วยให้ผู้ใช้สามารถนําข้อมูลไปยังสมุดบันทึก python ได้อย่างง่ายดายเพียงลองลาก & วางเพื่อรับส่วนย่อยของโค้ด

  • ผสมการเขียนโปรแกรมด้วย T-SQL: Python notebook มีวิธีง่าย ๆ ในการโต้ตอบกับคลังข้อมูลและจุดสิ้นสุด SQL ใน explorer โดยใช้ตัวเชื่อมต่อข้อมูล notebookutils คุณสามารถดําเนินการสคริปต์ T-SQL ภายใต้บริบทของ python

  • รองรับไลบรารีการวิเคราะห์ข้อมูลยอดนิยม: สมุด Python มาพร้อมกับไลบรารีที่ติดตั้งไว้ล่วงหน้า เช่น DuckDB, Polars และ Scikit-learn ซึ่งมีชุดเครื่องมือที่ครอบคลุมสําหรับการจัดการข้อมูล การวิเคราะห์ และการเรียนรู้ของเครื่อง

  • ปัญญาขั้นสูง: โน้ตบุ๊ก Python กําลังนํา Pylance มาใช้เป็นเอ็นจิ้น intellisense ร่วมกับบริการภาษาที่กําหนดเองของ Fabric อื่น ๆ โดยมีเป้าหมายเพื่อมอบประสบการณ์การเขียนโค้ดที่ล้ําสมัยสําหรับนักพัฒนาโน้ตบุ๊ก

  • NotebookUtils & ลิงก์เชิงความหมาย: ชุดเครื่องมือ API ที่มีประสิทธิภาพ ช่วยให้คุณใช้ความสามารถของ Fabric และ Power BI ได้อย่างง่ายดายด้วยประสบการณ์การใช้งานโค้ดครั้งแรก

  • ความสามารถในการแสดงข้อมูลด้วยภาพที่สมบูรณ์: ยกเว้นสําหรับฟังก์ชันการแสดงตัวอย่าง dataframe 'ตาราง' และฟังก์ชัน 'แผนภูมิ' ที่ได้รับความนิยม เรายังสนับสนุนไลบรารีการแสดงภาพยอดนิยม เช่น Matplotlib, Seaborn และ Plotly นอกจากนี้ PowerBIClient ยังสนับสนุนไลบรารีเหล่านี้เพื่อช่วยให้ผู้ใช้เข้าใจรูปแบบข้อมูลและข้อมูลเชิงลึกได้ดียิ่งขึ้น

  • ความสามารถทั่วไปสําหรับ Fabric Notebook: ฟีเจอร์ระดับสมุดบันทึกทั้งหมดสามารถใช้งานได้กับ Python เช่นคุณลักษณะการแก้ไข AutoSave การทํางานร่วมกัน การแชร์ และการจัดการสิทธิ์ การรวม Git การนําเข้า/ส่งออก ฯลฯ

  • ความสามารถของวิทยาศาสตร์ข้อมูลสแตกเต็มรูปแบบ: ชุดเครื่องมือขั้นสูงที่ใช้รหัสต่ํา Data Wrangler เฟรมเวิร์กการเรียนรู้ของเครื่อง MLFlow และ Copilot ที่มีประสิทธิภาพทั้งหมดพร้อมใช้งานบนสมุดบันทึก Python

วิธีการเข้าถึง Python Notebook

หลังจากเปิด Fabric Notebook แล้ว คุณสามารถเปลี่ยนเป็น Python ในเมนูแบบเลื่อนลงภาษาที่แท็บ หน้าแรก และแปลงการตั้งค่าสมุดบันทึกทั้งหมดเป็น Python

สกรีนช็อตที่แสดงการสลับไปยัง Python จากเมนูภาษาของสมุดบันทึก

คุณลักษณะทั่วไปส่วนใหญ่ได้รับการสนับสนุนเป็นระดับสมุดบันทึก คุณสามารถอ้างอิง วิธีใช้สมุดบันทึก Microsoft Fabric และ พัฒนา ดําเนินการ และจัดการสมุดบันทึก Microsoft Fabric เพื่อเรียนรู้การใช้งานโดยละเอียด ต่อไปนี้เราจะแสดงรายการความสามารถหลักบางอย่างที่เฉพาะเจาะจงสําหรับสถานการณ์ของ Python

เรียกใช้ Python notebooks

Python notebook รองรับหลายวิธีการทํางาน:

  • การเรียกใช้แบบโต้ตอบ: คุณสามารถเรียกใช้สมุดบันทึก Python แบบโต้ตอบได้เหมือนกับสมุดบันทึก Jupyter ดั้งเดิม
  • กําหนดการเรียกใช้: คุณสามารถใช้ประสบการณ์ตัวจัดกําหนดการที่มีน้ําหนักเบาในหน้าการตั้งค่าสมุดบันทึกเพื่อเรียกใช้สมุดบันทึก Python เป็นชุดงาน
  • การเรียกใช้ไปป์ไลน์: คุณสามารถประสานสมุดบันทึก Python เป็นกิจกรรมสมุดบันทึกใน ไปป์ไลน์ได้ สแนปช็อตจะถูกสร้างขึ้นหลังจากการดําเนินการงาน
  • การเรียกใช้อ้างอิง: คุณสามารถใช้ notebookutils.notebook.run() หรือ notebookutils.notebook.runMultiple() อ้างอิงการเรียกใช้สมุดบันทึก Python ในสมุดบันทึก Python อื่นเป็นงานแบทช์ สแนปช็อตจะถูกสร้างขึ้นหลังจากการเรียกใช้การอ้างอิงเสร็จสิ้น
  • Public API: คุณสามารถกําหนดตารางเวลาการเรียกใช้สมุดบันทึก python ของคุณด้วย notebook เรียกใช้ API สาธารณะตรวจสอบให้แน่ใจว่าคุณสมบัติภาษาและเคอร์เนลในเมตาดาต้าของสมุดบันทึกของส่วนข้อมูล API สาธารณะได้รับการตั้งค่าอย่างถูกต้อง

คุณสามารถตรวจสอบรายละเอียดการเรียกใช้งานสมุดบันทึก Python บนแท็บ Ribbon เรียกใช้ ->ดูการเรียกใช้ทั้งหมด

การโต้ตอบข้อมูล

คุณสามารถโต้ตอบกับ Lakehouse, Warehouses, จุดสิ้นสุด SQL และโฟลเดอร์ทรัพยากรที่มีอยู่ภายในบนสมุดบันทึก Python ได้

Note

  • รันไทม์ Python Notebook มาพร้อมกับไลบรารี delta-rs และ duckdb เพื่อรองรับทั้งการอ่านและเขียนข้อมูล Delta Lake อย่างไรก็ตาม โปรดทราบว่าคุณลักษณะบางอย่างของ Delta Lake อาจไม่ได้รับการสนับสนุนอย่างเต็มที่ในขณะนี้ สําหรับรายละเอียดเพิ่มเติมและการอัปเดตล่าสุด โปรดดูที่เว็บไซต์อย่างเป็นทางการของ delta-rs และ duckdb
  • ขณะนี้เราไม่รองรับ deltalake(delta-rs) เวอร์ชัน 1.0.0 ขึ้นไป คอยติดตาม.

ปฏิสัมพันธ์กับเลคเฮาส์

คุณสามารถตั้งค่าเลคเฮ้าส์เป็นค่าเริ่มต้นหรือคุณสามารถเพิ่มเลคเฮ้าส์หลายแห่งเพื่อสํารวจและใช้ในสมุดโน๊ตได้

ถ้าคุณไม่คุ้นเคยกับการอ่านออบเจ็กต์ข้อมูล เช่น ตารางเดลต้า ให้ลองลากและวางไฟล์และตารางเดลต้าไปยังพื้นที่ทํางานสมุดบันทึก หรือใช้ โหลด ข้อมูล ในเมนูดรอปดาวน์ของออบเจ็กต์ สมุดบันทึกจะแทรกส่วนย่อยของโค้ดลงในเซลล์โค้ดโดยอัตโนมัติและสร้างโค้ดสําหรับการอ่านวัตถุข้อมูลเป้าหมาย

Note

หากคุณพบ OOM เมื่อโหลดข้อมูลจํานวนมาก ลองใช้ DuckDB, Polars หรือ PyArrow dataframe แทน pandas

คุณสามารถค้นหาการดําเนินการเขียนเลคเฮ้าส์ได้ใน เรียกดู โค้ด ->เขียนข้อมูลไปยังตาราง deltaได้

สกรีนช็อตที่แสดงการดําเนินการเขียนของเลคเฮ้าส์

การโต้ตอบของคลังสินค้าและการโปรแกรมผสมกับ T-SQL

คุณสามารถเพิ่มคลังข้อมูลหรือจุดสิ้นสุด SQL ได้จากส่วนการสํารวจคลังสินค้าของสมุดบันทึกได้ ในทํานองเดียวกัน คุณสามารถลากและวางตารางลงในพื้นที่ทํางานของสมุดบันทึก หรือใช้การดําเนินการทางลัดในเมนูดรอปดาวน์ของตาราง สมุดบันทึกจะสร้างส่วนย่อยของโค้ดให้คุณโดยอัตโนมัติ คุณสามารถใช้ยูทิลิตี้ notebookutils.data เพื่อสร้างการเชื่อมต่อกับ Warehouses และคิวรีข้อมูลโดยใช้คําสั่ง T-SQL ในบริบทของ Python ได้

สกรีนช็อตที่แสดงทางลัดตารางคลังสินค้า

Note

จุดสิ้นสุด SQL เป็นแบบอ่านอย่างเดียวที่นี่

โฟลเดอร์ทรัพยากรของสมุดบันทึก

โฟลเดอร์ทรัพยากรในตัวของ ทรัพยากรสมุดบันทึก พร้อมใช้งานบน Python Notebook คุณสามารถโต้ตอบกับไฟล์ในโฟลเดอร์ทรัพยากรที่มีอยู่ภายในโดยใช้รหัส Python ราวกับว่าคุณกําลังทํางานกับระบบไฟล์ภายในเครื่องของคุณ ในขณะนี้ โฟลเดอร์ทรัพยากรสภาพแวดล้อมไม่ได้รับการสนับสนุน

การดําเนินการเคอร์เนล

โน้ตบุ๊ก Python รองรับเคอร์เนลในตัวสองเคอร์เนลในขณะนี้ ได้แก่ Python 3.10 และ Python 3.11 เคอร์เนลเริ่มต้นที่เลือกคือ Python 3.11 คุณสามารถสลับไปมาระหว่างเอกสารเหล่านั้นได้อย่างง่ายดาย

คุณสามารถขัดจังหวะ เริ่มระบบใหม่ หรือสลับเคอร์เนลบนแท็บ หน้าแรก ของ Ribbon ได้ การขัดจังหวะเคอร์เนลใน Python notebook จะเหมือนกับการยกเลิกเซลล์ในสมุดบันทึก Spark

สกรีนช็อตที่แสดงการดําเนินการเคอร์เนล

การออกจากเคอร์เนลที่ผิดปกติทําให้การเรียกใช้โค้ดถูกขัดจังหวะและสูญเสียตัวแปร แต่จะไม่หยุดเซสชันของสมุดบันทึก

มีคําสั่งที่อาจทําให้เคอร์เนลเสียชีวิต ตัวอย่างเช่น quit(),exit()

การจัดการห้องสมุด

คุณสามารถใช้คําสั่ง %pip และ %conda สําหรับการติดตั้งแบบอินไลน์คําสั่งรองรับทั้งไลบรารีสาธารณะและไลบรารีที่กําหนดเอง

สําหรับไลบรารีที่กําหนดเอง คุณสามารถอัปโหลดไฟล์ lib ไปยังโฟลเดอร์ทรัพยากรที่มีอยู่แล้วภายใน เรารองรับไลบรารีหลายประเภท รวมถึงรูปแบบต่างๆ เช่น Wheel (.whl), JAR (.jar), DLL (.dll) และ Python (.py) เพียงลองลากและวางไปที่ไฟล์และข้อมูลโค้ดจะถูกสร้างขึ้นโดยอัตโนมัติ

คุณอาจต้องรีสตาร์ทเคอร์เนลเพื่อใช้แพคเกจที่อัปเดตแล้ว

หากต้องการทําความเข้าใจและใช้คําสั่งที่คล้ายกันอย่างชัดเจน ให้ดูตารางด้านล่าง

Command/Syntax วัตถุประสงค์หลัก วิธีการทํางานในสมุดบันทึก Jupyter กรณีการใช้งานทั่วไป Notes
%pip install package ติดตั้งแพคเกจ Python เรียกใช้ pip ในเคอร์เนล Python ของสมุดบันทึก วิธีแนะนําในการติดตั้งแพคเกจ ใน Python Notebook เหมือนกับ !pip; ไม่ รีสตาร์ทเคอร์เนลโดยอัตโนมัติ
!pip install package ติดตั้งแพคเกจ Python ผ่านเชลล์ เรียกใช้ pip เป็นคําสั่งเชลล์ วิธีอื่นในการติดตั้งแพคเกจ ใน Python Notebook เหมือนกับ %pip; ไม่ รีสตาร์ทเคอร์เนลโดยอัตโนมัติ
import sys; sys.exit(0) รีสตาร์ทเคอร์เนลของสมุดบันทึก รีสตาร์ทเคอร์เนลทันที เคอร์เนลรีสตาร์ทโดยทางโปรแกรม ล้างตัวแปรและสถานะทั้งหมด ไม่แนะนําให้ ใช้โดยตรง
notebookutils.session.restartPython() รีสตาร์ทเคอร์เนลของสมุดบันทึก การโทร sys.exit(0) ภายใน วิธีที่แนะนําในการรีสตาร์ทเคอร์เนล API อย่างเป็นทางการ ปลอดภัยและเข้ากันได้มากกว่าการใช้ sys.exit(0) โดยตรง

Note

  • ใน Python Notebook %pip และมี!pipพฤติกรรมเหมือนกัน: ทั้งคู่ติดตั้งแพ็คเกจในสภาพแวดล้อมของเคอร์เนลปัจจุบัน และจะไม่รีสตาร์ทเคอร์เนลโดยอัตโนมัติหลังการติดตั้ง
  • หากคุณต้องการรีสตาร์ทเคอร์เนล (เช่น หลังจากติดตั้งแพ็คเกจบางแพ็คเกจแล้ว) ขอแนะนําให้ใช้แทนnotebookutils.session.restartPython()import sys; sys.exit(0)
    • notebookutils.session.restartPython() เป็น API อย่างเป็นทางการที่ครอบคลุม sys.exit(0) และปลอดภัยและเข้ากันได้มากขึ้นในสภาพแวดล้อมของสมุดบันทึก
  • ไม่ แนะนําให้ ใช้ sys.exit(0) โดยตรงเว้นแต่จําเป็น

การตรวจสอบการใช้ทรัพยากรแบบเรียลไทม์ของโน้ตบุ๊ก Python

สําคัญ

คุณลักษณะนี้อยู่ในตัวอย่าง

ด้วยบานหน้าต่างการตรวจสอบทรัพยากร คุณสามารถติดตามข้อมูลรันไทม์ที่สําคัญ เช่น ระยะเวลาเซสชัน ประเภทการประมวลผล และตัววัดทรัพยากรแบบเรียลไทม์ รวมถึงการใช้ CPU และหน่วยความจํา ได้โดยตรงภายในโน้ตบุ๊กของคุณ คุณลักษณะนี้ให้ภาพรวมทันทีของเซสชันที่ใช้งานอยู่ของคุณและทรัพยากรที่ใช้

การตรวจสอบทรัพยากรช่วยปรับปรุงการมองเห็นว่าปริมาณงาน Python ใช้ทรัพยากรระบบอย่างไร จัดการต้นทุน และลดความเสี่ยงของข้อผิดพลาดหน่วยความจําไม่เพียงพอ (OOM) ด้วยการตรวจสอบตัวชี้วัดแบบเรียลไทม์ คุณสามารถระบุการดําเนินการที่ใช้ทรัพยากรมาก วิเคราะห์รูปแบบการใช้งาน และตัดสินใจอย่างชาญฉลาดเกี่ยวกับการปรับขนาดหรือแก้ไขโค้ด

หากต้องการเริ่มใช้งาน ให้ตั้งค่าภาษาของสมุดบันทึกของคุณเป็น Python และเริ่มเซสชัน จากนั้นคุณสามารถเปิดจอภาพได้โดยคลิกทรัพยากรการคํานวณในแถบสถานะสมุดบันทึก หรือโดยการเลือก ดูการใช้ทรัพยากร จากแถบเครื่องมือ บานหน้าต่างการตรวจสอบทรัพยากรจะปรากฏขึ้นโดยอัตโนมัติ โดยให้ประสบการณ์การตรวจสอบแบบรวมสําหรับโค้ด Python ในสมุดบันทึก Fabric

สกรีนช็อตแสดงการตรวจสอบการใช้ทรัพยากรแบบเรียลไทม์ของสมุดบันทึก Python

คําสั่งเวทมนตร์การกําหนดค่าเซสชัน

เช่นเดียวกับการปรับแต่งการกําหนดค่าเซสชัน Spark ในสมุดบันทึก คุณยังสามารถใช้ %%configure ในสมุดบันทึก Python ได้เช่นกัน Python notebook รองรับการปรับแต่งขนาดโหนดคํานวณจุดต่อเชื่อมและเลคเฮ้าส์เริ่มต้นของเซสชันสมุดบันทึก ซึ่งสามารถใช้ในทั้งสมุดบันทึกแบบโต้ตอบและกิจกรรมสมุดบันทึกสําหรับไปป์ไลน์ เราขอแนะนําให้ใช้คําสั่ง %%configure ที่จุดเริ่มต้นของสมุดบันทึกของคุณ หรือคุณต้องเริ่มเซสชันของสมุดบันทึกใหม่เพื่อให้การตั้งค่ามีผล

นี่คือคุณสมบัติที่รองรับใน Python notebook %%configure:

%%configure -f
{
    "vCores": 4, // Recommended values: [4, 8, 16, 32, 64], Fabric will allocate matched memory according to the specified vCores.
    "defaultLakehouse": {  
        // Will overwrites the default lakehouse for current session
        "name": "<lakehouse-name>",
        "id": "<(optional) lakehouse-id>",
        "workspaceId": "<(optional) workspace-id-that-contains-the-lakehouse>" // Add workspace ID if it's from another workspace
    },
    "mountPoints": [
        {
            "mountPoint": "/myMountPoint",
            "source": "abfs[s]://<file_system>@<account_name>.dfs.core.windows.net/<path>"
        },
        {
            "mountPoint": "/myMountPoint1",
            "source": "abfs[s]://<file_system>@<account_name>.dfs.core.windows.net/<path1>"
        },
    ],
}

คุณสามารถดูการปรับปรุงทรัพยากรคํานวณบนแถบสถานะสมุดบันทึกและตรวจสอบการใช้ CPU และหน่วยความจําของโหนดการคํานวณในแบบเรียลไทม์

สกรีนช็อตที่แสดงการอัปเดตทรัพยากรคํานวณ

NotebookUtils

Notebook Utilities (NotebookUtils) เป็นแพคเกจในตัวเพื่อช่วยให้คุณทํางานทั่วไปได้อย่างง่ายดายใน Fabric Notebook มีการติดตั้งไว้ล่วงหน้าบนรันไทม์ Python คุณสามารถใช้ NotebookUtils เพื่อทํางานกับระบบไฟล์ เพื่อรับตัวแปรสภาพแวดล้อม เพื่อเกี่ยวโยงสมุดบันทึกเข้าด้วยกัน เพื่อเข้าถึงที่เก็บข้อมูลภายนอก และทํางานกับข้อมูลลับ

คุณสามารถใช้notebookutils.help()เพื่อแสดงรายการ API ที่มีอยู่และรับความช่วยเหลือเกี่ยวกับวิธีการ หรืออ้างอิงเอกสาร NotebookUtils

ยูทิลิตี้ข้อมูล

Note

ในขณะนี้ คุณลักษณะยังอยู่ในตัวอย่าง

คุณสามารถใช้โปรแกรมอรรถประโยชน์ notebookutils.data เพื่อสร้างการเชื่อมต่อกับแหล่งข้อมูลที่ให้มา จากนั้นอ่านและคิวรีข้อมูลโดยใช้คําสั่ง T-SQL

เรียกใช้คําสั่งต่อไปนี้เพื่อดูภาพรวมของวิธีการที่พร้อมใช้งาน:

notebookutils.data.help()

Output:

Help on module notebookutils.data in notebookutils:

NAME
    notebookutils.data - Utility for read/query data from connected data sources in Fabric

FUNCTIONS
    connect_to_artifact(artifact: str, workspace: str = '', artifact_type: str = '', **kwargs)
        Establishes and returns an ODBC connection to a specified artifact within a workspace 
        for subsequent data queries using T-SQL.
        
        :param artifact: The name or ID of the artifact to connect to.
        :param workspace:  Optional; The workspace in which the provided artifact is located, if not provided,
                             use the workspace where the current notebook is located.
        :param artifactType: Optional; The type of the artifact, Currently supported type are Lakehouse, Warehouse and MirroredDatabase. 
                                If not provided, the method will try to determine the type automatically.
        :param **kwargs Optional: Additional optional configuration. Supported keys include:
            - tds_endpoint : Allow user to specify a custom TDS endpoint to use for connection.
        :return: A connection object to the specified artifact.
        
        :raises UnsupportedArtifactException: If the specified artifact type is not supported to connect.
        :raises ArtifactNotFoundException: If the specified artifact is not found within the workspace.
        
        Examples:
            sql_query = "SELECT DB_NAME()"
            with notebookutils.data.connect_to_artifact("ARTIFACT_NAME_OR_ID", "WORKSPACE_ID", "ARTIFACT_TYPE") as conn:
                df = conn.query(sql_query)
                display(df)
    
    help(method_name: str = '') -> None
        Provides help for the notebookutils.data module or the specified method.
        
        Examples:
        notebookutils.data.help()
        notebookutils.data.help("connect_to_artifact")
        :param method_name: The name of the method to get help with.

DATA
    __all__ = ['help', 'connect_to_artifact']

FILE
    /home/trusted-service-user/jupyter-env/python3.10/lib/python3.10/site-packages/notebookutils/data.py

สอบถามข้อมูลจากเลคเฮ้าส์

conn = notebookutils.data.connect_to_artifact("lakehouse_name_or_id", "optional_workspace_id", "optional_lakehouse_type")
df = conn.query("SELECT * FROM sys.schemas;")

สอบถามข้อมูลจากคลังสินค้า

conn = notebookutils.data.connect_to_artifact("warehouse_name_or_id", "optional_workspace_id", "optional_warehouse_type")
df = conn.query("SELECT * FROM sys.schemas;")

การสืบค้นข้อมูลจากฐานข้อมูล SQL

conn = notebookutils.data.connect_to_artifact("sqldb_name_or_id", "optional_workspace_id", "optional_sqldatabase_type") 
df = conn.query("SELECT * FROM sys.schemas;")

Note

ยูทิลิตี้ข้อมูลใน NotebookUtils สามารถใช้งานได้บน Python notebook เท่านั้นสําหรับตอนนี้

เรียกดูส่วนย่อยของโค้ด

คุณสามารถค้นหาข้อมูลโค้ด python ที่มีประโยชน์ได้ใน แก้ไขแท็บ ->เรียกดูข้อมูลโค้ด ตัวอย่าง Python ใหม่พร้อมใช้งานแล้ว คุณสามารถเรียนรู้จากส่วนย่อยของโค้ด Python เพื่อเริ่มการสํารวจสมุดบันทึกได้

สกรีนช็อตที่แสดงตําแหน่งที่จะเรียกดูส่วนย่อยของโค้ด python

Semantic link เป็นคุณลักษณะที่ช่วยให้คุณสร้างการเชื่อมต่อระหว่าง โมเดลความหมาย และ Synapse Data Science ใน Microsoft Fabric ได้รับการสนับสนุนในแบบดั้งเดิมบน Python notebook วิศวกร BI และนักพัฒนา Power BI สามารถใช้ลิงก์ความหมายเชื่อมต่อและจัดการแบบจําลองความหมายได้อย่างง่ายดาย อ่าน เอกสารสาธารณะ เพื่อเรียนรู้เพิ่มเติมเกี่ยวกับลิงก์ความหมาย

Visualization

นอกเหนือจากการวาดแผนภูมิด้วยไลบรารีแล้ว ฟังก์ชัน การแสดงภาพในตัว ยังช่วยให้คุณสามารถเปลี่ยน DataFrames ให้เป็นการแสดงภาพข้อมูลในรูปแบบที่หลากหลาย คุณสามารถใช้ฟังก์ชัน display() บนดาต้าเฟรมเพื่อสร้างมุมมองตารางดาต้าเฟรมที่หลากหลายและมุมมองแผนภูมิ

สกรีนช็อตที่แสดงประสบการณ์การใช้งานการแสดงภาพใน Python notebook

Note

การกําหนดค่าแผนภูมิจะยังคงอยู่ใน Python notebook ซึ่งหมายความว่าหลังจากเรียกใช้เซลล์โค้ดอีกครั้ง หาก Schema ของ dataframe เป้าหมายไม่ได้เปลี่ยนแปลง แผนภูมิที่บันทึกไว้จะยังคงมีอยู่

รหัส intelliSense

Python notebook ยังใช้ Pylance เป็นเซิร์ฟเวอร์ภาษา สําหรับข้อมูลเพิ่มเติม โปรดดูที่ ปรับปรุง Python Development ด้วย Pylance

ความสามารถด้านวิทยาศาสตร์ข้อมูล

เยี่ยมชมเอกสาร Data Science ใน Microsoft Fabric เพื่อเรียนรู้เพิ่มเติมด้านวิทยาศาสตร์ข้อมูลและประสบการณ์ AI ใน Fabric ต่อไปนี้เราจะแสดงรายการฟีเจอร์วิทยาศาสตร์ข้อมูลที่สําคัญบางตัวที่ได้รับการสนับสนุนใน Python notebook ในแบบดั้งเดิม

  • Data Wrangler: Data Wrangler เป็นเครื่องมือที่ใช้โน้ตบุ๊กที่มีอินเทอร์เฟซที่สมจริงสําหรับการวิเคราะห์ข้อมูลการสํารวจ คุณลักษณะนี้รวมการแสดงผลข้อมูลที่คล้ายกับเส้นตารางด้วยสถิติสรุปแบบไดนามิก การแสดงภาพที่มีอยู่ภายใน และไลบรารีของการดําเนินการทําความสะอาดข้อมูลทั่วไป ซึ่งให้การทําความสะอาดข้อมูล การแปลงข้อมูล และการรวมกัน ซึ่งจะเร่งการเตรียมข้อมูลด้วย Data Wrangler

  • MLflow: การทดลองแมชชีนเลิร์นนิงเป็นหน่วยหลักขององค์กรและการควบคุมสําหรับการเรียกใช้แมชชีนเลิร์นนิงที่เกี่ยวข้องทั้งหมด การเรียกใช้สอดคล้องกับการดําเนินการเดียวของรหัสแบบจําลอง

  • Fabric Auto Logging: Synapse Data Science ใน Microsoft Fabric รวมถึงการบันทึกอัตโนมัติซึ่งจะช่วยลดปริมาณโค้ดที่จําเป็นในการบันทึกพารามิเตอร์เมตริกและรายการของแบบจําลองการเรียนรู้ของเครื่องในระหว่างการฝึกอบรมโดยอัตโนมัติ

    การล็อกอัตโนมัติขยายความสามารถในการติดตามกระแส ML การบันทึกอัตโนมัติสามารถจับภาพเมตริกต่าง ๆ รวมถึงความแม่นยํา การสูญเสีย คะแนน F1 และเมตริกที่กําหนดเองที่คุณกําหนด นักพัฒนาซอฟต์แวร์และนักวิทยาศาสตร์ข้อมูลสามารถติดตามและเปรียบเทียบประสิทธิภาพของแบบจําลองและการทดลองที่แตกต่างกันได้อย่างง่ายดายโดยไม่ต้องติดตามด้วยตนเอง

  • Copilot: สมุดบันทึก Copilot for Data Science และ Data Engineering เป็นผู้ช่วย AI ที่ช่วยคุณวิเคราะห์และแสดงภาพข้อมูล ซึ่งทํางานร่วมกับตารางเลคเฮ้าส์ ชุดข้อมูล Power BI และเฟรมข้อมูล pandas/spark ให้คําตอบและส่วนย่อยของโค้ดโดยตรงในสมุดบันทึก คุณสามารถใช้แผงแชท Copilot และ Char-magics ในสมุดบันทึกได้ และ AI จะตอบกลับหรือโค้ดเพื่อคัดลอกลงในสมุดบันทึกของคุณได้

ข้อจํากัดที่ทราบในการแสดงตัวอย่างสาธารณะ

  • ประสบการณ์การพูลสดไม่รับประกันสําหรับการเรียกใช้สมุดบันทึก python ทุกครั้ง เวลาเริ่มต้นเซสชันอาจใช้เวลาถึง 3 นาที ถ้าการเรียกใช้สมุดบันทึกไม่เข้าไปยังพูลที่ถ่ายทอดสด เมื่อการใช้โน้ตบุ๊ค Python เพิ่มขึ้น วิธีการพูลอัจฉริยะของเราค่อย ๆ เพิ่มการจัดสรรพูลสดเพื่อตอบสนองความต้องการ

  • การรวมสภาพแวดล้อมไม่พร้อมใช้งานบน Python notebook โดยการแสดงตัวอย่างสาธารณะ

  • ตั้งค่าการหมดเวลาของเซสชันไม่พร้อมใช้งานในตอนนี้

  • Copilot อาจสร้างคําสั่ง Spark ซึ่งอาจไม่สามารถดําเนินการได้ใน Python notebook

  • ในปัจจุบัน Copilot บน Python notebook ยังไม่ได้รับการรองรับอย่างสมบูรณ์ในหลายภูมิภาค กระบวนการปรับใช้ยังคงต้องติดตามอย่างต่อเนื่องขณะที่เรายังคงเผยแพร่การสนับสนุนในภูมิภาคเพิ่มเติม