แชร์ผ่าน


คําศัพท์สําหรับ Microsoft Fabric

เรียนรู้คําจํากัดความของคําศัพท์ที่ใช้ใน Microsoft Fabric รวมถึงคําศัพท์เฉพาะสําหรับ Synapse Data Warehouse, Synapse วิศวกรข้อมูล ing, Synapse Data Science, Real-Time Intelligence, Data Factory และ Power BI

ข้อกําหนดทั่วไป

  • ความจุ: ความจุคือชุดทรัพยากรเฉพาะที่พร้อมใช้งานในเวลาที่กําหนดที่จะใช้ ความจุจะกําหนดความสามารถของทรัพยากรในการดําเนินการกิจกรรมหรือเพื่อสร้างเอาต์พุต รายการต่าง ๆ ใช้ความจุที่แตกต่างกันในบางช่วงเวลา ผ้ามีความจุผ่าน Fabric SKU และการทดลองใช้ สําหรับข้อมูลเพิ่มเติม ให้ดู ความจุคืออะไร

  • ประสบการณ์: คอลเลกชันของความสามารถที่กําหนดเป้าหมายไปยังฟังก์ชันการทํางานที่เฉพาะเจาะจง ประสบการณ์การใช้งาน Fabric ประกอบด้วย Synapse Data Warehouse, Synapse วิศวกรข้อมูล ing, วิทยาศาสตร์ข้อมูล Synapse, Real-Time Intelligence, Data Factory และ Power BI

  • รายการ: ชุดความสามารถภายในประสบการณ์ ผู้ใช้สามารถสร้าง แก้ไข และลบรายการเหล่านั้นได้ หน่วยข้อมูลแต่ละชนิดมีความสามารถแตกต่างกัน ตัวอย่างเช่น ประสบการณ์วิศวกรข้อมูลประกอบด้วยเลคเฮาส์ สมุดบันทึก และรายการข้อกําหนดงาน Spark

  • ผู้เช่า: ผู้เช่าคืออินสแตนซ์เดียวของ Fabric สําหรับองค์กรและสอดคล้องกับรหัส Microsoft Entra

  • พื้นที่ทํางาน: พื้นที่ทํางานเป็นคอลเลกชันของรายการที่รวบรวมฟังก์ชันการทํางานที่แตกต่างกันในสภาพแวดล้อมเดียวที่ออกแบบมาสําหรับการทํางานร่วมกัน ซึ่งทําหน้าที่เป็นคอนเทนเนอร์ที่ใช้ความจุสําหรับงานที่ดําเนินการและมีการควบคุมว่าใครสามารถเข้าถึงรายการในนั้นได้ ตัวอย่างเช่น ในพื้นที่ทํางาน ผู้ใช้สร้างรายงาน สมุดบันทึก แบบจําลองความหมาย ฯลฯ สําหรับข้อมูลเพิ่มเติม ดูบทความพื้นที่ทํางาน

วิศวกรรมข้อมูลของ Synapse

  • เลคเฮ้าส์: เลคเฮ้าส์ เป็นคอลเลกชันของไฟล์ โฟลเดอร์ และตารางที่แสดงฐานข้อมูลผ่าน data lake ที่ใช้โดยกลไก Apache Spark และกลไกจัดการ SQL สําหรับการประมวลผลข้อมูลขนาดใหญ่ เลคเฮ้าส์รวมถึงความสามารถที่เพิ่มขึ้นสําหรับธุรกรรม ACID เมื่อใช้ตารางที่มีการจัดรูปแบบ Delta แบบโอเพนซอร์ส รายการ lakehouse ถูกโฮสต์ไว้ภายในโฟลเดอร์พื้นที่ทํางานที่ไม่ซ้ํากันใน Microsoft OneLake ซึ่งประกอบด้วยไฟล์ในรูปแบบต่าง ๆ (มีโครงสร้างและไม่มีโครงสร้าง) จัดระเบียบในโฟลเดอร์และโฟลเดอร์ย่อย สําหรับข้อมูลเพิ่มเติม โปรดดู ที่ เลคเฮ้าส์คืออะไร

  • โน้ตบุ๊ค: โน้ตบุ๊ค Fabric เป็นเครื่องมือการเขียนโปรแกรมแบบโต้ตอบหลายภาษาพร้อมฟังก์ชั่นที่สมบูรณ์ ซึ่งรวมถึงการเขียนโค้ดและ Markdown การเรียกใช้และการตรวจสอบงาน Spark การดูและการแสดงภาพผลลัพธ์ และการทํางานร่วมกันกับทีม ซึ่งช่วยให้วิศวกรข้อมูลและนักวิทยาศาสตร์ข้อมูลสามารถสํารวจและประมวลผลข้อมูล และสร้างการทดลองการเรียนรู้ของเครื่องด้วยประสบการณ์การใช้งานทั้งโค้ดและรหัสต่ํา ซึ่งสามารถแปลงเป็นกิจกรรมไปป์ไลน์สําหรับ orchestration ได้อย่างง่ายดาย

  • แอปพลิเคชัน Spark: แอปพลิเคชัน Apache Spark เป็นโปรแกรมที่เขียนโดยผู้ใช้โดยใช้หนึ่งในภาษา API ของ Spark (Scala, Python, Spark SQL หรือ Java) หรือภาษาที่เพิ่มโดย Microsoft (.NET ด้วย C# หรือ F#) เมื่อแอปพลิเคชันทํางาน แอปพลิเคชันจะถูกแบ่งออกเป็นงาน Spark อย่างน้อยหนึ่งงานที่ทํางานควบคู่ไปกับการประมวลผลข้อมูลได้รวดเร็วยิ่งขึ้น สําหรับข้อมูลเพิ่มเติม ให้ดู การตรวจสอบแอปพลิเคชัน Spark

  • งาน Apache Spark: งาน Spark เป็นส่วนหนึ่งของแอปพลิเคชัน Spark ที่เรียกใช้ควบคู่ไปกับงานอื่น ๆ ในแอปพลิเคชัน งานประกอบด้วยหลายงาน สําหรับข้อมูลเพิ่มเติม ให้ดู การตรวจสอบงาน Spark

  • ข้อกําหนดงาน Apache Spark: ข้อกําหนดงาน Spark คือชุดพารามิเตอร์ที่กําหนดโดยผู้ใช้ ซึ่งระบุว่าควรเรียกใช้แอปพลิเคชัน Spark อย่างไร ซึ่งช่วยให้คุณสามารถส่งชุดงานหรือสตรีมมิ่งงานไปยังคลัสเตอร์ Spark สําหรับข้อมูลเพิ่มเติม ให้ดู ข้อกําหนดงาน Apache Spark คืออะไร

  • V-order: การปรับให้เหมาะสมสําหรับการเขียนในรูปแบบไฟล์ parquet ที่ช่วยให้สามารถอ่านได้อย่างรวดเร็วและมีประสิทธิภาพด้านต้นทุนและประสิทธิภาพที่ดีขึ้น กลไก Fabric ทั้งหมดเขียนไฟล์ parquet แบบ v-ordered ตามค่าเริ่มต้น

คลังข้อมูล

  • เชื่อมต่อหรือ: Data Factory มีชุดตัวเชื่อมต่อที่หลากหลายที่ช่วยให้คุณสามารถเชื่อมต่อกับที่เก็บข้อมูลประเภทต่าง ๆ ได้ เมื่อเชื่อมต่อแล้ว คุณสามารถแปลงข้อมูลได้ สําหรับข้อมูลเพิ่มเติม ดู ตัวเชื่อมต่อ

  • ไปป์ไลน์ข้อมูล: ใน Data Factory จะใช้ไปป์ไลน์ข้อมูลสําหรับการเรียงการเคลื่อนย้ายและการแปลงข้อมูล ไปป์ไลน์เหล่านี้แตกต่างจากไปป์ไลน์การปรับใช้ใน Fabric สําหรับข้อมูลเพิ่มเติม ดู ไปป์ไลน์ ในภาพรวม Data Factory

  • กระแสข้อมูล Gen2: กระแสข้อมูลมีอินเทอร์เฟซที่มีรหัสต่ําสําหรับการนําเข้าข้อมูลจากแหล่งข้อมูลหลายร้อยแหล่งและแปลงข้อมูลของคุณ กระแสข้อมูลใน Fabric เรียกว่ากระแสข้อมูล Gen2 มีกระแสข้อมูลรุ่น 1 อยู่ใน Power BI กระแสข้อมูล Gen2 มีความสามารถพิเศษเมื่อเทียบกับกระแสข้อมูลใน Azure Data Factory หรือ Power BI คุณไม่สามารถอัปเกรดจาก Gen1 เป็น Gen2 ได้ สําหรับข้อมูลเพิ่มเติม โปรดดู กระแส ข้อมูลในภาพรวม Data Factory

วิทยาศาสตร์ข้อมูล Synapse

  • Data Wrangler: Data Wrangler เป็นเครื่องมือบนสมุดบันทึกที่มอบประสบการณ์การใช้งานอันดื่มด่ําในการดําเนินการวิเคราะห์ข้อมูลแบบสํารวจ คุณลักษณะนี้รวมการแสดงผลข้อมูลที่คล้ายกับตารางด้วยสถิติสรุปแบบไดนามิกและชุดของการดําเนินการล้างข้อมูลทั่วไปที่พร้อมใช้งานกับไอคอนที่เลือกไม่กี่รายการ การดําเนินการแต่ละรายการจะสร้างโค้ดที่สามารถบันทึกกลับไปยังสมุดบันทึกให้เป็นสคริปต์ที่นํามาใช้ใหม่ได้

  • การทดลอง: การทดลองการเรียนรู้ของเครื่องเป็นหน่วยหลักขององค์กรและควบคุมการเรียกใช้การเรียนรู้ของเครื่องที่เกี่ยวข้องทั้งหมด สําหรับข้อมูลเพิ่มเติม โปรดดู การทดลองการเรียนรู้ของเครื่องใน Microsoft Fabric

  • แบบจําลอง: แบบจําลองการเรียนรู้ของเครื่องเป็นไฟล์ที่ได้รับการฝึกฝนเพื่อจดจํารูปแบบบางประเภท คุณฝึกแบบจําลองผ่านชุดข้อมูลและคุณให้ข้อมูลด้วยอัลกอริทึมที่ใช้เพื่อเหตุผลและเรียนรู้จากชุดข้อมูลนั้น สําหรับข้อมูลเพิ่มเติม ให้ดู แบบจําลองการเรียนรู้ของเครื่อง

  • เรียกใช้: การเรียกใช้ที่สอดคล้องกับการดําเนินการของโค้ดแบบจําลองเดียว ใน MLflow การติดตามจะขึ้นอยู่กับการทดลองและการทํางาน

คลังข้อมูล Synapse

  • จุดสิ้นสุดการวิเคราะห์ SQL: เลคเฮ้าส์แต่ละแห่งมีจุดสิ้นสุดการวิเคราะห์ SQL ที่ช่วยให้ผู้ใช้สามารถคิวรีข้อมูลตาราง delta ด้วย TSQL บน TDS ได้ สําหรับข้อมูลเพิ่มเติม โปรดดู จุดสิ้นสุดการวิเคราะห์ SQL

  • Synapse Data Warehouse: ฟังก์ชัน Synapse Data Warehouse เป็นคลังข้อมูลแบบดั้งเดิมและสนับสนุนความสามารถทรานแซคชัน T-SQL เต็มรูปแบบที่คุณคาดหวังจากคลังข้อมูลขององค์กร สําหรับข้อมูลเพิ่มเติม ดู Synapse Data Warehouse

ตัวแสดงเวลาจริง

  • ฐานข้อมูล KQL: ฐานข้อมูล KQL เก็บข้อมูลในรูปแบบที่คุณสามารถดําเนินการคิวรี KQL ได้ สําหรับข้อมูลเพิ่มเติม ดู คิวรีฐานข้อมูล KQL

  • ชุดคิวรี KQL: คิวรี KQL คือรายการที่ใช้ในการเรียกใช้คิวรี ดูผลลัพธ์ และจัดการผลลัพธ์คิวรีบนข้อมูลจากฐานข้อมูล Data Explorer ของคุณ ชุดคิวรีประกอบด้วยฐานข้อมูลและตาราง คิวรี และผลลัพธ์ KQL Queryset ช่วยให้คุณสามารถบันทึกคิวรีสําหรับการใช้งานในอนาคต หรือส่งออกและแชร์คิวรีกับผู้อื่นได้ สําหรับข้อมูลเพิ่มเติม ดูข้อมูล คิวรีในชุดคิวรี KQL

  • สตรีมเหตุการณ์: คุณลักษณะสตรีมเหตุการณ์ Microsoft Fabric มีพื้นที่ส่วนกลางในแพลตฟอร์ม Fabric เพื่อจับภาพ แปลง และกําหนดเส้นทางเหตุการณ์แบบเรียลไทม์ไปยังปลายทางที่มีประสบการณ์แบบไม่มีรหัส สตรีมเหตุการณ์ประกอบด้วยแหล่งข้อมูลการสตรีมต่างๆ ปลายทางการนําเข้า และตัวประมวลผลเหตุการณ์เมื่อจําเป็นต้องมีการแปลงข้อมูล สําหรับข้อมูลเพิ่มเติม ดู สตรีมเหตุการณ์ของ Microsoft Fabric

OneLake

  • ทางลัด: ทางลัดคือการอ้างอิงแบบฝังตัวภายใน OneLake ที่ชี้ไปยังตําแหน่งจัดเก็บไฟล์อื่น พวกเขาให้วิธีการเชื่อมต่อกับข้อมูลที่มีอยู่โดยไม่ต้องคัดลอกโดยตรง สําหรับข้อมูลเพิ่มเติม ให้ดู ทางลัด OneLake