แชร์ผ่าน


ทางลัด OneLake

ด้วยทางลัดใน Microsoft OneLake คุณสามารถรวมข้อมูลของคุณข้ามโดเมน ระบบคลาวด์ และบัญชีต่างๆ เข้าด้วยกันได้โดยทําให้ OneLake เป็นที่จัดเก็บข้อมูลดิบเสมือนเดียวสําหรับทั้งองค์กรของคุณ ประสบการณ์แฟบริคและกลไกการวิเคราะห์สามารถเชื่อมต่อกับแหล่งข้อมูลที่มีอยู่ของคุณ รวมถึง Azure, Amazon Web Services (AWS) และ OneLake ผ่านเนมสเปซแบบรวม OneLake จัดการสิทธิ์และข้อมูลประจําตัวทั้งหมด ดังนั้นคุณไม่จําเป็นต้องกําหนดค่าปริมาณงาน Fabric แต่ละรายการแยกต่างหากเพื่อเชื่อมต่อกับแต่ละแหล่งข้อมูล นอกจากนี้ คุณยังสามารถใช้ทางลัดเพื่อกําจัดสําเนาขอบของข้อมูล และลดเวลาแฝงของกระบวนการที่เกี่ยวข้องกับสําเนาข้อมูลและการแบ่งระยะได้

ทางลัดคืออะไร

ทางลัดคือวัตถุใน OneLake ที่ชี้ไปยังตําแหน่งที่เก็บข้อมูลอื่น ตําแหน่งที่ตั้งสามารถอยู่ภายในหรือภายนอกไปยัง OneLake ได้ ตําแหน่งที่ตั้งที่คําสั่งลัดชี้ไปเรียกว่า เส้นทางเป้าหมาย ของคําสั่งลัด ตําแหน่งที่คําสั่งลัดแสดงขึ้นเรียกว่าเส้นทางคําสั่งลัด

ทางลัดจะปรากฏเป็นโฟลเดอร์ใน OneLake และบริการหรือปริมาณงานที่มีสิทธิ์เข้าถึง OneLake สามารถใช้ได้ ทางลัดทํางานเหมือนกับลิงก์ที่เป็นสัญลักษณ์ ซึ่งเป็นวัตถุอิสระจากเป้าหมาย ถ้าคุณลบปุ่มลัด เป้าหมายยังคงไม่ได้รับผลกระทบ ถ้าคุณย้าย เปลี่ยนชื่อ หรือลบเส้นทางเป้าหมาย ทางลัดสามารถหยุดได้

แผนภาพที่แสดงวิธีการที่ทางลัดเชื่อมต่อแฟ้มและโฟลเดอร์ที่จัดเก็บไว้ในตําแหน่งที่ตั้งอื่น

ฉันสามารถสร้างทางลัดได้ที่ไหน

คุณสามารถสร้างทางลัดในฐานข้อมูล lakehouses และ Kusto Query Language (KQL) ได้

คุณสามารถใช้พอร์ทัล Fabric เพื่อสร้างทางลัดแบบโต้ตอบ และคุณสามารถใช้ REST API เพื่อสร้างทางลัดโดยทางโปรแกรมได้

เลคเฮ้าส์

เมื่อสร้างทางลัดในเลคเฮ้าส์ คุณต้องทําความเข้าใจโครงสร้างโฟลเดอร์ของรายการ เลคเฮาส์มีโฟลเดอร์ระดับบนสุดสองโฟลเดอร์: โฟลเดอร์ตารางและโฟลเดอร์ไฟล์ โฟลเดอร์ตารางเป็นส่วนที่มีการจัดการของเลคเฮาส์สําหรับชุดข้อมูลที่มีโครงสร้าง โฟลเดอร์ไฟล์เป็นส่วนที่ไม่มีการจัดการของเลคเฮาส์สําหรับข้อมูลที่ไม่มีโครงสร้างหรือกึ่งโครงสร้าง

ในโฟลเดอร์ตาราง คุณสามารถสร้างทางลัดได้เฉพาะในระดับบนสุดเท่านั้น คําสั่งลัดไม่ได้รับการสนับสนุนในไดเรกทอรีย่อยของโฟลเดอร์ตาราง โดยทั่วไปทางลัดในส่วนตารางจะชี้ไปยังแหล่งข้อมูลภายในภายใน OneLake หรือลิงก์ไปยังแอสเซทข้อมูลอื่น ๆ ที่สอดคล้องกับรูปแบบตาราง Delta ถ้าเป้าหมายของทางลัดมีข้อมูลในรูปแบบ Delta Parquet เลคเฮาส์จะซิงโครไนซ์ข้อมูลเมตาโดยอัตโนมัติและจดจําโฟลเดอร์เป็นตาราง ทางลัดในส่วนตารางสามารถเชื่อมโยงไปยังตารางเดียวหรือเค้าร่าง ซึ่งเป็นโฟลเดอร์หลักสําหรับตารางหลายตาราง

หมายเหตุ

รูปแบบ Delta ไม่สนับสนุนตารางที่มีอักขระช่องว่างในชื่อ ทางลัดใด ๆ ที่มีช่องว่างในชื่อจะไม่ได้รับการค้นพบเป็นตาราง Delta ในเลคเฮาส์

ในโฟลเดอร์ไฟล์ จะไม่มีข้อจํากัดเกี่ยวกับตําแหน่งที่คุณสามารถสร้างทางลัดได้ คุณสามารถสร้างทางลัดในระดับใดก็ได้ของลําดับชั้นของโฟลเดอร์ การค้นพบตารางจะไม่เกิดขึ้นในโฟลเดอร์ไฟล์ ทางลัดที่นี่สามารถชี้ไปที่ OneLake ภายในและระบบจัดเก็บข้อมูลภายนอกที่มีข้อมูลในรูปแบบใดก็ได้

แผนภาพที่แสดงมุมมองทะเลสาบและมุมมองตารางแบบเคียงข้างกัน

ฐานข้อมูล KQL

เมื่อคุณสร้างทางลัดในฐานข้อมูล KQL จะปรากฏใน โฟลเดอร์ ทางลัด ของฐานข้อมูล ฐานข้อมูล KQL จะถือว่าทางลัดเช่นตารางภายนอก เมื่อต้องการคิวรีทางลัด ให้ใช้ external_table ฟังก์ชันของภาษาคิวรี Kusto

สกรีนช็อตของทางลัดภายในฐานข้อมูล KQL

ฉันจะเข้าถึงทางลัดได้ที่ไหน

การบริการ Fabric หรือ non-Fabric ใด ๆ ที่สามารถเข้าถึงข้อมูลใน OneLake สามารถใช้ทางลัดได้ ทางลัดจะโปร่งใสสําหรับบริการใดๆ ที่เข้าถึงข้อมูลผ่าน OneLake API ทางลัดจะปรากฏเป็นโฟลเดอร์อื่นใน lake Apache Spark, SQL, Real-Time Intelligence และ Analysis Services สามารถใช้ทางลัดทั้งหมดเมื่อทําการคิวรีข้อมูล

Apache Spark

Apache Spark notebooks และ Apache Spark job สามารถใช้ทางลัดที่คุณสร้างใน OneLake ได้ ใช้เส้นทางไฟล์สัมพัทธ์เพื่ออ่านข้อมูลโดยตรงจากทางลัด นอกจากนี้ ถ้าคุณสร้างทางลัดในส่วน ตาราง ของ lakehouse และอยู่ในรูปแบบ Delta คุณสามารถอ่านเป็นตารางที่มีการจัดการโดยใช้ไวยากรณ์ Apache Spark SQL

df = spark.read.format("delta").load("Tables/MyShortcut")
display(df)
df = spark.sql("SELECT * FROM MyLakehouse.MyShortcut LIMIT 1000")
display(df)

SQL

คุณสามารถอ่านทางลัดในส่วน ตาราง ของเลคเฮ้าส์ผ่านจุดสิ้นสุดการวิเคราะห์ SQL สําหรับเลคเฮ้าส์ คุณสามารถเข้าถึงจุดสิ้นสุดการวิเคราะห์ SQL ผ่านตัวเลือกโหมดของเลคเฮ้าส์หรือผ่าน SQL Server Management Studio (SSMS) ได้

SELECT TOP (100) *
FROM [MyLakehouse].[dbo].[MyShortcut]

ระบบอัจฉฉริยะในเวลาจริง

ทางลัดในฐานข้อมูล KQL จะถูกรับรู้ว่าเป็นตารางภายนอก เมื่อต้องการคิวรีทางลัด ให้ใช้ external_table ฟังก์ชันของภาษาคิวรี Kusto

external_table('MyShortcut')
| take 100

Analysis Services

คุณสามารถสร้างแบบจําลองเชิงความหมายสําหรับเลคเฮ้าส์ที่มีทางลัดในส่วน ตาราง ของเลคเฮ้าส์ เมื่อแบบจําลองความหมายทํางานในโหมด Direct Lake Analysis Services สามารถอ่านข้อมูลได้โดยตรงจากปุ่มลัด

บริการที่ไม่ใช่ Fabric

แอปพลิเคชันและบริการภายนอก Fabric ยังสามารถเข้าถึงทางลัดผ่าน OneLake API ได้ OneLake สนับสนุนชุดย่อยของ API ที่เก็บข้อมูล ADLS Gen2 และ Blob เมื่อต้องการเรียนรู้เพิ่มเติมเกี่ยวกับ OneLake API ดูการเข้าถึง OneLake ด้วย API

https://onelake.dfs.fabric.microsoft.com/MyWorkspace/MyLakhouse/Tables/MyShortcut/MyFile.csv

ชนิดของทางลัด

ทางลัด OneLake สนับสนุนแหล่งข้อมูลระบบไฟล์หลายแหล่ง ซึ่งรวมถึงตําแหน่งที่ตั้ง OneLake ภายในและแหล่งข้อมูลภายนอกหรือของบุคคลที่สาม

คุณยังสามารถ สร้างทางลัดไปยังตําแหน่งที่ตั้งภายในองค์กรหรือเครือข่ายที่จํากัด ด้วยการใช้เกตเวย์ข้อมูลภายในองค์กร (OPDG) ของ Fabric

ทางลัด OneLake ภายใน

ทางลัด OneLake ภายในช่วยให้คุณสามารถอ้างอิงข้อมูลภายในรายการ Fabric ที่มีอยู่รวมถึง:

  • ฐานข้อมูล KQL
  • เลคเฮ้าส์
  • แค็ตตาล็อก Azure Databricks ที่มิเรอร์
  • ฐานข้อมูลมิเรอร์
  • แบบจําลองความหมาย
  • ฐานข้อมูล SQL
  • คลังสินค้า

สําหรับคําแนะนําในการสร้างทางลัดภายใน โปรดดู สร้างทางลัด OneLake ภายใน

ทางลัดสามารถชี้ไปยังตําแหน่งโฟลเดอร์ภายในรายการเดียวกัน ข้ามรายการภายในพื้นที่ทํางานเดียวกัน หรือแม้กระทั่งข้ามรายการในพื้นที่ทํางานอื่น เมื่อคุณสร้างทางลัดข้ามรายการ ชนิดหน่วยข้อมูลไม่จําเป็นต้องตรงกัน ตัวอย่างเช่น คุณสามารถสร้างทางลัดในเลคเฮ้าส์ที่ชี้ไปยังข้อมูลในคลังข้อมูลได้

เมื่อผู้ใช้เข้าถึงข้อมูลผ่านทางลัดไปยังตําแหน่ง OneLake อื่น OneLake จะใช้ข้อมูลประจําตัวของผู้ใช้ที่เรียกเพื่ออนุญาตให้เข้าถึงข้อมูลในเส้นทางเป้าหมายของทางลัด ผู้ใช้นี้ต้องมีสิทธิ์ในตําแหน่งที่ตั้งเป้าหมายในการอ่านข้อมูล

สำคัญ

เมื่อเข้าถึงทางลัดผ่าน แบบจําลองความหมายของ Power BI โดยใช้ DirectLake ผ่านกลไกจัดการ SQL หรือ T-SQL ในโหมดข้อมูลประจําตัวที่ได้รับมอบสิทธิ์ ข้อมูลประจําตัวของผู้ใช้ที่เรียกใช้จะไม่ถูกส่งผ่านไปยังเป้าหมายทางลัด ข้อมูลประจําตัวของเจ้าของรายการที่เรียกจะถูกส่งผ่านแทน มอบหมายการเข้าถึงให้กับผู้ใช้ที่เรียก เพื่อแก้ไขปัญหานี้ ให้ใช้แบบจําลองความหมาย Power BI ใน DirectLake ผ่านโหมด OneLake หรือ T-SQL ในโหมดข้อมูลประจําตัวของผู้ใช้

ทางลัด OneLake ภายนอก

สําหรับคําแนะนําโดยละเอียดในการสร้างประเภทคําสั่งลัดที่เฉพาะเจาะจง ให้เลือกบทความจากรายการแหล่งข้อมูลภายนอกที่รองรับนี้:

การแคช

การแคชทางลัดสามารถลดค่าใช้จ่ายในการเข้าถึงข้อมูลข้ามคลาวด์ได้ เมื่อไฟล์ถูกอ่านผ่านทางลัดภายนอก ไฟล์จะถูกเก็บไว้ในแคชสําหรับพื้นที่ทํางาน Fabric คําขอการอ่านที่ตามมาจะถูกแสดงจากแคชแทนที่จะเป็นผู้ให้บริการที่เก็บข้อมูลระยะไกล ระยะเวลาการเก็บข้อมูลสําหรับไฟล์ที่แคชไว้สามารถตั้งค่าได้ตั้งแต่ 1-28 วัน แต่ละครั้งที่มีการเข้าถึงไฟล์ ระยะเวลาการเก็บรักษาจะถูกรีเซ็ต ถ้าแฟ้มในผู้ให้บริการที่เก็บข้อมูลระยะไกลเร็วกว่าแฟ้มในแคช ถ้าไม่มีการเข้าถึงไฟล์มานานกว่าระยะเวลาการเก็บข้อมูลที่เลือก ไฟล์จะถูกลบออกจากแคช แต่ละไฟล์ที่มีขนาดมากกว่า 1 GB จะไม่ถูกแคช

หมายเหตุ

ขณะนี้การแคชทางลัดได้รับการสนับสนุนสําหรับทางลัด GCS, S3, S3 ที่เข้ากันได้ และเกตเวย์ข้อมูลภายในองค์กร

หากต้องการเปิดใช้งานการแคชสําหรับทางลัด ให้เปิดแผง การตั้งค่า พื้นที่ทํางาน เลือกแท็บ OneLake สลับการตั้งค่าแคชไปเป็น เมื่อ และเลือกระยะเวลาการเก็บข้อมูล

แคชยังสามารถล้างออกได้ทุกเมื่อ จากหน้าการตั้งค่าเดียวกัน เลือกปุ่ม รีเซ็ตแคช การดําเนินการนี้จะเป็นการลบไฟล์ทั้งหมดออกจากแคชทางลัดในพื้นที่ทํางานนี้

สกรีนช็อตของแผงการตั้งค่าพื้นที่ทํางานที่เลือกแท็บ OneLake

ทางลัดใช้การเชื่อมต่อระบบคลาวด์อย่างไร

การอนุญาตทางลัด ADLS และ S3 จะได้รับมอบหมายโดยใช้การเชื่อมต่อระบบคลาวด์ เมื่อคุณสร้างทางลัด ADLS หรือ S3 ใหม่ คุณต้องสร้างการเชื่อมต่อใหม่หรือเลือกการเชื่อมต่อที่มีอยู่สําหรับแหล่งข้อมูล การตั้งค่าการเชื่อมต่อสําหรับทางลัดคือการดําเนินการที่ผูกไว้ เฉพาะผู้ใช้ที่มีสิทธิ์ในการเชื่อมต่อเท่านั้นที่สามารถทําการดําเนินการผูกได้ ถ้าคุณไม่มีสิทธิ์ในการเชื่อมต่อ คุณจะไม่สามารถสร้างทางลัดใหม่โดยใช้การเชื่อมต่อนั้นได้

การรักษาความปลอดภัยทางลัด

ทางลัดต้องการสิทธิ์บางอย่างในการจัดการและใช้ การรักษาความปลอดภัย ทางลัดของ OneLake จะดูที่สิทธิ์ที่จําเป็นในการสร้างทางลัดและเข้าถึงข้อมูลโดยใช้ทางลัดเหล่านั้น

ทางลัดจัดการกับการลบอย่างไร

ทางลัดจะไม่ดําเนินการลบแบบเรียงซ้อน เมื่อคุณลบทางลัด คุณจะลบเฉพาะออบเจ็กต์ทางลัดเท่านั้น ข้อมูลในเป้าหมายทางลัดจะยังคงไม่เปลี่ยนแปลง อย่างไรก็ตาม ถ้าคุณลบแฟ้มหรือโฟลเดอร์ภายในทางลัด และคุณมีสิทธิ์ในเป้าหมายทางลัดเพื่อดําเนินการลบ แฟ้มหรือโฟลเดอร์จะถูกลบในเป้าหมาย

ตัวอย่างเช่น พิจารณาเลคเฮ้าส์ที่มีเส้นทางดังต่อไปนี้: MyLakehouse\Files\MyShortcut\Foo\Bar MyShortcut เป็นทางลัดที่ชี้ไปยังบัญชี ADLS Gen2 ที่มีไดเรกทอรี Foo\Bar

คุณสามารถดําเนินการลบบนเส้นทางต่อไปนี้: MyLakehouse\Files\MyShortcut ในกรณีนี้ ทางลัด MyShortcut จะถูกลบออกจาก lakehouse แต่ไฟล์และไดเรกทอรีในบัญชี ADLS Gen2 Foo\Bar ยังคงไม่ได้รับผลกระทบ

คุณยังสามารถดําเนินการลบบนเส้นทางต่อไปนี้ได้: MyLakehouse\Files\MyShortcut\Foo\Bar ในกรณีนี้ ถ้าคุณมีสิทธิ์ในการเขียนในบัญชี ADLS Gen2 ไดเรกทอรี Bar จะถูกลบออกจากบัญชี ADLS Gen2

มุมมองสายข้อมูลพื้นที่ทํางาน

เมื่อสร้างทางลัดระหว่างรายการ Fabric หลายรายการภายในพื้นที่ทํางาน คุณสามารถแสดงภาพความสัมพันธ์ของทางลัดผ่านมุมมองสายข้อมูลของพื้นที่ทํางานได้ เลือก ปุ่มมุมมอง สายข้อมูล ( ) ที่มุมบนขวาของตัวสํารวจพื้นที่ทํางาน

สกรีนช็อตของหน้าจอมุมมองสายข้อมูลเพื่อแสดงความสัมพันธ์ของทางลัด

หมายเหตุ

มุมมองสายข้อมูลมีขอบเขตอยู่ในพื้นที่ทํางานเดียว ทางลัดไปยังตําแหน่งที่ตั้งภายนอกพื้นที่ทํางานที่เลือกจะไม่ปรากฏขึ้น

ข้อจํากัดและข้อควรพิจารณา

  • จํานวนสูงสุดของทางลัดต่อรายการ Fabric คือ 100,000 ในบริบทนี้ คําศัพท์รายการอ้างอิงถึง: แอป เลคเฮ้าส์ คลังสินค้า รายงาน และอื่น ๆ
  • จํานวนสูงสุดของทางลัดในเส้นทาง OneLake เดียวคือ 10
  • จํานวนสูงสุดของทางลัดโดยตรงไปยังลิงก์ทางลัดคือ 5
  • ชื่อทางลัด OneLake พาธหลัก และเส้นทางเป้าหมายไม่สามารถมีอักขระ "%" หรือ "+" ได้
  • ทางลัดไม่สนับสนุนอักขระที่ไม่ใช่ละติน
  • สายข้อมูลสําหรับทางลัดไปยังคลังข้อมูลและแบบจําลองความหมายไม่พร้อมใช้งานในขณะนี้
  • ทางลัด Fabric ซิงค์กับแหล่งข้อมูลเกือบจะทันที แต่เวลาการเผยแพร่อาจแตกต่างกันเนื่องจากประสิทธิภาพของแหล่งข้อมูล มุมมองที่แคช หรือปัญหาการเชื่อมต่อเครือข่าย
  • อาจใช้เวลาถึงหนึ่งนาทีในการจดจําทางลัดใหม่สําหรับ API ของตาราง