แชร์ผ่าน


บทช่วยสอน: กําหนดค่าฐานข้อมูลมิเรอร์ Microsoft Fabric จาก Azure Databricks

การสะท้อนฐานข้อมูลใน Microsoft Fabric เป็นเทคโนโลยี SaaS แบบ Enterprise บนระบบคลาวด์ ETL เป็นศูนย์ คู่มือนี้ช่วยคุณสร้างฐานข้อมูลที่มิเรอร์จาก Azure Databricks ซึ่งจะสร้างสําเนาแบบอ่านอย่างเดียวที่จําลองแบบอย่างต่อเนื่องของข้อมูล Azure Databricks ของคุณใน OneLake

ข้อกําหนดเบื้องต้น

  • คุณต้องเปิดใช้งานการเข้าถึงข้อมูลภายนอกบนเมตาสโตร์ สําหรับข้อมูลเพิ่มเติม โปรดดู เปิดใช้งานการเข้าถึงข้อมูลภายนอกบนเมตาสโตร์
  • สร้างหรือใช้พื้นที่ทํางาน Azure Databricks ที่มีอยู่โดยเปิดใช้งาน Unity Catalog
  • คุณต้องมีสิทธิ์ EXTERNAL USE SCHEMA ในสคีมาใน Unity Catalog ที่มีตารางที่จะเข้าถึงจาก Fabric
  • คุณต้องใช้โมเดลสิทธิ์ของ Fabric เพื่อตั้งค่าการควบคุมการเข้าถึงสําหรับแค็ตตาล็อก สคีมา และตารางใน Fabric
  • พื้นที่ทํางาน Azure Databricks ไม่สามารถอยู่เบื้องหลังจุดสิ้นสุดส่วนตัวได้

สร้างฐานข้อมูลที่มิเรอร์จาก Azure Databricks

ทําตามขั้นตอนเหล่านี้เพื่อสร้างฐานข้อมูลมิเรอร์ใหม่จากแค็ตตาล็อก Azure Databricks Unity ของคุณ

  1. ไปที่ https://powerbi.com.

  2. เลือก + ใหม่ แล้วเลือก แค็ตตาล็อก Azure Databricks ที่มิเรอร์

    ภาพหน้าจอจากพอร์ทัล Fabric ของรายการมิเรอร์ Azure Databricks ใหม่

  3. เลือกการเชื่อมต่อที่มีอยู่หากคุณกําหนดค่าไว้

    • หากคุณไม่มีการเชื่อมต่ออยู่แล้ว ให้สร้างการเชื่อมต่อใหม่และป้อนรายละเอียดทั้งหมด คุณสามารถรับรองความถูกต้องกับพื้นที่ทํางาน Azure Databricks ของคุณโดยใช้ 'บัญชีองค์กร' หรือ 'บริการหลัก' ในการสร้างการเชื่อมต่อ คุณต้องเป็นผู้ใช้หรือผู้ดูแลระบบของพื้นที่ทํางาน Azure Databricks
    • เมื่อต้องการเข้าถึงบัญชี Azure Data Lake Storage (ADLS) Gen2 ที่อยู่เบื้องหลังไฟร์วอลล์ คุณต้องทําตามขั้นตอนเพื่อ เปิดใช้งานการเข้าถึงความปลอดภัยเครือข่ายสําหรับบัญชี Azure Data Lake Storage Gen2 ของคุณ ในบทความนี้
  4. เมื่อคุณเชื่อมต่อกับพื้นที่ทํางาน Azure Databricks ในหน้า เลือกตารางจากแค็ตตาล็อก Databricks คุณสามารถเลือกแค็ตตาล็อก สคีมา และตารางผ่านรายการการรวม/การยกเว้นที่คุณต้องการเพิ่มและเข้าถึงจาก Microsoft Fabric เลือกแค็ตตาล็อกและสคีมาและตารางที่เกี่ยวข้องที่คุณต้องการเพิ่มลงในพื้นที่ทํางาน Fabric ของคุณ

    • คุณสามารถดูได้เฉพาะแค็ตตาล็อก/สคีมา/ตารางที่คุณมีสิทธิ์เข้าถึงตามสิทธิ์ที่ได้รับตามรูปแบบสิทธิ์ที่อธิบายไว้ที่ สิทธิ์ Unity Catalog และวัตถุที่ปลอดภัย
    • ตามค่าเริ่มต้น ซิงค์ การเปลี่ยนแปลงแค็ตตาล็อกในอนาคตโดยอัตโนมัติสําหรับสคีมาที่เลือก จะถูกเปิดใช้งาน สําหรับข้อมูลเพิ่มเติม โปรดดู การสะท้อนแค็ตตาล็อก Azure Databricks Unity
    • เมื่อคุณเลือกแล้ว ให้เลือก ถัดไป
  5. ตามค่าเริ่มต้น ชื่อของสินค้าจะเป็นชื่อของแค็ตตาล็อกที่คุณพยายามเพิ่มไปยัง Fabric บนหน้า ตรวจทานและสร้าง คุณสามารถตรวจทานรายละเอียด และเลือกเปลี่ยนชื่อรายการฐานข้อมูลที่มิเรอร์ ซึ่งต้องไม่ซ้ํากันในพื้นที่ทํางานของคุณ เลือก สร้าง

  6. รายการแค็ตตาล็อก Databricks ถูกสร้างขึ้น และสําหรับแต่ละตาราง ทางลัดชนิด Databricks ที่สอดคล้องกันจะถูกสร้างขึ้นด้วย

    • Schema ที่ไม่มีตารางจะไม่แสดง
  7. คุณยังสามารถดูตัวอย่างข้อมูลเมื่อคุณเข้าถึงทางลัดโดยเลือกจุดสิ้นสุดการวิเคราะห์ SQL เปิดรายการปลายทางการวิเคราะห์ SQL เพื่อเปิดหน้า Explorer และตัวแก้ไขคิวรี คุณสามารถคิวรีตาราง Azure Databricks ที่มิเรอร์ของคุณด้วย T-SQL ในตัวแก้ไข SQL

สร้างทางลัด Lakehouse ไปยังรายการแค็ตตาล็อก Databricks

คุณยังสามารถสร้างทางลัดจาก Lakehouse ไปยังรายการแค็ตตาล็อก Databricks เพื่อใช้ข้อมูล Lakehouse และใช้ Spark Notebooks ได้อีกด้วย

  1. ขั้นแรกเราสร้างเลคเฮาส์ หากคุณมีเลคเฮาส์ในพื้นที่ทํางานนี้อยู่แล้ว คุณสามารถใช้เลคเฮาส์ที่มีอยู่ได้
    1. เลือกพื้นที่ทํางานของคุณในเมนูการนําทาง
    2. เลือก + เล>ใหม่
    3. ระบุชื่อสําหรับเลคเฮาส์ของคุณในฟิลด์ ชื่อ แล้วเลือก สร้าง
  2. ในมุมมอง Explorer ของเลคเฮาส์ของคุณ ในเมนู รับข้อมูลในเลคเฮาส์ของคุณ ภายใต้ โหลดข้อมูลในเลคเฮาส์ของคุณ ให้เลือกปุ่มทางลัดใหม่
  3. เลือก Microsoft OneLake เลือกแค็ตตาล็อก นี่คือรายการข้อมูลที่คุณสร้างขึ้นในขั้นตอนก่อนหน้า จากนั้นเลือก ถัดไป
  4. เลือกตารางภายใน Schema แล้วเลือก ถัดไป
  5. เลือก สร้าง
  6. ทางลัดพร้อมใช้งานแล้ว Lakehouse ของคุณเพื่อใช้กับข้อมูล Lakehouse อื่นๆ ของคุณ คุณยังสามารถใช้ Notebooks และ Spark เพื่อดําเนินการประมวลผลข้อมูลกับข้อมูลสําหรับตารางแค็ตตาล็อกเหล่านี้ที่คุณเพิ่มจากพื้นที่ทํางาน Azure Databricks ของคุณ

สร้างแบบจําลองความหมาย

คุณสามารถสร้างแบบจําลองความหมายของ Power BI ตามรายการที่มิเรอร์ของคุณ และเพิ่ม/ลบตารางด้วยตนเอง สําหรับข้อมูลเพิ่มเติมเกี่ยวกับการสร้างและการจัดการแบบจําลองความหมาย โปรดดู สร้างแบบจําลองความหมายของ Power BI

ขอแนะนําให้คุณใช้ Microsoft Edge Browser สําหรับงานสร้างแบบจําลองความหมาย

จัดการความสัมพันธ์ของแบบจําลองความหมายของคุณ

เมื่อคุณสร้างโมเดลความหมายใหม่ตามฐานข้อมูลมิเรอร์ของคุณแล้ว

  1. เลือก เค้าโครงแบบจําลอง จาก Explorer ในพื้นที่ทํางานของคุณ
  2. เมื่อเลือกเค้าโครงแบบจําลองแล้ว คุณจะเห็นกราฟิกของตารางที่รวมเป็นส่วนหนึ่งของแบบจําลองความหมาย
  3. เมื่อต้องการสร้างความสัมพันธ์ระหว่างตาราง ให้ลากชื่อคอลัมน์จากตารางหนึ่งไปยังชื่อคอลัมน์อื่นของตารางอื่น ป๊อปอัปจะถูกนําเสนอเพื่อระบุความสัมพันธ์และคาร์ดินาลลิตี้ของตาราง

เปิดใช้งานการเข้าถึงความปลอดภัยเครือข่ายสําหรับบัญชี Azure Data Lake Storage Gen2 ของคุณ

ส่วนนี้จะแนะนําคุณเกี่ยวกับการกําหนดค่าความปลอดภัยเครือข่ายสําหรับบัญชี Azure Data Lake Storage (ADLS) Gen2 ของคุณเมื่อมีการกําหนดค่าไฟร์วอลล์ Azure Storage 

ข้อกําหนดเบื้องต้น

  • สร้างหรือใช้พื้นที่ทํางาน Azure Databricks ที่มีอยู่โดยเปิดใช้งาน Unity Catalog
  • เมื่อต้องการเปิดใช้งานชนิดการรับรองความถูกต้องของข้อมูลประจําตัวของพื้นที่ทํางาน (แนะนํา) พื้นที่ทํางาน Fabric ต้องเชื่อมโยงกับความจุ F ใดๆ เมื่อต้องการสร้างข้อมูลประจําตัวของพื้นที่ทํางาน โปรดดู การรับรองความถูกต้องด้วยข้อมูลประจําตัวของพื้นที่ทํางาน
  • ส่วนนี้มีไว้สําหรับการเข้าถึงบัญชีที่เก็บข้อมูล Azure Data Lake Storage (ADLS) Gen2 ที่อยู่เบื้องหลังไฟร์วอลล์ Azure Storage ไม่รองรับที่เก็บข้อมูลพื้นที่ทํางาน Azure Databricks ที่อยู่เบื้องหลังไฟร์วอลล์ Azure Storage
  • แค็ตตาล็อกต้องเชื่อมโยงกับบัญชีที่เก็บข้อมูลเดียว

เปิดใช้งานการเข้าถึงความปลอดภัยเครือข่าย

  1. เมื่อสร้างแค็ตตาล็อก Azure Databricks ที่มิเรอร์ใหม่ ในขั้นตอน เลือกข้อมูล ให้เลือกแท็บ ความปลอดภัยเครือข่าย

    สกรีนช็อตของแท็บ ความปลอดภัยเครือข่าย ใน Databricks

  2. เลือก การเชื่อมต่อ ที่มีอยู่กับ บัญชีที่เก็บข้อมูล ถ้าคุณมีการกําหนดค่าไว้ 

    • ถ้าคุณไม่มีการเชื่อมต่อ ADLS อยู่แล้ว ให้สร้างการเชื่อมต่อใหม่  
    • URL ของตําแหน่งข้อมูลที่เก็บข้อมูลคือที่จัดเก็บข้อมูลของแค็ตตาล็อกที่เลือก จุดสิ้นสุดควรเป็นโฟลเดอร์เฉพาะที่จัดเก็บข้อมูล แทนที่จะระบุจุดสิ้นสุดให้อยู่ที่ระดับบัญชีที่เก็บข้อมูล ตัวอย่างเช่น ให้มากกว่าhttps://<storage account>.dfs.core.windows.net/container1/folder1.https://<storage account>.dfs.core.windows.net/
    • ระบุข้อมูลประจําตัวการเชื่อมต่อ ชนิดการรับรองความถูกต้องที่รองรับ ได้แก่ บัญชีองค์กร บริการหลัก และข้อมูลประจําตัวพื้นที่ทํางาน (แนะนํา)
  3. ในพอร์ทัล Azure ให้สิทธิ์การเข้าถึงบัญชีที่เก็บข้อมูลตามชนิดการรับรองความถูกต้องที่คุณเลือกในขั้นตอนก่อนหน้า นําทางไปยังบัญชีที่เก็บข้อมูลในพอร์ทัล Azure เลือกการควบคุมการเข้าถึง (IAM) เลือก +เพิ่ม และ เพิ่มการมอบหมายบทบาท สําหรับข้อมูลเพิ่มเติม โปรดดู กําหนดบทบาท Azure โดยใช้พอร์ทัล Azure

    • ถ้าคุณระบุบัญชีที่เก็บข้อมูลเป็นส่วนหนึ่งของการเชื่อมต่อ วัตถุการรับรองความถูกต้องที่เลือกจําเป็นต้องมีบทบาท ผู้ อ่านข้อมูล Blob ที่เก็บข้อมูลในบัญชีที่เก็บข้อมูล 
    • ถ้าคุณระบุคอนเทนเนอร์เฉพาะเป็นส่วนหนึ่งของการเชื่อมต่อ ออบเจ็กต์การรับรองความถูกต้องที่เลือกจําเป็นต้องมีบทบาท Storage Blob Data Reader บนคอนเทนเนอร์  
    • หากคุณระบุโฟลเดอร์เฉพาะภายในคอนเทนเนอร์ (แนะนํา) วัตถุการรับรองความถูกต้องที่เลือกจะต้องมี Read (R) และ Execute (E) ที่ระดับโฟลเดอร์ หากคุณกําลังใช้ Service Principal หรือ Workspace Identity เป็นชนิดการรับรองความถูกต้อง คุณจําเป็นต้องให้สิทธิ์ Service Principal หรือ Workspace Identity Execute นั้นแก่โฟลเดอร์รากของคอนเทนเนอร์ และแต่ละโฟลเดอร์ในลําดับชั้นของโฟลเดอร์ที่นําไปสู่โฟลเดอร์ที่คุณระบุ 

    สําหรับข้อมูลเพิ่มเติมและขั้นตอนในการให้สิทธิ์การเข้าถึง ADLS โปรดดู การควบคุมการเข้าถึง ADLS

  4. เปิดใช้งาน การเข้าถึงพื้นที่ทํางานที่เชื่อถือได้ เพื่อเข้าถึงบัญชี Azure Data Lake Storage (ADLS) Gen2 ที่เปิดใช้งานไฟร์วอลล์ในลักษณะที่ปลอดภัย การเข้าถึงพื้นที่ทํางานที่เชื่อถือได้จําเป็นต้องสร้างการเชื่อมต่อโดยตรงกับบัญชีที่เก็บข้อมูล ADLS ซึ่งสามารถใช้ได้โดยไม่ขึ้นกับการเชื่อมต่อพื้นที่ทํางาน Azure Databricks สําหรับข้อมูลเพิ่มเติม โปรดดู ฐานข้อมูลมิเรอร์ Secure Fabric จาก Azure Databricks

  5. ทางลัดไปยังตาราง Unity Catalog ถูกสร้างขึ้นสําหรับตารางที่มีชื่อบัญชีที่เก็บข้อมูลตรงกับบัญชีที่เก็บข้อมูลที่ระบุในการเชื่อมต่อ ADLS สําหรับตารางใดๆ ที่มีชื่อบัญชีที่เก็บข้อมูลไม่ตรงกับบัญชีที่เก็บข้อมูลที่ระบุในการเชื่อมต่อ ADLS ทางลัดสําหรับตารางเหล่านั้นจะไม่ถูกสร้างขึ้น 

สําคัญ

หากคุณวางแผนที่จะใช้การเชื่อมต่อ ADLS นอกสถานการณ์รายการแค็ตตาล็อก Azure Databricks ที่มิเรอร์ คุณต้องให้บทบาท Storage Blob Delegator ในบัญชีที่เก็บข้อมูลด้วย

เปิดใช้งานการรักษาความปลอดภัย OneLake ในรายการ Databricks ที่มิเรอร์

แมปนโยบาย Unity Catalog (UC) กับการรักษาความปลอดภัยของ Microsoft OneLake โดยทําตามขั้นตอนเหล่านี้:

  1. ซิงค์กลุ่ม Entra และใช้สิทธิ์ในแค็ตตาล็อก Unity ใน Azure Databricks ให้ใช้การจัดการข้อมูลประจําตัวอัตโนมัติเพื่อซิงค์กลุ่ม Microsoft Entra ID และให้สิทธิ์ Unity Catalog ที่จําเป็น ตัวอย่างเช่น ใช้ เรียกดู เลือกบนแค็ตตาล็อก/ตารางที่เกี่ยวข้อง
  2. กําหนดบทบาทการเข้าถึงข้อมูล OneLake ในพื้นที่ทํางาน Fabric ให้สร้างบทบาทการเข้าถึงข้อมูลสําหรับข้อมูลที่มิเรอร์ใหม่ เพิ่มกลุ่ม Entra เดียวกันให้กับบทบาทนี้ และให้สิทธิ์การเข้าถึงการอ่านไปยังทางลัด OneLake ที่สอดคล้องกับตาราง Azure Databricks คุณสามารถเริ่มต้นใช้งานการรักษาความปลอดภัยระดับตารางได้ทันทีในปุ่ม จัดการความปลอดภัย OneLake ใน Ribbon ตรวจสอบให้แน่ใจว่าคุณซิงค์การกําหนดค่าการเข้าถึงอยู่เสมอเมื่อโครงสร้างแค็ตตาล็อกและสิทธิ์มีการพัฒนา สําหรับข้อมูลเพิ่มเติม โปรดดู แบบจําลองการควบคุมการเข้าถึงข้อมูล OneLake (พรีวิว)