แชร์ผ่าน


ย้ายข้อมูลและไปป์ไลน์จาก Azure Synapse Analytics ไปยัง Microsoft Fabric

ขั้นตอนแรกในข้อมูลและการโยกย้ายไปป์ไลน์คือการระบุข้อมูลที่คุณต้องการทําให้พร้อมใช้งานใน OneLake และไปป์ไลน์ที่คุณต้องการย้าย

คุณมีสองตัวเลือกสําหรับการโยกย้ายข้อมูล:

  • ตัวเลือกที่ 1: Azure Data Lake Storage (ADLS) Gen2 เป็นที่เก็บข้อมูลเริ่มต้น หากคุณกําลังใช้ ADLS Gen2 อยู่ในขณะนี้และต้องการหลีกเลี่ยงการคัดลอกข้อมูล ให้พิจารณาใช้ ทางลัด OneLake
  • ตัวเลือกที่ 2: OneLake เป็นที่เก็บข้อมูลเริ่มต้น หากคุณต้องการย้ายจาก ADLS Gen2 ไปยัง OneLake เป็นเลเยอร์ที่เก็บข้อมูล ให้พิจารณาอ่าน/เขียนจาก/ไปยัง OneLake จากสมุดบันทึกและข้อกําหนดงาน Spark ของคุณ

การโยกย้ายข้อมูล

ตัวเลือกที่ 1: ADLS Gen2 เป็นที่เก็บข้อมูล (ทางลัด)

หากคุณกําลังโต้ตอบกับ ADLS Gen2 และต้องการหลีกเลี่ยงการทําซ้ําข้อมูล คุณสามารถสร้างทางลัดไปยังเส้นทางแหล่งข้อมูล ADLS Gen2 ใน OneLake ได้ คุณสามารถสร้างทางลัดภายใน ส่วนไฟล์ และ ตาราง ของ lakehouse ใน Fabric ด้วยข้อควรพิจารณาต่อไปนี้:

  • ส่วน ไฟล์ เป็นพื้นที่ที่ไม่มีการจัดการของทะเลสาบ หากข้อมูลของคุณอยู่ในรูปแบบ CSV, JSON หรือ Parquet เราขอแนะนําให้สร้างทางลัดไปยังพื้นที่นี้
  • ส่วน ตาราง เป็นพื้นที่ที่มีการจัดการของทะเลสาบ ตารางทั้งหมด มีการลงทะเบียนทั้งตารางที่จัดการโดย Spark และตารางที่ไม่มีการจัดการที่นี่ ถ้าข้อมูลของคุณอยู่ในรูปแบบ Delta คุณสามารถสร้างทางลัดในพื้นที่นี้และกระบวนการค้นพบอัตโนมัติลงทะเบียนตาราง Delta เหล่านั้นในเมตาชอร์ของเลคเฮ้าส์โดยอัตโนมัติ

เรียนรู้เพิ่มเติมเกี่ยวกับการสร้าง ทางลัด ADLS Gen2

ตัวเลือกที่ 2: OneLake เป็นที่เก็บข้อมูล

หากต้องการใช้ OneLake เป็นเลเยอร์การจัดเก็บและย้ายข้อมูลจาก ADLS Gen2 ในขั้นต้น คุณควรชี้รายการที่เกี่ยวข้องกับ Azure Synapse Spark ไปยัง OneLake จากนั้นถ่ายโอนข้อมูลที่มีอยู่ไปยัง OneLake สําหรับอดีต ดูรวม OneLake กับ Azure Synapse Spark

เมื่อต้องการย้ายข้อมูลที่มีอยู่ไปยัง OneLake คุณมีหลายตัวเลือก:

  • fastcp ของ mssparkutils: ไลบรารี mssparkutils มี FASTCP API ที่ช่วยให้คุณสามารถคัดลอกข้อมูลจาก ADLS Gen2 ไปยัง OneLake ได้
  • AzCopy: คุณสามารถใช้ ยูทิลิตี้บรรทัดคําสั่ง AzCopy เพื่อคัดลอกข้อมูลจาก ADLS Gen2 ไปยัง OneLake ได้
  • Azure Data Factory, Azure Synapse Analytics และ Data Factory in Fabric: ใช้ กิจกรรม คัดลอกเพื่อคัดลอกข้อมูลไปยัง lakehouse
  • ใช้ปุ่มลัด: คุณสามารถเปิดใช้งานข้อมูลในอดีตของ ADLS Gen2 ใน OneLake โดยใช้ ปุ่มลัดได้ ไม่จําเป็นต้องมีสําเนาข้อมูล
  • Azure Storage Explorer: คุณสามารถย้ายไฟล์จากตําแหน่งที่ตั้ง ADLS Gen2 ไปยัง OneLake ได้โดยใช้ Azure Storage Explorer ดูวิธีการรวม OneLake เข้ากับ Azure Storage Explorer

หากไปป์ไลน์ Azure Synapse ของคุณมีกิจกรรมการกําหนดงานสมุดบันทึกและ/หรือ Spark คุณจะต้องย้ายไปป์ไลน์เหล่านั้นจาก Azure Synapse ไปยังไปป์ไลน์ Data Factory ใน Fabric และอ้างอิงสมุดบันทึกเป้าหมาย กิจกรรมสมุดบันทึกพร้อมใช้งานในไปป์ไลน์ Data Factory ดูกิจกรรมไปป์ไลน์ที่รองรับทั้งหมดใน Fabric ที่นี่