หมายเหตุ
การเข้าถึงหน้านี้ต้องได้รับการอนุญาต คุณสามารถลอง ลงชื่อเข้าใช้หรือเปลี่ยนไดเรกทอรีได้
การเข้าถึงหน้านี้ต้องได้รับการอนุญาต คุณสามารถลองเปลี่ยนไดเรกทอรีได้
ขั้นตอนแรกในข้อมูลและการโยกย้ายไปป์ไลน์คือการระบุข้อมูลที่คุณต้องการทําให้พร้อมใช้งานใน OneLake และไปป์ไลน์ที่คุณต้องการย้าย
คุณมีสองตัวเลือกสําหรับการโยกย้ายข้อมูล:
- ตัวเลือกที่ 1: Azure Data Lake Storage (ADLS) Gen2 เป็นที่เก็บข้อมูลเริ่มต้น หากคุณกําลังใช้ ADLS Gen2 อยู่ในขณะนี้และต้องการหลีกเลี่ยงการคัดลอกข้อมูล ให้พิจารณาใช้ ทางลัด OneLake
- ตัวเลือกที่ 2: OneLake เป็นที่เก็บข้อมูลเริ่มต้น หากคุณต้องการย้ายจาก ADLS Gen2 ไปยัง OneLake เป็นเลเยอร์ที่เก็บข้อมูล ให้พิจารณาอ่าน/เขียนจาก/ไปยัง OneLake จากสมุดบันทึกและข้อกําหนดงาน Spark ของคุณ
การโยกย้ายข้อมูล
ตัวเลือกที่ 1: ADLS Gen2 เป็นที่เก็บข้อมูล (ทางลัด)
หากคุณกําลังโต้ตอบกับ ADLS Gen2 และต้องการหลีกเลี่ยงการทําซ้ําข้อมูล คุณสามารถสร้างทางลัดไปยังเส้นทางแหล่งข้อมูล ADLS Gen2 ใน OneLake ได้ คุณสามารถสร้างทางลัดภายใน ส่วนไฟล์ และ ตาราง ของ lakehouse ใน Fabric ด้วยข้อควรพิจารณาต่อไปนี้:
- ส่วน ไฟล์ เป็นพื้นที่ที่ไม่มีการจัดการของทะเลสาบ หากข้อมูลของคุณอยู่ในรูปแบบ CSV, JSON หรือ Parquet เราขอแนะนําให้สร้างทางลัดไปยังพื้นที่นี้
- ส่วน ตาราง เป็นพื้นที่ที่มีการจัดการของทะเลสาบ ตารางทั้งหมด มีการลงทะเบียนทั้งตารางที่จัดการโดย Spark และตารางที่ไม่มีการจัดการที่นี่ ถ้าข้อมูลของคุณอยู่ในรูปแบบ Delta คุณสามารถสร้างทางลัดในพื้นที่นี้และกระบวนการค้นพบอัตโนมัติลงทะเบียนตาราง Delta เหล่านั้นในเมตาชอร์ของเลคเฮ้าส์โดยอัตโนมัติ
เรียนรู้เพิ่มเติมเกี่ยวกับการสร้าง ทางลัด ADLS Gen2
ตัวเลือกที่ 2: OneLake เป็นที่เก็บข้อมูล
หากต้องการใช้ OneLake เป็นเลเยอร์การจัดเก็บและย้ายข้อมูลจาก ADLS Gen2 ในขั้นต้น คุณควรชี้รายการที่เกี่ยวข้องกับ Azure Synapse Spark ไปยัง OneLake จากนั้นถ่ายโอนข้อมูลที่มีอยู่ไปยัง OneLake สําหรับอดีต ดูรวม OneLake กับ Azure Synapse Spark
เมื่อต้องการย้ายข้อมูลที่มีอยู่ไปยัง OneLake คุณมีหลายตัวเลือก:
- fastcp ของ mssparkutils: ไลบรารี mssparkutils มี FASTCP API ที่ช่วยให้คุณสามารถคัดลอกข้อมูลจาก ADLS Gen2 ไปยัง OneLake ได้
- AzCopy: คุณสามารถใช้ ยูทิลิตี้บรรทัดคําสั่ง AzCopy เพื่อคัดลอกข้อมูลจาก ADLS Gen2 ไปยัง OneLake ได้
- Azure Data Factory, Azure Synapse Analytics และ Data Factory in Fabric: ใช้ กิจกรรม คัดลอกเพื่อคัดลอกข้อมูลไปยัง lakehouse
- ใช้ปุ่มลัด: คุณสามารถเปิดใช้งานข้อมูลในอดีตของ ADLS Gen2 ใน OneLake โดยใช้ ปุ่มลัดได้ ไม่จําเป็นต้องมีสําเนาข้อมูล
- Azure Storage Explorer: คุณสามารถย้ายไฟล์จากตําแหน่งที่ตั้ง ADLS Gen2 ไปยัง OneLake ได้โดยใช้ Azure Storage Explorer ดูวิธีการรวม OneLake เข้ากับ Azure Storage Explorer
การโยกย้ายไปป์ไลน์ (กิจกรรมที่เกี่ยวข้องกับ Spark)
หากไปป์ไลน์ Azure Synapse ของคุณมีกิจกรรมการกําหนดงานสมุดบันทึกและ/หรือ Spark คุณจะต้องย้ายไปป์ไลน์เหล่านั้นจาก Azure Synapse ไปยังไปป์ไลน์ Data Factory ใน Fabric และอ้างอิงสมุดบันทึกเป้าหมาย กิจกรรมสมุดบันทึกพร้อมใช้งานในไปป์ไลน์ Data Factory ดูกิจกรรมไปป์ไลน์ที่รองรับทั้งหมดใน Fabric ที่นี่
- สําหรับข้อควรพิจารณาเกี่ยวกับกิจกรรมไปป์ไลน์ที่เกี่ยวข้องกับ Spark โปรดดูที่ความแตกต่างระหว่าง Azure Synapse Spark และ Fabric
- สําหรับการโยกย้ายสมุดบันทึก โปรดดูที่ การโยกย้ายสมุดบันทึกจาก Azure Synapse ไปยัง Fabric
- สําหรับการย้ายไปป์ไลน์ โปรดดู ย้ายไปยัง Data Factory ใน Fabric