รูปแบบ ORC ใน Data Factory ใน Microsoft Fabric
บทความนี้สรุปวิธีการกําหนดค่ารูปแบบ ORC ในไปป์ไลน์ข้อมูลของ Data Factory ใน Microsoft Fabric
รูปแบบ ORC ได้รับการสนับสนุนสําหรับกิจกรรมและตัวเชื่อมต่อต่อไปนี้เป็นต้นทางและปลายทาง
หมวดหมู่ | ตัวเชื่อมต่อ/กิจกรรม |
---|---|
ตัวเชื่อมต่อที่สนับสนุน | Amazon S3 |
เข้ากันได้กับ Amazon S3 | |
ที่เก็บข้อมูล Azure Blob | |
Azure Data Lake Storage Gen1 | |
Azure Data Lake Storage รุ่น2 | |
ไฟล์ Azure | |
ระบบไฟล์ | |
FTP | |
พื้นที่เก็บข้อมูล Google Cloud | |
HTTP | |
ไฟล์ของเลคเฮ้าส์ | |
ที่เก็บข้อมูล Oracle Cloud | |
SFTP | |
กิจกรรมที่ได้รับการสนับสนุน | คัดลอกกิจกรรม (ต้นทาง/ปลายทาง) |
ค้นหากิจกรรม | |
กิจกรรม GetMetadata | |
ลบกิจกรรมข้อมูล |
ในการกําหนดค่ารูปแบบ ORC ให้เลือกการเชื่อมต่อของคุณในต้นทางหรือปลายทางของกิจกรรมการคัดลอกไปป์ไลน์ข้อมูลจากนั้นเลือก ORC ในรายการดรอปดาวน์ของ รูปแบบไฟล์ เลือก การตั้งค่า สําหรับการกําหนดค่าเพิ่มเติมของรูปแบบนี้
หลังจากที่คุณเลือก การตั้งค่า ในส่วน รูปแบบไฟล์ คุณสมบัติต่อไปนี้จะแสดงในกล่องโต้ตอบการตั้งค่ารูปแบบไฟล์แบบป็อปอัพ
- ชนิดการบีบอัด: เลือกตัวแปลงสัญญาณการบีบอัดที่ใช้อ่านไฟล์ ORC ในรายการดรอปดาวน์ คุณสามารถเลือกจากไม่มี, zlib หรือ snappy
หลังจากที่คุณเลือก การตั้งค่า คุณสมบัติต่อไปนี้จะแสดงในกล่องโต้ตอบการตั้งค่ารูปแบบไฟล์แบบป็อปอัพ
- ชนิดการบีบอัด: เลือกตัวแปลงสัญญาณการบีบอัดที่ใช้ในการเขียนไฟล์ ORC ในรายการดรอปดาวน์ คุณสามารถเลือกจากไม่มี, zlib หรือ snappy
ภายใต้ การตั้งค่าขั้นสูง ใน แท็บ ปลายทาง คุณสมบัติที่เกี่ยวข้องกับรูปแบบ ORC ต่อไปนี้จะแสดงขึ้นมา
- แถวสูงสุดต่อไฟล์: เมื่อเขียนข้อมูลลงในโฟลเดอร์ คุณสามารถเลือกที่จะเขียนไปยังหลายไฟล์และระบุแถวสูงสุดต่อไฟล์ได้ ระบุแถวสูงสุดที่คุณต้องการเขียนต่อไฟล์
- คํานําหน้าชื่อไฟล์: ใช้ได้เมื่อมีการกําหนดค่าแถวสูงสุดต่อไฟล์ ระบุคํานําหน้าชื่อไฟล์เมื่อเขียนข้อมูลไปยังหลายไฟล์ ส่งผลให้เป็นรูปแบบนี้:
<fileNamePrefix>_00000.<fileExtension>
ถ้าไม่ได้ระบุ คํานําหน้าชื่อไฟล์จะถูกสร้างขึ้นโดยอัตโนมัติ คุณสมบัตินี้ใช้ไม่ได้เมื่อแหล่งข้อมูลเป็นที่เก็บตามไฟล์หรือตัวเลือกพาร์ติชันที่เปิดใช้งานที่เก็บข้อมูล
คุณสมบัติต่อไปนี้ได้รับการสนับสนุนในส่วนแหล่งกิจกรรมคัดลอกเมื่อใช้รูปแบบ ORC
ชื่อ | รายละเอียด | ค่า | ต้องมี | คุณสมบัติสคริปต์ JSON |
---|---|---|---|---|
รูปแบบไฟล์ | รูปแบบไฟล์ที่คุณต้องการใช้ | ORC | ใช่ | type (ภายใต้ datasetSettings ):Orc |
ชนิดการบีบอัด | ตัวแปลงสัญญาณการบีบอัดที่ใช้ในการอ่านไฟล์ ORC | ไม่มี zlib snappy |
ไม่ | orcCompressionCodec: ไม่มี zlib snappy |
คุณสมบัติต่อไปนี้ได้รับการสนับสนุนในส่วนคัดลอกปลายทางกิจกรรมเมื่อใช้รูปแบบ ORC
ชื่อ | รายละเอียด | ค่า | ต้องมี | คุณสมบัติสคริปต์ JSON |
---|---|---|---|---|
รูปแบบไฟล์ | รูปแบบไฟล์ที่คุณต้องการใช้ | ORC | ใช่ | type (ภายใต้ datasetSettings ):Orc |
ชนิดการบีบอัด | ตัวแปลงสัญญาณการบีบอัดที่ใช้ในการเขียนไฟล์ ORC | ไม่มี zlib snappy |
ไม่ | orcCompressionCodec: ไม่มี zlib snappy |
แถวสูงสุดต่อไฟล์ | เมื่อเขียนข้อมูลลงในโฟลเดอร์ คุณสามารถเลือกที่จะเขียนไปยังหลายไฟล์และระบุแถวสูงสุดต่อไฟล์ได้ ระบุแถวสูงสุดที่คุณต้องการเขียนต่อไฟล์ | <แถวสูงสุดของคุณต่อไฟล์> | ไม่ | maxRowsPerFile |
คํานําหน้าชื่อไฟล์ | ใช้ได้เมื่อมีการกําหนดค่าแถวสูงสุดต่อไฟล์ ระบุคํานําหน้าชื่อไฟล์เมื่อเขียนข้อมูลไปยังหลายไฟล์ ส่งผลให้เป็นรูปแบบนี้: <fileNamePrefix>_00000.<fileExtension> ถ้าไม่ได้ระบุ คํานําหน้าชื่อไฟล์จะถูกสร้างขึ้นโดยอัตโนมัติ คุณสมบัตินี้ใช้ไม่ได้เมื่อแหล่งข้อมูลเป็นที่เก็บตามไฟล์หรือตัวเลือกพาร์ติชันที่เปิดใช้งานที่เก็บข้อมูล |
<คํานําหน้าชื่อไฟล์ของคุณ> | ไม่ | fileNamePrefix |