รูปแบบ XML ใน Data Factory ใน Microsoft Fabric
บทความนี้สรุปวิธีการกําหนดค่ารูปแบบ XML ในไปป์ไลน์ข้อมูลของ Data Factory ใน Microsoft Fabric
รูปแบบ XML ได้รับการสนับสนุนสําหรับกิจกรรมและตัวเชื่อมต่อต่อไปนี้เป็นแหล่งข้อมูล
หมวดหมู่ | ตัวเชื่อมต่อ/กิจกรรม |
---|---|
ตัวเชื่อมต่อที่สนับสนุน | Amazon S3 |
เข้ากันได้กับ Amazon S3 | |
ที่เก็บข้อมูล Azure Blob | |
Azure Data Lake Storage Gen1 | |
Azure Data Lake Storage รุ่น2 | |
ไฟล์ Azure | |
ระบบไฟล์ | |
FTP | |
พื้นที่เก็บข้อมูล Google Cloud | |
HTTP | |
ไฟล์ของเลคเฮ้าส์ | |
ที่เก็บข้อมูล Oracle Cloud | |
SFTP | |
กิจกรรมที่ได้รับการสนับสนุน | คัดลอกกิจกรรม (ต้นทาง/-) |
ค้นหากิจกรรม | |
กิจกรรม GetMetadata | |
ลบกิจกรรม |
หากต้องการกําหนดค่ารูปแบบ XML ให้เลือกการเชื่อมต่อของคุณในแหล่งข้อมูลกิจกรรมการคัดลอกไปป์ไลน์ข้อมูลจากนั้นเลือก XML ในรายการดรอปดาวน์ของ รูปแบบไฟล์ เลือก การตั้งค่า สําหรับการกําหนดค่าเพิ่มเติมของรูปแบบนี้
หลังจากที่คุณเลือก การตั้งค่า ในส่วน รูปแบบไฟล์ คุณสมบัติต่อไปนี้จะแสดงในกล่องโต้ตอบการตั้งค่ารูปแบบไฟล์แบบป็อปอัพ
ชนิดการบีบอัด: ตัวแปลงสัญญาณการบีบอัดที่ใช้ในการอ่านไฟล์ XML คุณสามารถเลือกจาก ประเภท ไม่มี, bzip2, gzip, deflate, ZipDeflate, TarGZip หรือ tar ในรายการดรอปดาวน์
หากคุณเลือก ZipDeflate เป็นชนิดการบีบอัด รักษาชื่อไฟล์ zip เป็นโฟลเดอร์จะปรากฏขึ้นภายใต้การตั้งค่าขั้นสูงในแท็บแหล่งข้อมูล
- รักษาชื่อไฟล์ zip เป็นโฟลเดอร์: ระบุว่าจะเก็บรักษาชื่อไฟล์ zip ต้นทางเป็นโครงสร้างโฟลเดอร์ในระหว่างการคัดลอกหรือไม่
- หากเลือกกล่องกาเครื่องหมายนี้ (ค่าเริ่มต้น) บริการจะเขียนไฟล์ที่ไม่มีการบีบอัดไปยัง
<specified file path>/<folder named as source zip file>/
- หากไม่ได้ทําเครื่องหมายที่กล่องนี้ บริการจะเขียนไฟล์ที่คลายซิปโดยตรงไปยัง
<specified file path>
ตรวจสอบให้แน่ใจว่าคุณไม่มีชื่อไฟล์ที่ซ้ํากันในไฟล์ zip ต้นทางที่แตกต่างกันเพื่อหลีกเลี่ยงการแข่งรถหรือพฤติกรรมที่ไม่คาดคิด
- หากเลือกกล่องกาเครื่องหมายนี้ (ค่าเริ่มต้น) บริการจะเขียนไฟล์ที่ไม่มีการบีบอัดไปยัง
หากคุณเลือก TarGZip/tar เป็นชนิดการบีบอัด ชื่อไฟล์บีบอัดเป็นโฟลเดอร์จะแสดงขึ้นภายใต้การตั้งค่าขั้นสูงในแท็บแหล่งข้อมูล
- รักษาชื่อไฟล์การบีบอัดเป็นโฟลเดอร์: บ่งชี้ว่าจะรักษาชื่อไฟล์บีบอัดต้นทางเป็นโครงสร้างโฟลเดอร์ในระหว่างการคัดลอกหรือไม่
- หากเลือกกล่องกาเครื่องหมายนี้ (ค่าเริ่มต้น) บริการจะเขียนไฟล์ที่ขยายเป็น
<specified file path>/<folder named as source compressed file>/
- หากไม่ได้เลือกกล่องกาเครื่องหมายนี้ บริการจะเขียนไฟล์ที่ขยายโดยตรงไปยัง
<specified file path>
ตรวจสอบให้แน่ใจว่าคุณไม่มีชื่อไฟล์ที่ซ้ํากันในไฟล์ต้นฉบับที่แตกต่างกันเพื่อหลีกเลี่ยงการแข่งรถหรือลักษณะการทํางานที่ไม่คาดคิด
- หากเลือกกล่องกาเครื่องหมายนี้ (ค่าเริ่มต้น) บริการจะเขียนไฟล์ที่ขยายเป็น
- รักษาชื่อไฟล์ zip เป็นโฟลเดอร์: ระบุว่าจะเก็บรักษาชื่อไฟล์ zip ต้นทางเป็นโครงสร้างโฟลเดอร์ในระหว่างการคัดลอกหรือไม่
ระดับการบีบอัด: ระบุอัตราส่วนการบีบอัดเมื่อคุณเลือกชนิดการบีบอัด คุณสามารถเลือกจาก เร็วที่สุด หรือ เหมาะสมที่สุด
- เร็วที่สุด: การดําเนินการบีบอัดควรเสร็จสมบูรณ์โดยเร็วที่สุดแม้ว่าไฟล์ผลลัพธ์จะไม่ได้รับการบีบอัดอย่างเหมาะสมก็ตาม
- เหมาะสมที่สุด: การดําเนินการบีบอัดควรได้รับการบีบอัดอย่างเหมาะสมแม้ว่าการดําเนินการจะใช้เวลานานขึ้นก็ตาม สําหรับข้อมูลเพิ่มเติม ดู หัวข้อระดับการบีบอัด
การเข้ารหัส: ระบุชนิดการเข้ารหัสที่ใช้ในการเขียนไฟล์ทดสอบ เลือกชนิดหนึ่งจากรายการดรอปดาวน์ ค่าเริ่มต้นคือ UTF-8
ค่า Null: ระบุการแสดงสตริงของค่า null ค่าเริ่มต้นเป็นสตริงว่าง
ภายใต้ การตั้งค่าขั้นสูง ใน แท็บ แหล่งข้อมูล คุณสมบัติที่เกี่ยวข้องกับรูปแบบ XML ต่อไปนี้จะแสดงขึ้น
โหมดการตรวจสอบความถูกต้อง: ระบุว่าจะตรวจสอบความถูกต้องของ XML schema หรือไม่ เลือกหนึ่งโหมดจากรายการดรอปดาวน์
- ไม่มี: เลือกตัวเลือกนี้เพื่อไม่ใช้โหมดการตรวจสอบความถูกต้อง
- xsd: เลือกตัวเลือกนี้เพื่อตรวจสอบเค้าร่าง XML โดยใช้ XSD
- dtd: เลือกตัวเลือกนี้เพื่อตรวจสอบเค้าร่าง XML โดยใช้ DTD
Namespace: ระบุว่าจะเปิดใช้งาน namespace เมื่อแยกวิเคราะห์ไฟล์ XML หรือไม่ ซึ่งจะถูกเลือกตามค่าเริ่มต้น
คู่คํานําหน้า Namespace: ถ้า เปิดใช้งาน Namespace เลือก + ใหม่ และระบุ URL และ คํานําหน้า คุณสามารถเพิ่มคู่เพิ่มเติมโดยการเลือก + ใหม่
Namespace URI สําหรับการแมปคํานําหน้าถูกใช้เพื่อตั้งชื่อเขตข้อมูลเมื่อแยกวิเคราะห์ไฟล์ XML ถ้าไฟล์ XML มี namespace และเนมสเปซเปิดใช้งาน ตามค่าเริ่มต้น ชื่อเขตข้อมูลจะเหมือนกับที่อยู่ในเอกสาร XML ถ้ามีรายการที่กําหนดไว้สําหรับ namespace URI ในแผนที่นี้ ชื่อเขตข้อมูลคือprefix:fieldName
ตรวจหาชนิดข้อมูล: ระบุว่าจะตรวจหาชนิดข้อมูลจํานวนเต็ม คู่ และบูลีนหรือไม่ ซึ่งจะถูกเลือกตามค่าเริ่มต้น
คุณสมบัติต่อไปนี้ได้รับการสนับสนุนในส่วนแหล่งกิจกรรมการคัดลอกเมื่อใช้รูปแบบ XML
ชื่อ | คำอธิบาย | ค่า | ต้องระบุ | คุณสมบัติสคริปต์ JSON |
---|---|---|---|---|
รูปแบบไฟล์ | รูปแบบไฟล์ที่คุณต้องการใช้ | XML | ใช่ | type (ภายใต้ datasetSettings ):Xml |
ชนิดการบีบอัด | ตัวแปลงสัญญาณการบีบอัดที่ใช้ในการอ่านไฟล์ XML | ไม่มี bzip2 gzip แฟบ ZipDeflate TarGZip น้ํามันดิน |
ไม่ | type (ภายใต้ compression ): bzip2 gzip แฟบ ZipDeflate TarGZip น้ํามันดิน |
ระดับการบีบอัด | อัตราส่วนการบีบอัด | เร็วที่สุด เหมาะ สม |
ไม่ใช่ | ระดับ (ภายใต้ compression ): เร็วที่สุด เหมาะ สม |
การเข้ารหัส | ชนิดการเข้ารหัสที่ใช้ในการอ่านไฟล์ทดสอบ | "UTF-8" (ตามค่าเริ่มต้น),"UTF-8 โดยไม่มี BOM", "UTF-16LE", "UTF-16BE", "UTF-32LE", "UTF-32BE", "US-ASCII", "UTF-7", "BIG5", "EUC-JP", "EUC-KR", "GB2312", "GB18030", "JOHAB", "SHIFT-JIS", "CP875", "CP866", "IBM00858", "IBM037", "IBM273", "IBM437", "IBM500", "IBM737", "IBM775", "IBM850", "IBM852", "IBM855", "IBM857", "IBM860", "IBM861", "IBM863", "IBM863", "IBM864", "IBM865", "IBM869", "IBM870", "IBM01140", "IBM01141", "IBM01142", "IBM01143", "IBM01144", "IBM01145", "IBM01146", "IBM01147", "IBM01148", "IBM01149", "ISO-2022-JP", "ISO-2022-KR", "ISO-8859-1", "ISO-8859-2", "ISO-8859-3", "ISO-8859-4", "ISO-8859-5", "ISO-8859-6", "ISO-8859-7", "ISO-8859-8", "ISO-8859-9", "ISO-8859-13", "ISO-8859-15", "WINDOWS-874", "WINDOWS-1250", "WINDOWS-1251", "WINDOWS-1255 2", "WINDOWS-1253", "WINDOWS-1254", "WINDOWS-1255", "WINDOWS-1256", "WINDOWS-1257", "WINDOWS-1258" | ไม่ใช่ | encodingName |
รักษาชื่อไฟล์ zip เป็นโฟลเดอร์ | ระบุว่าจะรักษาชื่อไฟล์ zip ต้นทางเป็นโครงสร้างโฟลเดอร์ในระหว่างการคัดลอกหรือไม่ | เลือกแล้ว (ค่าเริ่มต้น) หรือยกเลิกการเลือก | ไม่ | preserveZipFileNameAsFolder (ภายใต้ compressionProperties ->type เป็น ZipDeflateReadSettings ):จริง (ค่าเริ่มต้น) หรือ เท็จ |
รักษาชื่อไฟล์การบีบอัดเป็นโฟลเดอร์ | ระบุว่าจะรักษาชื่อไฟล์ที่บีบอัดต้นทางเป็นโครงสร้างโฟลเดอร์ในระหว่างการคัดลอกหรือไม่ | เลือกแล้ว (ค่าเริ่มต้น) หรือยกเลิกการเลือก | ไม่ | preserveCompressionFileNameAsFolder (ภายใต้ compressionProperties ->type ตาม TarGZipReadSettings หรือ TarReadSettings ):จริง (ค่าเริ่มต้น) หรือ เท็จ |
ค่า Null | การแสดงสตริงของค่า null | <ค่า Null ของคุณ> สตริงที่ว่างเปล่า (ตามค่าเริ่มต้น) |
ไม่ใช่ | nullValue |
โหมดการตรวจสอบความถูกต้อง | จะตรวจสอบความถูกต้องของ XML schema หรือไม่ | ไม่มี xsd dtd |
ไม่ | validationMode: xsd dtd |
Namespaces | จะเปิดใช้งาน namespace เมื่อแยกวิเคราะห์ไฟล์ XML หรือไม่ | เลือกแล้ว (ค่าเริ่มต้น) หรือยกเลิกการเลือก | ไม่ | namespaces: จริง (ค่าเริ่มต้น) หรือ เท็จ |
คู่คํานําหน้า Namespace | URI ของ Namespace กับการแมปคํานําหน้า ซึ่งใช้ในการตั้งชื่อเขตข้อมูลเมื่อแยกวิเคราะห์ไฟล์ XML ถ้าไฟล์ XML มี namespace และเนมสเปซเปิดใช้งาน ตามค่าเริ่มต้น ชื่อเขตข้อมูลจะเหมือนกับที่อยู่ในเอกสาร XML ถ้ามีรายการที่กําหนดไว้สําหรับ namespace URI ในแผนที่นี้ ชื่อเขตข้อมูลคือ prefix:fieldName |
< url >:< คํานําหน้า > | ไม่ | namespacePrefixes: < url >:< คํานําหน้า > |
ตรวจพบชนิดข้อมูล | ไม่ว่าจะตรวจหาชนิดข้อมูลเป็นจํานวนเต็ม สองเท่า และแบบบูลีน | เลือกแล้ว (ค่าเริ่มต้น) หรือยกเลิกการเลือก | ไม่ | detectDataType: จริง (ค่าเริ่มต้น) หรือ เท็จ |