อ่านในภาษาอังกฤษ

แชร์ผ่าน


รูปแบบ XML ใน Data Factory ใน Microsoft Fabric

บทความนี้สรุปวิธีการกําหนดค่ารูปแบบ XML ในไปป์ไลน์ข้อมูลของ Data Factory ใน Microsoft Fabric

ความสามารถที่รองรับ

รูปแบบ XML ได้รับการสนับสนุนสําหรับกิจกรรมและตัวเชื่อมต่อต่อไปนี้เป็นแหล่งข้อมูล

รูปแบบ XML ในกิจกรรมการคัดลอก

หากต้องการกําหนดค่ารูปแบบ XML ให้เลือกการเชื่อมต่อของคุณในแหล่งข้อมูลกิจกรรมการคัดลอกไปป์ไลน์ข้อมูลจากนั้นเลือก XML ในรายการดรอปดาวน์ของ รูปแบบไฟล์ เลือก การตั้งค่า สําหรับการกําหนดค่าเพิ่มเติมของรูปแบบนี้

สกรีนช็อตที่แสดงการตั้งค่ารูปแบบไฟล์

XML เป็นแหล่งข้อมูล

หลังจากที่คุณเลือก การตั้งค่า ในส่วน รูปแบบไฟล์ คุณสมบัติต่อไปนี้จะแสดงในกล่องโต้ตอบการตั้งค่ารูปแบบไฟล์แบบป็อปอัพ

สกรีนช็อตที่แสดงการเลือกรูปแบบไฟล์

  • ชนิดการบีบอัด: ตัวแปลงสัญญาณการบีบอัดที่ใช้ในการอ่านไฟล์ XML คุณสามารถเลือกจาก ประเภท ไม่มี, bzip2, gzip, deflate, ZipDeflate, TarGZip หรือ tar ในรายการดรอปดาวน์

    หากคุณเลือก ZipDeflate เป็นชนิดการบีบอัด รักษาชื่อไฟล์ zip เป็นโฟลเดอร์จะปรากฏขึ้นภายใต้การตั้งค่าขั้นสูงในแท็บแหล่งข้อมูล

    • รักษาชื่อไฟล์ zip เป็นโฟลเดอร์: ระบุว่าจะเก็บรักษาชื่อไฟล์ zip ต้นทางเป็นโครงสร้างโฟลเดอร์ในระหว่างการคัดลอกหรือไม่
      • หากเลือกกล่องกาเครื่องหมายนี้ (ค่าเริ่มต้น) บริการจะเขียนไฟล์ที่ไม่มีการบีบอัดไปยัง<specified file path>/<folder named as source zip file>/
      • หากไม่ได้ทําเครื่องหมายที่กล่องนี้ บริการจะเขียนไฟล์ที่คลายซิปโดยตรงไปยัง<specified file path> ตรวจสอบให้แน่ใจว่าคุณไม่มีชื่อไฟล์ที่ซ้ํากันในไฟล์ zip ต้นทางที่แตกต่างกันเพื่อหลีกเลี่ยงการแข่งรถหรือพฤติกรรมที่ไม่คาดคิด

    หากคุณเลือก TarGZip/tar เป็นชนิดการบีบอัด ชื่อไฟล์บีบอัดเป็นโฟลเดอร์จะแสดงขึ้นภายใต้การตั้งค่าขั้นสูงในแท็บแหล่งข้อมูล

    • รักษาชื่อไฟล์การบีบอัดเป็นโฟลเดอร์: บ่งชี้ว่าจะรักษาชื่อไฟล์บีบอัดต้นทางเป็นโครงสร้างโฟลเดอร์ในระหว่างการคัดลอกหรือไม่
      • หากเลือกกล่องกาเครื่องหมายนี้ (ค่าเริ่มต้น) บริการจะเขียนไฟล์ที่ขยายเป็น<specified file path>/<folder named as source compressed file>/
      • หากไม่ได้เลือกกล่องกาเครื่องหมายนี้ บริการจะเขียนไฟล์ที่ขยายโดยตรงไปยัง<specified file path> ตรวจสอบให้แน่ใจว่าคุณไม่มีชื่อไฟล์ที่ซ้ํากันในไฟล์ต้นฉบับที่แตกต่างกันเพื่อหลีกเลี่ยงการแข่งรถหรือลักษณะการทํางานที่ไม่คาดคิด
  • ระดับการบีบอัด: ระบุอัตราส่วนการบีบอัดเมื่อคุณเลือกชนิดการบีบอัด คุณสามารถเลือกจาก เร็วที่สุด หรือ เหมาะสมที่สุด

    • เร็วที่สุด: การดําเนินการบีบอัดควรเสร็จสมบูรณ์โดยเร็วที่สุดแม้ว่าไฟล์ผลลัพธ์จะไม่ได้รับการบีบอัดอย่างเหมาะสมก็ตาม
    • เหมาะสมที่สุด: การดําเนินการบีบอัดควรได้รับการบีบอัดอย่างเหมาะสมแม้ว่าการดําเนินการจะใช้เวลานานขึ้นก็ตาม สําหรับข้อมูลเพิ่มเติม ดู หัวข้อระดับการบีบอัด
  • การเข้ารหัส: ระบุชนิดการเข้ารหัสที่ใช้ในการเขียนไฟล์ทดสอบ เลือกชนิดหนึ่งจากรายการดรอปดาวน์ ค่าเริ่มต้นคือ UTF-8

  • ค่า Null: ระบุการแสดงสตริงของค่า null ค่าเริ่มต้นเป็นสตริงว่าง

ภายใต้ การตั้งค่าขั้นสูง ใน แท็บ แหล่งข้อมูล คุณสมบัติที่เกี่ยวข้องกับรูปแบบ XML ต่อไปนี้จะแสดงขึ้น

  • โหมดการตรวจสอบความถูกต้อง: ระบุว่าจะตรวจสอบความถูกต้องของ XML schema หรือไม่ เลือกหนึ่งโหมดจากรายการดรอปดาวน์

    • ไม่มี: เลือกตัวเลือกนี้เพื่อไม่ใช้โหมดการตรวจสอบความถูกต้อง
    • xsd: เลือกตัวเลือกนี้เพื่อตรวจสอบเค้าร่าง XML โดยใช้ XSD
    • dtd: เลือกตัวเลือกนี้เพื่อตรวจสอบเค้าร่าง XML โดยใช้ DTD

    สกรีนช็อตที่แสดงโหมดการตรวจสอบความถูกต้อง

  • Namespace: ระบุว่าจะเปิดใช้งาน namespace เมื่อแยกวิเคราะห์ไฟล์ XML หรือไม่ ซึ่งจะถูกเลือกตามค่าเริ่มต้น

  • คู่คํานําหน้า Namespace: ถ้า เปิดใช้งาน Namespace เลือก + ใหม่ และระบุ URL และ คํานําหน้า คุณสามารถเพิ่มคู่เพิ่มเติมโดยการเลือก + ใหม่
    Namespace URI สําหรับการแมปคํานําหน้าถูกใช้เพื่อตั้งชื่อเขตข้อมูลเมื่อแยกวิเคราะห์ไฟล์ XML ถ้าไฟล์ XML มี namespace และเนมสเปซเปิดใช้งาน ตามค่าเริ่มต้น ชื่อเขตข้อมูลจะเหมือนกับที่อยู่ในเอกสาร XML ถ้ามีรายการที่กําหนดไว้สําหรับ namespace URI ในแผนที่นี้ ชื่อเขตข้อมูลคือprefix:fieldName

    สกรีนช็อตที่แสดงคู่คํานําหน้า namespace

  • ตรวจหาชนิดข้อมูล: ระบุว่าจะตรวจหาชนิดข้อมูลจํานวนเต็ม คู่ และบูลีนหรือไม่ ซึ่งจะถูกเลือกตามค่าเริ่มต้น

ข้อมูลสรุปของตาราง

XML เป็นแหล่งข้อมูล

คุณสมบัติต่อไปนี้ได้รับการสนับสนุนในส่วนแหล่งกิจกรรมการคัดลอกเมื่อใช้รูปแบบ XML

ชื่อ คำอธิบาย ค่า ต้องระบุ คุณสมบัติสคริปต์ JSON
รูปแบบไฟล์ รูปแบบไฟล์ที่คุณต้องการใช้ XML ใช่ type (ภายใต้ datasetSettings):
Xml
ชนิดการบีบอัด ตัวแปลงสัญญาณการบีบอัดที่ใช้ในการอ่านไฟล์ XML ไม่มี
bzip2
gzip
แฟบ
ZipDeflate
TarGZip
น้ํามันดิน
ไม่ type (ภายใต้ compression):

bzip2
gzip
แฟบ
ZipDeflate
TarGZip
น้ํามันดิน
ระดับการบีบอัด  อัตราส่วนการบีบอัด เร็วที่สุด
เหมาะ สม 
ไม่ใช่ ระดับ (ภายใต้ compression):
เร็วที่สุด
เหมาะ สม
การเข้ารหัส ชนิดการเข้ารหัสที่ใช้ในการอ่านไฟล์ทดสอบ "UTF-8" (ตามค่าเริ่มต้น),"UTF-8 โดยไม่มี BOM", "UTF-16LE", "UTF-16BE", "UTF-32LE", "UTF-32BE", "US-ASCII", "UTF-7", "BIG5", "EUC-JP", "EUC-KR", "GB2312", "GB18030", "JOHAB", "SHIFT-JIS", "CP875", "CP866", "IBM00858", "IBM037", "IBM273", "IBM437", "IBM500", "IBM737", "IBM775", "IBM850", "IBM852", "IBM855", "IBM857", "IBM860", "IBM861", "IBM863", "IBM863", "IBM864", "IBM865", "IBM869", "IBM870", "IBM01140", "IBM01141", "IBM01142", "IBM01143", "IBM01144", "IBM01145", "IBM01146", "IBM01147", "IBM01148", "IBM01149", "ISO-2022-JP", "ISO-2022-KR", "ISO-8859-1", "ISO-8859-2", "ISO-8859-3", "ISO-8859-4", "ISO-8859-5", "ISO-8859-6", "ISO-8859-7", "ISO-8859-8", "ISO-8859-9", "ISO-8859-13", "ISO-8859-15", "WINDOWS-874", "WINDOWS-1250", "WINDOWS-1251", "WINDOWS-1255 2", "WINDOWS-1253", "WINDOWS-1254", "WINDOWS-1255", "WINDOWS-1256", "WINDOWS-1257", "WINDOWS-1258" ไม่ใช่ encodingName
รักษาชื่อไฟล์ zip เป็นโฟลเดอร์ ระบุว่าจะรักษาชื่อไฟล์ zip ต้นทางเป็นโครงสร้างโฟลเดอร์ในระหว่างการคัดลอกหรือไม่ เลือกแล้ว (ค่าเริ่มต้น) หรือยกเลิกการเลือก ไม่ preserveZipFileNameAsFolder
(ภายใต้ compressionProperties->type เป็น ZipDeflateReadSettings):
จริง (ค่าเริ่มต้น) หรือ เท็จ
รักษาชื่อไฟล์การบีบอัดเป็นโฟลเดอร์ ระบุว่าจะรักษาชื่อไฟล์ที่บีบอัดต้นทางเป็นโครงสร้างโฟลเดอร์ในระหว่างการคัดลอกหรือไม่ เลือกแล้ว (ค่าเริ่มต้น) หรือยกเลิกการเลือก ไม่ preserveCompressionFileNameAsFolder
(ภายใต้ compressionProperties->type ตาม TarGZipReadSettings หรือ TarReadSettings):
จริง (ค่าเริ่มต้น) หรือ เท็จ
ค่า Null การแสดงสตริงของค่า null <ค่า Null ของคุณ>
สตริงที่ว่างเปล่า (ตามค่าเริ่มต้น)
ไม่ใช่ nullValue
โหมดการตรวจสอบความถูกต้อง จะตรวจสอบความถูกต้องของ XML schema หรือไม่ ไม่มี
xsd
dtd
ไม่ validationMode:

xsd
dtd
Namespaces จะเปิดใช้งาน namespace เมื่อแยกวิเคราะห์ไฟล์ XML หรือไม่ เลือกแล้ว (ค่าเริ่มต้น) หรือยกเลิกการเลือก ไม่ namespaces:
จริง (ค่าเริ่มต้น) หรือ เท็จ
คู่คํานําหน้า Namespace URI ของ Namespace กับการแมปคํานําหน้า ซึ่งใช้ในการตั้งชื่อเขตข้อมูลเมื่อแยกวิเคราะห์ไฟล์ XML
ถ้าไฟล์ XML มี namespace และเนมสเปซเปิดใช้งาน ตามค่าเริ่มต้น ชื่อเขตข้อมูลจะเหมือนกับที่อยู่ในเอกสาร XML
ถ้ามีรายการที่กําหนดไว้สําหรับ namespace URI ในแผนที่นี้ ชื่อเขตข้อมูลคือprefix:fieldName
< url >:< คํานําหน้า > ไม่ namespacePrefixes:
< url >:< คํานําหน้า >
ตรวจพบชนิดข้อมูล ไม่ว่าจะตรวจหาชนิดข้อมูลเป็นจํานวนเต็ม สองเท่า และแบบบูลีน เลือกแล้ว (ค่าเริ่มต้น) หรือยกเลิกการเลือก ไม่ detectDataType:
จริง (ค่าเริ่มต้น) หรือ เท็จ