แชร์ผ่าน


รูปแบบ XML ใน Data Factory ใน Microsoft Fabric

บทความนี้สรุปวิธีการกําหนดค่ารูปแบบ XML ในไปป์ไลน์ข้อมูลของ Data Factory ใน Microsoft Fabric

ความสามารถที่รองรับ

รูปแบบ XML ได้รับการสนับสนุนสําหรับกิจกรรมและตัวเชื่อมต่อต่อไปนี้เป็นแหล่งข้อมูล

หมวดหมู่ ตัวเชื่อมต่อ/กิจกรรม
ตัวเชื่อมต่อที่สนับสนุน Amazon S3
เข้ากันได้กับ Amazon S3
ที่เก็บข้อมูล Azure Blob
Azure Data Lake Storage Gen1
Azure Data Lake Storage รุ่น2
ไฟล์ Azure
ระบบไฟล์
FTP
พื้นที่เก็บข้อมูล Google Cloud
HTTP
ไฟล์ของเลคเฮ้าส์
ที่เก็บข้อมูล Oracle Cloud
SFTP
กิจกรรมที่ได้รับการสนับสนุน คัดลอกกิจกรรม (ต้นทาง/-)
ค้นหากิจกรรม
กิจกรรม GetMetadata
ลบกิจกรรม

รูปแบบ XML ในกิจกรรมการคัดลอก

หากต้องการกําหนดค่ารูปแบบ XML ให้เลือกการเชื่อมต่อของคุณในแหล่งข้อมูลกิจกรรมการคัดลอกไปป์ไลน์ข้อมูลจากนั้นเลือก XML ในรายการดรอปดาวน์ของ รูปแบบไฟล์ เลือก การตั้งค่า สําหรับการกําหนดค่าเพิ่มเติมของรูปแบบนี้

สกรีนช็อตที่แสดงการตั้งค่ารูปแบบไฟล์

XML เป็นแหล่งข้อมูล

หลังจากที่คุณเลือก การตั้งค่า ในส่วน รูปแบบไฟล์ คุณสมบัติต่อไปนี้จะแสดงในกล่องโต้ตอบการตั้งค่ารูปแบบไฟล์แบบป็อปอัพ

สกรีนช็อตที่แสดงการเลือกรูปแบบไฟล์

  • ชนิดการบีบอัด: ตัวแปลงสัญญาณการบีบอัดที่ใช้ในการอ่านไฟล์ XML คุณสามารถเลือกจาก ประเภท ไม่มี, bzip2, gzip, deflate, ZipDeflate, TarGZip หรือ tar ในรายการดรอปดาวน์

    หากคุณเลือก ZipDeflate เป็นชนิดการบีบอัด รักษาชื่อไฟล์ zip เป็นโฟลเดอร์จะปรากฏขึ้นภายใต้การตั้งค่าขั้นสูงในแท็บแหล่งข้อมูล

    • รักษาชื่อไฟล์ zip เป็นโฟลเดอร์: ระบุว่าจะเก็บรักษาชื่อไฟล์ zip ต้นทางเป็นโครงสร้างโฟลเดอร์ในระหว่างการคัดลอกหรือไม่
      • หากเลือกกล่องกาเครื่องหมายนี้ (ค่าเริ่มต้น) บริการจะเขียนไฟล์ที่ไม่มีการบีบอัดไปยัง<specified file path>/<folder named as source zip file>/
      • หากไม่ได้ทําเครื่องหมายที่กล่องนี้ บริการจะเขียนไฟล์ที่คลายซิปโดยตรงไปยัง<specified file path> ตรวจสอบให้แน่ใจว่าคุณไม่มีชื่อไฟล์ที่ซ้ํากันในไฟล์ zip ต้นทางที่แตกต่างกันเพื่อหลีกเลี่ยงการแข่งรถหรือพฤติกรรมที่ไม่คาดคิด

    หากคุณเลือก TarGZip/tar เป็นชนิดการบีบอัด ชื่อไฟล์บีบอัดเป็นโฟลเดอร์จะแสดงขึ้นภายใต้การตั้งค่าขั้นสูงในแท็บแหล่งข้อมูล

    • รักษาชื่อไฟล์การบีบอัดเป็นโฟลเดอร์: บ่งชี้ว่าจะรักษาชื่อไฟล์บีบอัดต้นทางเป็นโครงสร้างโฟลเดอร์ในระหว่างการคัดลอกหรือไม่
      • หากเลือกกล่องกาเครื่องหมายนี้ (ค่าเริ่มต้น) บริการจะเขียนไฟล์ที่ขยายเป็น<specified file path>/<folder named as source compressed file>/
      • หากไม่ได้เลือกกล่องกาเครื่องหมายนี้ บริการจะเขียนไฟล์ที่ขยายโดยตรงไปยัง<specified file path> ตรวจสอบให้แน่ใจว่าคุณไม่มีชื่อไฟล์ที่ซ้ํากันในไฟล์ต้นฉบับที่แตกต่างกันเพื่อหลีกเลี่ยงการแข่งรถหรือลักษณะการทํางานที่ไม่คาดคิด
  • ระดับการบีบอัด: ระบุอัตราส่วนการบีบอัดเมื่อคุณเลือกชนิดการบีบอัด คุณสามารถเลือกจาก เร็วที่สุด หรือ เหมาะสมที่สุด

    • เร็วที่สุด: การดําเนินการบีบอัดควรเสร็จสมบูรณ์โดยเร็วที่สุดแม้ว่าไฟล์ผลลัพธ์จะไม่ได้รับการบีบอัดอย่างเหมาะสมก็ตาม
    • เหมาะสมที่สุด: การดําเนินการบีบอัดควรได้รับการบีบอัดอย่างเหมาะสมแม้ว่าการดําเนินการจะใช้เวลานานขึ้นก็ตาม สําหรับข้อมูลเพิ่มเติม ดู หัวข้อระดับการบีบอัด
  • การเข้ารหัส: ระบุชนิดการเข้ารหัสที่ใช้ในการเขียนไฟล์ทดสอบ เลือกชนิดหนึ่งจากรายการดรอปดาวน์ ค่าเริ่มต้นคือ UTF-8

  • ค่า Null: ระบุการแสดงสตริงของค่า null ค่าเริ่มต้นเป็นสตริงว่าง

ภายใต้ การตั้งค่าขั้นสูง ใน แท็บ แหล่งข้อมูล คุณสมบัติที่เกี่ยวข้องกับรูปแบบ XML ต่อไปนี้จะแสดงขึ้น

  • โหมดการตรวจสอบความถูกต้อง: ระบุว่าจะตรวจสอบความถูกต้องของ XML schema หรือไม่ เลือกหนึ่งโหมดจากรายการดรอปดาวน์

    • ไม่มี: เลือกตัวเลือกนี้เพื่อไม่ใช้โหมดการตรวจสอบความถูกต้อง
    • xsd: เลือกตัวเลือกนี้เพื่อตรวจสอบเค้าร่าง XML โดยใช้ XSD
    • dtd: เลือกตัวเลือกนี้เพื่อตรวจสอบเค้าร่าง XML โดยใช้ DTD

    สกรีนช็อตที่แสดงโหมดการตรวจสอบความถูกต้อง

  • Namespace: ระบุว่าจะเปิดใช้งาน namespace เมื่อแยกวิเคราะห์ไฟล์ XML หรือไม่ ซึ่งจะถูกเลือกตามค่าเริ่มต้น

  • คู่คํานําหน้า Namespace: ถ้า เปิดใช้งาน Namespace เลือก + ใหม่ และระบุ URL และ คํานําหน้า คุณสามารถเพิ่มคู่เพิ่มเติมโดยการเลือก + ใหม่
    Namespace URI สําหรับการแมปคํานําหน้าถูกใช้เพื่อตั้งชื่อเขตข้อมูลเมื่อแยกวิเคราะห์ไฟล์ XML ถ้าไฟล์ XML มี namespace และเนมสเปซเปิดใช้งาน ตามค่าเริ่มต้น ชื่อเขตข้อมูลจะเหมือนกับที่อยู่ในเอกสาร XML ถ้ามีรายการที่กําหนดไว้สําหรับ namespace URI ในแผนที่นี้ ชื่อเขตข้อมูลคือprefix:fieldName

    สกรีนช็อตที่แสดงคู่คํานําหน้า namespace

  • ตรวจหาชนิดข้อมูล: ระบุว่าจะตรวจหาชนิดข้อมูลจํานวนเต็ม คู่ และบูลีนหรือไม่ ซึ่งจะถูกเลือกตามค่าเริ่มต้น

ข้อมูลสรุปของตาราง

XML เป็นแหล่งข้อมูล

คุณสมบัติต่อไปนี้ได้รับการสนับสนุนในส่วนแหล่งกิจกรรมการคัดลอกเมื่อใช้รูปแบบ XML

ชื่อ คำอธิบาย: ค่า ต้องระบุ คุณสมบัติสคริปต์ JSON
รูปแบบไฟล์ รูปแบบไฟล์ที่คุณต้องการใช้ XML ใช่ type (ภายใต้ datasetSettings):
Xml
ชนิดการบีบอัด ตัวแปลงสัญญาณการบีบอัดที่ใช้ในการอ่านไฟล์ XML ไม่มี
bzip2
gzip
แฟบ
ZipDeflate
TarGZip
น้ํามันดิน
ไม่ type (ภายใต้ compression):

bzip2
gzip
แฟบ
ZipDeflate
TarGZip
น้ํามันดิน
ระดับการบีบอัด  อัตราส่วนการบีบอัด เร็วที่สุด
เหมาะ สม 
ไม่ใช่ ระดับ (ภายใต้ compression):
เร็วที่สุด
เหมาะ สม
การเข้ารหัส ชนิดการเข้ารหัสที่ใช้ในการอ่านไฟล์ทดสอบ "UTF-8" (ตามค่าเริ่มต้น),"UTF-8 โดยไม่มี BOM", "UTF-16LE", "UTF-16BE", "UTF-32LE", "UTF-32BE", "US-ASCII", "UTF-7", "BIG5", "EUC-JP", "EUC-KR", "GB2312", "GB18030", "JOHAB", "SHIFT-JIS", "CP875", "CP866", "IBM00858", "IBM037", "IBM273", "IBM437", "IBM500", "IBM737", "IBM775", "IBM850", "IBM852", "IBM855", "IBM857", "IBM860", "IBM861", "IBM863", "IBM863", "IBM864", "IBM865", "IBM869", "IBM870", "IBM01140", "IBM01141", "IBM01142", "IBM01143", "IBM01144", "IBM01145", "IBM01146", "IBM01147", "IBM01148", "IBM01149", "ISO-2022-JP", "ISO-2022-KR", "ISO-8859-1", "ISO-8859-2", "ISO-8859-3", "ISO-8859-4", "ISO-8859-5", "ISO-8859-6", "ISO-8859-7", "ISO-8859-8", "ISO-8859-9", "ISO-8859-13", "ISO-8859-15", "WINDOWS-874", "WINDOWS-1250", "WINDOWS-1251", "WINDOWS-1255 2", "WINDOWS-1253", "WINDOWS-1254", "WINDOWS-1255", "WINDOWS-1256", "WINDOWS-1257", "WINDOWS-1258" ไม่ใช่ encodingName
รักษาชื่อไฟล์ zip เป็นโฟลเดอร์ ระบุว่าจะรักษาชื่อไฟล์ zip ต้นทางเป็นโครงสร้างโฟลเดอร์ในระหว่างการคัดลอกหรือไม่ เลือกแล้ว (ค่าเริ่มต้น) หรือยกเลิกการเลือก ไม่ preserveZipFileNameAsFolder
(ภายใต้ compressionProperties->type เป็น ZipDeflateReadSettings):
จริง (ค่าเริ่มต้น) หรือ เท็จ
รักษาชื่อไฟล์การบีบอัดเป็นโฟลเดอร์ ระบุว่าจะรักษาชื่อไฟล์ที่บีบอัดต้นทางเป็นโครงสร้างโฟลเดอร์ในระหว่างการคัดลอกหรือไม่ เลือกแล้ว (ค่าเริ่มต้น) หรือยกเลิกการเลือก ไม่ preserveCompressionFileNameAsFolder
(ภายใต้ compressionProperties->type ตาม TarGZipReadSettings หรือ TarReadSettings):
จริง (ค่าเริ่มต้น) หรือ เท็จ
ค่า Null การแสดงสตริงของค่า null <ค่า Null ของคุณ>
สตริงที่ว่างเปล่า (ตามค่าเริ่มต้น)
ไม่ใช่ nullValue
โหมดการตรวจสอบความถูกต้อง จะตรวจสอบความถูกต้องของ XML schema หรือไม่ ไม่มี
xsd
dtd
ไม่ validationMode:

xsd
dtd
Namespaces จะเปิดใช้งาน namespace เมื่อแยกวิเคราะห์ไฟล์ XML หรือไม่ เลือกแล้ว (ค่าเริ่มต้น) หรือยกเลิกการเลือก ไม่ namespaces:
จริง (ค่าเริ่มต้น) หรือ เท็จ
คู่คํานําหน้า Namespace URI ของ Namespace กับการแมปคํานําหน้า ซึ่งใช้ในการตั้งชื่อเขตข้อมูลเมื่อแยกวิเคราะห์ไฟล์ XML
ถ้าไฟล์ XML มี namespace และเนมสเปซเปิดใช้งาน ตามค่าเริ่มต้น ชื่อเขตข้อมูลจะเหมือนกับที่อยู่ในเอกสาร XML
ถ้ามีรายการที่กําหนดไว้สําหรับ namespace URI ในแผนที่นี้ ชื่อเขตข้อมูลคือprefix:fieldName
< url >:< คํานําหน้า > ไม่ namespacePrefixes:
< url >:< คํานําหน้า >
ตรวจพบชนิดข้อมูล ไม่ว่าจะตรวจหาชนิดข้อมูลเป็นจํานวนเต็ม สองเท่า และแบบบูลีน เลือกแล้ว (ค่าเริ่มต้น) หรือยกเลิกการเลือก ไม่ detectDataType:
จริง (ค่าเริ่มต้น) หรือ เท็จ