Ανάγνωση στα Αγγλικά

Κοινή χρήση μέσω


Μορφή XML στο Data Factory στο Microsoft Fabric

Αυτό το άρθρο περιγράφει τον τρόπο ρύθμισης παραμέτρων της μορφής XML στη διοχέτευση δεδομένων του Data Factory στο Microsoft Fabric.

Υποστηριζόμενες δυνατότητες

Η μορφή XML υποστηρίζεται για τις ακόλουθες δραστηριότητες και συνδέσεις ως προέλευση.

Μορφή XML στη δραστηριότητα αντιγραφής

Για να ρυθμίσετε τις παραμέτρους της μορφής XML, επιλέξτε τη σύνδεσή σας στην προέλευση δραστηριότητας αντιγραφής διοχέτευσης δεδομένων και, στη συνέχεια, επιλέξτε XML στην αναπτυσσόμενη λίστα Μορφή αρχείου. Επιλέξτε Ρυθμίσεις για περαιτέρω ρύθμιση παραμέτρων αυτής της μορφής.

Στιγμιότυπο οθόνης που εμφανίζει τις ρυθμίσεις μορφής αρχείου.

XML ως προέλευση

Αφού επιλέξετε Ρυθμίσεις στην ενότητα Μορφή αρχείου, οι παρακάτω ιδιότητες εμφανίζονται στο αναδυόμενο παράθυρο διαλόγου Ρυθμίσεις μορφής αρχείου.

Στιγμιότυπο οθόνης που εμφανίζει επιλεγμένη μορφή αρχείου.

  • Τύπος συμπίεσης: Ο κωδικοποιητής συμπίεσης που χρησιμοποιείται για την ανάγνωση αρχείων XML. Μπορείτε να επιλέξετε από τα στοιχεία None, bzip2, gzip, deflate, ZipDeflate, TarGZip ή tarGZip στην αναπτυσσόμενη λίστα.

    Εάν επιλέξετε ZipDeflate ως τύπο συμπίεσης, η επιλογή Διατήρηση ονόματος αρχείου zip ως φακέλου εμφανίζεται στην περιοχή Ρυθμίσεις για προχωρημένους στην καρτέλα Προέλευση .

    • Διατήρηση ονόματος αρχείου zip ως φακέλου: Υποδεικνύει εάν θέλετε να διατηρήσετε το όνομα του αρχείου zip προέλευσης ως δομή φακέλου κατά την αντιγραφή.
      • Εάν αυτό το πλαίσιο είναι επιλεγμένο (προεπιλογή), η υπηρεσία εγγράφει αποσυμπιεμένα αρχεία στο <specified file path>/<folder named as source zip file>/.
      • Εάν δεν είναι ενεργοποιημένη η επιλογή αυτού του πλαισίου, η υπηρεσία εγγράφει αποσυμπιεμένα αρχεία απευθείας στο <specified file path>. Βεβαιωθείτε ότι δεν έχετε διπλότυπα ονόματα αρχείων σε διαφορετικά αρχεία zip προέλευσης για να αποφύγετε αγωνιστικές ή μη αναμενόμενες συμπεριφορές.

    Εάν επιλέξετε TarGZip/tar ως τύπο συμπίεσης, η επιλογή Διατήρηση ονόματος αρχείου συμπίεσης ως φακέλου εμφανίζεται κάτω από τις Ρυθμίσεις για προχωρημένους στην καρτέλα Προέλευση .

    • Διατήρηση του ονόματος αρχείου συμπίεσης ως φάκελο: Υποδεικνύει εάν θα διατηρηθεί το όνομα του συμπιεσμένου αρχείου προέλευσης ως δομή φακέλου κατά την αντιγραφή.
      • Εάν αυτό το πλαίσιο είναι επιλεγμένο (προεπιλογή), η υπηρεσία εγγράφει αποσυμπιεμένα αρχεία στο <specified file path>/<folder named as source compressed file>/.
      • Εάν δεν είναι ενεργοποιημένη η επιλογή αυτού του πλαισίου, η υπηρεσία εγγράφει αποσυμπιεμένα αρχεία απευθείας στο <specified file path>. Βεβαιωθείτε ότι δεν έχετε διπλότυπα ονόματα αρχείων σε διαφορετικά αρχεία προέλευσης για να αποφύγετε αγωνιστική ή μη αναμενόμενη συμπεριφορά.
  • Επίπεδο συμπίεσης: Καθορίστε την αναλογία συμπίεσης όταν επιλέγετε έναν τύπο συμπίεσης. Μπορείτε να επιλέξετε το στοιχείο Ταχύτερη ή Βέλτιστη.

    • Ταχύτερη: Η λειτουργία συμπίεσης θα πρέπει να ολοκληρωθεί το συντομότερο δυνατό, ακόμα και αν το αρχείο που προκύπτει δεν συμπιέζεται βέλτιστα.
    • Βέλτιστη: Η λειτουργία συμπίεσης θα πρέπει να συμπιεστεί βέλτιστα, ακόμα και αν η λειτουργία απαιτεί περισσότερο χρόνο για να ολοκληρωθεί. Για περισσότερες πληροφορίες, ανατρέξτε στο θέμα Επίπεδο συμπίεσης.
  • Κωδικοποίηση: Καθορίστε τον τύπο κωδικοποίησης που χρησιμοποιείται για τη σύνταξη αρχείων δοκιμής. Επιλέξτε έναν τύπο από την αναπτυσσόμενη λίστα. Η προεπιλεγμένη τιμή είναι UTF-8.

  • Τιμή null: Καθορίζει την αναπαράσταση συμβολοσειράς της τιμής null. Η προεπιλεγμένη τιμή είναι κενή συμβολοσειρά.

Στην περιοχή Ρυθμίσεις για προχωρημένους στην καρτέλα Προέλευση , εμφανίζονται οι ακόλουθες ιδιότητες που σχετίζονται με τη μορφή XML.

  • Λειτουργία επικύρωσης: Καθορίζει εάν θα επικυρωθεί το σχήμα XML. Επιλέξτε μία λειτουργία από την αναπτυσσόμενη λίστα.

    • Καμία: Επιλέξτε το για να μην χρησιμοποιείται η λειτουργία επικύρωσης.
    • xsd: Επιλέξτε το για να επικυρώσετε το σχήμα XML χρησιμοποιώντας XSD.
    • dtd: Επιλέξτε το για να επικυρώσετε το σχήμα XML χρησιμοποιώντας το DTD.

    Στιγμιότυπο οθόνης που εμφανίζει λειτουργίες επικύρωσης.

  • Χώροι ονομάτων: Καθορίστε εάν θα ενεργοποιήσετε τον χώρο ονομάτων κατά την ανάλυση των αρχείων XML. Επιλέγεται από προεπιλογή.

  • Ζεύγη προθήματος χώρου ονομάτων: Εάν είναι ενεργοποιημένος ο χώρος ονομάτων, επιλέξτε + Δημιουργία και καθορίστε τη διεύθυνση URL και το Πρόθεμα. Μπορείτε να προσθέσετε περισσότερα ζεύγη επιλέγοντας + Δημιουργία.
    Το URI χώρου ονομάτων στην αντιστοίχιση προθήματος χρησιμοποιείται για την ονομασία πεδίων κατά την ανάλυση του αρχείου XML. Εάν ένα αρχείο XML έχει χώρο ονομάτων και ο χώρος ονομάτων είναι ενεργοποιημένος, από προεπιλογή, το όνομα πεδίου είναι το ίδιο όπως στο έγγραφο XML. Εάν υπάρχει ένα στοιχείο που έχει οριστεί για το URI χώρου ονομάτων σε αυτόν τον χάρτη, το όνομα πεδίου είναι prefix:fieldName.

    Στιγμιότυπο οθόνης που εμφανίζει ζεύγη προθήματος χώρου ονομάτων.

  • Εντοπισμός τύπου δεδομένων: Καθορίστε εάν θα εντοπίζονται τύποι δεδομένων ακέραιων, διπλών και δυαδικών δεδομένων. Επιλέγεται από προεπιλογή.

Σύνοψη πίνακα

XML ως προέλευση

Οι ακόλουθες ιδιότητες υποστηρίζονται στην ενότητα Αντιγραφή προέλευσης δραστηριότητας κατά τη χρήση της μορφής XML.

Όνομα Περιγραφή Τιμή Απαιτούμενο Ιδιότητα δέσμης ενεργειών JSON
Μορφή αρχείου Η μορφή αρχείου που θέλετε να χρησιμοποιήσετε. XML Όχι τύπος (στην περιοχή datasetSettings):
Xml
Τύπος συμπίεσης Ο κωδικοποιητής συμπίεσης που χρησιμοποιείται για την ανάγνωση αρχείων XML. Κανένας
bzip2
gzip
ελαττώνω την αξία
ZipDeflate
TarGZip
πίσσα
Όχι τύπος (στην περιοχή compression):

bzip2
gzip
ελαττώνω την αξία
ZipDeflate
TarGZip
πίσσα
Επίπεδο συμπίεσης  Η αναλογία συμπίεσης. Ταχύτερα
Βέλτιστος 
Όχι επίπεδο (κάτω από compression):
Ταχύτερα
Βέλτιστος
Κωδικοποίηση Ο τύπος κωδικοποίησης που χρησιμοποιείται για την ανάγνωση αρχείων δοκιμής. "UTF-8" (από προεπιλογή),"UTF-8 χωρίς BOM", "UTF-16LE", "UTF-16BE", "UTF-32LE", "UTF-32BE", "US-ASCII", "UTF-7", ""BIG5", "EUC-JP", "EUC-KR", "GB2312", "GB18030", "JOHAB", "SHIFT-JIS", "CP875", "CP866", "IBM00858", "IBM037", "IBM273", "IBM437", "IBM500", "IBM737", "IBM775", "IBM850", "IBM852", "IBM855", "IBM857", "IBM860", "IBM861", "IBM863", "IBM864 ", "IBM865", "IBM869", "IBM870", "IBM01140", "IBM01141", "IBM01142", "IBM01143", "IBM01144", "IBM01145", "IBM01146", "IBM01147", "IBM01148", "IBM01149", "ISO-2022-JP", "ISO-2022-KR", "ISO-8859-1", "ISO-8859-2", "ISO-8859-3", "ISO-8859-3", "ISO-8859-4", "ISO-8859-5", "ISO-8859-6", "ISO-8859-7", "ISO-8859-8", "ISO-8859-8", "ISO-8859-9", "ISO-8859-13", "ISO-8859-15", "WINDOWS-874", "WINDOWS-1250", "WINDOWS-1251", "WINDOWS-1252", "WINDOWS-1253", "WINDOWS-1254", "WINDOWS-1255", "WINDOWS-1256", "WINDOWS-1257", "WINDOWS-1258" Όχι encodingName
Διατήρηση ονόματος αρχείου zip ως φακέλου Υποδεικνύει εάν θέλετε να διατηρήσετε το όνομα αρχείου zip προέλευσης ως δομή φακέλου κατά την αντιγραφή. Επιλεγμένα (προεπιλογή) ή κατάργηση επιλογής Όχι preserveZipFileNameAsFolder
(κάτω από compressionProperties->type ως ZipDeflateReadSettings):
true (προεπιλογή) ή false
Διατήρηση ονόματος αρχείου συμπίεσης ως φακέλου Υποδεικνύει εάν θέλετε να διατηρήσετε το όνομα συμπιεσμένου αρχείου προέλευσης ως δομή φακέλου κατά την αντιγραφή. Επιλεγμένα (προεπιλογή) ή κατάργηση επιλογής Όχι preserveCompressionFileNameAsFolder
(κάτω από compressionProperties->type ως TarGZipReadSettings ή TarReadSettings):
true (προεπιλογή) ή false
Τιμή null Η αναπαράσταση συμβολοσειράς της τιμής null. <η τιμή null σας>
κενή συμβολοσειρά (από προεπιλογή)
Όχι nullValue
Λειτουργία επικύρωσης Εάν θέλετε να επικυρώσετε το σχήμα XML. Κανένας
xsd
dtd
Όχι validationMode:

xsd
dtd
Χώροι ονομάτων Ορίζει εάν θα ενεργοποιείται ο χώρος ονομάτων κατά την ανάλυση των αρχείων XML. Επιλεγμένα (προεπιλογή) ή μη επιλεγμένα Όχι χώροι ονομάτων:
true (προεπιλογή) ή false
Ζεύγη προθήματος χώρου ονομάτων URI χώρου ονομάτων στην αντιστοίχιση προθήματος, η οποία χρησιμοποιείται για την ονομασία πεδίων κατά την ανάλυση του αρχείου XML.
Εάν ένα αρχείο XML έχει χώρο ονομάτων και ο χώρος ονομάτων είναι ενεργοποιημένος, από προεπιλογή, το όνομα πεδίου είναι το ίδιο όπως στο έγγραφο XML.
Εάν υπάρχει ένα στοιχείο που έχει οριστεί για το URI χώρου ονομάτων σε αυτόν τον χάρτη, το όνομα πεδίου είναι prefix:fieldName.
< url >:< πρόθημα > Όχι namespacePrefixes:
< url >:< πρόθημα >
Εντοπισμός τύπου δεδομένων Εάν θα εντοπιστούν τύποι δεδομένων ακεραίου, διπλοί και δυαδικοί. Επιλεγμένα (προεπιλογή) ή μη επιλεγμένα Όχι detectDataType:
true (προεπιλογή) ή false