Μορφή XML στο Data Factory στο Microsoft Fabric
Αυτό το άρθρο περιγράφει τον τρόπο ρύθμισης παραμέτρων της μορφής XML στη διοχέτευση δεδομένων του Data Factory στο Microsoft Fabric.
Η μορφή XML υποστηρίζεται για τις ακόλουθες δραστηριότητες και συνδέσεις ως προέλευση.
Category | Σύνδεση/Δραστηριότητα |
---|---|
Υποστηριζόμενη σύνδεση | Amazon S3 |
Συμβατό με το Amazon S3 | |
Χώρος αποθήκευσης αντικειμένου Blob Azure | |
Azure Data Lake Storage Gen1 | |
Azure Data Lake Storage Gen2 | |
Αρχεία Azure | |
Σύστημα αρχείων | |
FTP | |
Χώρος αποθήκευσης Cloud Google | |
HTTP | |
Αρχεία Lakehouse | |
Oracle Cloud Storage | |
SFTP | |
Υποστηριζόμενη δραστηριότητα | Αντιγραφή δραστηριότητας (προέλευση/-) |
Δραστηριότητα αναζήτησης | |
Δραστηριότητα GetMetadata | |
Διαγραφή δραστηριότητας |
Για να ρυθμίσετε τις παραμέτρους της μορφής XML, επιλέξτε τη σύνδεσή σας στην προέλευση δραστηριότητας αντιγραφής διοχέτευσης δεδομένων και, στη συνέχεια, επιλέξτε XML στην αναπτυσσόμενη λίστα Μορφή αρχείου. Επιλέξτε Ρυθμίσεις για περαιτέρω ρύθμιση παραμέτρων αυτής της μορφής.
Αφού επιλέξετε Ρυθμίσεις στην ενότητα Μορφή αρχείου, οι παρακάτω ιδιότητες εμφανίζονται στο αναδυόμενο παράθυρο διαλόγου Ρυθμίσεις μορφής αρχείου.
Τύπος συμπίεσης: Ο κωδικοποιητής συμπίεσης που χρησιμοποιείται για την ανάγνωση αρχείων XML. Μπορείτε να επιλέξετε από τα στοιχεία None, bzip2, gzip, deflate, ZipDeflate, TarGZip ή tarGZip στην αναπτυσσόμενη λίστα.
Εάν επιλέξετε ZipDeflate ως τύπο συμπίεσης, η επιλογή Διατήρηση ονόματος αρχείου zip ως φακέλου εμφανίζεται στην περιοχή Ρυθμίσεις για προχωρημένους στην καρτέλα Προέλευση .
- Διατήρηση ονόματος αρχείου zip ως φακέλου: Υποδεικνύει εάν θέλετε να διατηρήσετε το όνομα του αρχείου zip προέλευσης ως δομή φακέλου κατά την αντιγραφή.
- Εάν αυτό το πλαίσιο είναι επιλεγμένο (προεπιλογή), η υπηρεσία εγγράφει αποσυμπιεμένα αρχεία στο
<specified file path>/<folder named as source zip file>/
. - Εάν δεν είναι ενεργοποιημένη η επιλογή αυτού του πλαισίου, η υπηρεσία εγγράφει αποσυμπιεμένα αρχεία απευθείας στο
<specified file path>
. Βεβαιωθείτε ότι δεν έχετε διπλότυπα ονόματα αρχείων σε διαφορετικά αρχεία zip προέλευσης για να αποφύγετε αγωνιστικές ή μη αναμενόμενες συμπεριφορές.
- Εάν αυτό το πλαίσιο είναι επιλεγμένο (προεπιλογή), η υπηρεσία εγγράφει αποσυμπιεμένα αρχεία στο
Εάν επιλέξετε TarGZip/tar ως τύπο συμπίεσης, η επιλογή Διατήρηση ονόματος αρχείου συμπίεσης ως φακέλου εμφανίζεται κάτω από τις Ρυθμίσεις για προχωρημένους στην καρτέλα Προέλευση .
- Διατήρηση του ονόματος αρχείου συμπίεσης ως φάκελο: Υποδεικνύει εάν θα διατηρηθεί το όνομα του συμπιεσμένου αρχείου προέλευσης ως δομή φακέλου κατά την αντιγραφή.
- Εάν αυτό το πλαίσιο είναι επιλεγμένο (προεπιλογή), η υπηρεσία εγγράφει αποσυμπιεμένα αρχεία στο
<specified file path>/<folder named as source compressed file>/
. - Εάν δεν είναι ενεργοποιημένη η επιλογή αυτού του πλαισίου, η υπηρεσία εγγράφει αποσυμπιεμένα αρχεία απευθείας στο
<specified file path>
. Βεβαιωθείτε ότι δεν έχετε διπλότυπα ονόματα αρχείων σε διαφορετικά αρχεία προέλευσης για να αποφύγετε αγωνιστική ή μη αναμενόμενη συμπεριφορά.
- Εάν αυτό το πλαίσιο είναι επιλεγμένο (προεπιλογή), η υπηρεσία εγγράφει αποσυμπιεμένα αρχεία στο
- Διατήρηση ονόματος αρχείου zip ως φακέλου: Υποδεικνύει εάν θέλετε να διατηρήσετε το όνομα του αρχείου zip προέλευσης ως δομή φακέλου κατά την αντιγραφή.
Επίπεδο συμπίεσης: Καθορίστε την αναλογία συμπίεσης όταν επιλέγετε έναν τύπο συμπίεσης. Μπορείτε να επιλέξετε το στοιχείο Ταχύτερη ή Βέλτιστη.
- Ταχύτερη: Η λειτουργία συμπίεσης θα πρέπει να ολοκληρωθεί το συντομότερο δυνατό, ακόμα και αν το αρχείο που προκύπτει δεν συμπιέζεται βέλτιστα.
- Βέλτιστη: Η λειτουργία συμπίεσης θα πρέπει να συμπιεστεί βέλτιστα, ακόμα και αν η λειτουργία απαιτεί περισσότερο χρόνο για να ολοκληρωθεί. Για περισσότερες πληροφορίες, ανατρέξτε στο θέμα Επίπεδο συμπίεσης.
Κωδικοποίηση: Καθορίστε τον τύπο κωδικοποίησης που χρησιμοποιείται για τη σύνταξη αρχείων δοκιμής. Επιλέξτε έναν τύπο από την αναπτυσσόμενη λίστα. Η προεπιλεγμένη τιμή είναι UTF-8.
Τιμή null: Καθορίζει την αναπαράσταση συμβολοσειράς της τιμής null. Η προεπιλεγμένη τιμή είναι κενή συμβολοσειρά.
Στην περιοχή Ρυθμίσεις για προχωρημένους στην καρτέλα Προέλευση , εμφανίζονται οι ακόλουθες ιδιότητες που σχετίζονται με τη μορφή XML.
Λειτουργία επικύρωσης: Καθορίζει εάν θα επικυρωθεί το σχήμα XML. Επιλέξτε μία λειτουργία από την αναπτυσσόμενη λίστα.
- Καμία: Επιλέξτε το για να μην χρησιμοποιείται η λειτουργία επικύρωσης.
- xsd: Επιλέξτε το για να επικυρώσετε το σχήμα XML χρησιμοποιώντας XSD.
- dtd: Επιλέξτε το για να επικυρώσετε το σχήμα XML χρησιμοποιώντας το DTD.
Χώροι ονομάτων: Καθορίστε εάν θα ενεργοποιήσετε τον χώρο ονομάτων κατά την ανάλυση των αρχείων XML. Επιλέγεται από προεπιλογή.
Ζεύγη προθήματος χώρου ονομάτων: Εάν είναι ενεργοποιημένος ο χώρος ονομάτων, επιλέξτε + Δημιουργία και καθορίστε τη διεύθυνση URL και το Πρόθεμα. Μπορείτε να προσθέσετε περισσότερα ζεύγη επιλέγοντας + Δημιουργία.
Το URI χώρου ονομάτων στην αντιστοίχιση προθήματος χρησιμοποιείται για την ονομασία πεδίων κατά την ανάλυση του αρχείου XML. Εάν ένα αρχείο XML έχει χώρο ονομάτων και ο χώρος ονομάτων είναι ενεργοποιημένος, από προεπιλογή, το όνομα πεδίου είναι το ίδιο όπως στο έγγραφο XML. Εάν υπάρχει ένα στοιχείο που έχει οριστεί για το URI χώρου ονομάτων σε αυτόν τον χάρτη, το όνομα πεδίου είναιprefix:fieldName
.Εντοπισμός τύπου δεδομένων: Καθορίστε εάν θα εντοπίζονται τύποι δεδομένων ακέραιων, διπλών και δυαδικών δεδομένων. Επιλέγεται από προεπιλογή.
Οι ακόλουθες ιδιότητες υποστηρίζονται στην ενότητα Αντιγραφή προέλευσης δραστηριότητας κατά τη χρήση της μορφής XML.
Όνομα | Περιγραφή | Τιμή | Απαιτούμενο | Ιδιότητα δέσμης ενεργειών JSON |
---|---|---|---|---|
Μορφή αρχείου | Η μορφή αρχείου που θέλετε να χρησιμοποιήσετε. | XML | Όχι | τύπος (στην περιοχή datasetSettings ):Xml |
Τύπος συμπίεσης | Ο κωδικοποιητής συμπίεσης που χρησιμοποιείται για την ανάγνωση αρχείων XML. | Κανένας bzip2 gzip ελαττώνω την αξία ZipDeflate TarGZip πίσσα |
Όχι | τύπος (στην περιοχή compression ): bzip2 gzip ελαττώνω την αξία ZipDeflate TarGZip πίσσα |
Επίπεδο συμπίεσης | Η αναλογία συμπίεσης. | Ταχύτερα Βέλτιστος |
Όχι | επίπεδο (κάτω από compression ): Ταχύτερα Βέλτιστος |
Κωδικοποίηση | Ο τύπος κωδικοποίησης που χρησιμοποιείται για την ανάγνωση αρχείων δοκιμής. | "UTF-8" (από προεπιλογή),"UTF-8 χωρίς BOM", "UTF-16LE", "UTF-16BE", "UTF-32LE", "UTF-32BE", "US-ASCII", "UTF-7", ""BIG5", "EUC-JP", "EUC-KR", "GB2312", "GB18030", "JOHAB", "SHIFT-JIS", "CP875", "CP866", "IBM00858", "IBM037", "IBM273", "IBM437", "IBM500", "IBM737", "IBM775", "IBM850", "IBM852", "IBM855", "IBM857", "IBM860", "IBM861", "IBM863", "IBM864 ", "IBM865", "IBM869", "IBM870", "IBM01140", "IBM01141", "IBM01142", "IBM01143", "IBM01144", "IBM01145", "IBM01146", "IBM01147", "IBM01148", "IBM01149", "ISO-2022-JP", "ISO-2022-KR", "ISO-8859-1", "ISO-8859-2", "ISO-8859-3", "ISO-8859-3", "ISO-8859-4", "ISO-8859-5", "ISO-8859-6", "ISO-8859-7", "ISO-8859-8", "ISO-8859-8", "ISO-8859-9", "ISO-8859-13", "ISO-8859-15", "WINDOWS-874", "WINDOWS-1250", "WINDOWS-1251", "WINDOWS-1252", "WINDOWS-1253", "WINDOWS-1254", "WINDOWS-1255", "WINDOWS-1256", "WINDOWS-1257", "WINDOWS-1258" | Όχι | encodingName |
Διατήρηση ονόματος αρχείου zip ως φακέλου | Υποδεικνύει εάν θέλετε να διατηρήσετε το όνομα αρχείου zip προέλευσης ως δομή φακέλου κατά την αντιγραφή. | Επιλεγμένα (προεπιλογή) ή κατάργηση επιλογής | Όχι | preserveZipFileNameAsFolder (κάτω από compressionProperties ->type ως ZipDeflateReadSettings ):true (προεπιλογή) ή false |
Διατήρηση ονόματος αρχείου συμπίεσης ως φακέλου | Υποδεικνύει εάν θέλετε να διατηρήσετε το όνομα συμπιεσμένου αρχείου προέλευσης ως δομή φακέλου κατά την αντιγραφή. | Επιλεγμένα (προεπιλογή) ή κατάργηση επιλογής | Όχι | preserveCompressionFileNameAsFolder (κάτω από compressionProperties ->type ως TarGZipReadSettings ή TarReadSettings ):true (προεπιλογή) ή false |
Τιμή null | Η αναπαράσταση συμβολοσειράς της τιμής null. | <η τιμή null σας> κενή συμβολοσειρά (από προεπιλογή) |
Όχι | nullValue |
Λειτουργία επικύρωσης | Εάν θέλετε να επικυρώσετε το σχήμα XML. | Κανένας xsd dtd |
Όχι | validationMode: xsd dtd |
Χώροι ονομάτων | Ορίζει εάν θα ενεργοποιείται ο χώρος ονομάτων κατά την ανάλυση των αρχείων XML. | Επιλεγμένα (προεπιλογή) ή μη επιλεγμένα | Όχι | χώροι ονομάτων: true (προεπιλογή) ή false |
Ζεύγη προθήματος χώρου ονομάτων | URI χώρου ονομάτων στην αντιστοίχιση προθήματος, η οποία χρησιμοποιείται για την ονομασία πεδίων κατά την ανάλυση του αρχείου XML. Εάν ένα αρχείο XML έχει χώρο ονομάτων και ο χώρος ονομάτων είναι ενεργοποιημένος, από προεπιλογή, το όνομα πεδίου είναι το ίδιο όπως στο έγγραφο XML. Εάν υπάρχει ένα στοιχείο που έχει οριστεί για το URI χώρου ονομάτων σε αυτόν τον χάρτη, το όνομα πεδίου είναι prefix:fieldName . |
< url >:< πρόθημα > | Όχι | namespacePrefixes: < url >:< πρόθημα > |
Εντοπισμός τύπου δεδομένων | Εάν θα εντοπιστούν τύποι δεδομένων ακεραίου, διπλοί και δυαδικοί. | Επιλεγμένα (προεπιλογή) ή μη επιλεγμένα | Όχι | detectDataType: true (προεπιλογή) ή false |