Μορφή ORC στο Data Factory στο Microsoft Fabric
Αυτό το άρθρο περιγράφει τον τρόπο ρύθμισης παραμέτρων της μορφής ORC στη διοχέτευση δεδομένων του Data Factory στο Microsoft Fabric.
Η μορφή ORC υποστηρίζεται για τις ακόλουθες δραστηριότητες και συνδέσεις ως προέλευση και προορισμό.
Category | Σύνδεση/Δραστηριότητα |
---|---|
Υποστηριζόμενη σύνδεση | Amazon S3 |
Συμβατό με το Amazon S3 | |
Χώρος αποθήκευσης αντικειμένου Blob Azure | |
Azure Data Lake Storage Gen1 | |
Azure Data Lake Storage Gen2 | |
Αρχεία Azure | |
Σύστημα αρχείων | |
FTP | |
Χώρος αποθήκευσης Cloud Google | |
HTTP | |
Αρχεία Lakehouse | |
Oracle Cloud Storage | |
SFTP | |
Υποστηριζόμενη δραστηριότητα | Αντιγραφή δραστηριότητας (προέλευσης/προορισμού) |
Δραστηριότητα αναζήτησης | |
Δραστηριότητα GetMetadata | |
Διαγραφή δραστηριότητας δεδομένων |
Για να ρυθμίσετε τις παραμέτρους της μορφής ORC, επιλέξτε τη σύνδεσή σας στην προέλευση ή στον προορισμό της δραστηριότητας αντιγραφής διοχέτευσης δεδομένων και, στη συνέχεια, επιλέξτε ORC στην αναπτυσσόμενη λίστα Μορφή αρχείου. Επιλέξτε Ρυθμίσεις για περαιτέρω ρύθμιση παραμέτρων αυτής της μορφής.
Αφού επιλέξετε Ρυθμίσεις στην ενότητα Μορφή αρχείου, οι παρακάτω ιδιότητες εμφανίζονται στο αναδυόμενο παράθυρο διαλόγου Ρυθμίσεις μορφής αρχείου.
- Τύπος συμπίεσης: Επιλέξτε τον κωδικοποιητή συμπίεσης που χρησιμοποιείται για την ανάγνωση αρχείων ORC στην αναπτυσσόμενη λίστα. Μπορείτε να επιλέξετε Κανένα, zlib ή snappy.
Αφού επιλέξετε Ρυθμίσεις, εμφανίζονται οι ακόλουθες ιδιότητες στο αναδυόμενο παράθυρο διαλόγου Ρυθμίσεις μορφής αρχείου.
- Τύπος συμπίεσης: Επιλέξτε τον κωδικοποιητή συμπίεσης που χρησιμοποιείται για την εγγραφή αρχείων ORC στην αναπτυσσόμενη λίστα. Μπορείτε να επιλέξετε Κανένα, zlib ή snappy.
Στην περιοχή Ρυθμίσεις για προχωρημένους στην καρτέλα Προορισμός , εμφανίζονται οι ακόλουθες ιδιότητες που σχετίζονται με τη μορφή ORC.
- Μέγιστος αριθμός γραμμών ανά αρχείο: Κατά την εγγραφή δεδομένων σε έναν φάκελο, μπορείτε να επιλέξετε να κάνετε εγγραφή σε πολλά αρχεία και να καθορίσετε τις μέγιστες γραμμές ανά αρχείο. Καθορίστε τις μέγιστες γραμμές που θέλετε να συντάξετε ανά αρχείο.
- Πρόθημα ονόματος αρχείου: Ισχύει όταν ρυθμίζεται η επιλογή Μέγιστος αριθμός γραμμών ανά αρχείο . Καθορίστε το πρόθημα ονόματος αρχείου κατά την εγγραφή δεδομένων σε πολλαπλά αρχεία, με αποτέλεσμα αυτό το μοτίβο:
<fileNamePrefix>_00000.<fileExtension>
. Εάν δεν καθοριστεί, δημιουργείται αυτόματα το πρόθεμα ονόματος αρχείου. Αυτή η ιδιότητα δεν ισχύει όταν η προέλευση είναι χώρος αποθήκευσης που βασίζεται σε αρχείο ή χώρο αποθήκευσης δεδομένων με δυνατότητα διαμερίσματος.
Οι ακόλουθες ιδιότητες υποστηρίζονται στην ενότητα Αντιγραφή προέλευσης δραστηριότητας κατά τη χρήση της μορφής ORC.
Ονομασία | Περιγραφή | Τιμή | Απαραίτητο | Ιδιότητα δέσμης ενεργειών JSON |
---|---|---|---|---|
Μορφή αρχείου | Η μορφή αρχείου που θέλετε να χρησιμοποιήσετε. | ORC | Όχι | τύπος (στην περιοχή datasetSettings ):Orc |
Τύπος συμπίεσης | Ο κωδικοποιητής συμπίεσης που χρησιμοποιείται για την ανάγνωση αρχείων ORC. | Κανένας zlib Ζωηρός |
Όχι | orcCompressionCodec: κανένας zlib Ζωηρός |
Οι ακόλουθες ιδιότητες υποστηρίζονται στην ενότητα αντιγραφή δραστηριότητας Προορισμός όταν χρησιμοποιείτε τη μορφή ORC.
Ονομασία | Περιγραφή | Τιμή | Απαραίτητο | Ιδιότητα δέσμης ενεργειών JSON |
---|---|---|---|---|
Μορφή αρχείου | Η μορφή αρχείου που θέλετε να χρησιμοποιήσετε. | ORC | Όχι | τύπος (στην περιοχή datasetSettings ):Orc |
Τύπος συμπίεσης | Ο κωδικοποιητής συμπίεσης που χρησιμοποιείται για την εγγραφή αρχείων ORC. | Κανένας zlib Ζωηρός |
Όχι | orcCompressionCodec: κανένας zlib Ζωηρός |
Μέγιστος αριθμός γραμμών ανά αρχείο | Κατά την εγγραφή δεδομένων σε έναν φάκελο, μπορείτε να επιλέξετε να γράψετε σε πολλά αρχεία και να καθορίσετε τις μέγιστες γραμμές ανά αρχείο. Καθορίστε τις μέγιστες γραμμές που θέλετε να συντάξετε ανά αρχείο. | <οι μέγιστες γραμμές ανά αρχείο> | Όχι | maxRowsPerFile |
Πρόθημα ονόματος αρχείου | Ισχύει όταν ρυθμίζονται οι παράμετροι της ρύθμισης Μέγιστος αριθμός γραμμών ανά αρχείο . Καθορίστε το πρόθημα ονόματος αρχείου κατά την εγγραφή δεδομένων σε πολλαπλά αρχεία, με αποτέλεσμα αυτό το μοτίβο: <fileNamePrefix>_00000.<fileExtension> . Εάν δεν καθοριστεί, δημιουργείται αυτόματα το πρόθεμα ονόματος αρχείου. Αυτή η ιδιότητα δεν ισχύει όταν η προέλευση είναι χώρος αποθήκευσης που βασίζεται σε αρχείο ή χώρο αποθήκευσης δεδομένων με δυνατότητα διαμερίσματος. |
<το πρόθημα ονόματος αρχείου> | Όχι | fileNamePrefix |