Σημείωση
Η πρόσβαση σε αυτή τη σελίδα απαιτεί εξουσιοδότηση. Μπορείτε να δοκιμάσετε να συνδεθείτε ή να αλλάξετε καταλόγους.
Η πρόσβαση σε αυτή τη σελίδα απαιτεί εξουσιοδότηση. Μπορείτε να δοκιμάσετε να αλλάξετε καταλόγους.
Αυτό το άρθρο παρέχει απαντήσεις σε συνήθεις ερωτήσεις σχετικά με το μοντέλο επεξεργασίας εγγράφων στο AI Builder. Εάν δεν βρίσκετε την ερώτησή σας εδώ, δείτε την Επισκόπηση του μοντέλου AI επεξεργασίας εγγράφων ή υποβάλετε την ερώτησή σας στην Κοινότητα του Power Automate για AI Builder.
Λειτουργικότητα
Τι μπορώ να κάνω με την επεξεργασία εγγράφων;
Με την επεξεργασία εγγράφων, μπορείτε να δημιουργήσετε ένα προσαρμοσμένο μοντέλο AI για την εξαγωγή πληροφοριών από διάφορα είδη εγγράφων.
- Η επιλογή εγγράφων προκαθορισμένου προτύπου είναι ιδανική όταν τα στοιχεία των εγγράφων σας μπορείτε να τα βρείτε σε παρόμοια σημεία. Αφορά συνήθως τα τιμολόγια, τις παραγγελίες αγοράς, τις παραγγελίες παράδοσης και τις φορολογικές φόρμες.
- Η επιλογή Γενικά έγγραφα είναι ιδανική για κάθε είδος εγγράφου, συμπεριλαμβανομένων εκείνων που υποστηρίζονται από την πρώτη επιλογή αλλά και για συμβάσεις, δηλώσεις εργασίας, επιστολές και άλλα. Αυτή η επιλογή μπορεί να είναι πιο ισχυρή για την εξαγωγή δεδομένων, αλλά απαιτεί περισσότερο χρόνο εκπαίδευσης.
Μάθετε περισσότερα στην Επισκόπηση του μοντέλου επεξεργασίας εγγράφων.
Ποιοι τύποι εγγράφων μπορεί να χειριστεί η επεξεργασία εγγράφων;
Οι υποστηριζόμενοι τύποι αρχείων είναι PDF, JPG και PNG.
Ποια δεδομένα μπορώ να εξαγάγω από έγγραφα χρησιμοποιώντας την επεξεργασία εγγράφων;
Η επεξεργασία εγγράφων μπορεί να εξαγάγει πεδία, πίνακες και πλαίσια ελέγχου από έγγραφα.
Μάθετε περισσότερα στην ενότητα Ορισμός πληροφοριών για εξαγωγή.
Μπορώ να εξαγάγω κείμενο από έγγραφα;
Ναι. Η επεξεργασία εγγράφων μπορεί να εξαγάγει εκτυπωμένο και χειρόγραφο κείμενο από τα έγγραφά σας.
Πόσα δείγματα χρειάζεται να εκπαιδεύω ένα μοντέλο επεξεργασίας εγγράφων;
Για έγγραφα υψηλής ποιότητας που χρησιμοποιούν την ίδια διάταξη, πέντε δείγματα εγγράφων θα πρέπει να είναι επαρκή. Για έγγραφα χαμηλής ποιότητας (για παράδειγμα, σαρώσεις χαμηλής ποιότητας), ενδεχομένως να απαιτούνται περισσότερα δείγματα εγγράφων. Για να βελτιώσετε τα αποτελέσματα, χρησιμοποιήστε 15 έως 20 δείγματα εγγράφων.
Βέλτιστες πρακτικές
Για έγγραφα προτύπου
- Μία (1) διάταξη ανά συλλογή.
- Η διάταξη πρέπει να είναι πανομοιότυπη μέσα στην ίδια συλλογή.
- Μην υπερβαίνετε αυτό το όριο. Τουλάχιστον πέντε (5) και μέγιστο 20 έγγραφα ανά συλλογή.
Για γενικά έγγραφα
Δημιουργήστε ένα ενιαίο μοντέλο για όλες τις παραλλαγές ενός τύπου εγγράφου, συμπεριλαμβανομένων τόσο των δομημένων όσο και των μη δομημένων εγγράφων.
Ετικετοποιήστε τα πεδία σύμφωνα με τις τιμές τους για καλύτερη ακρίβεια στην εξαγωγή.
Για παράδειγμα, χρησιμοποιήστε το "supplier_id" για ένα αναγνωριστικό προμηθευτή. Τα ονόματα πεδίων πρέπει να ταιριάζουν με τη γλώσσα του εγγράφου.
Μην υπερβαίνετε αυτό το όριο. Τουλάχιστον πέντε (5) και μέγιστο 20 έγγραφα ανά συλλογή.
Το μοντέλο μου δημοσιεύεται επί του παρόντος στο v3.1 (GA) και σκοπεύω να το επανεκπαιδεύσω χρησιμοποιώντας το v4.0 (GA). Είναι απαραίτητο να προσθέσω εκ νέου ετικέτα σε όλα τα έγγραφά μου;
Εκτός εάν προσθέτετε νέα πεδία, πλαίσια ελέγχου, πίνακες, υπογραφές για εξαγωγή δεδομένων ή νέα έγγραφα στη συλλογή, δεν χρειάζεται να προσθέσετε ξανά ετικέτες σε όλα τα έγγραφα.
Πριν από τη δημοσίευση του μοντέλου σας, συνιστάται η γρήγορη δοκιμή του μοντέλου σας χρησιμοποιώντας ένα ή περισσότερα δείγματα για να επαληθεύσετε και να βεβαιωθείτε ότι όλα τα πεδία που θέλετε έχουν εξαχθεί σωστά.
Μπορώ να αλλάξω από έναν τύπο εγγράφου σε έναν άλλο;
Ναι, κατά την επεξεργασία του μοντέλου σας, μπορείτε να κάνετε εναλλαγή μεταξύ ενός σταθερού τύπου εγγράφου προτύπου και ενός γενικού τύπου εγγράφου. Ωστόσο, αυτός ο διακόπτης δεν υποστηρίζεται για τιμολόγια.
Μπορεί ένα μεμονωμένο μοντέλο επεξεργασίας φόρμας να εξαγάγει πληροφορίες από έγγραφα που έχουν διαφορετικές διατάξεις ή πρότυπα;
Ναι. Χρησιμοποιώντας τη δυνατότητα συλλογών, εκπαιδεύετε ένα μεμονωμένο μοντέλο επεξεργασίας φόρμας για τον χειρισμό εγγράφων που έχουν διαφορετικές διατάξεις.
Μάθετε περισσότερα στην Ομαδοποίηση εγγράφων κατά συλλογές.
Μπορεί η επεξεργασία εγγράφων να χειριστεί πολλές φόρμες σε ένα μόνο έγγραφο;
Κάθε φόρμα πρέπει να βρίσκεται σε ξεχωριστό αρχείο. Για παράδειγμα, εάν έχετε ένα έγγραφο PDF με πολλά τιμολόγια σε αυτό, δημιουργήστε ένα ξεχωριστό αρχείο για κάθε τιμολόγιο πριν το στείλετε στο μοντέλο επεξεργασίας εγγράφων.
Μπορείτε επίσης να καθορίσετε σελίδες για να χειρίζεται το μοντέλο επεξεργασίας εγγράφων. Με αυτόν τον τρόπο μπορείτε να εκμεταλλευτείτε τη λειτουργικότητα του μοντέλου για να κάνετε κύκλο σελίδα προς σελίδα και να επεξεργαστείτε μία φόρμα κάθε φορά.
Μάθετε περισσότερα στην Περιοχή σελίδων.
Έχω εκπαιδεύσει ένα μοντέλο επεξεργασίας εγγράφων, αλλά δεν έχω καλά αποτελέσματα όσον αφορά δεδομένα που έχουν εξαχθεί. Πώς μπορώ να βελτιώσω το μοντέλο;
Εάν το μοντέλο σας επιστρέφει άσχημα αποτελέσματα μετά την εκπαίδευση, επεξεργαστείτε το μοντέλο και δώστε περισσότερα δείγματα για εκπαίδευση. Όσο περισσότερα δείγματα παρέχετε, τόσο περισσότερο το μοντέλο AI μαθαίνει πώς να εξαγάγει δεδομένα από τα έγγραφά σας.
Μάθετε περισσότερα στη Βελτίωση της απόδοσης του μοντέλου επεξεργασίας εγγράφων.
Περιορισμοί
Ποιο είναι το όριο για τον μέγιστο αριθμό εγγράφων που μπορώ να επεξεργαστώ;
Μπορείτε να επεξεργαστείτε έως και 360 έγγραφα ανά περιβάλλον, κάθε 60 δευτερόλεπτα.
Γιατί ορισμένοι χαρακτήρες αναγνωρίζονται λανθασμένα;
- Μπορεί να μπερδευτούν ορισμένοι χαρακτήρες: 0 (αριθμός) και Ο (γράμμα), 1 (αριθμός) και l (γράμμα), 4 (αριθμός) και Α (γράμμα) και άλλα.
- Μπορεί να συμβεί κάποιοι χαρακτήρες πάνω ή κοντά σε άλλους να αναγνωρίζονται εσφαλμένα: O (γράμμα) πάνω από μια κάθετη γραμμή γίνεται 0 (αριθμός), 5 (αριθμός) πάνω από μια γραμμή γίνεται $ (σύμβολο αμερικανικού δολαρίου), l_ (πεζό γράμμα, υπογράμμιση) γίνεται L (κεφαλαίο γράμμα) και πολλά άλλα.
- Μπορεί να συμβεί κάποιοι χαρακτήρες σε έγγραφα κακής ποιότητας να αναγνωρίζονται εσφαλμένα ή και καθόλου.
Στις προηγούμενες περιπτώσεις, δεν μπορεί να γίνει τίποτα στο AI Builder για τη βελτίωση της αναγνώρισης. Συνιστούμε τη βελτίωση της ποιότητας και της διάταξης του εγγράφου προέλευσης για την επίλυση παρόμοιων ζητημάτων.
Σημείωμα
Το Microsoft βελτιώνει συνεχώς την τεχνολογία οπτικής αναγνώρισης χαρακτήρων (OCR) για την ανίχνευση χαρακτήρων, επομένως τέτοια ζητήματα συμβαίνουν λιγότερο συχνά.
Μπορώ να δημιουργήσω ένα μοντέλο με πολλές συλλογές;
Μπορείτε να δημιουργήσετε έως και 200 συλλογές ανά μοντέλο. Ωστόσο, η εκπαίδευση μοντέλων Γενικά έγγραφα με δεκάδες συλλογές μπορεί να διαρκέσει αρκετές ώρες και—σε σπάνιες περιπτώσεις—το χρονικό όριο να παρέλθει. Εάν το μοντέλο σας διαθέτει μεγάλο αριθμό συλλογών, περιμένετε έως και 24 ώρες μέχρι να ολοκληρωθεί η εκπαίδευση μοντέλου.
Μπορώ να δημιουργήσω ένα μοντέλο σε μια λύση;
Επί του παρόντος, δεν είναι δυνατό να δημιουργηθεί ένα μοντέλο σε μια λύση.
Μπορώ να χρησιμοποιήσω συμβάσεις και επιστολές στο μοντέλο επεξεργασίας εγγράφων μου;
Ναι, τα μη δομημένα έγγραφα, όπως οι συμβάσεις και οι επιστολές, υποστηρίζονται από την επεξεργασία εγγράφων, χρησιμοποιώντας την επιλογή Γενικά έγγραφα.
Συγκρίσεις
Ποιες είναι οι διαφορές μεταξύ της επεξεργασίας εγγράφων, της επεξεργασίας τιμολογίου, της επεξεργασίας αποδείξεων, του προγράμματος ανάγνωσης εγγράφων ταυτότητας, του προγράμματος ανάγνωσης επαγγελματικών καρτών και της αναγνώρισης κειμένου;
Ανάλογα με την κατάστασή σας, ενδέχεται να χρειαστεί να χρησιμοποιήσετε ένα συγκεκριμένο μοντέλο ή ένα συνδυασμό τους.
Χρησιμοποιήστε την αναγνώριση κειμένου όταν θέλετε να εξαγάγετε όλο το κείμενο που υπάρχει σε μια εικόνα ή σε ένα PDF. Στη συνέχεια, μπορείτε, για παράδειγμα, να αναζητήσετε μια λέξη-κλειδί στο κείμενο που εξάγεται ή να δημιουργήσετε ορισμένους προκαθορισμένους κανόνες για την εξαγωγή ορισμένων στοιχείων.
Εάν θέλετε να εξαγάγετε πληροφορίες από τιμολόγια, αποδείξεις, διαβατήρια, άδειες οδήγησης ή επαγγελματικές κάρτες, ξεκινήστε με το αντίστοιχο προκατασκευασμένο μοντέλο:
- Επεξεργασία τιμολογίου
- Επεξεργασία αποδείξεων
- Πρόγραμμα ανάγνωσης ταυτοτήτων (διαβατήρια και άδειες οδήγησης)
- Πρόγραμμα ανάγνωσης επαγγελματικών καρτών
Μπορείτε να χρησιμοποιήσετε αυτά τα προκατασκευασμένα μοντέλα αμέσως, χωρίς να χρειάζεται να δημιουργήσετε ένα νέο μοντέλο. Αυτά τα μοντέλα μπορούν να εξάγουν κοινές πληροφορίες που βρίσκονται στον αντίστοιχο τύπο εγγράφου.
Για οποιονδήποτε άλλο τύπο εγγράφου, μπορείτε να δημιουργήσετε ένα προσαρμοσμένο μοντέλο επεξεργασίας εγγράφων για να εξαγάγετε τα πεδία και τους πίνακες που χρειάζεστε. Αυτό ισχύει επίσης εάν χρειάζεστε πρόσθετες πληροφορίες που δεν παρέχονται από το προκατασκευασμένο μοντέλο.
Μάθετε περισσότερα στο Προσαρμοσμένο μοντέλο επεξεργασίας εγγράφων.
Ποια είναι η διαφορά μεταξύ της επεξεργασίας εγγράφων AI Builder και της αναγνώρισης φορμών Azure;
Η επεξεργασία εγγράφων AI Builder είναι ενσωματωμένη στην αναγνώριση φορμών Azure. Αυτή η δυνατότητα παρέχει και στα δύο προϊόντα τις πιο πρόσφατες εξελίξεις στο Microsoft AI.
Το AI Builder είναι μέρος του Microsoft Power Platform. Αυτό δίνει σε όλους τη δυνατότητα προσθήκης AI σε εφαρμογές και αυτοματοποίηση με ένα εύχρηστο περιβάλλον εργασίας. Δεν χρειάζεται να είστε προγραμματιστής ή επιστήμονας δεδομένων.
Το Πρόγραμμα αναγνώρισης φόρμας Azureαπευθύνεται σε επαγγελματίες προγραμματιστές. Μπορούν να χρησιμοποιούν απλά REST API για να προσθέτουν δυνατότητες AI στις λύσεις τους προσαρμοσμένου κώδικα.
Επιλογές κόστους
Πόσο κοστίζει η επεξεργασία εγγράφων AI Builder;
Μπορείτε να ξεκινήσετε να δοκιμάσετε δωρεάν την επεξεργασία εγγράφων ξεκινώντας μια δοκιμαστική έκδοση. Αφού το αξιολογήσετε, θα χρειαστεί να αγοράσετε πίστωση AI Builder για να χρησιμοποιήσετε την επεξεργασία εγγράφων. Κάθε σελίδα που επεξεργάζεστε με την επεξεργασία εγγράφων καταναλώνει πίστωση AI Builder, ακόμα και αν η σελίδα δεν περιέχει δεδομένα για εξαγωγή. Οι πιστώσεις AI Builder αγοράζονται μέσω των πρόσθετων AI Builder.
Μάθετε περισσότερα στην Παραχώρηση αδειών του AI Builder.