Κοινή χρήση μέσω


Προδομημένο μοντέλο αναγνώρισης κειμένου

Το προκατασκευασμένο μοντέλο αναγνώρισης κειμένου εξάγει λέξεις από έγγραφα και εικόνες σε ροές χαρακτήρων με δυνατότητα ανάγνωσης από υπολογιστή. Χρησιμοποιούν κορυφαία τεχνολογία οπτικής αναγνώρισης χαρακτήρων (OCR) για τον εντοπισμό εκτυπωμένου και χειρόγραφου κειμένου σε εικόνες.

Αυτό το μοντέλο επεξεργάζεται εικόνες και αρχεία εγγράφων για την εξαγωγή γραμμών εκτυπωμένου ή χειρόγραφου κειμένου.

Χρήση σε Power Apps

Το προκατασκευασμένο μοντέλο αναγνώρισης κειμένου είναι διαθέσιμο στο Power Apps με χρήση του στοιχείου αναγνώρισης κειμένου. Περισσότερες πληροφορίες Χρήση του στοιχείου αναγνώρισης κειμένου στο Power Apps

Χρήση σε Power Automate

Για πληροφορίες σχετικά με τον τρόπο χρήσης αυτού του μοντέλου στο Power Automate, ανατρέξτε στο θέμα Χρήση του προδομημένου μοντέλου αναγνώρισης κειμένου στο Power Automate.

Υποστηριζόμενη γλώσσα, μορφή και μέγεθος

Τα αρχεία που μπορείτε να σαρώσετε με το μοντέλο αναγνώρισης κειμένου πρέπει να έχουν τα εξής χαρακτηριστικά:

  • Γλώσσα εκτύπωσης κειμένου: Αφρικάανς, Αλβανικά, Ανγκίκα (Devanagiri), Αραβικά, Αστουριανά, Αουάντι Ινδίας (Devanagiri), Αζερμπαϊτζανικά (Λατινικά), Μπαγκέλι , Βασκικά, Λευκορωσικά (Κυριλλικά), Λευκορωσικά (Λατινικά), Bhojpuri-Hindi (Devanagiri), Bislama, Bodo (Devanagiri), Βοσνιακά (Λατινικά), Brajbha, Breton, Βουλγαρικά, Bundeli, Buryat (Κυριλλικά), Καταλανικά, Cebuano, Chamling, Chamorro, Chhattisgarhi (Devanagiri), Κινέζικα (Απλοποιημένα), Κινέζικα (Παραδοσιακά), Κορνουαλικά, Κορσικανικά, Ταταρικά της Κριμαίας (Λατινικά), Κροατικά, Τσέχικα, Δανέζικα, Ντάρι, Ντίμαλ (Devanagiri), Ντόγκρι (Devanagiri), Ολλανδικά, Αγγλικά, Erzya (Κυριλλικά), Εσθονικά, Φερόε, Φίτζι, Φιλιππινέζικα, Φινλανδικά, Γαλλικά, Φριούλια, Γκαγκαούζ (Λατινικά ), Γαλικιανά, Γερμανικά, Γκιλμπερτέζικα, Γκόντι (Devanagiri), Γροιλανδικά, Gurung (Devanagiri), Αϊτινά κρεολικά, Halbi (Devanagiri), Hani, Haryanvi, Χαβάης, Χίντι, Hmong Daw (Λατινικά), Ho (Devanagiri), Ουγγρικά, Ισλανδικά , Inari Sami, Ινδονησιακά, Interlingua, Inuktitut (Λατινικά), Ιρλανδικά, Ιταλικά, Ιαπωνικά, Jaunsari (Devanagiri), Ιάβας, Kabuverdianu, Kachin (Λατινικά), Kangri (Devanagiri), Karachay-Balkar, Kara-Kalpak (Κυριλλικά), Kara-Kalpak (Λατινικά), Kashubian, Καζακικά (Κυριλλικά), Καζακικά (Λατινικά), Khaling, Khasi, K'iche', Κορεάτικα, Korku, Koryak, Kosraean, Kumyk (Κυριλλικά), Κουρδικά (Αραβικά), Κουρδικά (Λατινικά), Kurukh (Devanagiri), Κιργιζικά (Κυριλλικά), Lakota, Λατινικά, Λιθουανικά, Κάτω Σορβικά, Lule Sami, Λουξεμβουργιανά, Mahasu Pahari (Devanagiri), Μαλαισιανά (Λατινικά), Μαλτέζικα, Μάλτο (Devanagiri), Μανξ, Μαορί, Μαράθι, Μογγολικά (Κυριλλικά), Μαυροβουνίου (Κυριλλικά), Μαυροβουνίου (Λατινικά), Ναπολιτανικά, Νεπαλικά, Νιουέ, Νογκέι, Βόρεια Σάμι (Λατινικά), Νορβηγικά, Οξιτανικά, Οσετικά, Πάστο, Περσικά, Πολωνικά, Πορτογαλικά, Παντζάμπι (Αραβικά), Ripuarian, Ρουμάνικα, Ρομανικά, Ρώσικα, Σαντρί (Devanagiri), Σαμόα (Λατινικά), Σανσκριτικά (Devanagari), Santali (Devanagiri), Σκωτσέζικα, Σκωτσέζικα Γαελικά, Σερβικά (Λατινικά) , Sherpa (Devanagiri), Sirmauri (Devanagiri), Skolt Sami, Σλοβακικά, Σλοβενικά, Σομαλικά (Αραβικά), Νότια Σάμι, Ισπανικά, Σουαχίλι (Λατινικά), Σουηδικά, Τατζίκικα (Κυριλλικά), Ταταρικά (Λατινικά), Tetum, Th angmi, Tongan, Τουρκικά, Τουρκμενικά (Λατινικά), Τουβάν, Άνω Σορβικά, Ουρντού, Ουιγούρια (Αραβικά), Ουζμπεκικά (Αραβικά), Ουζμπεκικά (Κυριλλικά), Ουζμπεκικά (Λατινικά), Volapük, Walser, Ουαλικά, Δυτικά Φριζικά, Yucatec Maya, Τζουάνγκ, Ζουλού
  • Γλώσσα για χειρόγραφο κείμενο: Αγγλικά, Κινέζικα (Απλοποιημένα), Γαλλικά, Γερμανικά, Ιταλικά, Ιαπωνικά, Κορεατικά, Πορτογαλικά, Πορτογαλικά, Ισπανικά
  • Μορφή:
    • JPG
    • PNG
    • BMP
    • PDF
  • Μέγεθος: 20 MB κατά μέγιστο
  • Για έγγραφα PDF, γίνεται επεξεργασία μόνο των πρώτων 2,000 σελίδων.

Αποτέλεσμα μοντέλου

Εάν εντοπιστεί ένα έγγραφο, το μοντέλο αναγνώρισης κειμένου εξάγει τις παρακάτω πληροφορίες:

  • Αποτελέσματα: μια λίστα γραμμών που έχουν εξαχθεί από το κείμενο εισόδου.
  • Κείμενο: συμβολοσειρές που περιέχουν τη γραμμή κειμένου που εντοπίστηκε.
  • BoundingBox: τέσσερις τιμές που αντιπροσωπεύουν το πλαίσιο οριοθέτησης, το οποίο περιγράφεται με χρήση της επάνω και της αριστερής θέσης μαζί με το πλάτος και το ύψος του.

Όρια

Ενέργεια Όριο Περίοδος ανανέωσης
Κλήσεις αναγνώρισης κειμένου (ανά περιβάλλον) 480 60 δευτερόλεπτα

Εκπαίδευση: Αναγνώριση κειμένου με το AI Builder (εκπαιδευτική ενότητα)