पाठ पहचान पूर्वनिर्मित मॉडल
टेक्स्ट रिकग्निशन प्रीबिल्ट मॉडल दस्तावेज़ों और छवियों से शब्दों को मशीन-पठनीय कैरेक्टर स्ट्रीम में निकालता है। यह छवियों में मुद्रित और हस्तलिखित पाठ का पता लगाने के लिए अत्याधुनिक ऑप्टिकल कैरेक्टर रिकग्निशन (ओसीआर) का उपयोग करता है।
यह मॉडल मुद्रित या हस्तलिखित पाठ की पंक्तियों को निकालने के लिए छवियों और दस्तावेज़ फ़ाइलों को संसाधित करता है।
में उपयोग करना Power Apps
टेक्स्ट पहचान पूर्व-निर्मित मॉडल टेक्स्ट पहचानकर्ता घटक का उपयोग करके Power Apps में उपलब्ध है। अधिक जानकारी: टेक्स्ट पहचानकर्ता घटक का उपयोग करें Power Apps
में उपयोग करना Power Automate
Power Automateमें इस मॉडल का उपयोग कैसे करें, इसके बारे में जानकारी के लिए देखें टेक्स्ट रिकग्निशन प्रीबिल्ट मॉडल का उपयोग करें Power Automate।
समर्थित भाषा, प्रारूप और आकार
जिन फ़ाइलों को आप टेक्स्ट पहचान मॉडल से स्कैन कर सकते हैं उनमें ये विशेषताएं होनी चाहिए:
- मुद्रित पाठ के लिए भाषा: अफ़्रीकी, अल्बानियाई, अंगिका (देवनागिरी), अरबी, अस्तुरियन, अवधी-हिंदी (देवनागिरी), अज़रबैजानी (लैटिन), बाघेली, बास्क, बेलारूसी (सिरिलिक), बेलारूसी (लैटिन), भोजपुरी-हिंदी (देवनागिरी), बिस्लामा, बोडो (देवनागिरी), बोस्नियाई (लैटिन), ब्रजभा, ब्रेटन, बल्गेरियाई, बुंदेली, बुरात (सिरिलिक), कैटलन, सेबुआनो, चामलिंग, चमोरो, छत्तीसगढ़ी (देवनागिरी), चीनी (सरलीकृत), चीनी (पारंपरिक), कोर्निश, कोर्सीकन, क्रीमियन तातार (लैटिन), क्रोएशियाई, चेक, डेनिश, दारी, धीमाल (देवनगिरि), डोगरी (देवनगिरि), डच, अंग्रेजी, एर्ज़्या (सिरिलिक), एस्टोनियाई, फिरोज़ी, फ़िजी, फिलिपिनो, फ़िनिश, फ़्रेंच, फ़्रियुलियन, गागाउज़ (लैटिन), गैलिशियन, जर्मन, गिल्बर्टीज़, गोंडी (देवनागिरी), ग्रीनलैंडिक, गुरुंग (देवनागिरी), हाईटियन क्रियोल, हल्बी (देवनागिरी), हानी, हरियाणवी, हवाईयन, हिंदी, हमोंग डाव (लैटिन) ), हो (देवनगिरी), हंगेरियन, आइसलैंडिक, इनारी सामी, इंडोनेशियाई, इंटरलिंगुआ, इनुक्टिटुट (लैटिन), आयरिश, इतालवी, जापानी, जौनसारी (देवनगिरी), जावानीस, काबुवरदियानु, काचिन (लैटिन), कांगड़ी (देवनगिरी), कराची- बलकार, कारा-कल्पक (सिरिलिक), कारा-कल्पक (लैटिन), काशुबियन, कज़ाख (सिरिलिक), कज़ाख (लैटिन), खलिंग, खासी, किचे', कोरियाई, कोरकू, कोर्याक, कोसरायन, कुमायक (सिरिलिक), कुर्दिश (अरबी), कुर्दिश (लैटिन), कुरुख (देवनगिरी), किर्गिज़ (सिरिलिक), लकोटा, लैटिन, लिथुआनियाई, लोअर सोरबियन, लूले सामी, लक्ज़मबर्ग, महासू पहाड़ी (देवनगिरी), मलय (लैटिन), माल्टीज़, माल्टो (देवनगिरी) ), मैंक्स, माओरी, मराठी, मंगोलियाई (सिरिलिक), मोंटेनिग्रिन (सिरिलिक), मोंटेनिग्रिन (लैटिन), नीपोलिटन, नेपाली, नियुआन, नोगे, उत्तरी सामी (लैटिन), नॉर्वेजियन, ओसीटान, ओस्सेटिक, पश्तो, फ़ारसी, पोलिश, पुर्तगाली, पंजाबी (अरबी), रिपुरियन, रोमानियाई, रोमांश, रूसी, सदरी (देवनागिरी), सामोन (लैटिन), संस्कृत (देवनागरी), संताली (देवनागिरी), स्कॉट्स, स्कॉटिश गेलिक, सर्बियाई (लैटिन), शेरपा (देवनागिरी), सिरमौरी (देवनगिरी), स्कोल्ट सामी, स्लोवाक, स्लोवेनियाई, सोमाली (अरबी), दक्षिणी सामी, स्पेनिश, स्वाहिली (लैटिन), स्वीडिश, ताजिक (सिरिलिक), तातार (लैटिन), टेटम, थांगमी, टोंगन, तुर्की, तुर्कमेन (लैटिन), तुवन, ऊपरी सोरबियन, उर्दू, उइघुर (अरबी), उज़्बेक (अरबी), उज़्बेक (सिरिलिक), उज़्बेक (लैटिन), वोलापुक, वाल्सर, वेल्श, पश्चिमी फ़्रिसियाई, युकाटेक माया, ज़ुआंग, ज़ुलु
- हस्तलिखित पाठ के लिए भाषा: अंग्रेजी, चीनी (सरलीकृत), फ्रेंच, जर्मन, इतालवी, जापानी, कोरियाई, पुर्तगाली, स्पेनिश
- प्रारूप:
- JPG
- PNG
- BMP
- आकार: अधिकतम 20 एमबी
- पीडीएफ दस्तावेज़ों के लिए, केवल पहले 2,000 पृष्ठ ही संसाधित होते हैं।
मॉडल आउटपुट
यदि किसी दस्तावेज़ का पता लगाया जाता है, तो टेक्स्ट पहचान मॉडल निम्नलिखित जानकारी आउटपुट करता है:
- परिणाम: इनपुट टेक्स्ट से निकाली गई पंक्तियों की एक सूची।
- टेक्स्ट: स्ट्रिंग्स जिसमें टेक्स्ट की पंक्ति का पता लगाया गया है।
- बाउंडिंगबॉक्स: बाउंडिंग बॉक्स का प्रतिनिधित्व करने वाले चार मान, इसकी चौड़ाई और ऊंचाई के साथ शीर्ष और बाईं स्थिति का उपयोग करके वर्णित हैं।
सीमाएँ
कार्य | आप LIMIT | नवीनीकरण अवधि |
---|---|---|
पाठ पहचान कॉल (प्रति परिवेश) | 480 | 60 सेकंड |