टेक्स्ट पहचान प्रीबिल्ट मॉडल
टेक्स्ट पहचान प्रीबिल्ट मॉडल दस्तावेजों और छवियों से शब्दों को मशीन-पठनीय वर्ण धाराओं में निकालता है। यह छवियों में मुद्रित और हस्तलिखित पाठ का पता लगाने के लिए अत्याधुनिक ऑप्टिकल कैरेक्टर रिकग्निशन (ओसीआर) का उपयोग करता है।
यह मॉडल मुद्रित या हस्तलिखित पाठ की पंक्तियों को निकालने के लिए छवियों और दस्तावेज़ फ़ाइलों को संसाधित करता है।
Power Apps में उपयोग करें
टेक्स्ट पहचान प्रीबिल्ट मॉडल पाठ पहचानकर्ता घटक का उपयोग करके उपलब्ध है। Power Apps अधिक जानकारी: टेक्स्ट पहचानकर्ता घटक का उपयोग करें Power Apps
Power Automate में उपयोग करें
Power Automateमें इस मॉडल का उपयोग कैसे करें, इसके बारे में जानकारी के लिए, देखें टेक्स्ट पहचान प्रीबिल्ट मॉडल का उपयोग करें। Power Automate
समर्थित भाषा, प्रारूप और आकार
टेक्स्ट पहचान मॉडल के साथ आप जिन फ़ाइलों को स्कैन कर सकते हैं उनमें ये विशेषताएँ होनी चाहिए:
- प्रिंट पाठ के लिए भाषा: अफ्रीकी, अल्बानियाई, अंगिका (देवनागिरी), अरबी, अस्तुरियन, अवधी-हिंदी (देवनागिरी), अज़रबैजानी (लैटिन), बघेली, बास्क, बेलारूसी (सिरिलिक), बेलारूसी (लैटिन), भोजपुरी-हिंदी (देवनागिरी), बिस्लामा, बोडो (देवनागिरी), बोस्नियाई (लैटिन), ब्रजभा, ब्रेटन, बल्गेरियाई, बुंदेली, बुर्यत (सिरिलिक), कैटलन, सिबुआनो, चामलिंग, चमोरो, छत्तीसगढ़ी (देवनागिरी), चीनी (सरलीकृत), चीनी (पारंपरिक), कोर्निश, कोर्सीकन, क्रीमियन तातार (लैटिन), क्रोएशियाई, चेक, दानिश, दारी, धीमल (देवनगिरी), डोगरी (देवनागिरी), डच, अंग्रेजी, एर्ज़िया (सिरिलिक), एस्टोनियाई, फिरोज़ी, फिजियन, फिलिपिनो, फिनिश, फ्रेंच, फ्र्यूलियन, गागुज़ (लैटिन), गैलिशियन्, जर्मन, गिल्बर्टीज़, गोंडी (देवनागिरी), ग्रीनलैंडिक, गुरुंग (देवनागिरी), हाईटियन क्रियोल, हल्बी (देवनागिरी), हानी, हरियाणवी, हवाईयन, हिंदी, हमोंग दाव (लैटिन), हो (देवनागिरी), हंगेरियन, आइसलैंडिक, इनारी सामी, इंडोनेशियाई, इंटरलिंगुआ, इनुक्तितुत (लैटिन), आयरिश, इतालवी, जापानी, जौनसारी (देवनागिरी), जावानीज, काबुवेर्दियानु, काचिन (लैटिन), कांगड़ी (देवनागिरी), कराचाय-बलकर, कारा-कल्पक (सिरिलिक), कारा-कल्पक (लैटिन), काशुबियन, कज़ाख (सिरिलिक), कज़ाख (लैटिन), खालिंग, खासी, किचे ', कोरियाई, कोरकू, कोरयाक, कोसरायन, कुमिक (सिरिलिक), कुर्द (अरबी), कुर्द (लैटिन), कुरुख (देवनागिरी), किर्गिज़ (सिरिलिक), लकोटा, लैटिन, लिथुआनियाई, लोअर सोरबियन, लुले सामी, लक्ज़मबर्गिश, महासू पहाड़ी (देवनगिरी), मलय (लैटिन), माल्टीज़, माल्टो (देवनागिरी), मैनक्स, माओरी, मराठी, मंगोलियाई (सिरिलिक), मोंटेनिग्रिन (सिरिलिक), मोंटेनिग्रिन (लैटिन), नियपोलिटन, नेपाली, नियुआन, नोगे, उत्तरी सामी (लैटिन), नॉर्वेजियन, ओसीटान, ओसेटिक, पश्तो, फारसी, पोलिश, पुर्तगाली, पंजाबी (अरबी), रिपुरियन, रोमानियाई, रोमांश, रूसी, सदरी (देवनागिरी), सामोन (लैटिन), संस्कृत (देवनागरी), संताली (देवनागिरी), स्कॉट्स, स्कॉटिश गेलिक, सर्बियाई (लैटिन), शेरपा (देवनागिरी), सिरमौरी (देवनागिरी), स्कोल्ट सामी, स्लोवाक, स्लोवेनियाई, सोमाली (अरबी), दक्षिणी सामी, स्पेनिश, स्वाहिली (लैटिन), स्वीडिश, ताजिक (सिरिलिक), तातार (लैटिन), टेटम, थांगमी, टोंगन, तुर्की, तुर्कमेन (लैटिन), तुवन, ऊपरी सोरबियन, उर्दू, उइघुर (अरबी), उज़्बेक (अरबी), उज़्बेक (सिरिलिक), उज़्बेक (लैटिन), वोलापुक, वाल्सर, वेल्श, पश्चिमी फ़्रिसियन, युकाटेक माया, ज़ुआंग, ज़ुलु
- हस्तलिखित पाठ के लिए भाषा: अंग्रेजी, चीनी (सरलीकृत), फ्रेंच, जर्मन, इतालवी, जापानी, कोरियाई, पुर्तगाली, स्पेनिश
-
प्रारूप:
- JPG
- PNG
- BMP
- आकार: अधिकतम 20 एमबी
- पीडीएफ दस्तावेजों के लिए केवल पहले 2,000 पृष्ठों पर ही प्रक्रिया की जाती है।
मॉडल आउटपुट
यदि कोई दस्तावेज़ पाया जाता है, तो टेक्स्ट पहचान मॉडल निम्नलिखित जानकारी आउटपुट करता है:
- परिणाम: इनपुट पाठ से निकाली गई पंक्तियों की सूची।
- Text: पता लगाई गई पाठ पंक्ति वाली स्ट्रिंग्स.
- BoundingBox: बाउंडिंग बॉक्स को दर्शाने वाले चार मान, इसकी चौड़ाई और ऊंचाई के साथ शीर्ष और बाएं स्थान का उपयोग करके वर्णित किए गए हैं।
सीमाएँ
कार्रवाई | आप LIMIT | नवीकरण अवधि |
---|---|---|
टेक्स्ट पहचान कॉल (प्रति वातावरण) | 480 | 60 सेकंड |