टेक्स्ट पहचान प्रीबिल्ट मॉडल

टेक्स्ट पहचान प्रीबिल्ट मॉडल दस्तावेजों और छवियों से शब्दों को मशीन-पठनीय वर्ण धाराओं में निकालता है। यह छवियों में मुद्रित और हस्तलिखित पाठ का पता लगाने के लिए अत्याधुनिक ऑप्टिकल कैरेक्टर रिकग्निशन (ओसीआर) का उपयोग करता है।

यह मॉडल मुद्रित या हस्तलिखित पाठ की पंक्तियों को निकालने के लिए छवियों और दस्तावेज़ फ़ाइलों को संसाधित करता है।

Power Apps में उपयोग करें

टेक्स्ट पहचान प्रीबिल्ट मॉडल पाठ पहचानकर्ता घटक का उपयोग करके उपलब्ध है। Power Apps अधिक जानकारी: टेक्स्ट पहचानकर्ता घटक का उपयोग करें Power Apps

Power Automate में उपयोग करें

Power Automateमें इस मॉडल का उपयोग कैसे करें, इसके बारे में जानकारी के लिए, देखें टेक्स्ट पहचान प्रीबिल्ट मॉडल का उपयोग करें। Power Automate

समर्थित भाषा, प्रारूप और आकार

टेक्स्ट पहचान मॉडल के साथ आप जिन फ़ाइलों को स्कैन कर सकते हैं उनमें ये विशेषताएँ होनी चाहिए:

मुद्रित पाठ के लिए भाषा: अफ़्रीकी, अल्बानियाई, अंगिका (देवनागिरी), अरबी, अस्तुरियन, अवधी-हिंदी (देवनागिरी), अज़रबैजानी (लैटिन), बाघेली, बास्क, बेलारूसी (सिरिलिक), बेलारूसी (लैटिन), भोजपुरी-हिन्दी (देवनागिरी), बिस्लामा, बोडो (देवनागिरी), बोस्नियाई (लैटिन), ब्रजभा, ब्रेटन, बल्गेरियाई, बुंदेली, बुरात (सिरिलिक), कैटलन, सेबुआनो, चामलिंग, चमोरो, छत्तीसगढ़ी (देवनागिरी), चीनी (सरलीकृत), चीनी (पारंपरिक), कोर्निश, कोर्सीकन, क्रीमियन तातार (लैटिन), क्रोएशियाई, चेक, डेनिश, दारी, धिमल (देवनागिरी), डोगरी (देवनागिरी), डच, अंग्रेजी, एर्ज़्या (सिरिलिक), एस्टोनियाई, फिरोज़ी, फ़िजी, फिलिपिनो, फ़िनिश, फ़्रेंच, फ़्रीयुलियन, गागाउज़ (लैटिन), गैलिशियन, जर्मन, गिल्बर्टीज़, गोंडी (देवनागिरी), ग्रीनलैंडिक, गुरुंग (देवनागिरी), हाईटियन क्रियोल, हल्बी (देवनागिरी), हानी, हरियाणवी, हवाईयन, हिंदी, हमोंग डाव (लैटिन), हो (देवनागिरी), हंगेरियन, आइसलैंडिक, इनारी सामी, इंडोनेशियाई, इंटरलिंगुआ, इनुक्टिटुट (लैटिन), आयरिश, इतालवी, जापानी, जौनसारी (देवनगिरी), जावानीस, कबुवरदियानु, काचिन (लैटिन), कांगड़ी (देवनगिरी), कराची-बलकार, कारा-कल्पक (सिरिलिक), कारा-कल्पक (लैटिन), काशुबियन, कजाख (सिरिलिक), कजाख (लैटिन), खलिंग, खासी, किचे', कोरियाई, कोरकू, कोर्याक, कोसरियाई, कुमायक (सिरिलिक), कुर्दिश (अरबी), कुर्दिश (लैटिन), कुरुख (देवनगिरी), किर्गिज़ (सिरिलिक), लकोटा, लैटिन, लिथुआनियाई, लोअर सोरबियन, लूले सामी, लक्ज़मबर्ग, महासू पहाड़ी (देवनगिरी), मलय (लैटिन), माल्टीज़, माल्टो (देवनगिरी), मैक्स, माओरी, मराठी, मंगोलियाई (सिरिलिक) ), मोंटेनिग्रिन (सिरिलिक), मोंटेनिग्रिन (लैटिन), नियपोलिटन, नेपाली, नियुआन, नोगे, उत्तरी सामी (लैटिन), नॉर्वेजियन, ओसीटान, ओस्सेटिक, पश्तो, फ़ारसी, पोलिश, पुर्तगाली, पंजाबी (अरबी), रिपुरियन, रोमानियाई, रोमांश, रूसी, सदरी (देवनागिरी), समोअन (लैटिन), संस्कृत (देवनागरी) ), संताली (देवनगिरी), स्कॉट्स, स्कॉटिश गेलिक, सर्बियाई (लैटिन), शेरपा (देवनगिरी), सिरमौरी (देवनगिरी), स्कोल्ट सामी, स्लोवाक, स्लोवेनियाई, सोमाली (अरबी), दक्षिणी सामी, स्पेनिश, स्वाहिली (लैटिन), स्वीडिश, ताजिक (सिरिलिक), तातार (लैटिन), तेतुम, थांगमी, टोंगन, तुर्की, तुर्कमेन (लैटिन), तुवन, ऊपरी सोरबियन, उर्दू, उइगर (अरबी), उज़्बेक (अरबी), उज़्बेक (सिरिलिक), उज़्बेक (लैटिन), वोलापुक, वाल्सर, वेल्श, पश्चिमी फ़्रीज़ियन, युकाटेक माया, झुआंग, ज़ुलु
हस्तलिखित पाठ के लिए भाषा: अंग्रेजी, चीनी (सरलीकृत), फ्रेंच, जर्मन, इतालवी, जापानी, कोरियाई, पुर्तगाली, स्पेनिश
प्रारूप:
- JPG
- PNG
- BMP
- PDF
आकार: अधिकतम 20 एमबी
पीडीएफ दस्तावेजों के लिए केवल पहले 2,000 पृष्ठों पर ही प्रक्रिया की जाती है।

मॉडल आउटपुट

यदि कोई दस्तावेज़ पाया जाता है, तो टेक्स्ट पहचान मॉडल निम्नलिखित जानकारी आउटपुट करता है:

परिणाम: इनपुट पाठ से निकाली गई पंक्तियों की सूची।
Text: पता लगाई गई पाठ पंक्ति वाली स्ट्रिंग्स.
BoundingBox: बाउंडिंग बॉक्स को दर्शाने वाले चार मान, इसकी चौड़ाई और ऊंचाई के साथ शीर्ष और बाएं स्थान का उपयोग करके वर्णित किए गए हैं।

सीमाएँ

कार्रवाई	आप LIMIT	नवीकरण अवधि
टेक्स्ट पहचान कॉल (प्रति वातावरण)	480	60 सेकंड

प्रशिक्षण: AI Builder (मॉड्यूल) के साथ पाठ को पहचानें

प्रतिक्रिया

क्या यह पेज मददगार था?

Last updated on 2026-01-14