इसके माध्यम से साझा किया गया


पाठ पहचान पूर्वनिर्मित मॉडल

टेक्स्ट रिकग्निशन प्रीबिल्ट मॉडल दस्तावेज़ों और छवियों से शब्दों को मशीन-पठनीय कैरेक्टर स्ट्रीम में निकालता है। यह छवियों में मुद्रित और हस्तलिखित पाठ का पता लगाने के लिए अत्याधुनिक ऑप्टिकल कैरेक्टर रिकग्निशन (ओसीआर) का उपयोग करता है।

यह मॉडल मुद्रित या हस्तलिखित पाठ की पंक्तियों को निकालने के लिए छवियों और दस्तावेज़ फ़ाइलों को संसाधित करता है।

में उपयोग करना Power Apps

टेक्स्ट पहचान पूर्व-निर्मित मॉडल टेक्स्ट पहचानकर्ता घटक का उपयोग करके Power Apps में उपलब्ध है। अधिक जानकारी: टेक्स्ट पहचानकर्ता घटक का उपयोग करें Power Apps

में उपयोग करना Power Automate

Power Automateमें इस मॉडल का उपयोग कैसे करें, इसके बारे में जानकारी के लिए देखें टेक्स्ट रिकग्निशन प्रीबिल्ट मॉडल का उपयोग करें Power Automate

समर्थित भाषा, प्रारूप और आकार

जिन फ़ाइलों को आप टेक्स्ट पहचान मॉडल से स्कैन कर सकते हैं उनमें ये विशेषताएं होनी चाहिए:

  • मुद्रित पाठ के लिए भाषा: अफ़्रीकी, अल्बानियाई, अंगिका (देवनागिरी), अरबी, अस्तुरियन, अवधी-हिंदी (देवनागिरी), अज़रबैजानी (लैटिन), बाघेली, बास्क, बेलारूसी (सिरिलिक), बेलारूसी (लैटिन), भोजपुरी-हिंदी (देवनागिरी), बिस्लामा, बोडो (देवनागिरी), बोस्नियाई (लैटिन), ब्रजभा, ब्रेटन, बल्गेरियाई, बुंदेली, बुरात (सिरिलिक), कैटलन, सेबुआनो, चामलिंग, चमोरो, छत्तीसगढ़ी (देवनागिरी), चीनी (सरलीकृत), चीनी (पारंपरिक), कोर्निश, कोर्सीकन, क्रीमियन तातार (लैटिन), क्रोएशियाई, चेक, डेनिश, दारी, धीमाल (देवनगिरि), डोगरी (देवनगिरि), डच, अंग्रेजी, एर्ज़्या (सिरिलिक), एस्टोनियाई, फिरोज़ी, फ़िजी, फिलिपिनो, फ़िनिश, फ़्रेंच, फ़्रियुलियन, गागाउज़ (लैटिन), गैलिशियन, जर्मन, गिल्बर्टीज़, गोंडी (देवनागिरी), ग्रीनलैंडिक, गुरुंग (देवनागिरी), हाईटियन क्रियोल, हल्बी (देवनागिरी), हानी, हरियाणवी, हवाईयन, हिंदी, हमोंग डाव (लैटिन) ), हो (देवनगिरी), हंगेरियन, आइसलैंडिक, इनारी सामी, इंडोनेशियाई, इंटरलिंगुआ, इनुक्टिटुट (लैटिन), आयरिश, इतालवी, जापानी, जौनसारी (देवनगिरी), जावानीस, काबुवरदियानु, काचिन (लैटिन), कांगड़ी (देवनगिरी), कराची- बलकार, कारा-कल्पक (सिरिलिक), कारा-कल्पक (लैटिन), काशुबियन, कज़ाख (सिरिलिक), कज़ाख (लैटिन), खलिंग, खासी, किचे', कोरियाई, कोरकू, कोर्याक, कोसरायन, कुमायक (सिरिलिक), कुर्दिश (अरबी), कुर्दिश (लैटिन), कुरुख (देवनगिरी), किर्गिज़ (सिरिलिक), लकोटा, लैटिन, लिथुआनियाई, लोअर सोरबियन, लूले सामी, लक्ज़मबर्ग, महासू पहाड़ी (देवनगिरी), मलय (लैटिन), माल्टीज़, माल्टो (देवनगिरी) ), मैंक्स, माओरी, मराठी, मंगोलियाई (सिरिलिक), मोंटेनिग्रिन (सिरिलिक), मोंटेनिग्रिन (लैटिन), नीपोलिटन, नेपाली, नियुआन, नोगे, उत्तरी सामी (लैटिन), नॉर्वेजियन, ओसीटान, ओस्सेटिक, पश्तो, फ़ारसी, पोलिश, पुर्तगाली, पंजाबी (अरबी), रिपुरियन, रोमानियाई, रोमांश, रूसी, सदरी (देवनागिरी), सामोन (लैटिन), संस्कृत (देवनागरी), संताली (देवनागिरी), स्कॉट्स, स्कॉटिश गेलिक, सर्बियाई (लैटिन), शेरपा (देवनागिरी), सिरमौरी (देवनगिरी), स्कोल्ट सामी, स्लोवाक, स्लोवेनियाई, सोमाली (अरबी), दक्षिणी सामी, स्पेनिश, स्वाहिली (लैटिन), स्वीडिश, ताजिक (सिरिलिक), तातार (लैटिन), टेटम, थांगमी, टोंगन, तुर्की, तुर्कमेन (लैटिन), तुवन, ऊपरी सोरबियन, उर्दू, उइघुर (अरबी), उज़्बेक (अरबी), उज़्बेक (सिरिलिक), उज़्बेक (लैटिन), वोलापुक, वाल्सर, वेल्श, पश्चिमी फ़्रिसियाई, युकाटेक माया, ज़ुआंग, ज़ुलु
  • हस्तलिखित पाठ के लिए भाषा: अंग्रेजी, चीनी (सरलीकृत), फ्रेंच, जर्मन, इतालवी, जापानी, कोरियाई, पुर्तगाली, स्पेनिश
  • प्रारूप:
    • JPG
    • PNG
    • BMP
    • PDF
  • आकार: अधिकतम 20 एमबी
  • पीडीएफ दस्तावेज़ों के लिए, केवल पहले 2,000 पृष्ठ ही संसाधित होते हैं।

मॉडल आउटपुट

यदि किसी दस्तावेज़ का पता लगाया जाता है, तो टेक्स्ट पहचान मॉडल निम्नलिखित जानकारी आउटपुट करता है:

  • परिणाम: इनपुट टेक्स्ट से निकाली गई पंक्तियों की एक सूची।
  • टेक्स्ट: स्ट्रिंग्स जिसमें टेक्स्ट की पंक्ति का पता लगाया गया है।
  • बाउंडिंगबॉक्स: बाउंडिंग बॉक्स का प्रतिनिधित्व करने वाले चार मान, इसकी चौड़ाई और ऊंचाई के साथ शीर्ष और बाईं स्थिति का उपयोग करके वर्णित हैं।

सीमाएँ

कार्य आप LIMIT नवीनीकरण अवधि
पाठ पहचान कॉल (प्रति परिवेश) 480 60 सेकंड

भी देखें

प्रशिक्षण: AI Builder (मॉड्यूल) के साथ पाठ को पहचानें