इसके माध्यम से साझा किया गया


टेक्स्ट पहचान प्रीबिल्ट मॉडल

टेक्स्ट पहचान प्रीबिल्ट मॉडल दस्तावेजों और छवियों से शब्दों को मशीन-पठनीय वर्ण धाराओं में निकालता है। यह छवियों में मुद्रित और हस्तलिखित पाठ का पता लगाने के लिए अत्याधुनिक ऑप्टिकल कैरेक्टर रिकग्निशन (ओसीआर) का उपयोग करता है।

यह मॉडल मुद्रित या हस्तलिखित पाठ की पंक्तियों को निकालने के लिए छवियों और दस्तावेज़ फ़ाइलों को संसाधित करता है।

Power Apps में उपयोग करें

टेक्स्ट पहचान प्रीबिल्ट मॉडल पाठ पहचानकर्ता घटक का उपयोग करके उपलब्ध है। Power Apps अधिक जानकारी: टेक्स्ट पहचानकर्ता घटक का उपयोग करें Power Apps

Power Automate में उपयोग करें

Power Automateमें इस मॉडल का उपयोग कैसे करें, इसके बारे में जानकारी के लिए, देखें टेक्स्ट पहचान प्रीबिल्ट मॉडल का उपयोग करें। Power Automate

समर्थित भाषा, प्रारूप और आकार

टेक्स्ट पहचान मॉडल के साथ आप जिन फ़ाइलों को स्कैन कर सकते हैं उनमें ये विशेषताएँ होनी चाहिए:

  • प्रिंट पाठ के लिए भाषा: अफ्रीकी, अल्बानियाई, अंगिका (देवनागिरी), अरबी, अस्तुरियन, अवधी-हिंदी (देवनागिरी), अज़रबैजानी (लैटिन), बघेली, बास्क, बेलारूसी (सिरिलिक), बेलारूसी (लैटिन), भोजपुरी-हिंदी (देवनागिरी), बिस्लामा, बोडो (देवनागिरी), बोस्नियाई (लैटिन), ब्रजभा, ब्रेटन, बल्गेरियाई, बुंदेली, बुर्यत (सिरिलिक), कैटलन, सिबुआनो, चामलिंग, चमोरो, छत्तीसगढ़ी (देवनागिरी), चीनी (सरलीकृत), चीनी (पारंपरिक), कोर्निश, कोर्सीकन, क्रीमियन तातार (लैटिन), क्रोएशियाई, चेक, दानिश, दारी, धीमल (देवनगिरी), डोगरी (देवनागिरी), डच, अंग्रेजी, एर्ज़िया (सिरिलिक), एस्टोनियाई, फिरोज़ी, फिजियन, फिलिपिनो, फिनिश, फ्रेंच, फ्र्यूलियन, गागुज़ (लैटिन), गैलिशियन्, जर्मन, गिल्बर्टीज़, गोंडी (देवनागिरी), ग्रीनलैंडिक, गुरुंग (देवनागिरी), हाईटियन क्रियोल, हल्बी (देवनागिरी), हानी, हरियाणवी, हवाईयन, हिंदी, हमोंग दाव (लैटिन), हो (देवनागिरी), हंगेरियन, आइसलैंडिक, इनारी सामी, इंडोनेशियाई, इंटरलिंगुआ, इनुक्तितुत (लैटिन), आयरिश, इतालवी, जापानी, जौनसारी (देवनागिरी), जावानीज, काबुवेर्दियानु, काचिन (लैटिन), कांगड़ी (देवनागिरी), कराचाय-बलकर, कारा-कल्पक (सिरिलिक), कारा-कल्पक (लैटिन), काशुबियन, कज़ाख (सिरिलिक), कज़ाख (लैटिन), खालिंग, खासी, किचे ', कोरियाई, कोरकू, कोरयाक, कोसरायन, कुमिक (सिरिलिक), कुर्द (अरबी), कुर्द (लैटिन), कुरुख (देवनागिरी), किर्गिज़ (सिरिलिक), लकोटा, लैटिन, लिथुआनियाई, लोअर सोरबियन, लुले सामी, लक्ज़मबर्गिश, महासू पहाड़ी (देवनगिरी), मलय (लैटिन), माल्टीज़, माल्टो (देवनागिरी), मैनक्स, माओरी, मराठी, मंगोलियाई (सिरिलिक), मोंटेनिग्रिन (सिरिलिक), मोंटेनिग्रिन (लैटिन), नियपोलिटन, नेपाली, नियुआन, नोगे, उत्तरी सामी (लैटिन), नॉर्वेजियन, ओसीटान, ओसेटिक, पश्तो, फारसी, पोलिश, पुर्तगाली, पंजाबी (अरबी), रिपुरियन, रोमानियाई, रोमांश, रूसी, सदरी (देवनागिरी), सामोन (लैटिन), संस्कृत (देवनागरी), संताली (देवनागिरी), स्कॉट्स, स्कॉटिश गेलिक, सर्बियाई (लैटिन), शेरपा (देवनागिरी), सिरमौरी (देवनागिरी), स्कोल्ट सामी, स्लोवाक, स्लोवेनियाई, सोमाली (अरबी), दक्षिणी सामी, स्पेनिश, स्वाहिली (लैटिन), स्वीडिश, ताजिक (सिरिलिक), तातार (लैटिन), टेटम, थांगमी, टोंगन, तुर्की, तुर्कमेन (लैटिन), तुवन, ऊपरी सोरबियन, उर्दू, उइघुर (अरबी), उज़्बेक (अरबी), उज़्बेक (सिरिलिक), उज़्बेक (लैटिन), वोलापुक, वाल्सर, वेल्श, पश्चिमी फ़्रिसियन, युकाटेक माया, ज़ुआंग, ज़ुलु
  • हस्तलिखित पाठ के लिए भाषा: अंग्रेजी, चीनी (सरलीकृत), फ्रेंच, जर्मन, इतालवी, जापानी, कोरियाई, पुर्तगाली, स्पेनिश
  • प्रारूप:
    • JPG
    • PNG
    • BMP
    • PDF
  • आकार: अधिकतम 20 एमबी
  • पीडीएफ दस्तावेजों के लिए केवल पहले 2,000 पृष्ठों पर ही प्रक्रिया की जाती है।

मॉडल आउटपुट

यदि कोई दस्तावेज़ पाया जाता है, तो टेक्स्ट पहचान मॉडल निम्नलिखित जानकारी आउटपुट करता है:

  • परिणाम: इनपुट पाठ से निकाली गई पंक्तियों की सूची।
  • Text: पता लगाई गई पाठ पंक्ति वाली स्ट्रिंग्स.
  • BoundingBox: बाउंडिंग बॉक्स को दर्शाने वाले चार मान, इसकी चौड़ाई और ऊंचाई के साथ शीर्ष और बाएं स्थान का उपयोग करके वर्णित किए गए हैं।

सीमाएँ

कार्रवाई आप LIMIT नवीकरण अवधि
टेक्स्ट पहचान कॉल (प्रति वातावरण) 480 60 सेकंड

प्रशिक्षण: AI Builder (मॉड्यूल) के साथ पाठ को पहचानें