के माध्यम से साझा करें


टेक्स्ट पहचान प्रीबिल्ट मॉडल

टेक्स्ट पहचान प्रीबिल्ट मॉडल दस्तावेजों और छवियों से शब्दों को मशीन-पठनीय वर्ण धाराओं में निकालता है। यह छवियों में मुद्रित और हस्तलिखित पाठ का पता लगाने के लिए अत्याधुनिक ऑप्टिकल कैरेक्टर रिकग्निशन (ओसीआर) का उपयोग करता है।

यह मॉडल मुद्रित या हस्तलिखित पाठ की पंक्तियों को निकालने के लिए छवियों और दस्तावेज़ फ़ाइलों को संसाधित करता है।

Power Apps में उपयोग करें

टेक्स्ट पहचान प्रीबिल्ट मॉडल पाठ पहचानकर्ता घटक का उपयोग करके उपलब्ध है। Power Apps अधिक जानकारी: टेक्स्ट पहचानकर्ता घटक का उपयोग करें Power Apps

Power Automate में उपयोग करें

Power Automateमें इस मॉडल का उपयोग कैसे करें, इसके बारे में जानकारी के लिए, देखें टेक्स्ट पहचान प्रीबिल्ट मॉडल का उपयोग करें। Power Automate

समर्थित भाषा, प्रारूप और आकार

टेक्स्ट पहचान मॉडल के साथ आप जिन फ़ाइलों को स्कैन कर सकते हैं उनमें ये विशेषताएँ होनी चाहिए:

  • मुद्रित पाठ के लिए भाषा: अफ़्रीकी, अल्बानियाई, अंगिका (देवनागिरी), अरबी, अस्तुरियन, अवधी-हिंदी (देवनागिरी), अज़रबैजानी (लैटिन), बाघेली, बास्क, बेलारूसी (सिरिलिक), बेलारूसी (लैटिन), भोजपुरी-हिन्दी (देवनागिरी), बिस्लामा, बोडो (देवनागिरी), बोस्नियाई (लैटिन), ब्रजभा, ब्रेटन, बल्गेरियाई, बुंदेली, बुरात (सिरिलिक), कैटलन, सेबुआनो, चामलिंग, चमोरो, छत्तीसगढ़ी (देवनागिरी), चीनी (सरलीकृत), चीनी (पारंपरिक), कोर्निश, कोर्सीकन, क्रीमियन तातार (लैटिन), क्रोएशियाई, चेक, डेनिश, दारी, धिमल (देवनागिरी), डोगरी (देवनागिरी), डच, अंग्रेजी, एर्ज़्या (सिरिलिक), एस्टोनियाई, फिरोज़ी, फ़िजी, फिलिपिनो, फ़िनिश, फ़्रेंच, फ़्रीयुलियन, गागाउज़ (लैटिन), गैलिशियन, जर्मन, गिल्बर्टीज़, गोंडी (देवनागिरी), ग्रीनलैंडिक, गुरुंग (देवनागिरी), हाईटियन क्रियोल, हल्बी (देवनागिरी), हानी, हरियाणवी, हवाईयन, हिंदी, हमोंग डाव (लैटिन), हो (देवनागिरी), हंगेरियन, आइसलैंडिक, इनारी सामी, इंडोनेशियाई, इंटरलिंगुआ, इनुक्टिटुट (लैटिन), आयरिश, इतालवी, जापानी, जौनसारी (देवनगिरी), जावानीस, कबुवरदियानु, काचिन (लैटिन), कांगड़ी (देवनगिरी), कराची-बलकार, कारा-कल्पक (सिरिलिक), कारा-कल्पक (लैटिन), काशुबियन, कजाख (सिरिलिक), कजाख (लैटिन), खलिंग, खासी, किचे', कोरियाई, कोरकू, कोर्याक, कोसरियाई, कुमायक (सिरिलिक), कुर्दिश (अरबी), कुर्दिश (लैटिन), कुरुख (देवनगिरी), किर्गिज़ (सिरिलिक), लकोटा, लैटिन, लिथुआनियाई, लोअर सोरबियन, लूले सामी, लक्ज़मबर्ग, महासू पहाड़ी (देवनगिरी), मलय (लैटिन), माल्टीज़, माल्टो (देवनगिरी), मैक्स, माओरी, मराठी, मंगोलियाई (सिरिलिक) ), मोंटेनिग्रिन (सिरिलिक), मोंटेनिग्रिन (लैटिन), नियपोलिटन, नेपाली, नियुआन, नोगे, उत्तरी सामी (लैटिन), नॉर्वेजियन, ओसीटान, ओस्सेटिक, पश्तो, फ़ारसी, पोलिश, पुर्तगाली, पंजाबी (अरबी), रिपुरियन, रोमानियाई, रोमांश, रूसी, सदरी (देवनागिरी), समोअन (लैटिन), संस्कृत (देवनागरी) ), संताली (देवनगिरी), स्कॉट्स, स्कॉटिश गेलिक, सर्बियाई (लैटिन), शेरपा (देवनगिरी), सिरमौरी (देवनगिरी), स्कोल्ट सामी, स्लोवाक, स्लोवेनियाई, सोमाली (अरबी), दक्षिणी सामी, स्पेनिश, स्वाहिली (लैटिन), स्वीडिश, ताजिक (सिरिलिक), तातार (लैटिन), तेतुम, थांगमी, टोंगन, तुर्की, तुर्कमेन (लैटिन), तुवन, ऊपरी सोरबियन, उर्दू, उइगर (अरबी), उज़्बेक (अरबी), उज़्बेक (सिरिलिक), उज़्बेक (लैटिन), वोलापुक, वाल्सर, वेल्श, पश्चिमी फ़्रीज़ियन, युकाटेक माया, झुआंग, ज़ुलु
  • हस्तलिखित पाठ के लिए भाषा: अंग्रेजी, चीनी (सरलीकृत), फ्रेंच, जर्मन, इतालवी, जापानी, कोरियाई, पुर्तगाली, स्पेनिश
  • प्रारूप:
    • JPG
    • PNG
    • BMP
    • PDF
  • आकार: अधिकतम 20 एमबी
  • पीडीएफ दस्तावेजों के लिए केवल पहले 2,000 पृष्ठों पर ही प्रक्रिया की जाती है।

मॉडल आउटपुट

यदि कोई दस्तावेज़ पाया जाता है, तो टेक्स्ट पहचान मॉडल निम्नलिखित जानकारी आउटपुट करता है:

  • परिणाम: इनपुट पाठ से निकाली गई पंक्तियों की सूची।
  • Text: पता लगाई गई पाठ पंक्ति वाली स्ट्रिंग्स.
  • BoundingBox: बाउंडिंग बॉक्स को दर्शाने वाले चार मान, इसकी चौड़ाई और ऊंचाई के साथ शीर्ष और बाएं स्थान का उपयोग करके वर्णित किए गए हैं।

सीमाएँ

कार्रवाई आप LIMIT नवीकरण अवधि
टेक्स्ट पहचान कॉल (प्रति वातावरण) 480 60 सेकंड

प्रशिक्षण: AI Builder (मॉड्यूल) के साथ पाठ को पहचानें