इसके माध्यम से साझा किया गया


डॉक्यूमेंट प्रोसेसिंग के लिए अक्सर पूछे जाने वाले प्रश्न

इस आलेख में दस्तावेज़ प्रसंस्करण मॉडल के बारे में अक्सर पूछे जाने वाले प्रश्न शामिल हैं। AI Builder यदि आपको अपना प्रश्न यहाँ नहीं मिलता है, तो दस्तावेज़ प्रसंस्करण AI मॉडल का अवलोकन की समीक्षा करें या अपना प्रश्न Power Automate समुदाय के लिए सबमिट करें। AI Builder

कार्यक्षमता

मैं दस्तावेज़ प्रसंस्करण के संबंध में क्या कर सकता हूँ?

दस्तावेज़ प्रसंस्करण के साथ, आप विभिन्न प्रकार के दस्तावेज़ों से जानकारी निकालने के लिए एक कस्टम AI मॉडल बना सकते हैं।

  • यदि आपके दस्तावेज़ों के तत्व समान स्थानों पर पाए जा सकते हैं, तो फिक्स्ड-टेम्पलेट दस्तावेज़ विकल्प आदर्श है। यह आमतौर पर चालान, क्रय आदेश, डिलीवरी आदेश और कर फॉर्म के मामले में होता है।
  • सामान्य दस्तावेज़ विकल्प किसी भी प्रकार के दस्तावेज़ के लिए आदर्श है, जिसमें पहले विकल्प द्वारा समर्थित दस्तावेज़ शामिल हैं, साथ ही अनुबंध, कार्य विवरण, पत्र और अन्य भी शामिल हैं। यह विकल्प डेटा निकालने के लिए अधिक शक्तिशाली हो सकता है, लेकिन इसके लिए अधिक प्रशिक्षण समय की आवश्यकता होती है।

अधिक जानकारी के लिए दस्तावेज़ प्रसंस्करण मॉडल का अवलोकन देखें।

दस्तावेज़ प्रसंस्करण किस प्रकार के दस्तावेज़ों को संभाल सकता है?

समर्थित फ़ाइल प्रकार PDF, JPG, और PNG हैं।

दस्तावेज़ प्रसंस्करण का उपयोग करके मैं दस्तावेज़ों से कौन सा डेटा निकाल सकता हूँ?

दस्तावेज़ प्रसंस्करण दस्तावेज़ों से फ़ील्ड, तालिकाएँ और चेकबॉक्स निकाल सकता है।

अधिक जानकारी के लिए निकालने के लिए जानकारी परिभाषित करें देखें.

क्या मैं दस्तावेज़ों से हस्तलिखित पाठ निकाल सकता हूँ?

हाँ. दस्तावेज़ प्रसंस्करण आपके दस्तावेज़ों से मुद्रित और हस्तलिखित पाठ निकाल सकता है।

दस्तावेज़ प्रसंस्करण मॉडल को प्रशिक्षित करने के लिए मुझे कितने नमूनों की आवश्यकता होगी?

समान लेआउट का उपयोग करने वाले उच्च गुणवत्ता वाले दस्तावेज़ों के लिए, पांच नमूना दस्तावेज़ पर्याप्त होने चाहिए। निम्न-गुणवत्ता वाले दस्तावेज़ों (उदाहरण के लिए, खराब गुणवत्ता वाले स्कैन) के लिए, अधिक नमूना दस्तावेज़ों की आवश्यकता हो सकती है। परिणामों को बेहतर बनाने के लिए 15 से 20 नमूना दस्तावेजों का उपयोग करें।

सर्वश्रेष्ठ व्यवहार

  • टेम्पलेट दस्तावेज़ों के लिए

    • प्रति संग्रह एक (1) लेआउट.
    • लेआउट एक ही संग्रह के भीतर एक समान होना चाहिए।
    • प्रति संग्रह न्यूनतम पाँच (5) और अधिकतम 20 दस्तावेज़ (इस सीमा से अधिक न हो)।
  • सामान्य दस्तावेज़ों के लिए

    • संरचित और असंरचित दोनों दस्तावेज़ों सहित दस्तावेज़ प्रकार के सभी रूपों के लिए एक एकल मॉडल बनाएँ।

    • बेहतर निष्कर्षण सटीकता के लिए उनके मानों के अनुसार प्रासंगिक फ़ील्डों को लेबल करें।

      उदाहरण के लिए, आपूर्तिकर्ता आईडी के लिए "supplier_id" का उपयोग करें। फ़ील्ड नाम दस्तावेज़ की भाषा से मेल खाना चाहिए.

    • प्रति संग्रह न्यूनतम पाँच (5) और अधिकतम 20 दस्तावेज़ (इस सीमा से अधिक न हो)।

मेरा मॉडल वर्तमान में v3.1 (GA) में प्रकाशित है, और मैं v4.0 (GA) का उपयोग करके इसे पुनः प्रशिक्षित करने की योजना बना रहा हूं। क्या मेरे सभी दस्तावेज़ों को पुनः टैग करना आवश्यक है?

जब तक आप डेटा निष्कर्षण के लिए नए फ़ील्ड, चेकबॉक्स, तालिकाएँ, हस्ताक्षर या संग्रह में नए दस्तावेज़ नहीं जोड़ रहे हैं, तब तक आपको सभी दस्तावेज़ों को पुनः टैग करने की आवश्यकता नहीं है।

क्या मैं एक दस्तावेज़ प्रकार से दूसरे दस्तावेज़ प्रकार पर स्विच कर सकता हूँ?

हां, अपने मॉडल को संपादित करते समय, आप एक निश्चित टेम्पलेट दस्तावेज़ प्रकार और एक सामान्य दस्तावेज़ प्रकार के बीच स्विच कर सकते हैं। हालाँकि, यह स्विच चालान के लिए समर्थित नहीं है.

क्या एक एकल फॉर्म-प्रोसेसिंग मॉडल अलग-अलग लेआउट या टेम्पलेट वाले दस्तावेज़ों से जानकारी निकाल सकता है?

हाँ. संग्रह सुविधा का उपयोग करके, आप अलग-अलग लेआउट वाले दस्तावेज़ों को संभालने के लिए एकल फ़ॉर्म-प्रसंस्करण मॉडल को प्रशिक्षित करते हैं।

अधिक जानकारी के लिए दस्तावेज़ों को संग्रह के अनुसार समूहीकृत करें देखें.

क्या दस्तावेज़ प्रसंस्करण एक एकल दस्तावेज़ में एकाधिक प्रपत्रों को संभाल सकता है?

प्रत्येक फॉर्म को एक अलग फ़ाइल में होना चाहिए। उदाहरण के लिए, यदि आपके पास एकाधिक चालानों वाला एक PDF दस्तावेज़ है, तो दस्तावेज़ प्रसंस्करण मॉडल पर भेजने से पहले प्रत्येक चालान के लिए एक अलग फ़ाइल बनाएं।

आप दस्तावेज़ प्रसंस्करण मॉडल के लिए पृष्ठ भी निर्दिष्ट कर सकते हैं। इस तरह आप पृष्ठ दर पृष्ठ लूप करने के लिए मॉडल की कार्यक्षमता का लाभ उठा सकते हैं, और एक समय में एक फॉर्म को संसाधित कर सकते हैं।

अधिक जानकारी के लिए पृष्ठ श्रेणी पर जाएँ।

मैंने एक दस्तावेज़ प्रसंस्करण मॉडल को प्रशिक्षित किया, लेकिन निकाले गए डेटा के मामले में मुझे अच्छे परिणाम नहीं मिल रहे हैं। मैं मॉडल को कैसे बेहतर बना सकता हूं?

यदि आपके मॉडल को प्रशिक्षित करने के बाद भी वह खराब परिणाम दे रहा है, तो मॉडल को संपादित करें और प्रशिक्षण के लिए अधिक नमूने प्रदान करें। आप जितने अधिक नमूने उपलब्ध कराएंगे, AI मॉडल उतना ही अधिक सीखेगा कि आपके दस्तावेजों से डेटा कैसे निकाला जाए।

अधिक जानें अपने दस्तावेज़ प्रसंस्करण मॉडल के प्रदर्शन को बेहतर बनाएँ.

सीमाएँ

मैं अधिकतम कितने दस्तावेज़ों को संसाधित कर सकता हूँ?

आप प्रत्येक 60 सेकंड में प्रति परिवेश 360 दस्तावेज़ों तक का प्रसंस्करण कर सकते हैं।

कुछ अक्षर गलत क्यों पहचाने जाते हैं?

  • ऐसा हो सकता है कि कुछ अक्षर भ्रमित हो जाएं: 0 (संख्या) और O (अक्षर), 1 (संख्या) और l (अक्षर), 4 (संख्या) और A (अक्षर), आदि।
  • ऐसा हो सकता है कि कुछ अक्षर, जो दूसरों के ऊपर या पास हों, गलत तरीके से पहचाने जाएं: एक ऊर्ध्वाधर रेखा के ऊपर O (अक्षर) 0 (संख्या) बन जाता है, एक रेखा के ऊपर 5 (संख्या) $ (अमेरिकी डॉलर चिह्न) बन जाता है, l_ (छोटा अक्षर, अंडरस्कोर) L (बड़ा अक्षर) बन जाता है, तथा और भी बहुत कुछ।
  • ऐसा हो सकता है कि खराब गुणवत्ता वाले दस्तावेजों पर कुछ अक्षर गलत पहचाने जाएं, या पहचाने ही न जाएं।

पिछले मामलों में, मान्यता में सुधार के लिए कुछ भी नहीं किया जा सका। AI Builder हम इसी तरह की समस्याओं को हल करने के लिए स्रोत दस्तावेज़ की गुणवत्ता और लेआउट में सुधार करने की अनुशंसा करते हैं।

नोट

माइक्रोसॉफ्ट अक्षरों का पता लगाने के लिए ऑप्टिकल कैरेक्टर रिकॉग्निशन (ओसीआर) तकनीक में निरंतर सुधार करता रहता है, इसलिए ऐसी समस्याएं कम होती हैं।

क्या मैं कई संग्रहों वाला मॉडल बना सकता हूँ?

आप प्रति मॉडल 200 तक संग्रह बना सकते हैं। हालाँकि, प्रशिक्षण सामान्य दस्तावेज़ दसियों संग्रह वाले मॉडल में कई घंटे लग सकते हैं और—दुर्लभ अवसरों पर—समय समाप्त हो सकता है। यदि आपके मॉडल में संग्रहों की संख्या अधिक है, तो मॉडल प्रशिक्षण पूरा होने के लिए 24 घंटे तक प्रतीक्षा करने की अपेक्षा करें।

क्या मैं किसी समाधान में मॉडल बना सकता हूँ?

वर्तमान में, किसी समाधान में मॉडल बनाना संभव नहीं है।

क्या मैं अपने दस्तावेज़ प्रसंस्करण मॉडल में अनुबंधों और पत्रों का उपयोग कर सकता हूँ?

हां, अनुबंध और पत्र जैसे असंरचित दस्तावेज़ दस्तावेज़ प्रसंस्करण द्वारा समर्थित हैं, सामान्य दस्तावेज़ विकल्प।

तुलना

दस्तावेज़ प्रसंस्करण, चालान प्रसंस्करण, रसीद प्रसंस्करण, पहचान दस्तावेज़ रीडर, व्यवसाय कार्ड रीडर और पाठ पहचान के बीच क्या अंतर हैं?

आपकी स्थिति के आधार पर, आपको किसी विशेष मॉडल या उनके संयोजन का उपयोग करने की आवश्यकता हो सकती है।

उपयोग पाठ पहचान जब आप किसी छवि या पीडीएफ में मौजूद सभी पाठ को निकालना चाहते हैं। फिर, उदाहरण के लिए, आप निकाले गए पाठ में किसी कीवर्ड की खोज कर सकते हैं, या कुछ आइटम निकालने के लिए कुछ निश्चित नियम बना सकते हैं।

यदि आप चालान, रसीद, पासपोर्ट, ड्राइविंग लाइसेंस या व्यवसाय कार्ड से जानकारी निकालना चाहते हैं, तो संबंधित पूर्वनिर्मित मॉडल से शुरू करें:

आप इन पूर्वनिर्मित मॉडलों का उपयोग तुरंत कर सकते हैं, बिना कोई नया मॉडल बनाए। ये मॉडल अपने संबंधित दस्तावेज़ प्रकार में पाई जाने वाली सामान्य जानकारी निकाल सकते हैं।

किसी भी अन्य दस्तावेज़ प्रकार के लिए, आप अपनी ज़रूरत के अनुसार फ़ील्ड और तालिकाएँ निकालने के लिए एक कस्टम दस्तावेज़ प्रसंस्करण मॉडल बना सकते हैं। यह बात तब भी लागू होती है जब आपको अतिरिक्त जानकारी की आवश्यकता हो जो पूर्वनिर्मित मॉडल द्वारा प्रदान नहीं की गई हो।

कस्टम दस्तावेज़ प्रसंस्करण मॉडल में अधिक जानें.

दस्तावेज़ प्रसंस्करण और Azure फ़ॉर्म पहचानकर्ता के बीच क्या अंतर है? AI Builder

AI Builder दस्तावेज़ प्रसंस्करण Azure फ़ॉर्म पहचानकर्ता के शीर्ष पर बनाया गया है। इससे दोनों उत्पादों को माइक्रोसॉफ्ट AI में नवीनतम प्रगति प्राप्त होती है।

  • AI Builder Microsoft Power Platformका हिस्सा है. यह किसी को भी उपयोग में आसान इंटरफ़ेस के साथ ऐप्स और स्वचालन में एआई जोड़ने में सक्षम बनाता है। आपको डेवलपर या डेटा वैज्ञानिक होने की आवश्यकता नहीं है.

  • Azure फ़ॉर्म पहचानकर्ता पेशेवर डेवलपर्स के लिए लक्षित है . वे अपने कस्टम कोड समाधानों में AI क्षमताओं को जोड़ने के लिए सरल REST API का उपयोग कर सकते हैं।

लागत विकल्प

दस्तावेज़ प्रसंस्करण की लागत कितनी है? AI Builder

आप एक परीक्षण शुरू करके निःशुल्क दस्तावेज़ प्रसंस्करण का प्रयास कर सकते हैं। इसका मूल्यांकन करने के बाद, आपको दस्तावेज़ प्रसंस्करण का उपयोग करने के लिए क्रेडिट खरीदना होगा। AI Builder दस्तावेज़ प्रसंस्करण के साथ आपके द्वारा संसाधित किया जाने वाला प्रत्येक पृष्ठ क्रेडिट का उपभोग करता है, भले ही पृष्ठ में निकालने के लिए डेटा न हो। AI Builder AI Builder क्रेडिट ऐड-ऑन के माध्यम से खरीदे जा सकते हैं। AI Builder

अधिक जानकारी के लिए AI Builder लाइसेंसिंग पर जाएँ।