डॉक्यूमेंट प्रोसेसिंग के लिए अक्सर पूछे जाने वाले प्रश्न
इस आलेख में दस्तावेज़ प्रसंस्करण मॉडल के बारे में अक्सर पूछे जाने वाले प्रश्न शामिल हैं। AI Builder यदि आपको अपना प्रश्न यहाँ नहीं मिलता है, तो दस्तावेज़ प्रसंस्करण AI मॉडल का अवलोकन देखें या समुदाय के लिए अपना प्रश्न सबमिट करें। Power Automate AI Builder
दस्तावेज़ प्रसंस्करण के साथ, आप विभिन्न प्रकार के दस्तावेज़ों से जानकारी निकालने के लिए एक कस्टम AI मॉडल बना सकते हैं।
- यदि आपके दस्तावेज़ों के तत्व समान स्थानों पर पाए जा सकते हैं, तो फिक्स्ड-टेम्पलेट दस्तावेज़ विकल्प आदर्श है। यह आमतौर पर चालान, क्रय आदेश, डिलीवरी आदेश और कर फॉर्म के मामले में होता है।
- सामान्य दस्तावेज़ विकल्प किसी भी प्रकार के दस्तावेज़ के लिए आदर्श है, जिसमें पहले विकल्प द्वारा समर्थित दस्तावेज़ शामिल हैं, साथ ही अनुबंध, कार्य विवरण, पत्र और अन्य भी शामिल हैं। यह विकल्प डेटा निकालने के लिए अधिक शक्तिशाली हो सकता है, लेकिन इसके लिए अधिक प्रशिक्षण समय की आवश्यकता होती है।
अधिक जानें: दस्तावेज़ प्रसंस्करण मॉडल का अवलोकन
समर्थित फ़ाइल प्रकार PDF, JPG, और PNG हैं।
दस्तावेज़ प्रसंस्करण दस्तावेज़ों से फ़ील्ड, तालिकाएँ और चेकबॉक्स निकाल सकता है।
अधिक जानें: निकालने के लिए जानकारी निर्धारित करें
हाँ. दस्तावेज़ प्रसंस्करण आपके दस्तावेज़ों से मुद्रित और हस्तलिखित पाठ निकाल सकता है।
समान लेआउट का उपयोग करने वाले उच्च गुणवत्ता वाले दस्तावेज़ों के लिए, पांच नमूना दस्तावेज़ पर्याप्त होने चाहिए। निम्न-गुणवत्ता वाले दस्तावेज़ों के लिए (उदाहरण के लिए, खराब गुणवत्ता वाले स्कैन), अधिक नमूना दस्तावेज़ों की आवश्यकता हो सकती है। परिणामों को बेहतर बनाने के लिए 15 से 20 नमूना दस्तावेजों का उपयोग करें।
क्या एक एकल फॉर्म-प्रोसेसिंग मॉडल अलग-अलग लेआउट या टेम्पलेट वाले दस्तावेज़ों से जानकारी निकाल सकता है?
हाँ. संग्रह सुविधा का उपयोग करके, आप अलग-अलग लेआउट वाले दस्तावेज़ों को संभालने के लिए एकल फ़ॉर्म-प्रसंस्करण मॉडल को प्रशिक्षित करते हैं।
अधिक जानें: दस्तावेज़ों को संग्रह के अनुसार समूहीकृत करें
प्रत्येक फॉर्म को एक अलग फ़ाइल में होना चाहिए। उदाहरण के लिए, यदि आपके पास एकाधिक चालानों वाला एक PDF दस्तावेज़ है, तो दस्तावेज़ प्रसंस्करण मॉडल पर भेजने से पहले प्रत्येक चालान के लिए एक अलग फ़ाइल बनाएं।
आप दस्तावेज़ प्रसंस्करण मॉडल के लिए पृष्ठ भी निर्दिष्ट कर सकते हैं। इस तरह आप पृष्ठ दर पृष्ठ लूप करने के लिए मॉडल की कार्यक्षमता का लाभ उठा सकते हैं, और एक समय में एक फॉर्म को संसाधित कर सकते हैं।
अधिक जानें: पृष्ठ श्रेणी
मैंने एक दस्तावेज़ प्रसंस्करण मॉडल को प्रशिक्षित किया, लेकिन निकाले गए डेटा के मामले में मुझे अच्छे परिणाम नहीं मिल रहे हैं। मैं मॉडल को कैसे बेहतर बना सकता हूं?
यदि आपके मॉडल को प्रशिक्षित करने के बाद भी वह खराब परिणाम दे रहा है, तो मॉडल को संपादित करें और प्रशिक्षण के लिए अधिक नमूने प्रदान करें। आप जितने अधिक नमूने उपलब्ध कराएंगे, AI मॉडल उतना ही अधिक सीखेगा कि आपके दस्तावेजों से डेटा कैसे निकाला जाए।
अधिक जानें: अपने दस्तावेज़ प्रसंस्करण मॉडल के प्रदर्शन को बेहतर बनाएँ
आप प्रत्येक 60 सेकंड में प्रति परिवेश 360 दस्तावेज़ों तक का प्रसंस्करण कर सकते हैं।
- ऐसा हो सकता है कि कुछ अक्षर भ्रमित हो जाएं: 0 (संख्या) और O (अक्षर), 1 (संख्या) और l (अक्षर), 4 (संख्या) और A (अक्षर), और भी बहुत कुछ।
- ऐसा हो सकता है कि कुछ अक्षर, जो दूसरों के ऊपर या पास हों, गलत पहचाने जाएं: एक ऊर्ध्वाधर रेखा के ऊपर O (अक्षर) 0 (संख्या) बन जाता है, एक रेखा के ऊपर 5 (संख्या) $ (अमेरिकी डॉलर चिह्न) बन जाता है, l_ (छोटा अक्षर, अंडरस्कोर) L (बड़ा अक्षर) बन जाता है, तथा और भी बहुत कुछ।
- ऐसा हो सकता है कि खराब गुणवत्ता वाले दस्तावेजों पर कुछ अक्षर गलत पहचाने जाएं, या पहचाने ही न जाएं।
उपरोक्त मामलों में, मान्यता में सुधार के लिए कुछ भी नहीं किया जा सकता है। AI Builder हम इसी तरह की समस्याओं को हल करने के लिए स्रोत दस्तावेज़ की गुणवत्ता और लेआउट में सुधार करने की अनुशंसा करते हैं।
नोट
माइक्रोसॉफ्ट द्वारा वर्णों का पता लगाने वाली ओसीआर तकनीक में लगातार सुधार किया जा रहा है, इसलिए ऐसी समस्याएं कम होती हैं।
आप प्रति मॉडल 200 तक संग्रह बना सकते हैं। हालाँकि, दसियों संग्रह वाले मॉडल को प्रशिक्षित करने में कई घंटे लग सकते हैं और—दुर्लभ अवसरों पर—समय समाप्त हो सकता है। यदि आपके मॉडल में संग्रहों की संख्या अधिक है, तो मॉडल प्रशिक्षण पूरा होने के लिए 24 घंटे तक प्रतीक्षा करने की अपेक्षा करें।
वर्तमान में, किसी समाधान में मॉडल बनाना संभव नहीं है।
हां, अनुबंध और पत्र जैसे असंरचित दस्तावेज़ों को सामान्य दस्तावेज़ विकल्प का उपयोग करके दस्तावेज़ प्रसंस्करण द्वारा समर्थित किया जाता है।
दस्तावेज़ प्रसंस्करण, चालान प्रसंस्करण, रसीद प्रसंस्करण, पहचान दस्तावेज़, व्यवसाय कार्ड और पाठ पहचान के बीच क्या अंतर हैं?
आपकी स्थिति के आधार पर, आपको किसी विशेष मॉडल या उनके संयोजन का उपयोग करने की आवश्यकता हो सकती है।
उपयोग पाठ पहचान जब आप किसी छवि या पीडीएफ में मौजूद सभी पाठ को निकालना चाहते हैं। फिर, उदाहरण के लिए, आप निकाले गए पाठ में किसी कीवर्ड की खोज कर सकते हैं, या कुछ आइटम निकालने के लिए कुछ निश्चित नियम बना सकते हैं।
यदि आप चालान, रसीद, पासपोर्ट, ड्राइविंग लाइसेंस या व्यवसाय कार्ड से जानकारी निकालना चाहते हैं, तो संबंधित पूर्वनिर्मित मॉडल से शुरू करें:
- बीजक संसाधित करना
- रसीद प्रसंस्करण
- पहचान दस्तावेज़ रीडर (पासपोर्ट और ड्राइविंग लाइसेंस)
- बिज़नेस कार्ड रीडर
आप इन पूर्वनिर्मित मॉडलों का उपयोग तुरंत कर सकते हैं, बिना कोई नया मॉडल बनाए। ये मॉडल अपने संबंधित दस्तावेज़ प्रकार में पाई जाने वाली सामान्य जानकारी निकाल सकते हैं।
किसी भी अन्य दस्तावेज़ प्रकार के लिए, आप अपनी ज़रूरत के अनुसार फ़ील्ड और तालिकाएँ निकालने के लिए एक कस्टम दस्तावेज़ प्रसंस्करण मॉडल बना सकते हैं। यह बात तब भी लागू होती है जब आपको पूर्वनिर्मित मॉडल द्वारा उपलब्ध न कराई गई अतिरिक्त जानकारी की आवश्यकता हो।
अधिक जानें: कस्टम दस्तावेज़ प्रसंस्करण मॉडल
AI Builder दस्तावेज़ प्रसंस्करण Azure फ़ॉर्म पहचानकर्ता के शीर्ष पर बनाया गया है। इससे दोनों उत्पादों को माइक्रोसॉफ्ट AI में नवीनतम प्रगति प्राप्त होती है।
AI Builder हिस्सा है। Microsoft Power Platform यह किसी को भी उपयोग में आसान इंटरफ़ेस के साथ ऐप्स और स्वचालन में एआई जोड़ने में सक्षम बनाता है। आपको डेवलपर या डेटा वैज्ञानिक होने की आवश्यकता नहीं है।
Azure फ़ॉर्म पहचानकर्ता पेशेवर डेवलपर्स के लिए लक्षित है . वे अपने कस्टम कोड समाधानों में AI क्षमताओं को जोड़ने के लिए सरल REST API का उपयोग कर सकते हैं।
आप एक परीक्षण शुरू करके निःशुल्क दस्तावेज़ प्रसंस्करण का प्रयास कर सकते हैं। इसका मूल्यांकन करने के बाद, आपको दस्तावेज़ प्रसंस्करण का उपयोग करने के लिए क्रेडिट खरीदना होगा। AI Builder दस्तावेज़ प्रसंस्करण के साथ आपके द्वारा संसाधित किया जाने वाला प्रत्येक पृष्ठ क्रेडिट का उपभोग करता है, भले ही पृष्ठ में निकालने के लिए डेटा न हो। AI Builder AI Builder क्रेडिट ऐड-ऑन के माध्यम से खरीदे जा सकते हैं। AI Builder
अधिक जानें: AI Builder लाइसेंसिंग