डॉक्यूमेंट प्रोसेसिंग मॉडल का उपयोग करें Power Automate
Power Automateपर लॉग इन करें.
चुनें मेरे प्रवाह>नया प्रवाह>तत्काल क्लाउड फ़्लो.
अपने प्रवाह के लिए एक नाम दर्ज करें.
इस प्रवाह को ट्रिगर करने का तरीका चुनें के अंतर्गत, मैन्युअल रूप से प्रवाह को ट्रिगर करें का चयन करें, और फिर बनाएँ का चयन करें.
विस्तृत करें मैन्युअल रूप से प्रवाह ट्रिगर करें, और फिर इनपुट प्रकार के रूप में +इनपुट जोड़ें>फ़ाइल का चयन करें.
+नया चरण>AI Builder चुनें, और फिर क्रियाओं की सूची में दस्तावेजों से जानकारी निकालें चुनें.
वह डॉक्यूमेंट प्रोसेसिंग मॉडल चुनें जिसका आप उपयोग करना चाहते हैं, और फिर दस्तावेज़ प्रकार चुनें।
फ़ॉर्म फ़ील्ड में, ट्रिगर से फ़ाइल सामग्री जोड़ें.
क्रमिक क्रियाओं में, आप AI Builder मॉडल द्वारा निकाले गए किसी भी फ़ील्ड और तालिका का उपयोग कर सकते हैं। उदाहरण के लिए, मान लें कि हमारा मॉडल लॉट संख्या , नेट वजन , और सकल वजन मान निकालने के लिए प्रशिक्षित है। हम इन्हें दस्तावेज़ से निकालने के बाद चैनल पर भी पोस्ट करना चाहते हैं। Microsoft Teams AI Builder बस कनेक्टर से संदेश पोस्ट करें कार्रवाई जोड़ें, और फिर टोकन की सूची से अपने फ़ील्ड का चयन करें। Microsoft Teams
नोट
- किसी फ़ील्ड का मान प्राप्त करने के लिए, <field_name> value का चयन करें. उदाहरण के लिए, लॉट संख्या फ़ील्ड के लिए, लॉट संख्या मान का चयन करें.
- किसी चेकबॉक्स का मान प्राप्त करने के लिए, <checkbox_name> value का चयन करें. उदाहरण के लिए, प्राथमिकता शिपिंग नामक चेकबॉक्स के लिए, प्राथमिकता शिपिंग मान चुनें. वापसी मान बूलियन प्रकार का होता है:
true
यदि दस्तावेज़ में चेकबॉक्स चयनित के रूप में चिह्नित है,false
यदि नहीं है। - निकाले गए आइटम के लिए कॉन्फिडेंस स्कोर प्राप्त करने के लिए, <field_name> कॉन्फिडेंस स्कोर का चयन करें. उदाहरण के लिए, लॉट नंबर फ़ील्ड के लिए, लॉट नंबर कॉन्फिडेंस स्कोर चुनें.
बधाई! आपने एक प्रवाह बनाया है जो AI Builder डॉक्यूमेंट प्रोसेसिंग मॉडल का उपयोग करता है. अपने प्रवाह को आज़माने के लिए ऊपर दाईं ओर सहेजें चुनें, और फिर परीक्षण चुनें।
पेज सीमा
एकाधिक पृष्ठों वाले दस्तावेज़ों के लिए, संसाधित करने हेतु पृष्ठ श्रेणी निर्दिष्ट करना संभव है।
दस्तावेजों से जानकारी निकालें कार्ड पर, उन्नत विकल्प दिखाएँ का चयन करें. यह विकल्प उन्नत विकल्प छिपाएँ में बदल जाता है.
पृष्ठ पैरामीटर में, पृष्ठ मान या पृष्ठ श्रेणी दर्ज करें. उदाहरण: 1 या 3-5.
नोट
यदि आपके पास केवल एक फ़ॉर्म वाला एक बड़ा दस्तावेज़ है, तो हम दृढ़ता से अनुशंसा करते हैं कि आप पृष्ठ पैरामीटर का उपयोग करें। ऐसा करने से मॉडल पूर्वानुमान की लागत कम हो सकती है, जिससे प्रदर्शन बढ़ सकता है। हालाँकि, सही डेटा लौटाने के लिए कार्रवाई हेतु पृष्ठ श्रेणी में एक अद्वितीय फ़ॉर्म होना चाहिए।
उदाहरण: किसी दस्तावेज़ में पहला फ़ॉर्म पृष्ठ 2 पर है तथा दूसरा फ़ॉर्म पृष्ठ 3 और 4 पर फैला हुआ है:
- यदि आप पृष्ठ श्रेणी 2 में प्रवेश करते हैं, तो यह पहले फॉर्म का डेटा लौटाएगा।
- यदि आप पृष्ठ श्रेणी 3-4 दर्ज करते हैं, तो यह केवल दूसरे फॉर्म का डेटा लौटाएगा।
- यदि आप पृष्ठ श्रेणी 2-4 में प्रवेश करते हैं, तो यह प्रथम और द्वितीय फॉर्म का आंशिक डेटा लौटाएगा (इससे बचना चाहिए)।
पैरामीटर्स
इनपुट
नाम | आवश्य | प्रकार | विवरण | मान |
---|---|---|---|---|
एआई मॉडल | हां | नमूना | विश्लेषण के लिए उपयोग हेतु डॉक्यूमेंट प्रोसेसिंग मॉडल | प्रशिक्षित और प्रकाशित डॉक्यूमेंट प्रोसेसिंग मॉडल |
दस्तावेज़ का प्रकार | हां | सूची | विश्लेषण हेतु प्रपत्र का फ़ाइल प्रकार | पीडीएफ दस्तावेज़ (.pdf), जेपीईजी छवि (.jpeg), पीएनजी छवि (.png) |
रूप | हां | फ़ाइल | प्रक्रिया हेतु प्रपत्र | |
पृष्ठों | No | string | संसाधित करने के लिए पृष्ठ सीमा |
आउटपुट
नाम | प्रकार | विवरण | मान |
---|---|---|---|
{field} मूल्य | string | एआई मॉडल द्वारा निकाला गया मूल्य | |
{field} कॉन्फिडेंस स्कोर | बहना | मॉडल अपने पूर्वानुमान से कितना आश्वस्त है | मान 0 से 1 की सीमा में. 1 के करीब मान इस बात का अधिक विश्वास दर्शाते हैं कि निकाला गया मान सटीक है |
{table}{column} मूल्य | string | किसी तालिका में किसी कक्ष के लिए AI मॉडल द्वारा निकाला गया मान | |
{table}{column} कॉन्फिडेंस स्कोर | बहना | मॉडल अपने पूर्वानुमान से कितना आश्वस्त है | मान 0 से 1 की सीमा में. 1 के करीब मान अधिक विश्वास का संकेत देते हैं कि निकाले गए सेल मूल्य सटीक है |
नोट
अधिक आउटपुट पैरामीटर प्रस्तावित किए जा सकते हैं जैसे फ़ील्ड निर्देशांक, बहुभुज, बाउंडिंग बॉक्स और पृष्ठ संख्याएँ। ये उद्देश्य पर सूचीबद्ध नहीं हैं क्योंकि वे मुख्य रूप से उन्नत उपयोग के लिए अभिप्रेत हैं।
निर्देशांक को दस्तावेज़ की ऊँचाई और चौड़ाई के प्रतिशत के रूप में दर्शाया जाता है, जो ऊपरी-बाएँ कोने से उत्पन्न होता है. उदाहरण के लिए, यदि निर्देशांक X = 0.10 और Y = 0.20 दिए गए हैं, तो यह X-अक्ष के साथ दस्तावेज़ की चौड़ाई के 10% और Y-अक्ष के साथ इसकी ऊंचाई के 20% पर एक स्थान को दर्शाता है, दोनों को ऊपरी-बाएँ कोने से मापा जाता है।
सामान्य उपयोग के मामले
में एक डॉक्यूमेंट प्रोसेसिंग टेबल आउटपुट को पुनरावृत्त करें Power Automate
इस प्रक्रिया को स्पष्ट करने के लिए, हम निम्नलिखित उदाहरण का उपयोग करते हैं जहां हमने एक डॉक्यूमेंट प्रोसेसिंग मॉडल को एक टेबल निकालने के लिए प्रशिक्षित किया है जिसे हमने तीन कॉलम के साथ आइटम नाम दिया है: मात्रा , विवरण और कुल । हम टेबल से प्रत्येक लाइन आइटम को एक्सेल फाइल में स्टोर करना चाहते हैं।
उस फ़ील्ड का चयन करें जिसे आप किसी तालिका के लिए कक्ष लिखना चाहते हैं. डायनेमिक कंटेंट पैनल वह सब कुछ दिखाएगा जो डॉक्यूमेंट प्रोसेसिंग मॉडल को निकालना जानता है। {अपना तालिका नाम, अपना स्तंभ} {नाम} मान खोजें. हमारा उदाहरण Items Quantity value का उपयोग करता है।
एक बार जब आप यह मान जोड़ लेते हैं, तो वह क्रिया जहाँ आपने इसे जोड़ा था, स्वचालित रूप से प्रत्येक नियंत्रण पर लागू करें में सम्मिलित हो जाती है. इस तरह, प्रवाह चलाने पर तालिका में प्रत्येक पंक्ति संसाधित की जाएगी।
उन स्तंभों को जोड़ते रहें जिन्हें आप दोहराना चाहते हैं।
नोट
डॉक्यूमेंट प्रोसेसिंग द्वारा निकाली गई तालिकाएँ वर्तमान में कॉन्फिडेंस स्कोर नहीं लौटाती हैं।
में चेकबॉक्स के प्रोसेस आउटपुट Power Automate
चेकबॉक्स मान बूलियन: true
का अर्थ है कि चेकबॉक्स को दस्तावेज़ में चयनित के रूप में चिह्नित किया गया है, और false
इसका अर्थ है कि यह नहीं है।
एक तरह से आप इसके मूल्य की जांच कर सकते हैं एक शर्त कार्रवाई के साथ है। यदि चेकबॉक्स मान के बराबर है, तो एक क्रिया निष्पादित करें true
। यदि मान है false
, तो एक अलग कार्रवाई निष्पादित करें। निम्न उदाहरण एक उदाहरण दिखाता है.
एक अन्य विकल्प if true
/false
व्यंजक का उपयोग करके चेकबॉक्स के आउटपुट को अपनी पसंद के अन्य मानों पर मैप करना है। उदाहरण के लिए, आपके पास एक्सेल फ़ाइल में एक कॉलम हो सकता है जहां आप 'प्राथमिकता' लिखना चाहते हैं यदि दस्तावेज़ में चेकबॉक्स में से एक का चयन किया गया है, या 'गैर-प्राथमिकता' यदि चयनित नहीं है। ऐसा करने के लिए, आप निम्न अभिव्यक्ति का उपयोग कर सकते हैं: if(<document processing output>, 'Priority', 'Non-priority')
निम्नलिखित एनीमेशन एक उदाहरण दिखाता है।
में डॉक्यूमेंट प्रोसेसिंग आउटपुट में मुद्रा प्रतीकों (€, $,...) को निकालें Power Automate
उदाहरण के लिए, डॉक्यूमेंट प्रोसेसिंग मॉडल द्वारा निकाले गए कुल मान में मुद्रा प्रतीक हो सकता है, उदाहरण के लिए, $54. $ चिह्न या ऐसे किन्हीं अन्य प्रतीकों को निकालने के लिए जिन्हें आप छोड़ना चाहते हैं, इसे निकालने के लिए बदलें व्यंजक का उपयोग करें. यहाँ बताया गया है कि कैसे:
replace(<document processing output>, '$', '')
डॉक्यूमेंट प्रोसेसिंग आउटपुट स्ट्रिंग को किसी संख्या में कनवर्ट करें Power Automate
AI Builder डॉक्यूमेंट प्रोसेसिंग सभी निकाले गए मानों को स्ट्रिंग्स के रूप में लौटाता है। यदि गंतव्य जहां आप डॉक्यूमेंट प्रोसेसिंग द्वारा AI Builder निकाले गए मान को सहेजना चाहते हैं, को एक संख्या की आवश्यकता है, तो आप इंट या फ्लोट व्यंजक का उपयोग करके एक मान को संख्या में बदल सकते हैं । यदि संख्या में दशमलव नहीं है तो int का उपयोग करें। यदि संख्या में दशमलव है तो फ्लोट का उपयोग करें। ऐसा करने का तरीका यहां बताया गया है:
float('<document processing output>')
में डॉक्यूमेंट प्रोसेसिंग आउटपुट में रिक्त स्थान निकालें Power Automate
आउटपुट मानों से रिक्त स्थान निकालने के लिए, बदलें फ़ंक्शन का उपयोग करें:
replace(<document processing output>, ' ', '')
डॉक्यूमेंट प्रोसेसिंग आउटपुट स्ट्रिंग को किसी दिनांक में कनवर्ट करें Power Automate
AI Builder डॉक्यूमेंट प्रोसेसिंग सभी आउटपुट को स्ट्रिंग्स के रूप में लौटाता है। यदि वह गंतव्य जहाँ आप डॉक्यूमेंट प्रोसेसिंग द्वारा निकाले गए मान को सहेजना चाहते हैं, दिनांक स्वरूप में होना आवश्यक है, तो आप दिनांक स्वरूप वाले मान को कनवर्ट कर सकते हैं. formatDateTime व्यंजक का उपयोग करके ऐसा करें. ऐसा करने का तरीका यहां बताया गया है:
formatDateTime(<document processing output>)
किसी प्रवाह से ईमेल हस्ताक्षर फ़िल्टर करें ताकि यह डॉक्यूमेंट प्रोसेसिंग मॉडल (Microsoft 365 Outlook) द्वारा संसाधित न हो
आउटलुक कनेक्टर से Microsoft 365 आने वाले ईमेल के लिए, ईमेल हस्ताक्षर अनुलग्नकों के Power Automate रूप में उठाए जाते हैं। इन्हें डॉक्यूमेंट प्रोसेसिंग मॉडल द्वारा संसाधित होने से रोकने के लिए, अपने प्रवाह में एक शर्त जोड़ें जो यह जांचती है कि अटैचमेंट नामक Microsoft 365 आउटलुक कनेक्टर से आउटपुट इनलाइन गलत के बराबर है या नहीं। शर्त की यदि हाँ शाखा में, डॉक्यूमेंट प्रोसेसिंग क्रिया जोड़ें। इसके साथ, केवल उन ईमेल अटैचमेंट को संसाधित किया जाएगा जो इनलाइन हस्ताक्षर नहीं हैं।