Azure दस्तावेज़ इंटेलिजेंस क्या है?

Complete

सुझाव

अधिक जानकारी के लिए टेक्स्ट और इमेज टैब देखें!

Azure Document Intelligence Microsoft फाउंड्री में एक क्लाउड-आधारित AI सेवा है जो दस्तावेज़ों से टेक्स्ट, कुंजी-मान जोड़े, चयन चिह्न और तालिकाएँ निकालने के लिए OCR और गहन शिक्षण मॉडल का उपयोग करती है।

ओसीआर एक छवि में पता लगाई गई वस्तुओं के चारों ओर बाउंडिंग बॉक्स बनाकर दस्तावेज़ संरचना को कैप्चर करता है। बाउंडिंग बॉक्स के स्थान शेष पृष्ठ के संबंध में निर्देशांक के रूप में दर्ज किए जाते हैं। Azure दस्तावेज़ इंटेलिजेंस बाउंडिंग बॉक्स डेटा और अन्य जानकारी को एक संरचित JSON प्रारूप में लौटाता है जो मूल दस्तावेज़ से संबंधों को संरक्षित करता है।

दस्तावेज़ इंटेलिजेंस को निकाले गए फ़ील्ड और बाउंडिंग बॉक्स के साथ एक नमूना दस्तावेज़ का विश्लेषण करने वाला स्क्रीनशॉट दिखा रहा है।

खरोंच से एक उच्च-सटीकता दस्तावेज़ निष्कर्षण मॉडल बनाने के लिए गहन शिक्षण विशेषज्ञता, बड़ी मात्रा में गणना और लंबे प्रशिक्षण समय की आवश्यकता होती है। Azure Document Intelligence हज़ारों प्रपत्र उदाहरणों पर पहले से ही प्रशिक्षित अंतर्निहित मॉडल प्रदान करता है, ताकि आप न्यूनतम प्रयास के साथ उच्च-सटीकता डेटा निष्कर्षण प्राप्त कर सकें.

दस्तावेज़ खुफिया सेवा घटक

Azure दस्तावेज़ इंटेलिजेंस मॉडल की तीन श्रेणियों से बना है:

  • दस्तावेज़ विश्लेषण मॉडल: दस्तावेज़ों से पाठ, संरचना, तालिकाएँ और चयन चिह्न निकालें। रीड मॉडल टेक्स्ट निकालता है और भाषाओं का पता लगाता है, जबकि लेआउट मॉडल टेबल और संरचना निष्कर्षण जोड़ता है। आप इन मॉडलों को उपयोग पूर्वनिर्मित मॉडल इकाई में विस्तार से देखेंगे।

  • पूर्वनिर्मित मॉडल: सामान्य दस्तावेज़ प्रकारों से जानकारी निकालें — जैसे इनवॉइस, रसीदें, कर प्रपत्र, आईडी दस्तावेज़, और बहुत कुछ — बिना किसी प्रशिक्षण की आवश्यकता के। आपको पूर्वनिर्मित मॉडल का उपयोग करें इकाई में उपलब्ध पूर्वनिर्मित मॉडल की पूरी सूची दिखाई देगी।

  • कस्टम मॉडल: अपने स्वयं के लेबल किए गए डेटासेट का उपयोग करके अपने व्यवसाय के लिए विशिष्ट फ़ॉर्म से डेटा निकालें. विकल्पों में कस्टम टेम्पलेट मॉडल (निश्चित लेआउट के लिए तेज़ और लागत प्रभावी), कस्टम न्यूरल मॉडल (अलग-अलग लेआउट के लिए उच्च सटीकता), रचित मॉडल और कस्टम क्लासिफायर शामिल हैं। आप ट्रेन में कस्टम मॉडल के प्रशिक्षण और उपयोग के बारे में जानेंगे और कस्टम मॉडल इकाई का उपयोग करेंगे

दस्तावेज़ खुफिया सेवाओं तक पहुंचें

आप Azure दस्तावेज़ इंटेलिजेंस को कई तरीकों से एक्सेस कर सकते हैं:

  • REST API: HTTP अनुरोधों का उपयोग करके सीधे सेवा को कॉल करें।
  • क्लाइंट लाइब्रेरी SDK: पायथन, C#, Java और JavaScript के लिए SDK टूल का इस्तेमाल करें.
  • दस्तावेज़ इंटेलिजेंस स्टूडियो: दस्तावेज़ इंटेलिजेंस समाधानों की दृश्यात्मक खोज, परीक्षण और निर्माण के लिए एक ऑनलाइन उपकरण।
  • Microsoft फाउंड्री पोर्टल: दस्तावेज़ इंटेलिजेंस को अन्य फाउंड्री टूल के साथ एकीकृत करें।

सुझाव

इस मॉड्यूल का अभ्यास पायथन एसडीके पर केंद्रित है। अंतर्निहित आरईएसटी सेवाओं का उपयोग किसी भी भाषा द्वारा किया जा सकता है।

कोई दस्तावेज़ इंटेलिजेंस संसाधन बनाएँ

Azure दस्तावेज़ इंटेलिजेंस का उपयोग करने के लिए, आपको एक Azure संसाधन की आवश्यकता होती है। आप इनमें से किसी एक का उपयोग कर सकते हैं:

  • एक फाउंड्री संसाधन: एक बहु-सेवा सदस्यता जो एक ही समापन बिंदु और कुंजी के तहत कई एआई सेवाओं तक पहुंच प्रदान करती है।
  • Azure दस्तावेज़ इंटेलिजेंस संसाधन: एक एकल-सेवा संसाधन जिसका उपयोग केवल दस्तावेज़ इंटेलिजेंस के साथ किया जाता है.

नोट

यदि आप एक ही समापन बिंदु और कुंजी के तहत कई फाउंड्री टूल तक पहुंचने की योजना बना रहे हैं तो एक फाउंड्री संसाधन बनाएं। केवल दस्तावेज़ इंटेलिजेंस पहुँच के लिए, एक समर्पित दस्तावेज़ इंटेलिजेंस संसाधन बनाएँ.

इनपुट आवश्यकताएँ

Azure दस्तावेज़ इंटेलिजेंस इनपुट दस्तावेज़ों पर काम करता है जो इन आवश्यकताओं को पूरा करते हैं:

  • प्रारूप JPEG, PNG, BMP, PDF (पाठ या स्कैन), या TIFF होना चाहिए। रीड मॉडल Microsoft Office फ़ाइल स्वरूपों को भी स्वीकार करता है।
  • फ़ाइल का आकार मानक स्तर के लिए 500 एमबी और फ्री टियर के लिए 4 एमबी से कम होना चाहिए।
  • छवि आयाम 50 x 50 पिक्सेल और 10,000 x 10,000 पिक्सेल के बीच होना चाहिए।
  • पीडीएफ दस्तावेजों का आयाम 17 x 17 इंच (A3 पेपर आकार) से कम होना चाहिए।
  • पीडीएफ दस्तावेजों को पासवर्ड से सुरक्षित नहीं होना चाहिए।

और जानो