หมายเหตุ
การเข้าถึงหน้านี้ต้องได้รับการอนุญาต คุณสามารถลอง ลงชื่อเข้าใช้หรือเปลี่ยนไดเรกทอรีได้
การเข้าถึงหน้านี้ต้องได้รับการอนุญาต คุณสามารถลองเปลี่ยนไดเรกทอรีได้
บทความนี้ประกอบด้วยคำถามที่ถามบ่อยเกี่ยวกับโมเดลการประมวลผลเอกสารใน AI Builder หากคุณไม่พบคำถามของคุณที่นี่ ให้ตรวจทาน ภาพรวมของโมเดล AI สำหรับการประมวลผลเอกสาร หรือส่งคำถามของคุณไปที่ Power Automate Community สำหรับ AI Builder
ฟังก์ชันการทำงาน
ฉันสามารถทำอะไรกับการประมวลผลเอกสารได้
ด้วยการประมวลผลเอกสาร คุณสามารถสร้างโมเดล AI แบบกำหนดเองเพื่อแยกข้อมูลจากเอกสารประเภทต่างๆ
- ตัวเลือก เอกสารเทมเพลตคงที่ เหมาะอย่างยิ่งหากองค์ประกอบของเอกสารของคุณอยู่ในตำแหน่งที่คล้ายคลึงกัน โดยปกติจะเป็นกรณีของใบแจ้งหนี้ ใบสั่งซื้อ ใบส่งสินค้า และแบบฟอร์มภาษี
- ตัวเลือก เอกสารทั่วไป เหมาะกับเอกสารทุกประเภท รวมถึงเอกสารที่ได้รับการสนับสนุนจากตัวเลือกแรก แต่ยังรวมไปถึงสัญญา ใบแจ้งงาน จดหมาย และอื่นๆ ตัวเลือกนี้อาจมีประสิทธิภาพมากกว่าในการแยกข้อมูล แต่ต้องใช้เวลาการฝึกนานกว่า
เรียนรู้เพิ่มเติมใน ภาพรวมของโมเดลการประมวลผลเอกสาร
เอกสารชนิดใดบ้างที่สามารถจัดการด้วยการประมวลผลเอกสาร
ชนิดไฟล์ที่รองรับคือ PDF, JPG และ PNG
ฉันสามารถแยกข้อมูลใดจากเอกสารโดยใช้การประมวลผลเอกสาร
การประมวลผลเอกสารสามารถแยกฟิลด์ ตาราง และกล่องกาเครื่องหมายออกจากเอกสารได้
เรียนรู้เพิ่มเติมใน กำหนดข้อมูลที่จะแยก
ฉันสามารถดึงข้อความที่เขียนด้วยลายมือออกจากเอกสารได้หรือไม่
ใช่ การประมวลผลเอกสารสามารถแยกข้อความที่พิมพ์และเขียนด้วยลายมือออกจากเอกสารของคุณได้
ฉันต้องใช้ตัวอย่างกี่ตัวอย่างในการฝึกโมเดลการประมวลผลเอกสาร
สำหรับเอกสารคุณภาพสูงที่ใช้เค้าโครงเดียวกัน เอกสารตัวอย่างห้าฉบับก็เพียงพอแล้ว สำหรับเอกสารคุณภาพต่ำ (เช่น การสแกนคุณภาพไม่ดี) อาจจำเป็นต้องมีเอกสารตัวอย่างเพิ่มเติม หากต้องการปรับปรุงผลลัพธ์ ใช้เอกสารตัวอย่าง 15 ถึง 20 ตัวอย่าง
แนวทางปฏิบัติ
สำหรับเอกสารเทมเพลต
- หนึ่ง (1) เค้าโครงต่อคอลเลกชัน
- เค้าโครงต้องเหมือนกันภายในคอลเลกชันเดียวกัน
- เอกสารอย่างน้อยห้า (5) ฉบับและสูงสุด 20 ฉบับต่อการรวบรวม (ไม่เกินขีดจำกัดนี้)
สำหรับเอกสารทั่วไป
สร้างแบบจำลองเดียวสำหรับรูปแบบทั้งหมดของชนิดเอกสาร รวมทั้งเอกสารที่มีโครงสร้างและไม่มีโครงสร้าง
ติดฉลากฟิลด์ที่เกี่ยวข้องกับค่าเพื่อความแม่นยำในการสกัดที่ดีขึ้น
ตัวอย่างเช่น ใช้ "supplier_id" สำหรับรหัสซัพพลายเออร์ ชื่อเขตข้อมูลควรตรงกับภาษาของเอกสาร
เอกสารอย่างน้อยห้า (5) ฉบับและสูงสุด 20 ฉบับต่อการรวบรวม (ไม่เกินขีดจำกัดนี้)
โมเดลของฉันได้รับการเผยแพร่ใน v3.1 (GA) และฉันวางแผนที่จะฝึกใหม่โดยใช้ v4.0 (GA) จำเป็นต้องติดแท็กเอกสารทั้งหมดของฉันใหม่หรือไม่
เว้นแต่คุณจะเพิ่มฟิลด์ใหม่ กล่องกาเครื่องหมาย ตาราง ลายเซ็นสำหรับการดึงข้อมูล หรือเอกสารใหม่ไปยังคอลเลกชัน คุณไม่จำเป็นต้องติดแท็กเอกสารทั้งหมดอีกครั้ง
ฉันสามารถสลับจากเอกสารประเภทหนึ่งไปเป็นอีกประเภทหนึ่งได้หรือไม่
ได้ เมื่อแก้ไขโมเดลของคุณ คุณสามารถสลับระหว่างชนิดเอกสารเทมเพลตแบบคงที่และชนิดเอกสารทั่วไปได้ อย่างไรก็ตาม สวิตช์นี้ไม่รองรับใบแจ้งหนี้
โมเดลการประมวลผลแบบฟอร์มเดียวสามารถดึงข้อมูลจากเอกสารที่มีเค้าโครงหรือเทมเพลตที่แตกต่างกันได้หรือไม่
ใช่ ด้วยการใช้คุณลักษณะคอลเลกชัน คุณจะฝึกโมเดลการประมวลผลแบบฟอร์มเดียวเพื่อจัดการเอกสารที่มีเค้าโครงที่แตกต่างกัน
เรียนรู้เพิ่มเติมใน จัดกลุ่มเอกสารโดยคอลเลกชัน
สามารถจัดการกับการประมวลผลเอกสารได้ หลาย ฟอร์มในเอกสาร เดียว
ฟอร์มแต่ละฟอร์มจะต้องอยู่ในไฟล์ที่แยกต่างหาก ตัวอย่างเช่น หากคุณมีเอกสาร PDF ที่มีใบแจ้งหนี้หลายใบ ให้สร้างไฟล์แยกต่างหากสำหรับใบแจ้งหนี้แต่ละใบก่อนที่คุณจะส่งไปยังโมเดลการประมวลผลเอกสาร
คุณยังสามารถระบุหน้าสำหรับโมเดลการประมวลผลเอกสารที่จะจัดการได้ วิธีนี้ทำให้คุณสามารถใช้ประโยชน์จากฟังก์ชันของโมเดลเพื่อวนลูปทีละหน้า และประมวลผลฟอร์มครั้งละรายการ
เรียนรู้เพิ่มเติมใน ช่วงหน้า
ฉันได้ฝึกโมเดลการประมวลผลเอกสารแล้ว แต่ไม่ได้รับผลลัพธ์ที่ดีสำหรับข้อมูลที่แยกออกมา ฉันจะปรับปรุงโมเดลได้อย่างไร
หากโมเดลของคุณให้ผลลัพธ์ที่ไม่ดีหลังจากที่คุณได้ฝึก ให้แก้ไขโมเดลและจัดเตรียมตัวอย่างเพิ่มเติมสำหรับการฝึก ยิ่งคุณระบุตัวอย่างมากเท่าใด โมเดล AI ก็จะยิ่งเรียนรู้วิธีดึงข้อมูลจากเอกสารของคุณมากเท่านั้น
เรียนรู้เพิ่มเติมใน ปรับปรุงประสิทธิภาพของโมเดลการประมวลผลเอกสารของคุณ
ข้อจำกัด
ฉันสามารถประมวลผลเอกสารได้สูงสุดกี่ฉบับ
คุณสามารถประมวลผลเอกสารได้สูงสุด 360 รายการต่อสภาพแวดล้อม ทุกๆ 60 วินาที
เพราะอะไรจึงมีการจดจำอักขระบางตัวไม่ถูกต้อง
- อักขระบางตัวอาจสร้างความสับสนได้ เช่น 0 (ตัวเลข) และ O (ตัวอักษร), 1 (ตัวเลข) และ l (ตัวอักษร), 4 (ตัวเลข) และ A (ตัวอักษร) เป็นต้น
- อักขระบางตัวที่อยู่เหนือหรือใกล้กับอักขระตัวอื่นอาจได้รับการจดจำที่ไม่ถูกต้อง: O (ตัวอักษร) เหนือเส้นแนวตั้งกลายเป็น 0 (ตัวเลข), 5 (ตัวเลข) เหนือเส้นกลายเป็น $ (เครื่องหมายดอลลาร์อเมริกัน), l_ (อักษรตัวพิมพ์เล็ก, ขีดล่าง) จะกลายเป็น L (อักษรตัวพิมพ์ใหญ่) และอื่นๆ
- อักขระบางตัวในเอกสารอาจมีคุณภาพที่ต่ำ จึงอาจได้รับการจดจำที่ไม่ถูกต้อง หรืออาจจดจำไม่ได้เลย
ในกรณีก่อนหน้านี้ ไม่สามารถดำเนินการใดๆ ใน AI Builder เพื่อปรับปรุงการรับรู้ เราขอแนะนำให้ปรับปรุงคุณภาพและเค้าโครงของเอกสารต้นฉบับเพื่อแก้ไขปัญหาที่คล้ายกัน
หมายเหตุ
Microsoft ปรับปรุงเทคโนโลยีการรู้จำอักขระด้วยแสง (OCR) อย่างต่อเนื่องเพื่อตรวจจับอักขระ ดังนั้นปัญหาดังกล่าวจึงเกิดขึ้นน้อยลง
ฉันสามารถสร้างแบบจำลองที่มีคอลเลกชันจำนวนมากได้ไหม
คุณสามารถสร้างคอลเลกชันได้มากถึง 200 รายการต่อโมเดล อย่างไรก็ตาม การฝึกโมเดล เอกสารทั่วไป ที่มีคอลเลกชันหลายสิบคอลเลกชันอาจใช้เวลาหลายชั่วโมงและหมดเวลาในบางกรณี หากโมเดลของคุณมีคอลเลกชันจำนวนมาก คาดว่าจะต้องรอถึง 24 ชั่วโมงในการฝึกโมเดลให้เสร็จสิ้น
ฉันสามารถสร้างแบบจำลองในโซลูชันก็ได้ไหม
ในปัจจุบัน ยังไม่สามารถสร้างแบบจำลองในโซลูชันได้
ฉันสามารถใช้สัญญาและจดหมายในโมเดลการประมวลผลเอกสารของฉันได้หรือไม่
ได้ เอกสารที่ไม่มีโครงสร้าง เช่น สัญญาและจดหมาย มีการรองรับโดยการประมวลผลเอกสารโดยใช้ตัวเลือก เอกสารทั่วไป
การเปรียบเทียบ
การประมวลผลเอกสาร การประมวลผลใบแจ้งหนี้ การประมวลผลใบเสร็จ ตัวอ่านเอกสารข้อมูลประจำตัว ตัวอ่านนามบัตร ผู้อ่าน และการรู้จำข้อความแตกต่างกันอย่างไร
คุณอาจต้องใช้โมเดลเฉพาะ หรือหลายแบบทั้งนี้ขึ้นอยู่กับสถานการณ์ของคุณ
ใช้ การจดจำข้อความ เมื่อคุณต้องการแยกข้อความทั้งหมดที่อยู่ในรูปภาพหรือ PDF จากนั้น คุณสามารถค้นหาคำสำคัญในข้อความที่แยกออกมา หรือสร้างกฎตายตัวเพื่อดึงข้อมูลบางรายการ
หากคุณต้องการดึงข้อมูลจากใบแจ้งหนี้, ใบเสร็จ, หนังสือเดินทาง, ใบขับขี่, หรือนามบัตร ให้เริ่มต้นด้วยโมเดลที่สร้างไว้ล่วงหน้าที่เกี่ยวข้อง:
- การประมวลผลใบแจ้งหนี้
- การประมวลผลใบเสร็จ
- ตัวอ่านเอกสารข้อมูลประจำตัว (หนังสือเดินทางและใบขับขี่)
- ตัวอ่านนามบัตร
คุณสามารถใช้โมเดลที่สร้างไว้ล่วงหน้าเหล่านี้ได้ทันที โดยไม่ต้องสร้างโมเดลใหม่ โมเดลเหล่านี้สามารถดึงข้อมูลทั่วไปที่พบในชนิดเอกสารที่เกี่ยวข้องได้
สำหรับเอกสารชนิดอื่นๆ คุณสามารถสร้างโมเดลการประมวลผลเอกสารแบบกำหนดเองเพื่อแยกฟิลด์และตารางที่คุณต้องการ นอกจากนี้ยังใช้หากคุณต้องการข้อมูลเพิ่มเติมที่ไม่ได้มาจากโมเดลที่สร้างไว้ล่วงหน้า
เรียนรู้เพิ่มเติมใน โมเดลการประมวลผลเอกสารแบบกำหนดเอง
การประมวลผลเอกสาร AI Builder กับ Azure Form Recognizer แตกต่างกันอย่างไร
การประมวลผลเอกสาร AI Builder ถูกสร้างขึ้นบน Azure Form Recognizer นี่ทำให้ผลิตภัณฑ์ทั้งสองรายการมีความก้าวหน้าล่าสุดใน Microsoft AI
AI Builder เป็นส่วนหนึ่งของ Microsoft Power Platform นี่ทำให้ทุกคนสามารถเพิ่ม AI ลงในแอปและระบบอัตโนมัติด้วยอินเทอร์เฟซที่ใช้งานง่าย คุณไม่จำเป็นต้องเป็นนักพัฒนาหรือนักวิทยาศาสตร์ข้อมูล
Azure Form Recognizerมุ่งเป้าไปที่นักพัฒนามืออาชีพ พวกเขาสามารถใช้ REST API แบบง่ายเพื่อเพิ่มความสามารถ AI ให้กับโซลูชันโค้ดที่กำหนดเองได้
ตัวเลือกต้นทุน
การประมวลผลเอกสาร AI Builder มีราคาเท่าใด
คุณสามารถเริ่มการทดลองใช้การประมวลผลเอกสารได้ฟรีโดยการเริ่ม การทดลองใช้ หลังจากที่ประเมินแล้ว คุณจะต้องซื้อเครดิต AI Builder เพื่อใช้การประมวลผลเอกสาร ทุกหน้าที่คุณประมวลผลด้วยการประมวลผลเอกสารจะใช้เครดิต AI Builder แม้ว่าหน้านั้นจะไม่มีข้อมูลที่จะแยกออกมาก็ตาม สามารถซื้อเครดิต AI Builder ได้ผ่าน add-on ของ AI Builder
เรียนรู้เพิ่มเติมใน การให้สิทธิการใช้งาน AI Builder