คำถามที่ถามบ่อยเกี่ยวกับการประมวลผลเอกสาร
บทความนี้ประกอบด้วยคำถามที่ถามบ่อยเกี่ยวกับโมเดลการประมวลผลเอกสารใน AI Builder หากคุณไม่พบคำถามของคุณที่นี่ ให้ตรวจทาน ภาพรวมของโมเดล AI ของการประมวลผลเอกสาร หรือส่งคำถามของคุณไปที่ Power Automate Community สำหรับ AI Builder
ด้วยการประมวลผลเอกสาร คุณสามารถสร้างโมเดล AI แบบกำหนดเองเพื่อแยกข้อมูลจากเอกสารประเภทต่างๆ
- ตัวเลือก เอกสารเทมเพลตคงที่ เหมาะอย่างยิ่งหากองค์ประกอบของเอกสารของคุณอยู่ในตำแหน่งที่คล้ายคลึงกัน โดยปกติจะเป็นกรณีของใบแจ้งหนี้ ใบสั่งซื้อ ใบส่งสินค้า และแบบฟอร์มภาษี
- ตัวเลือก เอกสารทั่วไป เหมาะกับเอกสารทุกประเภท รวมถึงเอกสารที่ได้รับการสนับสนุนจากตัวเลือกแรก แต่ยังรวมไปถึงสัญญา ใบแจ้งงาน จดหมาย และอื่นๆ ตัวเลือกนี้อาจมีประสิทธิภาพมากกว่าในการแยกข้อมูล แต่ต้องใช้เวลาการฝึกนานกว่า
เรียนรู้เพิ่มเติม: ภาพรวมของโมเดลการประมวลผลเอกสาร
ชนิดไฟล์ที่รองรับคือ PDF, JPG และ PNG
การประมวลผลเอกสารสามารถแยกฟิลด์ ตาราง และกล่องกาเครื่องหมายออกจากเอกสารได้
เรียนรู้เพิ่มเติม: กำหนดข้อมูลที่จะแยก
ใช่ การประมวลผลเอกสารสามารถแยกข้อความที่พิมพ์และเขียนด้วยลายมือออกจากเอกสารของคุณได้
สำหรับเอกสารคุณภาพสูงที่ใช้เค้าโครงเดียวกัน เอกสารตัวอย่างห้าฉบับก็เพียงพอแล้ว สำหรับเอกสารคุณภาพต่ำ เช่น การสแกนคุณภาพไม่ดี อาจจำเป็นต้องมีเอกสารตัวอย่างเพิ่มเติม หากต้องการปรับปรุงผลลัพธ์ ใช้เอกสารตัวอย่าง 15 ถึง 20 ตัวอย่าง
โมเดลการประมวลผลแบบฟอร์มเดียวสามารถดึงข้อมูลจากเอกสารที่มีเค้าโครงหรือเทมเพลตที่แตกต่างกันได้หรือไม่
ใช่ ด้วยการใช้คุณลักษณะคอลเลกชัน คุณจะฝึกโมเดลการประมวลผลแบบฟอร์มเดียวเพื่อจัดการเอกสารที่มีเค้าโครงที่แตกต่างกัน
เรียนรู้เพิ่มเติม: จัดกลุ่มเอกสารโดยคอลเลกชัน
ฟอร์มแต่ละฟอร์มจะต้องอยู่ในไฟล์ที่แยกต่างหาก ตัวอย่างเช่น หากคุณมีเอกสาร PDF ที่มีใบแจ้งหนี้หลายใบ ให้สร้างไฟล์แยกต่างหากสำหรับใบแจ้งหนี้แต่ละใบก่อนที่คุณจะส่งไปยังโมเดลการประมวลผลเอกสาร
คุณยังสามารถระบุหน้าสำหรับโมเดลการประมวลผลเอกสารที่จะจัดการได้ วิธีนี้ทำให้คุณสามารถใช้ประโยชน์จากฟังก์ชันของโมเดลเพื่อวนลูปทีละหน้า และประมวลผลฟอร์มครั้งละรายการ
เรียนรู้เพิ่มเติม: ช่วงหน้า
ฉันได้ฝึกโมเดลการประมวลผลเอกสารแล้ว แต่ไม่ได้รับผลลัพธ์ที่ดีสำหรับข้อมูลที่แยกออกมา ฉันจะปรับปรุงโมเดลได้อย่างไร
หากโมเดลของคุณให้ผลลัพธ์ที่ไม่ดีหลังจากที่คุณได้ฝึก ให้แก้ไขโมเดลและจัดเตรียมตัวอย่างเพิ่มเติมสำหรับการฝึก ยิ่งคุณระบุตัวอย่างมากเท่าใด โมเดล AI ก็จะยิ่งเรียนรู้วิธีดึงข้อมูลจากเอกสารของคุณมากเท่านั้น
เรียนรู้เพิ่มเติม: ปรับปรุงประสิทธิภาพของโมเดลการประมวลผลเอกสารของคุณ
คุณสามารถประมวลผลเอกสารได้สูงสุด 360 รายการต่อสภาพแวดล้อม ทุกๆ 60 วินาที
- อักขระบางตัวอาจสร้างความสับสนได้ เช่น 0 (ตัวเลข) และ O (ตัวอักษร), 1 (ตัวเลข) และ l (ตัวอักษร), 4 (ตัวเลข) และ A (ตัวอักษร) เป็นต้น
- อักขระบางตัวที่อยู่เหนือหรือใกล้กับอักขระตัวอื่นอาจได้รับการจดจำที่ไม่ถูกต้อง: O (ตัวอักษร) เหนือเส้นแนวตั้งกลายเป็น 0 (ตัวเลข), 5 (ตัวเลข) เหนือเส้นกลายเป็น $ (เครื่องหมายดอลลาร์อเมริกัน), l_ (อักษรตัวพิมพ์เล็ก, ขีดล่าง) จะกลายเป็น L (อักษรตัวพิมพ์ใหญ่) และอื่นๆ
- อักขระบางตัวในเอกสารอาจมีคุณภาพที่ต่ำ จึงอาจได้รับการจดจำที่ไม่ถูกต้อง หรืออาจจดจำไม่ได้เลย
ในกรณีข้างต้น จะไม่สามารถดำเนินการใดๆ ได้ใน AI Builder เพื่อปรับปรุงการจดจำ เราขอแนะนำให้ปรับปรุงคุณภาพและเค้าโครงของเอกสารต้นฉบับเพื่อแก้ไขปัญหาที่คล้ายกัน
หมายเหตุ
Microsoft ปรับปรุงเทคโนโลยี OCR ในการตรวจจับอักขระได้รับการปรับปรุงอย่างต่อเนื่อง ดังนั้นปัญหาดังกล่าวจึงเกิดขึ้นน้อยลง
คุณสามารถสร้างคอลเลกชันได้มากถึง 200 รายการต่อโมเดล อย่างไรก็ตาม การฝึกโมเดล เอกสารทั่วไป ที่มีคอลเลกชันหลายสิบคอลเลกชันอาจใช้เวลาหลายชั่วโมงและหมดเวลาในบางกรณี หากโมเดลของคุณมีคอลเลกชันจำนวนมาก คาดว่าจะต้องรอถึง 24 ชั่วโมงในการฝึกโมเดลให้เสร็จสิ้น
ในปัจจุบัน ยังไม่สามารถสร้างแบบจำลองในโซลูชันได้
ได้ เอกสารที่ไม่มีโครงสร้าง เช่น สัญญาและจดหมาย มีการรองรับโดยการประมวลผลเอกสารโดยใช้ตัวเลือก เอกสารทั่วไป
การประมวลผลเอกสาร การประมวลผลใบแจ้งหนี้ การประมวลผลใบเสร็จ ตัวอ่านเอกสารข้อมูลประจำตัว ตัวอ่านนามบัตร ผู้อ่าน และการรู้จำข้อความแตกต่างกันอย่างไร
คุณอาจต้องใช้โมเดลเฉพาะ หรือหลายแบบทั้งนี้ขึ้นอยู่กับสถานการณ์ของคุณ
ใช้ การจดจำข้อความ เมื่อคุณต้องการแยกข้อความทั้งหมดที่อยู่ในรูปภาพหรือ PDF จากนั้น ตัวอย่างเช่น คุณสามารถค้นหาคำสำคัญในข้อความที่แยกออกมา หรือสร้างกฎตายตัวบางอย่างเพื่อดึงข้อมูลบางรายการ
หากคุณต้องการดึงข้อมูลจากใบแจ้งหนี้, ใบเสร็จ, หนังสือเดินทาง, ใบขับขี่, หรือนามบัตร ให้เริ่มต้นด้วยโมเดลที่สร้างไว้ล่วงหน้าที่เกี่ยวข้อง:
- การประมวลผลใบแจ้งหนี้
- การประมวลผลใบเสร็จ
- ตัวอ่านเอกสารข้อมูลประจำตัว (หนังสือเดินทางและใบขับขี่)
- ตัวอ่านนามบัตร
คุณสามารถใช้โมเดลที่สร้างไว้ล่วงหน้าเหล่านี้ได้ทันที โดยไม่ต้องสร้างโมเดลใหม่ โมเดลเหล่านี้สามารถดึงข้อมูลทั่วไปที่พบในชนิดเอกสารที่เกี่ยวข้องได้
สำหรับเอกสารชนิดอื่นๆ คุณสามารถสร้างโมเดลการประมวลผลเอกสารแบบกำหนดเองเพื่อแยกฟิลด์และตารางที่คุณต้องการ นอกจากนี้ยังใช้หากคุณต้องการข้อมูลเพิ่มเติมที่ไม่ได้มาจากโมเดลที่สร้างไว้ล่วงหน้า
เรียนรู้เพิ่มเติม: โมเดลการประมวลผลเอกสารแบบกำหนดเอง
การประมวลผลเอกสาร AI Builder ถูกสร้างขึ้นบน Azure Form Recognizer นี่ทำให้ผลิตภัณฑ์ทั้งสองรายการมีความก้าวหน้าล่าสุดใน Microsoft AI
AI Builder เป็นส่วนหนึ่งของ Microsoft Power Platform นี่ทำให้ทุกคนสามารถเพิ่ม AI ลงในแอปและระบบอัตโนมัติด้วยอินเทอร์เฟซที่ใช้งานง่าย คุณไม่จำเป็นต้องเป็นนักพัฒนาหรือนักวิทยาศาสตร์ข้อมูล
Azure Form Recognizer มุ่งเป้าไปที่นักพัฒนามืออาชีพ พวกเขาสามารถใช้ REST API แบบง่ายเพื่อเพิ่มความสามารถ AI ให้กับโซลูชันโค้ดที่กำหนดเองได้
คุณสามารถเริ่มการทดลองใช้การประมวลผลเอกสารได้ฟรีโดยการเริ่ม การทดลองใช้ หลังจากที่ประเมินแล้ว คุณจะต้องซื้อเครดิต AI Builder เพื่อใช้การประมวลผลเอกสาร ทุกหน้าที่คุณประมวลผลด้วยการประมวลผลเอกสารจะใช้เครดิต AI Builder แม้ว่าหน้านั้นจะไม่มีข้อมูลที่จะแยกออกมาก็ตาม สามารถซื้อเครดิต AI Builder ได้ผ่าน add-on ของ AI Builder
เรียนรู้เพิ่มเติม: การให้สิทธิการใช้งาน AI Builder