อ่านในภาษาอังกฤษ

แชร์ผ่าน


คำถามที่ถามบ่อยเกี่ยวกับการประมวลผลเอกสาร

บทความนี้ประกอบด้วยคำถามที่ถามบ่อยเกี่ยวกับโมเดลการประมวลผลเอกสารใน AI Builder หากคุณไม่พบคำถามของคุณที่นี่ ให้ตรวจทาน ภาพรวมของโมเดล AI ของการประมวลผลเอกสาร หรือส่งคำถามของคุณไปที่ Power Automate Community สำหรับ AI Builder

ฟังก์ชันการทำงาน

ฉันสามารถทำอะไรกับการประมวลผลเอกสารได้

ด้วยการประมวลผลเอกสาร คุณสามารถสร้างโมเดล AI แบบกำหนดเองเพื่อแยกข้อมูลจากเอกสารประเภทต่างๆ

  • ตัวเลือก เอกสารเทมเพลตคงที่ เหมาะอย่างยิ่งหากองค์ประกอบของเอกสารของคุณอยู่ในตำแหน่งที่คล้ายคลึงกัน โดยปกติจะเป็นกรณีของใบแจ้งหนี้ ใบสั่งซื้อ ใบส่งสินค้า และแบบฟอร์มภาษี
  • ตัวเลือก เอกสารทั่วไป เหมาะกับเอกสารทุกประเภท รวมถึงเอกสารที่ได้รับการสนับสนุนจากตัวเลือกแรก แต่ยังรวมไปถึงสัญญา ใบแจ้งงาน จดหมาย และอื่นๆ ตัวเลือกนี้อาจมีประสิทธิภาพมากกว่าในการแยกข้อมูล แต่ต้องใช้เวลาการฝึกนานกว่า

เรียนรู้เพิ่มเติม: ภาพรวมของโมเดลการประมวลผลเอกสาร

เอกสารชนิดใดบ้างที่สามารถจัดการด้วยการประมวลผลเอกสาร

ชนิดไฟล์ที่รองรับคือ PDF, JPG และ PNG

ฉันสามารถแยกข้อมูลใดจากเอกสารโดยใช้การประมวลผลเอกสาร

การประมวลผลเอกสารสามารถแยกฟิลด์ ตาราง และกล่องกาเครื่องหมายออกจากเอกสารได้

เรียนรู้เพิ่มเติม: กำหนดข้อมูลที่จะแยก

ฉันสามารถดึงข้อความที่เขียนด้วยลายมือออกจากเอกสารได้หรือไม่

ใช่ การประมวลผลเอกสารสามารถแยกข้อความที่พิมพ์และเขียนด้วยลายมือออกจากเอกสารของคุณได้

ฉันต้องใช้ตัวอย่างกี่ตัวอย่างในการฝึกโมเดลการประมวลผลเอกสาร

สำหรับเอกสารคุณภาพสูงที่ใช้เค้าโครงเดียวกัน เอกสารตัวอย่างห้าฉบับก็เพียงพอแล้ว สำหรับเอกสารคุณภาพต่ำ เช่น การสแกนคุณภาพไม่ดี อาจจำเป็นต้องมีเอกสารตัวอย่างเพิ่มเติม หากต้องการปรับปรุงผลลัพธ์ ใช้เอกสารตัวอย่าง 15 ถึง 20 ตัวอย่าง

โมเดลการประมวลผลแบบฟอร์มเดียวสามารถดึงข้อมูลจากเอกสารที่มีเค้าโครงหรือเทมเพลตที่แตกต่างกันได้หรือไม่

ใช่ ด้วยการใช้คุณลักษณะคอลเลกชัน คุณจะฝึกโมเดลการประมวลผลแบบฟอร์มเดียวเพื่อจัดการเอกสารที่มีเค้าโครงที่แตกต่างกัน

เรียนรู้เพิ่มเติม: จัดกลุ่มเอกสารโดยคอลเลกชัน

สามารถจัดการกับการประมวลผลเอกสารได้ หลาย ฟอร์มในเอกสาร เดียว

ฟอร์มแต่ละฟอร์มจะต้องอยู่ในไฟล์ที่แยกต่างหาก ตัวอย่างเช่น หากคุณมีเอกสาร PDF ที่มีใบแจ้งหนี้หลายใบ ให้สร้างไฟล์แยกต่างหากสำหรับใบแจ้งหนี้แต่ละใบก่อนที่คุณจะส่งไปยังโมเดลการประมวลผลเอกสาร

คุณยังสามารถระบุหน้าสำหรับโมเดลการประมวลผลเอกสารที่จะจัดการได้ วิธีนี้ทำให้คุณสามารถใช้ประโยชน์จากฟังก์ชันของโมเดลเพื่อวนลูปทีละหน้า และประมวลผลฟอร์มครั้งละรายการ

เรียนรู้เพิ่มเติม: ช่วงหน้า

ฉันได้ฝึกโมเดลการประมวลผลเอกสารแล้ว แต่ไม่ได้รับผลลัพธ์ที่ดีสำหรับข้อมูลที่แยกออกมา ฉันจะปรับปรุงโมเดลได้อย่างไร

หากโมเดลของคุณให้ผลลัพธ์ที่ไม่ดีหลังจากที่คุณได้ฝึก ให้แก้ไขโมเดลและจัดเตรียมตัวอย่างเพิ่มเติมสำหรับการฝึก ยิ่งคุณระบุตัวอย่างมากเท่าใด โมเดล AI ก็จะยิ่งเรียนรู้วิธีดึงข้อมูลจากเอกสารของคุณมากเท่านั้น

เรียนรู้เพิ่มเติม: ปรับปรุงประสิทธิภาพของโมเดลการประมวลผลเอกสารของคุณ

ข้อจำกัด

ฉันสามารถประมวลผลเอกสารได้สูงสุดกี่ฉบับ

คุณสามารถประมวลผลเอกสารได้สูงสุด 360 รายการต่อสภาพแวดล้อม ทุกๆ 60 วินาที

เพราะอะไรจึงมีการจดจำอักขระบางตัวไม่ถูกต้อง

  • อักขระบางตัวอาจสร้างความสับสนได้ เช่น 0 (ตัวเลข) และ O (ตัวอักษร), 1 (ตัวเลข) และ l (ตัวอักษร), 4 (ตัวเลข) และ A (ตัวอักษร) เป็นต้น
  • อักขระบางตัวที่อยู่เหนือหรือใกล้กับอักขระตัวอื่นอาจได้รับการจดจำที่ไม่ถูกต้อง: O (ตัวอักษร) เหนือเส้นแนวตั้งกลายเป็น 0 (ตัวเลข), 5 (ตัวเลข) เหนือเส้นกลายเป็น $ (เครื่องหมายดอลลาร์อเมริกัน), l_ (อักษรตัวพิมพ์เล็ก, ขีดล่าง) จะกลายเป็น L (อักษรตัวพิมพ์ใหญ่) และอื่นๆ
  • อักขระบางตัวในเอกสารอาจมีคุณภาพที่ต่ำ จึงอาจได้รับการจดจำที่ไม่ถูกต้อง หรืออาจจดจำไม่ได้เลย

ในกรณีข้างต้น จะไม่สามารถดำเนินการใดๆ ได้ใน AI Builder เพื่อปรับปรุงการจดจำ เราขอแนะนำให้ปรับปรุงคุณภาพและเค้าโครงของเอกสารต้นฉบับเพื่อแก้ไขปัญหาที่คล้ายกัน

หมายเหตุ

Microsoft ปรับปรุงเทคโนโลยี OCR ในการตรวจจับอักขระได้รับการปรับปรุงอย่างต่อเนื่อง ดังนั้นปัญหาดังกล่าวจึงเกิดขึ้นน้อยลง

ฉันสามารถสร้างแบบจำลองที่มีคอลเลกชันจำนวนมากได้ไหม

คุณสามารถสร้างคอลเลกชันได้มากถึง 200 รายการต่อโมเดล อย่างไรก็ตาม การฝึกโมเดล เอกสารทั่วไป ที่มีคอลเลกชันหลายสิบคอลเลกชันอาจใช้เวลาหลายชั่วโมงและหมดเวลาในบางกรณี หากโมเดลของคุณมีคอลเลกชันจำนวนมาก คาดว่าจะต้องรอถึง 24 ชั่วโมงในการฝึกโมเดลให้เสร็จสิ้น

ฉันสามารถสร้างแบบจำลองในโซลูชันก็ได้ไหม

ในปัจจุบัน ยังไม่สามารถสร้างแบบจำลองในโซลูชันได้

ฉันสามารถใช้สัญญาและจดหมายในโมเดลการประมวลผลเอกสารของฉันได้หรือไม่

ได้ เอกสารที่ไม่มีโครงสร้าง เช่น สัญญาและจดหมาย มีการรองรับโดยการประมวลผลเอกสารโดยใช้ตัวเลือก เอกสารทั่วไป

การเปรียบเทียบ

การประมวลผลเอกสาร การประมวลผลใบแจ้งหนี้ การประมวลผลใบเสร็จ ตัวอ่านเอกสารข้อมูลประจำตัว ตัวอ่านนามบัตร ผู้อ่าน และการรู้จำข้อความแตกต่างกันอย่างไร

คุณอาจต้องใช้โมเดลเฉพาะ หรือหลายแบบทั้งนี้ขึ้นอยู่กับสถานการณ์ของคุณ

ใช้ การจดจำข้อความ เมื่อคุณต้องการแยกข้อความทั้งหมดที่อยู่ในรูปภาพหรือ PDF จากนั้น ตัวอย่างเช่น คุณสามารถค้นหาคำสำคัญในข้อความที่แยกออกมา หรือสร้างกฎตายตัวบางอย่างเพื่อดึงข้อมูลบางรายการ

หากคุณต้องการดึงข้อมูลจากใบแจ้งหนี้, ใบเสร็จ, หนังสือเดินทาง, ใบขับขี่, หรือนามบัตร ให้เริ่มต้นด้วยโมเดลที่สร้างไว้ล่วงหน้าที่เกี่ยวข้อง:

คุณสามารถใช้โมเดลที่สร้างไว้ล่วงหน้าเหล่านี้ได้ทันที โดยไม่ต้องสร้างโมเดลใหม่ โมเดลเหล่านี้สามารถดึงข้อมูลทั่วไปที่พบในชนิดเอกสารที่เกี่ยวข้องได้

สำหรับเอกสารชนิดอื่นๆ คุณสามารถสร้างโมเดลการประมวลผลเอกสารแบบกำหนดเองเพื่อแยกฟิลด์และตารางที่คุณต้องการ นอกจากนี้ยังใช้หากคุณต้องการข้อมูลเพิ่มเติมที่ไม่ได้มาจากโมเดลที่สร้างไว้ล่วงหน้า

เรียนรู้เพิ่มเติม: โมเดลการประมวลผลเอกสารแบบกำหนดเอง

การประมวลผลเอกสาร AI Builder กับ Azure Form Recognizer แตกต่างกันอย่างไร

การประมวลผลเอกสาร AI Builder ถูกสร้างขึ้นบน Azure Form Recognizer นี่ทำให้ผลิตภัณฑ์ทั้งสองรายการมีความก้าวหน้าล่าสุดใน Microsoft AI

  • AI Builder เป็นส่วนหนึ่งของ Microsoft Power Platform นี่ทำให้ทุกคนสามารถเพิ่ม AI ลงในแอปและระบบอัตโนมัติด้วยอินเทอร์เฟซที่ใช้งานง่าย คุณไม่จำเป็นต้องเป็นนักพัฒนาหรือนักวิทยาศาสตร์ข้อมูล

  • Azure Form Recognizer มุ่งเป้าไปที่นักพัฒนามืออาชีพ พวกเขาสามารถใช้ REST API แบบง่ายเพื่อเพิ่มความสามารถ AI ให้กับโซลูชันโค้ดที่กำหนดเองได้

ตัวเลือกต้นทุน

การประมวลผลเอกสาร AI Builder มีราคาเท่าใด

คุณสามารถเริ่มการทดลองใช้การประมวลผลเอกสารได้ฟรีโดยการเริ่ม การทดลองใช้ หลังจากที่ประเมินแล้ว คุณจะต้องซื้อเครดิต AI Builder เพื่อใช้การประมวลผลเอกสาร ทุกหน้าที่คุณประมวลผลด้วยการประมวลผลเอกสารจะใช้เครดิต AI Builder แม้ว่าหน้านั้นจะไม่มีข้อมูลที่จะแยกออกมาก็ตาม สามารถซื้อเครดิต AI Builder ได้ผ่าน add-on ของ AI Builder

เรียนรู้เพิ่มเติม: การให้สิทธิการใช้งาน AI Builder