ภาพรวมของการดึงข้อมูล
Note
ดูแท็บ ข้อความและรูปภาพ สําหรับรายละเอียดเพิ่มเติม!
การดึงข้อมูลเป็นภาระงานที่รวมเทคนิค AI หลายอย่างเข้าด้วยกันเพื่อดึงข้อมูลจากเนื้อหา ซึ่งมักจะเป็นเอกสารดิจิทัล โซลูชันการดึงข้อมูลที่ครอบคลุมเกี่ยวข้องกับองค์ประกอบของคอมพิวเตอร์วิทัศน์เพื่อตรวจจับข้อความในข้อมูลที่ใช้รูปภาพ และการเรียนรู้ของเครื่อง หรือ AI ที่สร้างมากขึ้นเรื่อยๆ เพื่อแมปข้อความที่แยกออกมากับฟิลด์ข้อมูลเฉพาะ
- การตรวจจับและแยกข้อความจากรูปภาพโดยใช้การรู้จําอักขระด้วยแสง (OCR)
- การระบุค่าและการแมปจากผลลัพธ์ OCR ไปยังฟิลด์ข้อมูล
ตัวอย่างเช่น โซลูชันการประมวลผลการเรียกร้องค่าใช้จ่ายที่ขับเคลื่อนด้วย AI อาจแยกฟิลด์ที่เกี่ยวข้องจากใบเสร็จรับเงินโดยอัตโนมัติเพื่อประมวลผลการเรียกร้องค่าสินไหมทดแทนอย่างมีประสิทธิภาพมากขึ้น
| ใบเสร็จที่สแกน | ข้อมูลที่ดึงออกมา |
|---|---|
|
|
การเลือกแนวทางที่เหมาะสม
เมื่อวางแผนโซลูชันการดึงข้อมูล สิ่งสําคัญคือต้องพิจารณาข้อกําหนดและข้อจํากัดที่ระบบต้องแก้ไข ข้อควรพิจารณาที่สําคัญบางประการ ได้แก่ :
ลักษณะเอกสาร เอกสารที่คุณต้องดึงข้อมูลเป็นพื้นฐานของโซลูชันทั้งหมด พิจารณาปัจจัยต่างๆ เช่น:
- ความสอดคล้องของเค้าโครง: แบบฟอร์มที่ได้มาตรฐานสนับสนุนแนวทางที่ใช้เทมเพลต ในขณะที่ความจําเป็นในการประมวลผลหลายรูปแบบและเลย์เอาต์อาจต้องใช้โซลูชันที่ใช้แมชชีนเลิร์นนิงที่ซับซ้อนมากขึ้น
- ข้อกําหนดด้านปริมาณ: การประมวลผลปริมาณมากได้รับประโยชน์จากโมเดลแมชชีนเลิร์นนิงอัตโนมัติที่ทํางานบนฮาร์ดแวร์ระบบที่ปรับให้เหมาะสม
- ข้อกําหนดด้านความแม่นยํา: แอปพลิเคชันที่สําคัญอาจต้องมีการตรวจสอบความถูกต้องของมนุษย์ในลูป
ข้อกําหนดและข้อจํากัดด้านโครงสร้างพื้นฐานทางเทคนิค โซลูชันของคุณจะต้องใช้โครงสร้างพื้นฐานฮาร์ดแวร์และซอฟต์แวร์ในการทํางาน พิจารณาปัจจัยต่างๆ เช่น:
- ความปลอดภัยและความเป็นส่วนตัว: เอกสารที่คุณกําลังประมวลผลอาจมีข้อมูลที่ละเอียดอ่อนหรือเป็นความลับ โซลูชันของคุณต้องมีมาตรการที่เพียงพอเพื่อรักษาความปลอดภัยในการเข้าถึงข้อมูล และการปฏิบัติตามข้อกําหนดของอุตสาหกรรมสําหรับการจัดเก็บและประมวลผลข้อมูลที่ได้รับการปกป้อง
- พลังการประมวลผล: การเรียนรู้เชิงลึกและโมเดล AI เชิงกําเนิดที่ใช้กันทั่วไปในโซลูชันการดึงข้อมูลต้องใช้ทรัพยากรการคํานวณจํานวนมาก
- ข้อกําหนดเวลาแฝง: การประมวลผลแบบเรียลไทม์อาจจํากัดความซับซ้อนของแบบจําลอง
- ความต้องการความสามารถในการปรับขนาด: โซลูชันบนคลาวด์ให้ความสามารถในการปรับขนาดที่ดีขึ้นสําหรับปริมาณงานที่แปรผัน
- ความซับซ้อนของการรวม: พิจารณาความเข้ากันได้ของ API และข้อกําหนดของรูปแบบข้อมูล
เคล็ดลับ
ในหลายกรณี โซลูชันการแยกข้อมูลสามารถสร้างได้โดยใช้บริการซอฟต์แวร์ เช่น Azure Document Intelligence ใน Microsoft Foundry Tools และ Azure Content Understanding ใน Microsoft Foundry Tools การใช้บริการเช่นนี้เป็นรากฐานสําหรับโซลูชันของคุณสามารถลดความพยายามในการพัฒนาที่จําเป็นได้อย่างมากในขณะที่ให้ประสิทธิภาพความแม่นยําและความสามารถในการผสานรวมที่ปรับขนาดได้สูงและได้รับการพิสูจน์แล้วในอุตสาหกรรม