ภาพรวมของการดึงข้อมูล

เสร็จสมบูรณ์เมื่อ

Note

ดูแท็บ ข้อความและรูปภาพ สําหรับรายละเอียดเพิ่มเติม!

การดึงข้อมูลเป็นภาระงานที่รวมเทคนิค AI หลายอย่างเข้าด้วยกันเพื่อดึงข้อมูลจากเนื้อหา ซึ่งมักจะเป็นเอกสารดิจิทัล โซลูชันการดึงข้อมูลที่ครอบคลุมเกี่ยวข้องกับองค์ประกอบของคอมพิวเตอร์วิทัศน์เพื่อตรวจจับข้อความในข้อมูลที่ใช้รูปภาพ และการเรียนรู้ของเครื่อง หรือ AI ที่สร้างมากขึ้นเรื่อยๆ เพื่อแมปข้อความที่แยกออกมากับฟิลด์ข้อมูลเฉพาะ

ไดอะแกรมของกระบวนการดึงข้อมูล

  1. การตรวจจับและแยกข้อความจากรูปภาพโดยใช้การรู้จําอักขระด้วยแสง (OCR)
  2. การระบุค่าและการแมปจากผลลัพธ์ OCR ไปยังฟิลด์ข้อมูล

ตัวอย่างเช่น โซลูชันการประมวลผลการเรียกร้องค่าใช้จ่ายที่ขับเคลื่อนด้วย AI อาจแยกฟิลด์ที่เกี่ยวข้องจากใบเสร็จรับเงินโดยอัตโนมัติเพื่อประมวลผลการเรียกร้องค่าสินไหมทดแทนอย่างมีประสิทธิภาพมากขึ้น

ใบเสร็จที่สแกน ข้อมูลที่ดึงออกมา
แผนภาพของใบเสร็จรับเงิน
  • ผู้ขาย: กาแฟที่สี่
  • วันที่: 2024-08-15
  • ผลรวมย่อย: $6.48
  • ภาษี: $0.49
  • การเรียกร้องทั้งหมด: $6.97

การเลือกแนวทางที่เหมาะสม

เมื่อวางแผนโซลูชันการดึงข้อมูล สิ่งสําคัญคือต้องพิจารณาข้อกําหนดและข้อจํากัดที่ระบบต้องแก้ไข ข้อควรพิจารณาที่สําคัญบางประการ ได้แก่ :

  • ลักษณะเอกสาร เอกสารที่คุณต้องดึงข้อมูลเป็นพื้นฐานของโซลูชันทั้งหมด พิจารณาปัจจัยต่างๆ เช่น:

    • ความสอดคล้องของเค้าโครง: แบบฟอร์มที่ได้มาตรฐานสนับสนุนแนวทางที่ใช้เทมเพลต ในขณะที่ความจําเป็นในการประมวลผลหลายรูปแบบและเลย์เอาต์อาจต้องใช้โซลูชันที่ใช้แมชชีนเลิร์นนิงที่ซับซ้อนมากขึ้น
    • ข้อกําหนดด้านปริมาณ: การประมวลผลปริมาณมากได้รับประโยชน์จากโมเดลแมชชีนเลิร์นนิงอัตโนมัติที่ทํางานบนฮาร์ดแวร์ระบบที่ปรับให้เหมาะสม
    • ข้อกําหนดด้านความแม่นยํา: แอปพลิเคชันที่สําคัญอาจต้องมีการตรวจสอบความถูกต้องของมนุษย์ในลูป
  • ข้อกําหนดและข้อจํากัดด้านโครงสร้างพื้นฐานทางเทคนิค โซลูชันของคุณจะต้องใช้โครงสร้างพื้นฐานฮาร์ดแวร์และซอฟต์แวร์ในการทํางาน พิจารณาปัจจัยต่างๆ เช่น:

    • ความปลอดภัยและความเป็นส่วนตัว: เอกสารที่คุณกําลังประมวลผลอาจมีข้อมูลที่ละเอียดอ่อนหรือเป็นความลับ โซลูชันของคุณต้องมีมาตรการที่เพียงพอเพื่อรักษาความปลอดภัยในการเข้าถึงข้อมูล และการปฏิบัติตามข้อกําหนดของอุตสาหกรรมสําหรับการจัดเก็บและประมวลผลข้อมูลที่ได้รับการปกป้อง
    • พลังการประมวลผล: การเรียนรู้เชิงลึกและโมเดล AI เชิงกําเนิดที่ใช้กันทั่วไปในโซลูชันการดึงข้อมูลต้องใช้ทรัพยากรการคํานวณจํานวนมาก
    • ข้อกําหนดเวลาแฝง: การประมวลผลแบบเรียลไทม์อาจจํากัดความซับซ้อนของแบบจําลอง
    • ความต้องการความสามารถในการปรับขนาด: โซลูชันบนคลาวด์ให้ความสามารถในการปรับขนาดที่ดีขึ้นสําหรับปริมาณงานที่แปรผัน
    • ความซับซ้อนของการรวม: พิจารณาความเข้ากันได้ของ API และข้อกําหนดของรูปแบบข้อมูล

เคล็ดลับ

ในหลายกรณี โซลูชันการแยกข้อมูลสามารถสร้างได้โดยใช้บริการซอฟต์แวร์ เช่น Azure Document Intelligence ใน Microsoft Foundry Tools และ Azure Content Understanding ใน Microsoft Foundry Tools การใช้บริการเช่นนี้เป็นรากฐานสําหรับโซลูชันของคุณสามารถลดความพยายามในการพัฒนาที่จําเป็นได้อย่างมากในขณะที่ให้ประสิทธิภาพความแม่นยําและความสามารถในการผสานรวมที่ปรับขนาดได้สูงและได้รับการพิสูจน์แล้วในอุตสาหกรรม