Oversigt over informationsudtrækning

Fuldført

Notat

Se fanen Tekst og billeder for flere detaljer!

Informationsudtrækning er en arbejdsbyrde, der kombinerer flere AI-teknikker for at udtrække data fra indhold – ofte digitale dokumenter. En omfattende informationsudtrækningsløsning involverer elementer af computer vision til at opdage tekst i billedbaserede data; og maskinlæring, eller i stigende grad generativ AI, til semantisk at kortlægge den udtrukne tekst til specifikke datafelter.

Diagram over informationsudtrækningsprocessen.

  1. Tekstdetektion og uddrag fra billeder ved brug af optisk tegngenkendelse (OCR).
  2. Værdiidentifikation og kortlægning fra OCR-resultaterne til datafelterne.

For eksempel kan en AI-drevet løsning til udgiftsbehandling automatisk udtrække de relevante felter fra kvitteringer for at behandle krav mere effektivt.

Scannet kvittering Udtrukne data
Diagram over en kvittering.
  • Leverandør: Fourth Coffee
  • Dato: 2024-08-15
  • Subtotal: $6,48
  • Skat: $0,49
  • Samlet krav: $6,97

Valg af den rigtige tilgang

Når man planlægger en informationsudtrækningsløsning, er det vigtigt at overveje de krav og begrænsninger, som systemet skal imødekomme. Nogle vigtige overvejelser omfatter:

  • Dokumentets karakteristika. De dokumenter, du skal udtrække data fra, er grundlaget for hele løsningen. Overvej faktorer som:

    • Layoutkonsistens: Standardiserede formularer favoriserer skabelonbaserede tilgange, mens behovet for at behandle flere formater og layouts kan kræve en mere kompleks maskinlæringsbaseret løsning.
    • Volumenkrav: Højvolumenbehandling drager fordel af automatiserede maskinlæringsmodeller, der kører på optimeret systemhardware.
    • Nøjagtighedskrav: Kritiske applikationer kan have brug for human-in-the-loop-validering.
  • Tekniske infrastrukturkrav og begrænsninger. Din løsning vil kræve hardware- og softwareinfrastruktur for at køre. Overvej faktorer som:

    • Sikkerhed og privatliv: De dokumenter, du behandler, kan indeholde følsomme eller fortrolige data. Din løsning skal indeholde tilstrækkelige foranstaltninger til at sikre adgang til dataene og overholde eventuelle branchekrav for lagring og behandling af beskyttede data.
    • Processorkraft: Deep learning og generative AI-modeller, der ofte anvendes i informationsudtrækningsløsninger, kræver betydelige beregningsressourcer.
    • Latenskrav: Realtidsbehandling kan begrænse modellens kompleksitet.
    • Skalerbarhedsbehov: Skybaserede løsninger tilbyder bedre skalerbarhed for variable arbejdsbelastninger.
    • Integrationskompleksitet: Overvej API-kompatibilitet og krav til dataformater.

Tips

I mange tilfælde kan informationsudtrækningsløsninger bygges ved hjælp af softwaretjenester, såsom Azure Document Intelligence i Microsoft Foundry Tools og Azure Content Understanding i Microsoft Foundry Tools. At bruge sådanne tjenester som fundamentet for din løsning kan i høj grad reducere udviklingsindsatsen, samtidig med at du leverer meget skalerbare, branchebeviste ydeevne-, nøjagtigheds- og integrationsmuligheder.