Oversigt over informationsudtrækning
Notat
Se fanen Tekst og billeder for flere detaljer!
Informationsudtrækning er en arbejdsbyrde, der kombinerer flere AI-teknikker for at udtrække data fra indhold – ofte digitale dokumenter. En omfattende informationsudtrækningsløsning involverer elementer af computer vision til at opdage tekst i billedbaserede data; og maskinlæring, eller i stigende grad generativ AI, til semantisk at kortlægge den udtrukne tekst til specifikke datafelter.
- Tekstdetektion og uddrag fra billeder ved brug af optisk tegngenkendelse (OCR).
- Værdiidentifikation og kortlægning fra OCR-resultaterne til datafelterne.
For eksempel kan en AI-drevet løsning til udgiftsbehandling automatisk udtrække de relevante felter fra kvitteringer for at behandle krav mere effektivt.
| Scannet kvittering | Udtrukne data |
|---|---|
|
|
Valg af den rigtige tilgang
Når man planlægger en informationsudtrækningsløsning, er det vigtigt at overveje de krav og begrænsninger, som systemet skal imødekomme. Nogle vigtige overvejelser omfatter:
Dokumentets karakteristika. De dokumenter, du skal udtrække data fra, er grundlaget for hele løsningen. Overvej faktorer som:
- Layoutkonsistens: Standardiserede formularer favoriserer skabelonbaserede tilgange, mens behovet for at behandle flere formater og layouts kan kræve en mere kompleks maskinlæringsbaseret løsning.
- Volumenkrav: Højvolumenbehandling drager fordel af automatiserede maskinlæringsmodeller, der kører på optimeret systemhardware.
- Nøjagtighedskrav: Kritiske applikationer kan have brug for human-in-the-loop-validering.
Tekniske infrastrukturkrav og begrænsninger. Din løsning vil kræve hardware- og softwareinfrastruktur for at køre. Overvej faktorer som:
- Sikkerhed og privatliv: De dokumenter, du behandler, kan indeholde følsomme eller fortrolige data. Din løsning skal indeholde tilstrækkelige foranstaltninger til at sikre adgang til dataene og overholde eventuelle branchekrav for lagring og behandling af beskyttede data.
- Processorkraft: Deep learning og generative AI-modeller, der ofte anvendes i informationsudtrækningsløsninger, kræver betydelige beregningsressourcer.
- Latenskrav: Realtidsbehandling kan begrænse modellens kompleksitet.
- Skalerbarhedsbehov: Skybaserede løsninger tilbyder bedre skalerbarhed for variable arbejdsbelastninger.
- Integrationskompleksitet: Overvej API-kompatibilitet og krav til dataformater.
Tips
I mange tilfælde kan informationsudtrækningsløsninger bygges ved hjælp af softwaretjenester, såsom Azure Document Intelligence i Microsoft Foundry Tools og Azure Content Understanding i Microsoft Foundry Tools. At bruge sådanne tjenester som fundamentet for din løsning kan i høj grad reducere udviklingsindsatsen, samtidig med at du leverer meget skalerbare, branchebeviste ydeevne-, nøjagtigheds- og integrationsmuligheder.