Delen via


Mogelijkheden van de invoegtoepassing Document Intelligence

Belangrijk

  • Openbare preview-versies van Document Intelligence bieden vroegtijdige toegang tot functies die actief zijn in ontwikkeling. Functies, benaderingen en processen kunnen veranderen, vóór algemene beschikbaarheid (GA), op basis van feedback van gebruikers.
  • De openbare preview-versie van Document Intelligence-clientbibliotheken is standaard ingesteld op REST API-versie 2024-07-31-preview.
  • Openbare preview-versie 2024-07-31-preview is momenteel alleen beschikbaar in de volgende Azure-regio's. Houd er rekening mee dat het aangepaste model voor generatieve (extractie van documentvelden) in AI Studio alleen beschikbaar is in de regio VS - noord-centraal:
    • VS - oost
    • VS - west 2
    • Europa -west
    • VS - noord-centraal

Deze inhoud is van toepassing op: vinkje v4.0 (preview) | Vorige versies: blauw-vinkje v3.1 (GA)

Deze inhoud is van toepassing op: vinkje v3.1 (GA) | Nieuwste versie: paars vinkje v4.0 (preview)

Notitie

Mogelijkheden voor invoegtoepassingen zijn beschikbaar in alle modellen, met uitzondering van het visitekaartjesmodel.

Functies

Document Intelligence biedt ondersteuning voor geavanceerdere en modulaire analysemogelijkheden. Gebruik de invoegtoepassingsfuncties om de resultaten uit te breiden met meer functies die zijn geëxtraheerd uit uw documenten. Voor sommige invoegtoepassingsfuncties worden extra kosten in rekening gebracht. Deze optionele functies kunnen worden ingeschakeld en uitgeschakeld, afhankelijk van het scenario van de documentextractie. Als u een functie wilt inschakelen, voegt u de bijbehorende functienaam toe aan de eigenschap van de features queryreeks. U kunt meer dan één invoegtoepassingsfunctie inschakelen op een aanvraag door een door komma's gescheiden lijst met functies op te geven. De volgende uitbreidingsmogelijkheden zijn beschikbaar voor 2023-07-31 (GA) en latere versies.

Voor 2024-07-31-preview release en later ondersteunt het read-model doorzoekbare PDF-uitvoer:

Notitie

  • Niet alle mogelijkheden voor invoegtoepassingen worden ondersteund door alle modellen. Zie modelgegevensextractie voor meer informatie.

  • Invoegtoepassingsmogelijkheden worden momenteel niet ondersteund voor Microsoft Office-bestandstypen.

Document Intelligence ondersteunt optionele functies die kunnen worden ingeschakeld en uitgeschakeld, afhankelijk van het scenario voor documentextractie. De volgende mogelijkheden voor invoegtoepassingen zijn beschikbaar voor 2023-10-31-previewen latere versies:

Notitie

De implementatie van queryvelden in de API 2023-10-30-preview verschilt van de laatste preview-versie. De nieuwe implementatie is goedkoper en werkt goed met gestructureerde documenten.

Beschikbaarheid van versie

Mogelijkheid voor invoegtoepassingen Invoegtoepassing/gratis 2024-02-29-preview 2023-07-31 (GA) 2022-08-31 (GA) v2.1 (GA)
Extractie van lettertype-eigenschap Invoegtoepassing ✔️ ✔️ n.v.t. n.v.t.
Formuleextractie Invoegtoepassing ✔️ ✔️ n.v.t. n.v.t.
Extractie met hoge resolutie Invoegtoepassing ✔️ ✔️ n.v.t. n.v.t.
Streepjescode-extractie Gratis ✔️ ✔️ n.v.t. n.v.t.
Taaldetectie Gratis ✔️ ✔️ n.v.t. n.v.t.
Sleutel-waardeparen Gratis ✔️ n.v.t. n.v.t. n.v.t.
Queryvelden Invoegtoepassing* ✔️ n.v.t. n.v.t. n.v.t.

✱ Invoegtoepassing - Queryvelden zijn anders geprijsd dan de andere invoegtoepassingsfuncties. Zie prijzen voor meer informatie.

Ondersteunde bestandsindelingen

  • PDF

  • Afbeeldingen: JPEG/JPG, PNG, BMP, , TIFFHEIF

✱ Microsoft Office-bestanden worden momenteel niet ondersteund.

Extractie met hoge resolutie

De taak van het herkennen van kleine tekst uit grote documenten, zoals technische tekeningen, is een uitdaging. De tekst wordt vaak gemengd met andere grafische elementen en heeft verschillende lettertypen, grootten en afdrukstanden. Bovendien kan de tekst worden opgesplitst in afzonderlijke delen of worden verbonden met andere symbolen. Document Intelligence biedt nu ondersteuning voor het extraheren van inhoud uit deze typen documenten met de ocr.highResolution mogelijkheid. U krijgt verbeterde kwaliteit van inhoudextractie uit A1/A2/A3-documenten door deze invoegtoepassing in te schakelen.

{your-resource-endpoint}.cognitiveservices.azure.com/documentintelligence/documentModels/prebuilt-layout:analyze?api-version=2024-02-29-preview&features=ocrHighResolution
{your-resource-endpoint}.cognitiveservices.azure.com/formrecognizer/documentModels/prebuilt-layout:analyze?api-version=2023-07-31&features=ocrHighResolution

Formuleextractie

Met de ocr.formula mogelijkheid worden alle geïdentificeerde formules, zoals wiskundige vergelijkingen, in de verzameling geëxtraheerd als een object op het formulas hoogste niveau onder content. Binnen contentworden gedetecteerde formules weergegeven als :formula:. Elke vermelding in deze verzameling vertegenwoordigt een formule met het formuletype als inline of display, en de LaTeX-weergave, samen value met de polygon coördinaten. In eerste instantie worden formules weergegeven aan het einde van elke pagina.

Notitie

De confidence score is in code vastgelegd.

{your-resource-endpoint}.cognitiveservices.azure.com/documentintelligence/documentModels/prebuilt-layout:analyze?api-version=2024-02-29-preview&features=formulas
{your-resource-endpoint}.cognitiveservices.azure.com/formrecognizer/documentModels/prebuilt-layout:analyze?api-version=2023-07-31&features=formulas

Extractie van lettertype-eigenschap

De ocr.font mogelijkheid extraheert alle lettertype-eigenschappen van tekst die in de styles verzameling zijn geëxtraheerd als een object op het hoogste niveau onder content. Elk stijlobject specificeert één lettertype-eigenschap, de tekst waarop het van toepassing is en de bijbehorende betrouwbaarheidsscore. De bestaande stijleigenschap wordt uitgebreid met meer lettertype-eigenschappen, zoals similarFontFamily voor het lettertype van de tekst, fontStyle voor stijlen zoals cursief en normaal, fontWeight voor vet of normaal, color voor kleur van de tekst en backgroundColor voor kleur van het tekstbegrenzingsvak.

  {your-resource-endpoint}.cognitiveservices.azure.com/documentintelligence/documentModels/prebuilt-layout:analyze?api-version=2024-02-29-preview&features=styleFont
  {your-resource-endpoint}.cognitiveservices.azure.com/formrecognizer/documentModels/prebuilt-layout:analyze?api-version=2023-07-31&features=styleFont

Extractie van streepjescode-eigenschap

Met de ocr.barcode mogelijkheid worden alle geïdentificeerde streepjescodes in de verzameling geëxtraheerd als een object op het barcodes hoogste niveau onder content. Binnen de contentgedetecteerde streepjescodes worden weergegeven als :barcode:. Elke vermelding in deze verzameling vertegenwoordigt een streepjescode en bevat het type streepjescode als kind en de inhoud van de ingesloten streepjescode, samen value met polygon de coördinaten. In eerste instantie worden streepjescodes weergegeven aan het einde van elke pagina. De confidence code is vastgelegd voor als 1.

Ondersteunde streepjescodetypen

Type streepjescode Voorbeeld
QR Code Schermopname van de QR-code.
Code 39 Schermopname van code 39.
Code 93 Schermopname van code 93.
Code 128 Schermopname van code 128.
UPC (UPC-A & UPC-E) Schermopname van de UPC.
PDF417 Schermopname van pdf417.
EAN-8 Schermopname van de europese streepjescode streepjescode ean-8.
EAN-13 Schermopname van de Europese streepjescode streepjescode ean-13.
Codabar Schermopname van de Codabar.
Databar Schermopname van de gegevensbalk.
Databar Uitgebreid Schermopname van de gegevensbalk uitgevouwen.
ITF Schermopname van de interleaved-two-of-five streepjescode (ITF).
Data Matrix Schermopname van de gegevensmatrix.
{your-resource-endpoint}.cognitiveservices.azure.com/documentintelligence/documentModels/prebuilt-layout:analyze?api-version=2024-02-29-preview&features=barcodes
{your-resource-endpoint}.cognitiveservices.azure.com/formrecognizer/documentModels/prebuilt-layout:analyze?api-version=2023-07-31&features=barcodes

Taaldetectie

Als u de languages functie toevoegt aan de analyzeResult aanvraag, wordt de gedetecteerde primaire taal voor elke tekstregel voorspeld, samen met de confidence in de languages verzameling eronder analyzeResult.

{your-resource-endpoint}.cognitiveservices.azure.com/documentintelligence/documentModels/prebuilt-layout:analyze?api-version=2024-02-29-preview&features=languages
{your-resource-endpoint}.cognitiveservices.azure.com/formrecognizer/documentModels/prebuilt-layout:analyze?api-version=2023-07-31&features=languages

Doorzoekbare PDF

Met de doorzoekbare PDF-functie kunt u een analoge PDF, zoals gescande PDF-bestanden, converteren naar een PDF met ingesloten tekst. Met de ingesloten tekst kunt u diep zoeken in de geëxtraheerde inhoud van het PDF-bestand door de gedetecteerde tekstentiteiten boven op de afbeeldingsbestanden te plaatsen.

Belangrijk

  • Op dit moment wordt de doorzoekbare PDF-functie alleen ondersteund door het Read OCR-model prebuilt-read. Wanneer u deze functie gebruikt, geeft u het modelId op als prebuilt-read, omdat andere modeltypen een fout retourneren voor deze preview-versie.
  • Doorzoekbare PDF is opgenomen in het model 2024-07-31-preview prebuilt-read zonder gebruikskosten voor algemeen PDF-verbruik.

Doorzoekbare PDF gebruiken

Als u doorzoekbare PDF wilt gebruiken, maakt u een POST aanvraag met behulp van de Analyze bewerking en geeft u de uitvoerindeling op als pdf:


POST /documentModels/prebuilt-read:analyze?output=pdf
{...}
202

Zodra de Analyze bewerking is voltooid, dient u een GET aanvraag in om de Analyze bewerkingsresultaten op te halen.

Na een geslaagde voltooiing kan de PDF worden opgehaald en gedownload als application/pdf. Met deze bewerking kunt u direct downloaden van de ingesloten tekstvorm van PDF in plaats van met Base64 gecodeerde JSON.


// Monitor the operation until completion.
GET /documentModels/prebuilt-read/analyzeResults/{resultId}
200
{...}

// Upon successful completion, retrieve the PDF as application/pdf.
GET /documentModels/prebuilt-read/analyzeResults/{resultId}/pdf
200 OK
Content-Type: application/pdf

Sleutel-waardeparen

In eerdere API-versies heeft het prebuilt-document model sleutel-waardeparen uit formulieren en documenten geëxtraheerd. Met de toevoeging van de keyValuePairs functie aan vooraf gedefinieerde indeling produceert het indelingsmodel nu dezelfde resultaten.

Sleutel-waardeparen zijn specifieke spanten binnen het document waarmee een label of sleutel en de bijbehorende reactie of waarde worden geïdentificeerd. In een gestructureerd formulier kunnen deze paren het label zijn en de waarde die de gebruiker voor dat veld heeft ingevoerd. In een ongestructureerd document kunnen ze de datum zijn waarop een contract is uitgevoerd op basis van de tekst in een alinea. Het AI-model is getraind om identificeerbare sleutels en waarden te extraheren op basis van een groot aantal documenttypen, indelingen en structuren.

Sleutels kunnen ook geïsoleerd bestaan wanneer het model detecteert dat er een sleutel bestaat, zonder gekoppelde waarde of bij het verwerken van optionele velden. In sommige gevallen kan bijvoorbeeld een veld met een middelste naam leeg blijven in een formulier. Sleutel-waardeparen zijn tekstbereiken in het document. Voor documenten waarbij dezelfde waarde op verschillende manieren wordt beschreven, bijvoorbeeld klant/gebruiker, is de bijbehorende sleutel klant of gebruiker (op basis van context).

REST-API

{your-resource-endpoint}.cognitiveservices.azure.com/documentintelligence/documentModels/prebuilt-layout:analyze?api-version=2024-02-29-preview&features=keyValuePairs

Queryvelden

Queryvelden zijn een invoegtoepassingsmogelijkheid om het schema uit te breiden dat is geëxtraheerd uit een vooraf samengesteld model of om een specifieke sleutelnaam te definiëren wanneer de sleutelnaam variabel is. Als u queryvelden wilt gebruiken, stelt u de functies queryFields in op een door komma's gescheiden lijst met veldnamen in de queryFields eigenschap.

  • Document Intelligence ondersteunt nu extracties van queryvelden. Met extractie van queryvelden kunt u velden toevoegen aan het extractieproces met behulp van een queryaanvraag zonder dat u extra training nodig hebt.

  • Gebruik queryvelden wanneer u het schema van een vooraf gedefinieerd of aangepast model wilt uitbreiden of een paar velden wilt extraheren met de uitvoer van de indeling.

  • Queryvelden zijn een premium-invoegtoepassingsmogelijkheid. Voor de beste resultaten definieert u de velden die u wilt extraheren met behulp van kameel- of Pascal-hoofdletterveldnamen voor veldnamen met meerdere woorden.

  • Queryvelden ondersteunen maximaal 20 velden per aanvraag. Als het document een waarde voor het veld bevat, worden het veld en de waarde geretourneerd.

  • Deze release heeft een nieuwe implementatie van de mogelijkheid voor queryvelden die lager is dan de eerdere implementatie en moet worden gevalideerd.

Notitie

Queryveldextractie van Document Intelligence Studio is momenteel beschikbaar met de API voor indelings- en vooraf samengestelde modellen 2024-02-29-preview 2023-10-31-preview en latere versies, met uitzondering van de US tax modellen (W2, 1098s en 1099s).

Queryveldextractie

Geef voor extractie van queryvelden de velden op die u wilt extraheren en Document Intelligence analyseert het document dienovereenkomstig. Hier volgt een voorbeeld:

  • Als u een contract in Document Intelligence Studio verwerkt, gebruikt u de 2024-02-29-preview of 2023-10-31-preview versies:

    Schermopname van de knop Queryvelden in Document Intelligence Studio.

  • U kunt een lijst met veldlabels Party1zoals , Party2, TermsOfUse, en PaymentDatePaymentTermsTermEndDate als onderdeel van de analyze document aanvraag doorgeven.

    Schermopname van het selectievenster van queryvelden in Document Intelligence Studio.

  • Document Intelligence kan de veldgegevens analyseren en extraheren en de waarden retourneren in een gestructureerde JSON-uitvoer.

  • Naast de queryvelden bevat het antwoord tekst, tabellen, selectiemarkeringen en andere relevante gegevens.

{your-resource-endpoint}.cognitiveservices.azure.com/documentintelligence/documentModels/prebuilt-layout:analyze?api-version=2024-02-29-preview&features=queryFields&queryFields=TERMS

Volgende stappen

Meer informatie: Modelindelingsmodel lezen

SDK-voorbeelden: python

Meer voorbeelden zoeken: Mogelijkheden voor invoegtoepassingen

Meer voorbeelden zoeken: Mogelijkheden voor invoegtoepassingen