Nyheter i Azure AI Document Intelligence

Det här innehållet gäller för:checkmarkv4.0 (förhandsversion)checkmarkv3.1 (GA)checkmarkv3.0 (GA)checkmarkv2.1 (GA)

Dokumentinformationstjänsten uppdateras kontinuerligt. Bokmärke den här sidan för att hålla dig uppdaterad med viktig information, funktionsförbättringar och vår senaste dokumentation.

Viktigt!

Förhandsversioner av API dras tillbaka när GA-API:et har släppts. API-versionen 2023-02-28-preview dras tillbaka, om du fortfarande använder förhandsversions-API:et eller tillhörande SDK-versioner uppdaterar du koden för att rikta in dig på den senaste API-versionen 2023-07-31 (GA).

Februari 2024

Rest-API:et för document intelligence 2024-02-29-preview är nu tillgängligt. Det här förhandsversions-API:et introducerar nya och uppdaterade funktioner:

  • Den offentliga förhandsversionen 2024-02-29-preview är för närvarande endast tillgänglig i följande Azure-regioner:

    • USA, östra
    • USA, västra 2
    • Europa, västra
  • Layoutmodellen stöder nu bildidentifiering och hierarkisk dokumentstrukturanalys (avsnitt och underavsnitt). AI-kvaliteten för identifiering av läsordning och logiska roller förbättras också.

  • Anpassade extraheringsmodeller

    • Anpassade extraheringsmodeller stöder nu konfidenspoäng på cell-, rad- och tabellnivå. Läs mer om konfidens för tabeller, rader och celler.
    • Anpassade extraheringsmodeller har AI-kvalitetsförbättringar för fältextrahering.
    • Den anpassade mallextraheringsmodellen stöder nu extrahering av överlappande fält. Läs mer om överlappande fält och hur du använder dem.
  • Anpassad klassificeringsmodell

    • Anpassad klassificeringsmodell har nu stöd för inkrementell träning för scenarier där du behöver uppdatera klassificerarmodellen med ytterligare exempel eller ytterligare klasser. Läs mer om inkrementell träning.
    • Anpassad klassificeringsmodell lägger till stöd för Office-dokumenttyper (.docx, .pptx och .xls). Läs mer om utökat stöd för dokumenttyper.
  • Fakturamodell

    • Stöd för nya nationella inställningar:
    Nationella inställningar Kod
    Arabiska (ar)
    Bulgariska (bg)
    Grekiska (el)
    Hebreiska (he)
    Makedonska (mk)
    Ryska (ru) Serbisk kyrillisk (sr-cyrl)
    Ukrainska (uk)
    Thailändska (th)
    Turkiska (tr)
    Vietnamesiska (vi)
    • Stöd för nya valutakoder:
    Valuta Nationella inställningar Kod
    BAM Bosnisk konvertibel mark (ba)
    BGN Bulgariska Lev (bg)
    ILS Israeliska nya Shekel (il)
    MKD Makedonska denar (mk)
    RUB Ryska rubel (ru)
    THB Thai Baht (th)
    TRY Turkisk lira (tr)
    UAH Ukrainska Hryvnia (ua)
    VND Vietnamesisk dong (vn)
    • Skatteposter stöder expansion för Tyskland (de), Spanien (es),Portugal (pt), Engelska Kanada en-CA.
  • ID-modell

  • 🆕 Inteckningsdokument

    • Extrahera information från Uniform Residential Loan Application (formulär 1003).
    • Extrahera information från enhetlig underskrift och överföringssammanfattning eller formulär 1008.
    • Extrahera information från upplysning om stängning av bolån.
  • 🆕 Kredit-/debetkortsmodell

    • Extrahera information från bankkort.
  • 🆕 Vigselbevis

    • Ny fördefinierade för att extrahera information från äktenskapscertifikat.

December 2023

Dokumentinformationsklientbiblioteken för REST API 2023-10-31-preview är nu tillgängliga för användning!

November 2023

Rest-API:et för document intelligence 2023-10-31-preview är nu tillgängligt. Det här förhandsversions-API:et introducerar nya och uppdaterade funktioner:

  • Förhandsversion 2023-10-31-preview är för närvarande endast tillgänglig i följande Azure-regioner:

    • USA, östra
    • USA, västra 2
    • Europa, västra
  • Läs modell

    • Språkexpansion för handskrift: Russian(ru), Arabic(ar), Thai(th).
    • Efterlevnad av Cyber Executive Order (EO).
  • Layoutmodell

    • Stöd för Office- och HTML-filer.
    • Stöd för Markdown-utdata.
    • Förbättringar av tabellextrahering, läsordning och avsnittsrubrikidentifiering.
    • Med document intelligence 2023-10-31-preview är den allmänna dokumentmodellen (fördefinierade dokumentet) inaktuell. Om du vill extrahera nyckel/värde-par från dokument prebuilt-layout använder du modellen med den valfria frågesträngsparametern features=keyValuePairs aktiverad.
  • Kvittomodell

    • Extraherar nu valuta för alla prisrelaterade fält.
  • Modell för sjukförsäkringskort

    • Nytt fältstöd för Medicare- och Medicaid-information.
  • Modeller för amerikanska skattedokument

    • Ny skattemodell från 1099. Stöder basformuläret 1099 och följande varianter: A, B, C, CAP, DIV, G, H, INT, K, LS, LTC, MISC, NEC, OID, PATR, Q, QA, R, S, SA, SB.
  • Fakturamodell

    • Stöd för KVK fält.
    • Stöd för BPAY fält.
    • Många fältförfiningar.
  • Anpassad klassificering

    • Stöd för dokument med flera språk.
    • Nya alternativ för siddelning: autosplit, dela alltid efter sida, ingen delning.
  • Tilläggsfunktioner

    • Frågefält är tillgängliga med versionen 2023-10-31-preview .
    • Tilläggsfunktioner är tillgängliga i alla modeller förutom Läs-modellen.

Kommentar

Med versionen 2022-08-31 API general availability (GA) är de associerade förhandsversions-API:erna inaktuella. Om du använder 2021-09-30-preview, API-versionerna 2022-01-30-preview eller 2022-06-30-preview uppdaterar du dina program så att de riktar in sig på API-versionen 2022-08-31. Det finns några mindre ändringar, mer information finns i migreringsguiden.

juli 2023

Kommentar

Formigenkänning är nu Azure AI Document Intelligence!

  • Dokument: Azure AI-tjänster omfattar allt som tidigare kallades Cognitive Services och Azure Applied AI Services.
  • Det finns inga ändringar i prissättningen.
  • Namnen Cognitive Services och Azure Applied AI fortsätter att användas i Azure-fakturering, kostnadsanalys, prislista och pris-API:er.
  • Det finns inga icke-bakåtkompatibla ändringar i programprogramprogramgränssnitt (API:er) eller klientbibliotek.
  • Vissa plattformar väntar fortfarande på uppdatering av namnbytet. Alla omnämnanden av Formigenkänning eller dokumentinformation i vår dokumentation avser samma Azure-tjänst.

Dokumentinformation v3.1 (GA)

Api:et för Dokumentinformation version 3.1 är nu allmänt tillgängligt (GA)! API-versionen motsvarar 2023-07-31. V3.1-API:et introducerar nya och uppdaterade funktioner:

Document Intelligence Studio UX-Uppdateringar

✔️ Analysera alternativ

  • Dokumentinformation stöder nu mer avancerade analysfunktioner och Studio tillåter en startpunkt (knappen Analysera alternativ) för att enkelt konfigurera tilläggsfunktionerna.

  • Beroende på scenariot för dokumentextrahering konfigurerar du analysintervallet, dokumentsidans intervall, valfri identifiering och premiumidentifieringsfunktioner.

    Animated screenshot showing use of the analyze-options button to configure options in Studio.

    Kommentar

    Extrahering av teckensnitt visualiseras inte i Document Intelligence Studio. Du kan dock kontrollera formatmallsavsnittet i JSON-utdata för att se resultatet av teckensnittsidentifieringen.

✔️ Automatisk etikettering av dokument med fördefinierade modeller eller en av dina egna modeller

  • På sidan med anpassade extraheringsmodeller kan du nu automatiskt märka dina dokument med någon av de fördefinierade modellerna eller modellerna i Document Intelligent Service som du tidigare har tränat.

    Animated screenshot showing auto labeling in Studio.

  • För vissa dokument kan det finnas dubbletter av etiketter när den automatiska etiketten har körts. Se till att ändra etiketterna så att det inte finns några dubblettetiketter på etikettsidan efteråt.

    Screenshot showing duplicate label warning after auto labeling.

✔️ Tabeller för automatisk etikettering

  • På sidan för anpassad extraheringsmodelletikett kan du nu automatiskt märka tabellerna i dokumentet utan att behöva märka tabellerna manuellt.

    Animated screenshot showing auto table labeling in Studio.

✔️ Lägga till testfiler direkt i din träningsdatauppsättning

  • När du har tränat en anpassad extraheringsmodell använder du testsidan för att förbättra modellkvaliteten genom att ladda upp testdokument till träningsdatauppsättningen om det behövs.

  • Om en låg konfidenspoäng returneras för vissa etiketter kontrollerar du att de är korrekt märkta. Om inte lägger du till dem i träningsdatauppsättningen och ometiketter för att förbättra modellkvaliteten.

Animated screenshot showing how to add test files to training dataset.

✔️ Använd alternativen och filtren för dokumentlistan i anpassade projekt

  • Använd etiketteringssidan för den anpassade extraheringsmodellen. Nu kan du enkelt navigera i dina träningsdokument genom att använda sökning, filter och sortering efter funktion.

  • Använd rutnätsvyn för att förhandsgranska dokument eller använda listvyn för att rulla igenom dokumenten enklare.

    Screenshot showing document list view options and filters.

✔️ Projektdelning

maj 2023

Introduktion till uppdaterad dokumentation för Build 2023

April 2023

Tillkännagivande av den senaste offentliga förhandsversionen av Document Intelligence-klientbiblioteket

Mars 2023

Viktigt!

2023-02-28-preview funktioner är för närvarande endast tillgängliga i följande regioner:

  • Västeuropa
  • USA, västra 2
  • USA, östra

2023 februari


Januari 2023

  • Fördefinierad kvittomodell – tillagda språk som stöds. Kvittomodellen har nu stöd för dessa tillagda språk och nationella inställningar

    • Japanska – Japan (ja-JP)
    • Franska – Kanada (fr-CA)
    • Nederländska – Nederländerna (nl-NL)
    • Engelska – Förenade Arabemiraten (en-AE)
    • Portugisiska – Brasilien (pt-BR)
  • Fördefinierad fakturamodell – lade till språk som stöds. Fakturamodellen stöder nu dessa tillagda språk och nationella inställningar

    • Engelska – USA (en-US), Australien (en-AU), Kanada (en-CA), Storbritannien (en-UK), Indien (en-IN)
    • Spanska - Spanien (es-ES)
    • Franska - Frankrike (fr-FR)
    • Italienska – Italien (it-IT)
    • Portugisiska – Portugal (pt-PT)
    • Nederländska – Nederländerna (nl-NL)
  • Fördefinierad fakturamodell – tillagda fält som identifieras. Fakturamodellen känner nu igen de här tillagda fälten

    • Valutakod
    • Betalningsalternativ
    • Total rabatt
    • Skatteobjekt (endast en-IN)
  • Fördefinierad ID-modell – lade till dokumenttyper som stöds. ID-modellen stöder nu dessa tillagda dokumenttyper

    • Amerikanskt militär-ID

Dricks

Alla uppdateringar för januari 2023 är tillgängliga med REST API version 2022-08-31 (GA).

  • Fördefinierad kvittomodell – ytterligare språkstöd:

    Den fördefinierade kvittomodellen lägger till stöd för följande språk:

    • Engelska – Förenade Arabemiraten (en-AE)
    • Nederländska – Nederländerna (nl-NL)
    • Franska – Kanada (fr-CA)
    • Tyska - (de-DE)
    • Italienska - (it-IT)
    • Japanska – Japan (ja-JP)
    • Portugisiska – Brasilien (pt-BR)
  • Fördefinierad fakturamodell – ytterligare språkstöd och fältextraheringar

    Den fördefinierade fakturamodellen lägger till stöd för följande språk:

    • Engelska - Australien (en-AU), Kanada (en-CA), Storbritannien (en-UK), Indien (en-IN)
    • Portugisiska – Brasilien (pt-BR)

    Den fördefinierade fakturamodellen lägger nu till stöd för följande fältextraheringar:

    • Valutakod
    • Betalningsalternativ
    • Total rabatt
    • Skatteobjekt (endast en-IN)
  • Fördefinierad ID-dokumentmodell – ytterligare stöd för dokumenttyper

    Den fördefinierade ID-dokumentmodellen lägger nu till stöd för följande dokumenttyper:

    • Expansion av körkort som stöder Indien, Kanada, Storbritannien och Australien
    • Amerikanska militära ID-kort och dokument
    • Indien ID-kort och dokument (PAN och Aadhaar)
    • Australien ID-kort och dokument (fotokort, Nyckel-pass-ID)
    • Kanada ID-kort och dokument (ID-kort, Maple-kort)
    • ID-kort och dokument i Storbritannien (nationellt/regionalt identitetskort)

December 2022

  • Uppdateringar av Document Intelligence Studio

    Document Intelligence Studio-versionen i december innehåller de senaste uppdateringarna av Document Intelligence Studio. Det finns betydande förbättringar av användarupplevelsen, främst med stöd för anpassad modelletikettering.

    • Sidintervall. Studio stöder nu analys av angivna sidor från ett dokument.

    • Anpassad modelletikettering:

      • Kör layout-API:et automatiskt. Du kan välja att köra layout-API:et för alla dokument automatiskt i bloblagringen under konfigurationsprocessen för den anpassade modellen.

      • Söka. Studio innehåller nu sökfunktioner för att hitta ord i ett dokument. Den här förbättringen möjliggör enklare navigering vid etikettering.

      • Navigering. Du kan välja etiketter som mål för etiketterade ord i ett dokument.

      • Automatisk tabelletikettering. När du har valt tabellikonen i ett dokument kan du välja att automatiskt märka den extraherade tabellen i etikettvyn.

      • Etikettundertyper och undertyper på andra nivån Studio stöder nu undertyper för tabellkolumner, tabellrader och undertyper på andra nivån för typer som datum och tal.

  • Det finns nu stöd för att skapa anpassade neurala modeller i regionen US Gov Virginia.

  • Förhandsversioner av API:et 2022-01-30-preview och 2021-09-30-preview dras tillbaka den 31 januari 2023. Uppdatera till API-versionen 2022-08-31 för att undvika avbrott i tjänsten.


November 2022

  • Vi presenterar den senaste stabila versionen av Azure AI Document Intelligence-bibliotek
    • Den här versionen innehåller viktiga ändringar och uppdateringar för .NET-, Java-, JavaScript- och Python-klientbibliotek. Mer information finns iAzure SDK DevBlog.
    • De viktigaste förbättringarna är introduktionen av två nya klienter, DocumentAnalysisClient och DocumentModelAdministrationClient.

Oktober 2022

  • Innehåll med version av dokumentinformation

    • Dokumentationen om dokumentinformation uppdateras för att presentera en version av upplevelsen. Nu kan du välja att visa innehåll som är inriktat på v3.0 GA upplevelsen eller v2.1 GA upplevelsen. V3.0-upplevelsen är standard.

      Screenshot of the Document Intelligence landing page denoting the version dropdown menu.

  • Exempelkod för Document Intelligence Studio

    • Exempelkod för Document Intelligence Studio-etiketteringsfunktionen är nu tillgänglig på GitHub. Kunder kan utveckla och integrera dokumentinformation i sitt eget UX eller skapa ett eget nytt UX med hjälp av Exempelkoden för Document Intelligence Studio.
  • Språkexpansion

    • Med den senaste förhandsversionen stöder Modeller för dokumentinformationsläsning (OCR), layout och anpassade mallar 134 nya språk. Dessa språktillägg inkluderar grekiska, lettiska, serbiska, thailändska, ukrainska och vietnamesiska, tillsammans med flera latinska och kyrilliska språk. Dokumentinformation har nu totalt 299 språk som stöds i de senaste ga- och nya förhandsversionerna. Se sidan språk som stöds för att se alla språk som stöds.
    • Använd REST API-parametern api-version=2022-06-30-preview när du använder API:et eller motsvarande SDK för att stödja de nya språken i dina program.
  • Ny fördefinierad kontraktsmodell

    • En ny fördefinierade som extraherar information från kontrakt som parter, titel, kontrakt-ID, körningsdatum med mera. kontraktmodellen är för närvarande i förhandsversion och begär åtkomst här.
  • Regionexpansion för träning av anpassade neurala modeller

    • Träning av anpassade neurala modeller stöds nu i tillagda regioner.
      • East US
      • USA, östra 2
      • US Gov, Arizona

September 2022

Kommentar

Från och med version 4.0.0 har en ny uppsättning klienter introducerats för att utnyttja de senaste funktionerna i document intelligence-tjänsten.

SDK version 4.0.0 GA innehåller följande uppdateringar:

  • Version 4.0.0 GA (2022-09-08)
  • Stöder REST API v3.0- och v2.0-klienter

Paket (NuGet)

Ändringslogg/versionshistorik

Migreringsguide

Readme

Exempel

  • Regionexpansion för träning av anpassade neurala modeller stöds nu i sex nya regioner

    • Australien, östra
    • Central US
    • Asien, östra
    • Frankrike, centrala
    • Södra Storbritannien
    • USA, västra 2
    • En fullständig lista över regioner där träning stöds finns i anpassade neurala modeller.

    • Version av Document Intelligence SDK 4.0.0 GA :

      • Dokumentinformationsklientbibliotek version 4.0.0 (.NET/C#, Java, JavaScript) och version 3.2.0 (Python) är allmänt tillgängliga och redo att användas i produktionsprogram!.
      • Mer information om dokumentinformationsklientbibliotek finns i SDK-översikten.
      • Uppdatera dina program med hjälp av programmeringsspråkets migreringsguide.

Augusti 2022

Förhandsversionen av Document Intelligence SDK beta augusti 2022 innehåller följande uppdateringar:

Version 4.0.0-beta.5 (2022-08-09)

Ändringslogg/versionshistorik

Paket (NuGet)

Referensdokumentation för SDK

  • Dokumentinformation v3.0 allmänt tillgänglig

    • Document Intelligence REST API v3.0 är nu allmänt tillgängligt och redo för användning i produktionsprogram! Uppdatera dina program med REST API version 2022-08-31.
  • Uppdateringar av Document Intelligence Studio

    • Nästa steg. Under varje modellsida har Studio nu ett nästa steg-avsnitt. Användare kan snabbt referera till exempelkod, felsökningsriktlinjer och prisinformation.
    • Anpassade modeller. Studio innehåller nu möjligheten att ändra ordning på etiketter i anpassade modellprojekt för att förbättra etiketteffektiviteten.
    • Kopiera modeller Anpassade modeller kan kopieras mellan dokumentinformationstjänster från Studio. Åtgärden möjliggör befordran av en tränad modell till andra miljöer och regioner.
    • Ta bort dokument. Studio stöder nu borttagning av dokument från etiketterade datamängder i anpassade projekt.
  • Uppdateringar av dokumentinformationstjänsten

    • prebuilt-read. Läs OCR-modellen är nu också tillgänglig i Dokumentinformation med stycken och språkidentifiering som de två nya funktionerna. Document Intelligence Read riktar in sig på avancerade dokumentscenarier som är anpassade till de bredare funktionerna för dokumentinformation i Dokumentinformation.
    • fördefinierad layout. Layoutmodellen extraherar stycken och huruvida den extraherade texten är ett stycke, rubrik, avsnittsrubrik, fotnot, sidhuvud, sidfot eller sidnummer.
    • fördefinierad faktura. Fälten TotalVAT och Line/VAT matchas nu till de befintliga fälten TotalTax respektive Line/Tax.
    • prebuilt-idDocument. Stöd för dataextrahering för amerikanska tillstånds-ID, social trygghet och gröna kort. Stöd för information om passvisum.
    • förinställt kvitto. Utökat språkstöd för franska (fr-FR), spanska (es-ES), portugisiska (pt-PT), italienska (it-IT) och tyska (de-DE).
    • prebuilt-businessCard. Stöd för adressparse för att extrahera underfält för adresskomponenter som adress, ort, delstat, land/region och postnummer.
  • Förbättringar av AI-kvalitet

    • prebuilt-read. Förbättrat stöd för enstaka tecken, handskrivna datum, belopp, namn, andra viktiga data som ofta finns i kvitton och fakturor samt förbättrad bearbetning av digitala PDF-dokument.
    • fördefinierad layout. Stöd för bättre identifiering av beskurna tabeller, kantlösa tabeller och förbättrad igenkänning av långa celler.
    • prebuilt-document. Förbättrad värde- och kryssruteidentifiering.
    • custom-neural. Förbättrad noggrannhet för tabellidentifiering och extrahering.

Juni 2022

  • Förhandsversionen av Document Intelligence SDK beta juni 2022 innehåller följande uppdateringar:
  • Document Intelligence Studio Juni-versionen är den senaste uppdateringen av Document Intelligence Studio. Det finns betydande användarupplevelse och hjälpmedelsförbättringar som åtgärdas i den här uppdateringen:

    • Kodexempel för JavaScript och C#. Fliken Studio-kod lägger nu till JavaScript- och C#-kodexempel utöver det befintliga Python-kodexemplet.
    • Nytt användargränssnitt för dokumentuppladdning. Studio stöder nu uppladdning av ett dokument med dra och släpp till det nya uppladdningsanvändargränssnittet.
    • Ny funktion för anpassade projekt. Anpassade projekt har nu stöd för att skapa lagringskonto och blobar när projektet konfigureras. Dessutom stöder anpassat projekt nu uppladdning av träningsfiler direkt i Studio och kopiering av den befintliga anpassade modellen.
  • Document Intelligence v3.0 2022-06-30-preview release presenterar omfattande uppdateringar i funktions-API:erna:


Februari 2022

  • Förhandsversionen av Document Intelligence v3.0 introducerar flera nya funktioner, funktioner och förbättringar:

    • Anpassad neural modell eller anpassad dokumentmodell är en ny anpassad modell för att extrahera text- och urvalsmarkeringar från strukturerade formulär, halvstrukturerade och ostrukturerade dokument.
    • Den fördefinierade W-2-modellen är en ny fördefinierad modell för att extrahera fält från W-2-formulär för scenarier för skatterapportering och inkomstverifiering.
    • Läs-API extraherar tryckta textrader, ord, textplatser, identifierade språk och handskriven text om det upptäcks.
    • Den allmänna modellen för förträning av dokument har nu uppdaterats för att stödja urvalsmarkeringar utöver API-text, tabeller, struktur och nyckel/värde-par från formulär och dokument.
    • Den fördefinierade fakturamodellen faktura-API :et utökar stödet till spanska fakturor.
    • Document Intelligence Studio lägger till nya demonstrationer för Read, W2, Hotel-kvittoexempel och stöd för träning av de nya anpassade neurala modellerna.
    • Språkexpansion Dokumentinformation Läs, Layout och Anpassat formulär lägger till stöd för 42 nya språk, inklusive arabiska, hindi och andra språk med hjälp av arabiska och Devanagari-skript för att utöka täckningen till 164 språk. Stöd för handskrivna språk utökas till japanska och koreanska.
  • Kom igång med det nya REST-API:et, Python eller .NET SDK för förhandsversions-API:et v3.0.

  • Extrahering av dokumentinformationsmodelldata:

    Modell Extrahering av text Nyckel/värde-par Markeringsmarkeringar Tabeller Signaturer
    Lästa
    Allmänt dokument
    Layout
    Faktura
    Kvitto
    ID-dokument
    Visitkort
    Anpassad mall
    Anpassad neural
  • Förhandsversionen av Document Intelligence SDK beta innehåller följande uppdateringar:


November 2021

  • Document Intelligence v3.0 preview SDK release update (beta.2) innehåller buggkorrigeringar och mindre funktionsuppdateringar.

Oktober 2021

  • Document Intelligence v3.0 förhandsversion version 4.0.0-beta.1 (2021-10-07)introducerar flera nya funktioner:

    • Allmän dokumentmodell är ett nytt API som använder en förtränad modell för att extrahera text, tabeller, struktur och nyckel/värde-par från formulär och dokument.

    • Hotellkvittomodell har lagts till för fördefinierad kvittobearbetning.

    • Expanderade fält för ID-dokument ID-modellen stöder godkännanden, begränsningar och extrahering av fordonsklassificering från amerikanska körkort.

    • Signaturfält är en ny fälttyp i anpassade formulär för att identifiera förekomsten av en signatur i ett formulärfält.

    • Stöd för språkexpansion för 122 språk (utskrift) och 7 språk (handskriven). Dokumentinformationslayout och anpassat formulär utökar språk som stöds till 122 med den senaste förhandsversionen. Förhandsversionen innehåller textextrahering för tryckt text på 49 nya språk, inklusive ryska, bulgariska och andra kyrilliska och fler latinska språk. Dessutom stöder extrahering av handskriven text nu sju språk som inkluderar engelska och nya förhandsversioner av förenklad kinesiska, franska, tyska, italienska, portugisiska och spanska.

    • Förbättringar av tabeller och textextrahering Layout stöder nu extrahering av tabeller med en rad, även kallade nyckel/värde-tabeller. Förbättringar av textextrahering omfattar bättre bearbetning av digitala PDF-filer och MRZ-text (Machine Readable Zone) i identitetsdokument, tillsammans med allmänna prestanda.

    • Document Intelligence Studio För att förenkla användningen av tjänsten kan du nu komma åt Document Intelligence Studio för att testa de olika fördefinierade modellerna eller etiketterna och träna en anpassad modell.

    • Kom igång med det nya REST-API:et, Python eller .NET SDK för förhandsversions-API:et v3.0.

  • Extrahering av dokumentinformationsmodelldata

    Modell Extrahering av text Nyckel/värde-par Markeringsmarkeringar Tabeller
    Allmänt dokument
    Layout
    Faktura
    Kvitto
    ID-dokument
    Visitkort
    Anpassat

September 2021

  • Avancerade funktioner i Azure Metrics Explorer finns på sidan Översikt över dokumentinformationsresurser i Azure-portalen.

  • Övervakningsmeny:

    Screenshot showing the monitoring menu in the Azure portal.

  • Diagram:

    Screenshot showing an example metric chart in the Azure portal.

  • Uppdatering av ID-dokumentmodell : angivna namn, inklusive ett suffix, med eller utan punkt (fullständigt stopp), process:

    Indatatext Resultat med uppdatering
    William Isaac Kirby Jr. Förnamn: William Isaac

    LastName: Kirby Jr.
    Henry Caleb Ross Sr Förnamn: Henry Caleb

    Efternamn: Ross Sr.

Juli 2021


Juni 2021

  • Dokumentinformationscontainrar v2.1 släpptes i gated preview och stöds nu av sex funktionscontainrar – Layout, Visitkort, ID-dokument, Kvitto, Faktura och Anpassad. Om du vill använda dem måste du skicka en onlinebegäran och få godkännande.

  • Document Intelligence-anslutningsappen släpptes i förhandsversionen: Document Intelligence-anslutningsappen integreras med Azure Logic Apps, Microsoft Power Automate och Microsoft Power Apps. Anslutningsappen stöder arbetsflödesåtgärder och utlösare för att extrahera och analysera dokumentdata och struktur från anpassade och fördefinierade formulär, fakturor, kvitton, visitkort och ID-dokument.

  • Document Intelligence SDK v3.1.0 korrigerat till v3.1.1 för C#, Java och Python. Korrigeringen adresserar fakturor som inte har underradsobjektfält som identifierats, till exempel en FormField med Text men ingen BoundingBox eller Page information.


Maj 2021

  • Version 3.1.0 (2021-05-26)

Referensdokumentation för Ändringslogg/Versionshistorik| NuGet-paket version 3.0.1 | |

  • Dokumentinformation 2.1 är allmänt tillgänglig. Ga-versionen markerar stabiliteten för de ändringar som introducerades i tidigare versioner av förhandsversionen av förhandsversionen av 2.1-paketet. Med den här versionen kan du identifiera och extrahera information och data från följande dokumenttyper:

  • Kom igång genom att prova exempelverktyget för dokumentinformation och följa snabbstarten.

  • Den uppdaterade layout-API-tabellfunktionen lägger till rubrikigenkänning med kolumnrubriker som kan sträcka sig över flera rader. Varje tabellcell har ett attribut som anger om det är en del av ett huvud eller inte. Den här uppdateringen kan användas för att identifiera vilka rader som utgör tabellrubriken.


April 2021

  • NuGet-paketversion 3.1.0-beta.4

  • Ändringslogg/versionshistorik.

  • Nya metoder för att analysera data från identitetsdokument:

    StartRecognizeIdDocumentsFromUriAsync

    StartRecognizeIdDocumentsAsync

    En lista över fältvärden finns i Fält som extraherats i dokumentationen för dokumentinformation.

  • Expanderade den uppsättning dokumentspråk som kan anges till metoden StartRecognizeContent.

  • Ny egenskap Pages som stöds av följande klasser:

    RecognizeBusinessCardsOptions
    RecognizeCustomFormsOptions

    RecognizeInvoicesOptions

    RecognizeReceiptsOptions

    Med Pages egenskapen kan du välja enskilda sidor eller ett antal sidor för PDF- och TIFF-dokument med flera sidor. För enskilda sidor anger du sidnumret, till exempel 3. För ett intervall med sidor (t.ex. sida 2 och sidorna 5–7) anger du p-åldersnumren och intervallen avgränsade med kommatecken: 2, 5-7.

  • Ny egenskap ReadingOrder som stöds för följande klass:

    RecognizeContentOptions

    Egenskapen ReadingOrder är en valfri parameter som gör att du kan ange vilken läsordningsalgoritm som naturalbasic ska användas för att ordna extrahering av textelement. Om det inte anges är basicstandardvärdet .

  • SDK-förhandsversionsuppdateringar för API-versionen 2.1-preview.3 introducerar funktionsuppdateringar och förbättringar.

Mars 2021

Document Intelligence v2.1 public preview v2.1-preview.3 har släppts och innehåller följande funktioner:

  • Ny fördefinierad ID-modell Den nya fördefinierade ID-modellen gör det möjligt för kunder att ta ID:n och returnera strukturerade data för att automatisera bearbetningen. Den kombinerar våra kraftfulla OCR-funktioner (Optical Character Recognition) med ID Understanding-modeller för att extrahera viktig information från pass och amerikanska körkort.

    Läs mer om den fördefinierade ID-modellen

    Screenshot of a sample passport.

  • Extrahering av radobjekt för fakturamodell – Den fördefinierade fakturamodellen har nu stöd för extrahering av radobjekt. Nu extraheras fullständiga objekt och deras delar – beskrivning, mängd, kvantitet, produkt-ID, datum med mera. Med ett enkelt API/SDK-anrop kan du extrahera användbara data från dina fakturor – text, tabell, nyckel/värde-par och radobjekt.

    Läs mer om fakturamodellen.

  • Övervakad tabelletikettering och träning, etikettering med tomt värde – Utöver document intelligences avancerade funktioner för automatisk extrahering av tabeller med djupinlärning kan kunderna nu märka och träna på tabeller. Den här nya versionen innehåller möjligheten att märka och träna på radobjekt/tabeller (dynamiska och fasta) och träna en anpassad modell för att extrahera nyckel/värde-par och radobjekt. När en modell har tränats extraherar modellen radobjekt som en del av JSON-utdata i avsnittet documentResults.

    Screenshot of the table labeling feature.

    Förutom att märka tabeller kan du nu märka tomma värden och regioner. Om vissa dokument i träningsuppsättningen inte har värden för vissa fält kan du märka dem så att din modell vet att extrahera värden korrekt från analyserade dokument.

  • Stöd för 66 nya språk – Layout-API:et och anpassade modeller för dokumentinformation stöder nu 73 språk.

    Läs mer om språkstöd för Document Intelligence.

  • Naturlig läsordning, handskriftsklassificering och sidval – Med den här uppdateringen kan du välja att hämta textradsutdata i den naturliga läsordningen i stället för standardordningen från vänster till höger och upp till nederkant. Använd den nya frågeparametern readingOrder och ställ in den på "naturligt" värde för ett mer människovänligt läsordningsutdata. För latinska språk klassificerar Document Intelligence dessutom textrader som handskrivna format eller inte och ger en konfidenspoäng.

  • Kvalitetsförbättringar för fördefinierade kvittomodeller Den här uppdateringen innehåller många kvalitetsförbättringar för den fördefinierade kvittomodellen, särskilt kring extrahering av radobjekt.


November 2020

  • Document Intelligence v2.1-preview.2 har släppts och innehåller följande funktioner:

    • Ny fördefinierad fakturamodell – Den nya fördefinierade fakturamodellen gör det möjligt för kunder att ta fakturor i olika format och returnera strukturerade data för att automatisera fakturabearbetningen. Den kombinerar våra kraftfulla OCR-funktioner (Optical Character Recognition) med modeller för att förstå djupinlärningsmodeller för att extrahera viktig information från fakturor på engelska. Den extraherar nyckeltext, tabeller och information som kund, leverantör, faktura-ID, fakturaförfallodatum, total, förfallobelopp, skattebelopp, leverans till och faktura till.

      Läs mer om den fördefinierade fakturamodellen

      Screenshot of a sample invoice.

    • Förbättrad extrahering av tabeller – Dokumentinformation ger nu förbättrad extrahering av tabeller, vilket kombinerar våra kraftfulla OCR-funktioner (Optisk teckenigenkänning) med en extraheringsmodell för djupinlärningstabeller. Dokumentinformation kan extrahera data från tabeller, inklusive komplexa tabeller med sammanfogade kolumner, rader, inga kantlinjer och mer.

      Screenshot of tables analysis.

      Läs mer om extrahering av layout.

    • Uppdatering av klientbibliotek – De senaste versionerna av klientbiblioteken för .NET, Python, Java och JavaScript stöder API:et document intelligence 2.1.

    • Nytt språk stöds: Japanska – Följande nya språk stöds nu: för AnalyzeLayout och AnalyzeCustomForm: Japanska (ja). Språkstöd.

    • Textradsformatindikering (handskriven/annan) (endast latinska språk) – Dokumentinformation matar nu ut ett appearance objekt som klassificerar om varje textrad är handskriven eller inte, tillsammans med en konfidenspoäng. Den här funktionen stöds endast för latinska språk.

    • Kvalitetsförbättringar – Extraheringsförbättringar inklusive förbättringar av extrahering av ensiffriga siffror.

    • Ny try-it-out-funktion i exempel- och märkningsverktyget för dokumentinformation – Möjlighet att prova färdiga modeller för faktura, kvitto och visitkort och LAYOUT-API:et med hjälp av exempeletikettverktyget för dokumentinformation. Se hur dina data extraheras utan att skriva någon kod.

    • Prova verktyget Exempeletiketter för dokumentinformation

      Screenshot of the Sample Labeling tool homepage.

      • Feedbackloop – När du analyserar filer via verktyget Exempeletiketter kan du nu också lägga till den i träningsuppsättningen och justera etiketterna om det behövs och träna för att förbättra modellen.
      • Autoetikettdokument – Etikettera automatiskt dokument som lagts till baserat på tidigare etiketterade dokument i projektet.

Augusti 2020

  • **Dokumentinformation v2.1-preview.1 innehåller följande funktioner:

    • REST API-referens är tillgänglig – Visa v2.1-preview.1 reference.
    • Nya språk stöds Förutom engelska stöds nu följande språk : för Layout och Train Custom Model: engelska (en), kinesiska (förenklad) (zh-Hans), nederländska (nl), franska (fr), tyska (de), italienska (it), portugisiska (pt) och spanska (es).
    • Kryssruta/Markeringsmarkeringsidentifiering – Dokumentinformation stöder identifiering och extrahering av markeringsmarkeringar, till exempel kryssrutor och alternativknappar. Markeringsmarkeringar extraheras i Layout och du kan nu även märka och träna iTrain Custom Model - Träna med etiketter för att extrahera nyckel/värde-par för markeringsmarkeringar.
    • Model Compose – gör att flera modeller kan skrivas och anropas med ett enda modell-ID. När du skickar ett dokument som ska analyseras med ett sammansatt modell-ID utförs först ett klassificeringssteg för att dirigera det till rätt anpassad modell. Model Compose är tillgängligt för Train Custom Model - Träna med etiketter.
    • Modellnamn – lägg till ett eget namn i dina anpassade modeller för enklare hantering och spårning.
    • Ny fördefinierad modell för visitkort för att extrahera vanliga fält på engelska, språk visitkort.
    • Nya nationella inställningar för fördefinierade kvitton utöver EN-US finns nu stöd för EN-AU, EN-CA, EN-GB, EN-IN.
    • Kvalitetsförbättringar för Layout, Train Custom Model - Träna utan etiketter och Träna med etiketter.
  • v2.0 innehåller följande uppdatering:

    • Klientbiblioteken för NET, Python, Java och JavaScript är allmänt tillgängliga.

    Nya exempel finns på GitHub.

    • Kunskapsextraheringsrecept – Forms-spelboken samlar in metodtips från verkliga kundengagemang för Dokumentinformation och tillhandahåller användbara kodexempel, checklistor och exempelpipelines som används för att utveckla dessa projekt.
    • Verktyget Exempeletiketter har uppdaterats för att stödja den nya v2.1-funktionen. Se den här snabbstarten för att komma igång med verktyget.
    • Exemplet intelligent kioskdokumentinformation visar hur du integrerar Analyze Receipt och Train Custom Model - tränar utan etiketter.

Juli 2020

  • Dokumentinformation v2.0-referens tillgänglig – Visa api-referensen för v2.0 och de uppdaterade klientbiblioteken för .NET, Python, Java och JavaScript.
    • Förbättringar av tabeller och extrahering – innehåller förbättringar av noggrannhet och förbättringar av tabellextraheringar, särskilt möjligheten att lära sig tabellers rubriker och strukturer i anpassat tåg utan etiketter.

    • Valutastöd – Identifiering och extrahering av globala valutasymboler.

    • Azure Gov – Dokumentinformation är nu också tillgängligt i Azure Gov.

    • Förbättrade säkerhetsfunktioner:


Juni 2020


April 2020

  • SDK-stöd för Document Intelligence API v2.0 Offentlig förhandsversion – Den här månaden har vi utökat vårt tjänststöd för att inkludera en förhandsversion av SDK för Document Intelligence v2.0-versionen. Använd de här länkarna för att komma igång med ditt valfritt språk:
  • .NET SDK
  • Java SDK
  • Python SDK
  • JavaScript SDK

Den nya SDK:n stöder alla funktioner i rest-API:et v2.0 för dokumentinformation. Du kan dela din feedback om klientbiblioteken via SDK-feedbackformuläret.


Mars 2020

  • Värdetyper för etikettering Du kan nu ange de typer av värden som du etiketterar med verktyget Exempeletiketter för dokumentinformation. Följande värdetyper och varianter stöds för närvarande:
  • string
    • default, no-whitespaces, alphanumeric
  • number
    • Standard currency
  • date
    • default, dmy, mdy, ymd
  • time
  • integer

Se verktygsguiden för exempeletiketter för att lära dig hur du använder den här funktionen.

  • Tabellvisualisering Verktyget Exempeletiketter visar nu tabeller som har identifierats i dokumentet. Med den här funktionen kan du visa identifierade och extraherade tabeller från dokumentet innan du etiketterar och analyserar. Den här funktionen kan aktiveras/inaktiveras med alternativet lager.

  • Följande bild är ett exempel på hur tabeller identifieras och extraheras:

    Screenshot of table visualization using the Sample Labeling tool.

  • De extraherade tabellerna är tillgängliga i JSON-utdata under "pageResults".

    Viktigt!

    Etiketteringstabeller stöds inte. Om tabeller inte känns igen och extraheras automatiskt kan du bara märka dem som nyckel/värde-par. När du etiketterar tabeller som nyckel/värde-par, etiketterar du varje cell som ett unikt värde.

  • Extraheringsförbättringar.

  • Den här versionen innehåller extraheringsförbättringar och precisionsförbättringar, särskilt möjligheten att märka och extrahera flera nyckel/värde-par i samma textrad.

  • Exempelverktyget för etikettering är nu öppen källkod.

  • Verktyget Exempeletiketter för dokumentinformation är nu tillgängligt som ett projekt med öppen källkod. Du kan integrera den i dina lösningar och göra kundspecifika ändringar för att uppfylla dina behov.

  • Mer information om verktyget Exempeletiketter för dokumentinformation finns i dokumentationen som är tillgänglig på GitHub.

  • TLS 1.2 Verkställighet.

  • TLS 1.2 tillämpas nu för alla HTTP-begäranden till den här tjänsten. Mer information finns i Säkerhet för Azure AI-tjänster.


Januari 2020

Den här versionen introducerar Document Intelligence 2.0. I nästa avsnitt hittar du mer information om nya funktioner, förbättringar och ändringar.

  • Nya funktioner

    • Anpassad modell

      • Träna med etiketter Du kan nu träna en anpassad modell med manuellt märkta data. Den här metoden resulterar i bättre presterande modeller och kan skapa modeller som fungerar med komplexa formulär eller formulär som innehåller värden utan nycklar.
      • Asynkront API Du kan använda asynkrona API-anrop för att träna med och analysera stora datamängder och filer.
      • Stöd för TIFF-filer Du kan nu träna med och extrahera data från TIFF-dokument.
      • Förbättringar av extraheringsprecision.
    • Fördefinierad kvittomodell

      • Tipsbelopp Du kan nu extrahera tipsmängder och andra handskrivna värden.
      • Extrahering av radobjekt Du kan extrahera radobjektvärden från kvitton.
      • Konfidensvärden Du kan visa modellens förtroende för varje extraherat värde.
      • Förbättringar av extraheringsprecision.
      • Extrahering av layout Du kan nu använda layout-API:et för att extrahera textdata och tabelldata från dina formulär.
  • Api-ändringar för anpassad modell

    Alla API:er för träning och användning av anpassade modeller har bytt namn och vissa synkrona metoder är nu asynkrona. Följande är viktiga ändringar:

    • Processen för att träna en modell är nu asynkron. Du initierar träningen via API-anropet /custom/models . Det här anropet returnerar ett åtgärds-ID som du kan skicka till anpassade/modeller/{modelID} för att returnera träningsresultatet.
    • Extrahering av nyckel/värde initieras nu av API-anropet /custom/models/{modelID}/analyze . Det här anropet returnerar ett åtgärds-ID som du kan skicka till anpassade/modeller/{modelID}/analyzeResults/{resultID} för att returnera extraheringsresultatet.
    • Åtgärds-ID:t för tågåtgärden finns nu i platsrubriken för HTTP-svar, inte i rubriken Åtgärd-plats.
  • Api-ändringar för kvitto

    • API:erna för att läsa försäljningskvitton har bytt namn.

    • Extrahering av kvittodata initieras nu av API-anropet /prebuilt/receipt/analyze . Det här anropet returnerar ett åtgärds-ID som du kan skicka till /prebuilt/receipt/analyzeResults/{resultID} för att returnera extraheringsresultatet.

  • Ändringar i utdataformat

    • JSON-svaren för alla API-anrop har nya format. Vissa nycklar och värden läggs till, tas bort eller byts namn. Se snabbstarterna för exempel på aktuella JSON-format.

Nästa steg

  • Prova att bearbeta dina egna formulär och dokument med Document Intelligence Studio.

  • Slutför en snabbstart för dokumentinformation och kom igång med att skapa en app för dokumentbearbetning på valfritt utvecklingsspråk.

  • Prova att bearbeta dina egna formulär och dokument med verktyget Exempeletiketter för dokumentinformation.

  • Slutför en snabbstart för dokumentinformation och kom igång med att skapa en app för dokumentbearbetning på valfritt utvecklingsspråk.