Az Azure AI-dokumentumintelligencia újdonságai

Ez a tartalom a következőre vonatkozik::checkmarkv4.0 (előzetes verzió)checkmarkv3.1 (GA)checkmarkv3.0 (GA)checkmarkv2.1 (GA)

A Document Intelligence szolgáltatás folyamatosan frissül. Könyvjelzővel jelenik meg a lap, hogy naprakész maradjon a kibocsátási megjegyzésekkel, a funkciófejlesztésekkel és a legújabb dokumentációval.

Fontos

Az előzetes verziójú API-verziók a GA API kiadása után megszűnnek. A 2023-02-28-as verziójú API-verzió kivonása folyamatban van, ha továbbra is az előzetes verziójú API-t vagy a kapcsolódó SDK-verziót használja, frissítse a kódot a legújabb 2023-07-31-es API-verzióra (GA).

2024. február

A Document Intelligence 2024-02-29-preview REST API már elérhető. Ez az előzetes verziójú API új és frissített képességeket vezet be:

  • A nyilvános előzetes verzió 2024-02-29 előzetes verziója jelenleg csak a következő Azure-régiókban érhető el:

    • USA keleti régiója
    • USA2 nyugati régiója
    • Nyugat-Európa
  • Az elrendezési modell mostantól támogatja az ábraészlelést és a hierarchikus dokumentumstruktúra-elemzést (szakaszok és alszakaszok). Az olvasási sorrend és a logikai szerepkör-észlelés AI-minősége is javul.

  • Egyéni extrakciós modellek

    • Az egyéni kinyerési modellek mostantól támogatják a cella-, sor- és táblaszintű megbízhatósági pontszámokat. További információ a táblázatról, a sorról és a cella megbízhatóságáról.
    • Az egyéni extrakciós modellek AI-minőségi fejlesztésekkel rendelkeznek a mezőkinyeréshez.
    • Az egyéni sablonkinyerési modell mostantól támogatja az átfedésben lévő mezők kinyerését. További információ az átfedésben lévő mezőkről és azok használatáról.
  • Egyéni besorolási modell

    • Az egyéni besorolási modell mostantól támogatja a növekményes betanítást olyan forgatókönyvek esetében, ahol az osztályozómodellt további mintákkal vagy további osztályokkal kell frissítenie. További információ a növekményes betanításról.
    • Az egyéni besorolási modell támogatja az Office-dokumentumtípusokat (.docx, .pptx és .xls). További információ a bővített dokumentumtípus támogatásáról.
  • Számlamodell

    • Új területi beállítások támogatása:
    Területi beállítás Kód
    Arab (ar)
    Bolgár (bg)
    Görög (el)
    héber (he)
    Macedón (mk)
    Orosz (ru) Szerb cirill (sr-cyrl)
    Ukrán (uk)
    Thai (th)
    Török (tr)
    Vietnámi (vi)
    • Új pénznemkódok támogatása:
    Pénznem Területi beállítás Kód
    BAM Bosnyák kabriójel (ba)
    BGN Bolgár Lev (bg)
    ILS Izraeli új sékel (il)
    MKD Macedón dénár (mk)
    RUB Orosz rubel (ru)
    THB Thai Baht (th)
    TRY Török líra (tr)
    UAH Ukrán hrivnya (ua)
    VND Vietnami dong (vn)
    • Az adótételek németországi (), spanyolországi (dees),portugáliai (pt), angol-kanadai en-CA– bővülést támogatnak.
  • Azonosító modell

  • 🆕 Jelzáloghitel-dokumentumok

    • Információk kinyerve az egységes lakáshitel-kérelemből (1003-at tartalmazó űrlap).
    • Információk kinyerése egységes jegyzési és továbbítási összegzésből vagy 1008-ból.
    • Információk kinyerése a jelzálog-záró közzétételből.
  • 🆕 Hitel-/bankkártya-modell

    • Információk kinyerve a bankkártyákból.
  • 🆕 Házassági anyakönyvi kivonat

    • Új előre összeállított, a házassági anyakönyvi kivonatok adatainak kinyeréséhez.

2023. december

A REST API 2023-10-31 előzetes verzióját célzó Dokumentumintelligencia-ügyfélkódtárak már használhatók!

2023. november

A Document Intelligence 2023-10-31-preview REST API már elérhető. Ez az előzetes verziójú API új és frissített képességeket vezet be:

  • A nyilvános előzetes verzió 2023-10-31 előzetes verziója jelenleg csak a következő Azure-régiókban érhető el:

    • USA keleti régiója
    • USA2 nyugati régiója
    • Nyugat-Európa
  • Modell olvasása

    • Nyelvbővítés kézíráshoz: orosz(ru), arab(ar), thai(th).
    • Cyber Executive Order (EO) megfelelőség.
  • Elrendezési modell

    • Office- és HTML-fájlok támogatása.
    • Markdown-kimenet támogatása.
    • A táblázat kinyerése, az olvasási sorrend és a szakaszfejléc-észlelés fejlesztései.
    • A Document Intelligence 2023-10-31 előzetes verziójával az általános dokumentummodell (előre összeállított dokumentum) elavult. A kulcs-érték párok dokumentumokból való kinyeréséhez használja a prebuilt-layout modellt az opcionális lekérdezési sztringparaméter features=keyValuePairs engedélyezésével.
  • Nyugtamodell

    • Most kinyeri az összes árhoz kapcsolódó mező pénznemét.
  • Egészségbiztosítási kártya modell

    • Új terület támogatása Medicare és Medicaid információk.
  • Usa-beli adódokumentum-modellek

    • Új 1099 adómodell. Támogatja az 1099-es alapformát és a következő változatokat: A, B, C, CAP, DIV, G, H, INT, K, LS, LTC, MISC, NEC, OID, PATR, Q, QA, R, S, SA, SB.
  • Számlamodell

    • KVK A mező támogatása.
    • BPAY A mező támogatása.
    • Számos mező finomítása.
  • Egyéni besorolás

    • Többnyelvű dokumentumok támogatása.
    • Új oldalfelosztási beállítások: automatikus kiosztás, mindig felosztás oldal szerint, nincs felosztás.
  • Bővítmények képességei

Feljegyzés

A 2022-08-31 API általános rendelkezésre állási (GA) kiadásával a társított előzetes API-k elavultak. Ha a 2021-09-30-preview, a 2022-01-30-preview vagy a 2022-06-30-preview API-verziót használja, frissítse alkalmazásait a 2022-08-31 API-verzióra. A migrálási útmutatóban néhány kisebb módosítás is szerepel. További információt a migrálási útmutatóban talál.

2023. július

Feljegyzés

A Form Recognizer mostantól Az Azure AI-dokumentumintelligencia!

  • A dokumentum, az Azure AI-szolgáltatások magukban foglalják a korábban Cognitive Servicesnek és Azure-alkalmazás AI-szolgáltatásoknak nevezett összes szolgáltatást.
  • A díjszabás nem változik.
  • A Cognitive Services és a Azure-alkalmazás lied AI neve továbbra is használatos az Azure-számlázásban, a költségelemzésben, az árlistában és az ár API-kban.
  • Az alkalmazásprogramozási felületek (API-k) és az ügyfélkódtárak nem változnak kompatibilitástörően.
  • Egyes platformok továbbra is az átnevezési frissítésre várnak. A Dokumentációnkban a Form Recognizer vagy a Document Intelligence minden említése ugyanarra az Azure-szolgáltatásra vonatkozik.

Document Intelligence v3.1 (GA)

A Document Intelligence 3.1-es verziója már általánosan elérhető (GA)! Az API-verzió a következőnek felel meg 2023-07-31: . A v3.1 API új és frissített képességeket vezet be:

Document Intelligence Studio UX Frissítések

✔️ Elemzési beállítások

  • A Dokumentumintelligencia mostantól támogatja a kifinomultabb elemzési képességeket, és a Studio lehetővé teszi egy belépési pontot (Elemzési beállítások gomb) a bővítmények egyszerű konfigurálásához.

  • A dokumentum kinyerési forgatókönyvétől függően konfigurálja az elemzési tartományt, a dokumentum oldaltartományát, az opcionális észlelést és a prémium szintű észlelési funkciókat.

    Animated screenshot showing use of the analyze-options button to configure options in Studio.

    Feljegyzés

    A betűtípus-kinyerés nem vizualizálódik a Document Intelligence Studióban. A JSON-kimenet stílusszakaszában azonban ellenőrizheti a betűfelismerési eredményeket.

✔️ Dokumentumok automatikus címkézése előre összeállított modellekkel vagy saját modellek egyikével

  • Az egyéni extrakciós modell címkézési oldalán mostantól automatikusan címkézheti a dokumentumokat a Korábban betanított Dokumentumintelligens szolgáltatás egyik előre összeállított modellje vagy modellje használatával.

    Animated screenshot showing auto labeling in Studio.

  • Egyes dokumentumok esetében az automatikus címke futtatása után ismétlődő címkék is lehetnek. Ügyeljen arra, hogy módosítsa a címkéket, hogy később ne legyenek ismétlődő címkék a címkézési lapon.

    Screenshot showing duplicate label warning after auto labeling.

✔️ Táblák automatikus címkézése

  • Az egyéni extrakciós modell címkézési lapján mostantól automatikusan címkézheti a dokumentumban lévő táblákat anélkül, hogy manuálisan kellene címkéznie a táblákat.

    Animated screenshot showing auto table labeling in Studio.

✔️ Tesztfájlok hozzáadása közvetlenül a betanítási adatkészlethez

  • Miután betanított egy egyéni extrakciós modellt, használja a tesztlapot a modell minőségének javításához, ha szükséges, feltölti a tesztdokumentumokat a betanítási adatkészletbe.

  • Ha egyes címkék esetében alacsony megbízhatósági pontszámot ad vissza, győződjön meg arról, hogy megfelelően vannak címkézve. Ha nem, adja hozzá őket a betanítási adatkészlethez, és a modell minőségének javítása érdekében adja hozzá őket újracímkézéshez.

Animated screenshot showing how to add test files to training dataset.

✔️ A dokumentumlista beállításainak és szűrőinek használata egyéni projektekben

  • Használja az egyéni extrakciós modell címkézési oldalát. Mostantól könnyedén navigálhat a betanítási dokumentumok között a keresés, a szűrés és a rendezés funkció alapján történő használatával.

  • A rácsnézet használatával megtekintheti a dokumentumokat, vagy a listanézet használatával egyszerűbben görgetheti végig a dokumentumokat.

    Screenshot showing document list view options and filters.

✔️ Projektmegosztás

2023. május

A 2023-ban készült build frissített dokumentációjának bemutatása

2023. április

A Document Intelligence legújabb nyilvános előzetes verziójának bejelentése

2023. március

Fontos

2023-02-28-preview képességek jelenleg csak a következő régiókban érhetők el:

  • Nyugat-Európa
  • USA 2. nyugati régiója
  • USA keleti régiója

február 2023.

  • A 3.0-s verzió dokumentumintelligencia-tárolóinak kiválasztása már használható!

  • Jelenleg az Olvasás 3.0 és az Elrendezés v3.0 tárolók érhetők el.

    További információ: Dokumentumintelligencia-tárolók telepítése és futtatása.


2023. január

  • Előre összeállított nyugtamodell – a hozzáadott nyelvek támogatottak. A nyugtamodell mostantól támogatja ezeket a hozzáadott nyelveket és területi beállításokat

    • Japán - Japán (ja-JP)
    • Francia – Kanada (fr-CA)
    • Holland – Hollandia (nl-NL)
    • Angol – Egyesült Arab Emírségek (en-AE)
    • Portugál - Brazília (pt-BR)
  • Előre összeállított számlamodell – támogatott nyelvek. A számlamodell mostantól támogatja ezeket a hozzáadott nyelveket és területi beállításokat

    • Angol – Egyesült Államok (en-US), Ausztrália (en-AU), Kanada (en-CA), Egyesült Királyság (en-UK), India (en-IN)
    • Spanyol – Spanyolország (es-ES)
    • Francia - Franciaország (fr-FR)
    • Olasz - Olaszország (it-IT)
    • Portugál - Portugália (pt-PT)
    • Holland – Hollandia (nl-NL)
  • Előre összeállított számlamodell – felismert mezők hozzáadva. A számlamodell felismeri ezeket a hozzáadott mezőket

    • Pénznemkód
    • Fizetési lehetőségek
    • Teljes kedvezmény
    • Adótételek (csak en-IN)
  • Előre összeállított azonosítómodell – támogatott dokumentumtípusok. Az azonosítómodell mostantól támogatja ezeket a hozzáadott dokumentumtípusokat

    • AMERIKAI katonai azonosító

Tipp.

A 2023. januári frissítések a REST API 2022-08-31-es (GA) verziójával érhetők el.

  • Előre összeállított nyugtamodell – további nyelvi támogatás:

    Az előre összeállított nyugtamodell a következő nyelvek támogatását nyújtja:

    • Angol – Egyesült Arab Emírségek (en-AE)
    • Holland – Hollandia (nl-NL)
    • Francia – Kanada (fr-CA)
    • Német - (de-DE)
    • Olasz - (it-IT)
    • Japán - Japán (ja-JP)
    • Portugál - Brazília (pt-BR)
  • Előre összeállított számlamodell – további nyelvi támogatás és mezők kinyerése

    Az előre összeállított számlamodell támogatja a következő nyelveket:

    • Angol – Ausztrália (en-AU), Kanada (en-CA), Egyesült Királyság (en-UK), India (en-IN)
    • Portugál - Brazília (pt-BR)

    Az előre összeállított számlamodell mostantól támogatja a következő mezőkinyeréseket:

    • Pénznemkód
    • Fizetési lehetőségek
    • Teljes kedvezmény
    • Adótételek (csak en-IN)
  • Előre összeállított azonosító dokumentummodell – további dokumentumtípusok támogatása

    Az előre összeállított azonosítójú dokumentummodell mostantól támogatja a következő dokumentumtípusokat:

    • Jogosítványbővítés Indiát, Kanadát, Az Egyesült Királyságot és Ausztráliát támogatva
    • Amerikai katonai személyazonosító igazolványok és dokumentumok
    • India id kártyák és dokumentumok (PAN és Aadhaar)
    • Ausztrália személyazonosító igazolványai és dokumentumai (fényképkártya, kulcs-pass azonosító)
    • Kanada személyi igazolványai és dokumentumai (azonosító kártya, juharkártya)
    • Egyesült Királyság személyazonosító igazolványai és okmányai (nemzeti/regionális személyazonosító igazolvány)

2022. december

  • A Document Intelligence Studio frissítései

    A Document Intelligence Studio decemberi kiadása tartalmazza a Document Intelligence Studio legújabb frissítéseit. A felhasználói élmény jelentős mértékben javul, elsősorban az egyéni modellcímkézés támogatásával.

    • Oldaltartomány. A Studio mostantól támogatja egy dokumentum adott lapjainak elemzését.

    • Egyéni modell címkézése:

      • Futtassa automatikusan az Layout API-t. Az egyéni modell beállítási folyamata során dönthet úgy, hogy automatikusan futtatja az Layout API-t a blobtárolóban lévő összes dokumentumhoz.

      • Keresés. A Studio mostantól keresési funkciókat is tartalmaz a szavak dokumentumon belüli megkereséséhez. Ez a fejlesztés lehetővé teszi a könnyebb navigációt címkézés közben.

      • Navigáció. Címkéket kijelölve megcélzhatja a címkézett szavakat a dokumentumban.

      • Automatikus táblázatcímkézés. Miután kiválasztotta a táblázat ikonját egy dokumentumban, a kibontott táblázatot feliratozási nézetben is automatikusan megjelölheti.

      • Címke altípusai és másodszintű altípusai A Studio mostantól támogatja a táblázatoszlopok, a táblázatsorok és a második szintű altípusok altípusait olyan típusok esetében, mint a dátumok és számok.

  • Az egyéni neurális modellek létrehozása mostantól támogatott az USA Gov Virginia régiójában.

  • Előzetes verziójú API-verziók 2022-01-30-preview , és 2021-09-30-preview 2023. január 31-én megszűnik. Frissítsen az 2022-08-31 API-verzióra a szolgáltatáskimaradások elkerülése érdekében.


2022. november

  • Az Azure AI Document Intelligence-kódtárak legújabb stabil kiadásának bejelentése
    • Ez a kiadás fontos módosításokat és frissítéseket tartalmaz a .NET-, Java-, JavaScript- és Python-ügyfélkódtárakhoz. További információ: Azure SDK DevBlog.
    • A legfontosabb fejlesztések a bevezetése két új ügyfelek, a DocumentAnalysisClient és a DocumentModelAdministrationClient.

2022. október

  • Dokumentumintelligencia-verziójú tartalom

    • A Dokumentumintelligencia dokumentációja frissül, hogy egy verziószámozott felületet jelenítsen meg. Most kiválaszthatja, hogy megtekintse az élményt vagy a v3.0 GAv2.1 GA felhasználói élményt célzó tartalmakat. A 3.0-s verziós felület az alapértelmezett.

      Screenshot of the Document Intelligence landing page denoting the version dropdown menu.

  • Document Intelligence Studio mintakód

    • A Document Intelligence Studio címkézési felületének mintakódja már elérhető a GitHubon. Az ügyfelek fejleszthetik és integrálhatják a Document Intelligencet a saját UX-jukba, vagy létrehozhatják saját új UX-jukat a Document Intelligence Studio mintakódjának használatával.
  • Nyelvbővítés

    • A legújabb előzetes kiadással a Dokumentumintelligencia olvasási (OCR), elrendezési és egyéni sablonmodelljei 134 új nyelvet támogatnak. Ezek a nyelvi kiegészítések közé tartozik a görög, a lett, a szerb, a thai, az ukrán és a vietnami, valamint számos latin és cirill nyelv. A Dokumentumintelligencia jelenleg összesen 299 támogatott nyelvvel rendelkezik a legutóbbi ga és az új előzetes verzióban. A támogatott nyelvek megtekintéséhez tekintse meg a támogatott nyelvek oldalát.
    • Használja a REST API paramétert api-version=2022-06-30-preview az API vagy a megfelelő SDK használatakor az alkalmazások új nyelveinek támogatásához.
  • Új előre összeállított szerződésmodell

    • Egy új előre összeállított, amely adatokat nyer ki olyan szerződésekből, mint a felek, a cím, a szerződés azonosítója, a végrehajtási dátum stb. A szerződésmodell jelenleg előzetes verzióban érhető el, és itt kérhet hozzáférést.
  • Régióbővítés egyéni neurális modellek betanításához

    • Az egyéni neurális modellek betanítása mostantól támogatott a hozzáadott régiókban.
      • USA keleti régiója
      • USA 2. keleti régiója
      • USA-beli államigazgatás – Arizona

Szeptember 2022.

Feljegyzés

A 4.0.0-s verziótól kezdve új ügyfélkészletet vezetünk be a Dokumentumintelligencia szolgáltatás legújabb funkcióinak kihasználásához.

Az SDK 4.0.0 GA-verziójú kiadása a következő frissítéseket tartalmazza:

  • 4.0.0 GA-verzió (2022-09-08)
  • Támogatja a REST API 3.0-s és 2.0-s verziós ügyfeleit

Csomag (NuGet)

Változásnapló/kiadási előzmények

Migrálási útmutató

Readme

Példák

  • Az egyéni neurális modellek betanításának régióbővítése mostantól hat új régióban támogatott

    • Kelet-Ausztrália
    • Az USA középső régiója
    • Kelet-Ázsia
    • Közép-Franciaország
    • Az Egyesült Királyság déli régiója
    • USA 2. nyugati régiója
    • Azoknak a régióknak a teljes listáját, ahol a betanítás támogatott, tekintse meg az egyéni neurális modelleket.

    • Document Intelligence SDK-verzió 4.0.0 GA kiadása:

      • A Document Intelligence ügyfélkódtárak 4.0.0-s (.NET/C#, Java, JavaScript) és 3.2.0-s verzió (Python) általánosan elérhetők és használatra készek éles alkalmazásokban!.
      • A Dokumentumintelligencia-ügyfélkódtárakról további információt az SDK áttekintésében talál.
      • Frissítse alkalmazásait a programozási nyelv migrálási útmutatójával.

2022. augusztus

A Document Intelligence SDK 2022. augusztusi bétaverziójának előzetes kiadása a következő frissítéseket tartalmazza:

4.0.0-béta.5-ös verzió (2022-08-09)

Változásnapló/kiadási előzmények

Csomag (NuGet)

SDK-referenciadokumentáció

  • A Document Intelligence v3.0 általánosan elérhető

    • A Document Intelligence REST API 3.0-s verzió már általánosan elérhető és használatra kész éles alkalmazásokban! Frissítse alkalmazásait a REST API 2022-08-31-es verziójával.
  • A Document Intelligence Studio frissítései

    • Következő lépések. Az egyes modelloldalakon a Studio most egy következő lépésekkel foglalkozó szakaszt tartalmaz. A felhasználók gyorsan hivatkozhatnak a mintakódra, hibaelhárítási irányelvekre és díjszabási információkra.
    • Egyéni modellek. A Studio mostantól lehetővé teszi a címkék átrendezését egyéni modellprojektekben a címkézés hatékonyságának javítása érdekében.
    • A Másolási modellek egyéni modellek átmásolhatók a Dokumentumintelligencia-szolgáltatások között a Studióban. A művelet lehetővé teszi a betanított modellek előléptetését más környezetek és régiók számára.
    • Dokumentumok törlése. A Studio mostantól támogatja a dokumentumok törlését a címkézett adathalmazból az egyéni projektekben.
  • Dokumentumintelligencia-szolgáltatás frissítései

    • előre összeállított olvasott. Az olvasási OCR-modell mostantól a Dokumentumintelligencia szolgáltatásban is elérhető, a két új funkció pedig a bekezdések és a nyelvfelismerés. A Dokumentumintelligencia olvasása a dokumentumintelligencia szélesebb körű dokumentumintelligencia-képességeihez igazodó speciális dokumentumforgatókönyveket céloz meg.
    • előre összeállított elrendezés. Az Elrendezési modell kinyeri a bekezdéseket, és hogy a kinyert szöveg egy bekezdés, cím, szakaszfejléc, lábjegyzet, oldalfejléc, oldalláb vagy oldalszám.
    • előre összeállított számla. A TotalVAT és a Line/Vat mezők mostantól a TotalTax és a Line/Tax meglévő mezőkre lesznek feloldva.
    • előre összeállított-idDocument. Az usa államazonosítójának, társadalombiztosítási és zöld kártyáinak adatkinyerési támogatása. Útlevél vízuminformációk támogatása.
    • előre összeállított nyugta. Kiterjesztett területi támogatás francia (fr-FR), spanyol (es-ES), portugál (pt-PT), olasz (it-IT) és német (de-DE) számára.
    • előre összeállított businessCard. A cím elemzése támogatja a címösszetevők, például a cím, a város, az állam, az ország/régió és az irányítószám almezőinek kinyeréséhez.
  • Az AI minőségi fejlesztései

    • előre összeállított olvasott. Az egykarakterek, kézzel írt dátumok, összegek, nevek, egyéb, a nyugtákban és számlákban gyakran használt kulcsadatok, valamint a digitális PDF-dokumentumok jobb feldolgozása fokozott támogatása.
    • előre összeállított elrendezés. A körülvágott táblák, szegély nélküli táblák jobb észlelésének és a hosszú átnyúló cellák jobb felismerésének támogatása.
    • előre összeállított dokumentum. Továbbfejlesztett érték- és jelölőnégyzetfelismerés.
    • egyéni neurális. Nagyobb pontosság a táblaészleléshez és a kinyeréshez.

2022. június

  • A Document Intelligence SDK 2022. júniusi előzetes verziójának bétaverziója a következő frissítéseket tartalmazza:

február 2022.

  • A Document Intelligence 3.0 előzetes verziójú kiadása számos új funkciót, képességet és fejlesztést vezet be:

    • Az egyéni neurális modell vagy egyéni dokumentummodell egy új egyéni modell, amely szöveges és kijelölési jeleket nyer ki strukturált űrlapokból, félig strukturált és strukturálatlan dokumentumokból.
    • A W-2 előre összeállított modell egy új előre összeállított modell, amely az adóbevallási és jövedelem-ellenőrzési forgatókönyvek W-2 űrlapjaiból nyer ki mezőket.
    • A Read API kinyomtatott szövegsorokat, szavakat, szöveghelyeket, észlelt nyelveket és kézzel írt szöveget nyer ki, ha észleli.
    • Az általános dokumentum-előre betanított modell frissült, hogy az API-szövegek, táblázatok, struktúra és kulcs-érték párok mellett az űrlapokból és dokumentumokból is támogassa a kijelölési jeleket.
    • A Invoice API Számla előre összeállított modellje kibővíti a spanyol számlák támogatását.
    • A Document Intelligence Studio új demókat ad hozzá az Olvasás, W2, Hotel nyugtamintákhoz, és támogatja az új egyéni neurális modellek betanítását.
    • A nyelvbővítési dokumentumintelligencia olvasása, elrendezése és egyéni űrlapja 42 új nyelv, köztük az arab, hindi és egyéb nyelvek támogatását teszi lehetővé arab és devanagari szkriptek használatával, hogy a lefedettséget 164 nyelvre bővítse. A kézzel írt nyelvi támogatás japán és koreai nyelvre terjed ki.
  • Ismerkedés az új REST API-val, Pythonnal vagy .NET SDK-val a v3.0 előzetes verziójú API-hoz.

  • Dokumentumintelligencia-modell adatkinyerése:

    Modell Szöveg kinyerése Kulcs-érték párok Kijelölési jelek Táblák Aláírások
    Olvasás
    Általános dokumentum
    Elrendezés
    Számla
    Nyugta
    Személyazonosító okmányok
    Névjegykártya
    Egyéni sablon
    Egyéni neurális
  • A Document Intelligence SDK bétaverziójának előzetes kiadása a következő frissítéseket tartalmazza:


2021. november

  • A Document Intelligence 3.0-s előzetes verziójú SDK kiadási frissítése (béta.2) hibajavításokat és kisebb funkciók frissítését tartalmazza.

2021. október

  • A Document Intelligence 3.0 előzetes verziójú kiadásának 4.0.0-béta.1-es verziója (2021-10-07) számos új funkciót és funkciót vezet be:

    • Az általános dokumentummodell egy új API, amely előre betanított modellt használ szöveg, táblázatok, struktúra és kulcs-érték párok űrlapokból és dokumentumokból való kinyeréséhez.

    • Szállodai nyugtamodell hozzáadva az előre összeállított nyugtafeldolgozáshoz.

    • Az azonosító-modell által támogatott azonosító-dokumentum kibővített mezői támogatják a jóváhagyásokat, a korlátozásokat és a járműbesorolási kinyeréseket az EGYESÜLT Államok jogosítványaiból.

    • Az Aláírás mező egy új mezőtípus az egyéni űrlapokban, amely észleli az aláírás jelenlétét egy űrlapmezőben.

    • Nyelvbővítés támogatása 122 nyelvhez (nyomtatás) és 7 (kézzel írt) nyelvhez. A dokumentumintelligencia-elrendezés és az egyéni űrlap a legújabb előzetes verzióval 122-re bővíti a támogatott nyelveket . Az előzetes verzióban 49 új nyelven, például orosz, bolgár és más cirill és több latin nyelven található szöveg kinyerése látható. Emellett a kézzel írt szövegek kinyerése mostantól hét nyelvet támogat, amelyek tartalmazzák az angolt, valamint a kínai egyszerűsített, francia, német, olasz, portugál és spanyol nyelvű új előzetes verziókat.

    • A táblázatok és a szövegkinyerés fejlesztései Az elrendezés mostantól támogatja az egysoros táblák, más néven kulcs-érték táblák kinyerését. A szövegkinyerési fejlesztések közé tartozik a digitális PDF-fájlok és a gépi olvasható zóna (MRZ) szövegének jobb feldolgozása az identitásdokumentumokban, valamint az általános teljesítmény.

    • A Document Intelligence Studio A szolgáltatás használatának egyszerűsítése érdekében mostantól hozzáférhet a Document Intelligence Studióhoz a különböző előre összeállított modellek teszteléséhez vagy címkézéséhez és egyéni modellek betanításához.

    • Ismerkedés az új REST API-val, Pythonnal vagy .NET SDK-val a v3.0 előzetes verziójú API-hoz.

  • Dokumentumintelligencia-modell adatainak kinyerése

    Modell Szöveg kinyerése Kulcs-érték párok Kijelölési jelek Táblák
    Általános dokumentum
    Elrendezés
    Számla
    Nyugta
    Személyazonosító okmányok
    Névjegykártya
    Egyéni

2021. szeptember

  • Az Azure Metrics Explorer speciális funkciói az Azure Portal Dokumentumintelligencia-erőforrásáttekintő oldalán érhetők el.

  • Figyelési menü:

    Screenshot showing the monitoring menu in the Azure portal.

  • Diagramok:

    Screenshot showing an example metric chart in the Azure portal.

  • Azonosító dokumentummodell frissítése: a megadott nevek, beleértve az utótagot, ponttal vagy anélkül (teljes leállítással) sikeresen feldolgozhatók:

    Beviteli szöveg Eredmény frissítéssel
    William Isaac Kirby Jr. FirstName: William Isaac

    LastName: Kirby Jr.
    Henry Caleb Ross Sr Utónév: Henry Caleb

    LastName: Ross Sr.

2021. július

  • Rendszer által hozzárendelt felügyelt identitás támogatása: Mostantól engedélyezheti a rendszer által hozzárendelt felügyelt identitásokat, hogy a Document Intelligence korlátozott hozzáférést biztosítson a privát tárfiókokhoz, beleértve a virtuális hálózattal, tűzfallal vagy saját tárhellyel (BYOS) védett fiókokat. További információ:Felügyelt identitás létrehozása és használata a Dokumentumintelligencia-erőforráshoz .

2021. június


2021. május

  • A Document Intelligence 2.1 általánosan elérhető. A GA-kiadás a korábbi, 2.1-es előzetes verziójú csomagverziókban bevezetett módosítások stabilitását jelzi. Ez a kiadás lehetővé teszi az információk és adatok észlelését és kinyerását a következő dokumentumtípusokból:

  • Első lépésként próbálja ki a dokumentumintelligencia-mintaeszközt , és kövesse a rövid útmutatót.

  • A frissített Layout API táblafunkció több sorra kiterjedő oszlopfejlécekkel bővíti a fejlécfelismerést. Minden táblázatcella rendelkezik egy attribútummal, amely jelzi, hogy egy fejléc része-e vagy sem. Ez a frissítés a tábla fejlécét alkotó sorok azonosítására használható.


április 2021.

  • NuGet-csomag 3.1.0-béta.4-es verziója

  • Változásnapló/kiadási előzmények.

  • Új módszerek az identitásdokumentumokból származó adatok elemzésére:

    StartRecognizeIdDocumentsFromUriAsync

    StartRecognizeIdDocumentsAsync

    A mezőértékek listájáért tekintse mega Dokumentumintelligencia dokumentációjában kinyert mezőket.

  • Kibontottuk a StartRecognizeContent metódushoz megadható dokumentumnyelveket.

  • Az alábbi osztályok által támogatott új tulajdonságPages:

    RecognizeBusinessCardsOptions
    RecognizeCustomFormsOptions

    RecognizeInvoicesOptions

    RecognizeReceiptsOptions

    A Pages tulajdonság lehetővé teszi a többoldalas PDF- és TIFF-dokumentumok egyéni vagy többoldalas laptartományának kiválasztását. Az egyes oldalak esetében adja meg például 3az oldalszámot. Egy oldaltartományhoz (például a 2. és az 5-7. oldalhoz) írja be a p korszámokat és tartományokat vesszővel elválasztva: 2, 5-7.

  • A következő osztályhoz támogatott új tulajdonságReadingOrder:

    RecognizeContentOptions

    A ReadingOrder tulajdonság egy opcionális paraméter, amellyel megadhatja, hogy melyik olvasási sorrendi algoritmustbasicnaturalkell alkalmazni a szövegelemek kinyerésének sorrendjére. Ha nincs megadva, az alapértelmezett érték a következő basic: .

  • Az API-verzió 2.1-preview.3 SDK előzetes frissítései funkciófrissítéseket és fejlesztéseket vezetnek be.

2021. március

A Document Intelligence v2.1 nyilvános előzetes verziójú v2.1-preview.3 megjelent, és a következő funkciókat tartalmazza:

  • Új előre összeállított azonosítómodell Az új előre összeállított azonosító modell lehetővé teszi az ügyfelek számára, hogy azonosítókat vegyenek fel, és strukturált adatokat adjanak vissza a feldolgozás automatizálásához. Egyesíti a hatékony optikai karakterfelismerési (OCR) képességeket az azonosító-értelmező modellekkel, hogy kulcsinformációkat nyerjen ki az útlevelekből és az egyesült államokbeli jogosítványokból.

    További információ az előre összeállított azonosító modellről

    Screenshot of a sample passport.

  • Sorelem-kinyerés a számlamodellhez – Az előre összeállított számlamodell mostantól támogatja a sorelemek kinyerése; mostantól teljes cikkeket és azok részeit – leírást, összeget, mennyiséget, termékazonosítót, dátumot és egyebeket – nyer ki. Egy egyszerű API/SDK-hívással hasznos adatokat nyerhet ki a számlákból – szövegből, táblázatból, kulcs-érték párokból és sorelemekből.

    További információ a számlamodellről.

  • Felügyelt táblacímkézés és betanítás , üres értékű címkézés – A Document Intelligence korszerű mélytanulási automatikus táblázatkiemelési képességei mellett mostantól lehetővé teszi az ügyfelek számára a táblák címkézését és betanítását. Ez az új kiadás magában foglalja a sorelemek/táblák címkézését és betanítása (dinamikus és rögzített), valamint egy egyéni modell betanítása kulcs-érték párok és sorelemek kinyerésére. A modell betanítása után a modell a documentResults szakaszban lévő JSON-kimenet részeként kinyeri a sorelemeket.

    Screenshot of the table labeling feature.

    A táblák címkézése mellett mostantól üres értékeket és régiókat is címkézhet. Ha a betanítási csoport egyes dokumentumai nem tartalmaznak értékeket bizonyos mezőkhöz, címkézheti őket, hogy a modell megfelelően kinyerje az értékeket az elemzett dokumentumokból.

  • 66 új nyelv támogatása – Az Layout API és a Document Intelligence egyéni modelljei mostantól 73 nyelvet támogatnak.

    További információ a Dokumentumintelligencia nyelvi támogatásáról.

  • Természetes olvasási sorrend, kézírás-besorolás és oldalkijelölés – Ezzel a frissítéssel a szövegsorok kimeneteit természetes olvasási sorrendbe állíthatja az alapértelmezett balról jobbra és felülről lefelé rendezés helyett. Használja az új readingOrder lekérdezési paramétert, és állítsa "természetes" értékre az emberbarát olvasási sorrend kimenetéhez. Ezenkívül a latin nyelvek esetében a Dokumentumintelligencia kézzel írt stílusként osztályozza a szövegsorokat, és megbízhatósági pontszámot ad.

  • Előre összeállított nyugtamodell minőségi fejlesztései Ez a frissítés számos minőségi fejlesztést tartalmaz az előre összeállított nyugtamodellhez, különösen a sorelemek kinyerése körül.


2020. november

  • Megjelent a Document Intelligence 2.1-preview.2 verziója, amely a következő funkciókat tartalmazza:

    • Új előre összeállított számlamodell – Az új előre összeállított számlamodell lehetővé teszi az ügyfelek számára, hogy különböző formátumú számlákat készítsenek, és strukturált adatokat adjanak vissza a számlafeldolgozás automatizálásához. A hatékony optikai karakterfelismerési (OCR) képességeket ötvözi a számlafelismerési mélytanulási modellekkel, hogy a számlákból fő információkat nyerjen ki angol nyelven. Olyan kulcsszövegeket, táblázatokat és információkat nyer ki, mint az ügyfél, a szállító, a számlaazonosító, a számla határideje, az összeg, a fizetendő összeg, az adó összege, a szállítási és a számlázási adatok.

      További információ az előre összeállított számlamodellről

      Screenshot of a sample invoice.

    • Továbbfejlesztett táblázatkinyerés – A Dokumentumintelligencia mostantól továbbfejlesztett táblázatkinyerési funkciót biztosít, amely ötvözi a hatékony optikai karakterfelismerési (OCR) képességeket egy mélytanulási táblázat kinyerési modellel. A Dokumentumintelligencia képes adatokat kinyerni a táblákból, beleértve az egyesített oszlopokat, sorokat, szegélyeket és egyebeket tartalmazó összetett táblákat is.

      Screenshot of tables analysis.

      További információ az elrendezés kinyeréséről.

    • Ügyfélkódtár frissítése – A .NET, Python , Java és JavaScript ügyfélkódtárainak legújabb verziói támogatják a Document Intelligence 2.1 API-t.

    • Új nyelv támogatott: japán – A következő új nyelvek támogatottak: és AnalyzeLayoutAnalyzeCustomForm: japán (ja). Nyelvi támogatás.

    • Szövegsorstílus jelzése (kézzel írt/egyéb) (csak latin nyelvű) – A Dokumentumintelligencia mostantól egy appearance objektumot ad ki, amely osztályozza, hogy az egyes szövegsorok kézzel írt stílusok-e vagy sem, valamint egy megbízhatósági pontszámot. Ez a funkció csak latin nyelvek esetén támogatott.

    • Minőségi fejlesztések – Extrakciós fejlesztések, beleértve az egyjegyű extrakciós fejlesztéseket.

    • A dokumentumintelligencia-minta- és címkézési eszköz új kipróbálási funkciója – Az előre összeállított számla-, nyugta- és névjegykártya-modellek és az Layout API kipróbálása a Dokumentumintelligencia-mintacímkéző eszközzel. Nézze meg, hogyan nyeri ki az adatokat kód írása nélkül.

    • A Dokumentumintelligencia-mintacímkéző eszköz kipróbálása

      Screenshot of the Sample Labeling tool homepage.

      • Visszajelzési ciklus – Ha a mintacímkézési eszközzel elemzi a fájlokat, hozzáadhatja azt a betanítási csoporthoz, és szükség esetén módosíthatja a címkéket, és betanítással fejlesztheti a modellt.
      • Dokumentumok automatikus címkézése – A projekt korábbi címkével ellátott dokumentumai alapján automatikusan felcímkézi a hozzáadott dokumentumokat.

2020. augusztus

  • **A dokumentumintelligencia v2.1-preview.1 a következő funkciókat tartalmazza:

    • A REST API-referencia elérhető – Tekintse meg a v2.1-preview.1 reference.
    • Az angol mellett az alábbi nyelvek támogatottak: LayoutTrain Custom Modelangol (), kínai (enegyszerűsített) (zh-Hans), holland (), francia (nlfr), német (de), olasz (it), portugál (pt) és spanyol (es).
    • Jelölőnégyzet/ Kijelölésjel észlelése – A dokumentumintelligencia támogatja a kijelölési jelek, például a jelölőnégyzetek és a választógombok észlelését és kinyerását. A kijelölési jelek ki vannak nyerveLayout, és mostantól címkéket is címkézhet és betanított a Címkék betanítása területen Train Custom Model - a kijelölési jelek kulcs-érték párjainak kinyeréséhez.
    • Model Compose – lehetővé teszi több modell összeállítását és meghívását egyetlen modellazonosítóval. Amikor elküld egy dokumentumot, amelyet egy összeállított modellazonosítóval szeretne elemezni, a rendszer először egy besorolási lépést hajt végre, amely a megfelelő egyéni modellhez irányítja. A Model Compose a címkékkel való betanítása érdekébenTrain Custom Model - érhető el.
    • Modellnév – adjon hozzá egy rövid nevet az egyéni modellekhez a könnyebb felügyelet és nyomon követés érdekében.
    • Új előre összeállított modell névjegykártyákhoz az angol nyelvű, nyelvi névjegykártyák gyakori mezőinek kinyerése érdekében.
    • Az előre összeállított nyugták új területi beállításai az EN-US mellett mostantól az EN-AU, EN-CA, EN-GB és EN-IN esetén is elérhetők.
    • Minőségi fejlesztések a Layoutcímkék Train Custom Model - nélküli betanításhoz és a címkékkel való betanításhoz.
  • A 2.0-s verzió a következő frissítést tartalmazza:

    Új minták érhetők el a GitHubon.

    • A Tudáskinyerési receptek – Forms forgatókönyv összegyűjti az ajánlott eljárásokat a valódi Dokumentumintelligencia-ügyfelek előjegyzéseiből, és használható kódmintákat, ellenőrzőlistákat és mintafolyamatokat biztosít ezeknek a projekteknek a fejlesztéséhez.
    • A mintacímkézési eszköz frissül az új v2.1-funkció támogatásához. Az eszköz használatának első lépéseit ebben a rövid útmutatóban tekintheti meg.
    • Az Intelligens kioszk dokumentumintelligencia-minta bemutatja, hogyan integrálható Analyze Receipt ésTrain Custom Model - tanítható be címkék nélkül.

2020. július

  • A Document Intelligence 2.0-s referenciája elérhető – A v2.0 API-referencia és a .NET, Python, Java és JavaScript frissített ügyfélkódtárainak megtekintése.
    • Táblázatfejlesztések és extrakciós fejlesztések – a pontosság javításai és a táblázatkinyerés fejlesztései, különösen a táblafejlécek és -struktúrák elsajátítása a címkék nélküli egyéni betanításban.

    • Pénznemtámogatás – A globális pénznemszimbólumok észlelése és kinyerése.

    • Az Azure Gov – A dokumentumintelligencia mostantól az Azure Gov-ban is elérhető.

    • Továbbfejlesztett biztonsági funkciók:

      • Saját kulcs használata – A Dokumentumintelligencia automatikusan titkosítja az adatokat, amikor a felhőben maradnak, hogy megvédjék őket, és segítsenek megfelelni a szervezeti biztonsági és megfelelőségi követelményeknek. Alapértelmezés szerint az előfizetés a Microsoft által felügyelt titkosítási kulcsokat használja. Most már saját titkosítási kulcsokkal is kezelheti előfizetését. Az ügyfél által felügyelt kulcsok, más néven a saját kulcs (BYOK) nagyobb rugalmasságot biztosítanak a hozzáférés-vezérlők létrehozásához, elforgatásához, letiltásához és visszavonásához. Továbbá az adatok védelméhez használt titkosítási kulcsok naplózására is lehetősége van.
      • Privát végpontok – Lehetővé teszi, hogy egy virtuális hálózaton biztonságosan hozzáférjen az adatokhoz privát kapcsolaton keresztül.

2020. június


április 2020.

  • SDK-támogatás a Document Intelligence API 2.0-s nyilvános előzetes verziójához – Ebben a hónapban bővítettük szolgáltatástámogatásunkat, hogy tartalmazza a Document Intelligence 2.0-s verziójához készült előzetes verziójú SDK-t. Az alábbi hivatkozások segítségével ismerkedhet meg a választott nyelvvel:
  • .NET SDK
  • Java SDK
  • Python SDK
  • JavaScript SDK

Az új SDK támogatja a v2.0 REST API for Document Intelligence összes funkcióját. Az ügyfélkódtárakra vonatkozó visszajelzéseit az SDK visszajelzési űrlapján oszthatja meg.

  • Egyéni modell másolása Mostantól modelleket másolhat régiók és előfizetések között az új Egyéni modell másolása funkcióval. Az egyéni modell másolása API meghívása előtt először meg kell szereznie a célerőforrásba való másoláshoz szükséges engedélyt. Ezt az engedélyezést úgy biztosítjuk, hogy meghívjuk a Másolás engedélyezése műveletet a célerőforrás-végponthoz.

  • Hozzon létre egy másolás-engedélyezési REST API-t.

  • Másolja ki az egyéni modell REST API-t.

  • Biztonsági fejlesztések.

  • Az ügyfél által felügyelt kulcsok mostantól elérhetők a FormRecognizerhez. További információ: Inaktív adattitkosítás a Dokumentumintelligencia szolgáltatásban.

  • Felügyelt identitások használata Azure-erőforrásokhoz való hozzáféréshez az Azure Active Directoryval. További információ: Hozzáférés engedélyezése felügyelt identitásokhoz.


2020. március

  • A címkézés értéktípusai Mostantól megadhatja, hogy milyen típusú értékeket címkéz a dokumentumintelligencia-mintacímkézési eszközzel. Jelenleg a következő értéktípusok és -változatok támogatottak:
  • string
    • alapértelmezett, no-whitespaces, alphanumeric
  • number
    • Alapértelmezett currency
  • date
    • alapértelmezett, dmy, , mdyymd
  • time
  • integer

A funkció használatának megismeréséhez tekintse meg a Mintacímkézés eszköz útmutatóját.

  • Táblázatvizualizáció A Mintacímkézés eszköz mostantól megjeleníti a dokumentumban felismert táblákat. Ez a funkció lehetővé teszi a felismert és kinyert táblák megtekintését a dokumentumból a címkézés és elemzés előtt. Ez a funkció be- és kikapcsolható a rétegek beállítással.

  • Az alábbi kép egy példa a táblák felismerésére és kinyerésének módjára:

    Screenshot of table visualization using the Sample Labeling tool.

  • A kinyert táblák a JSON-kimenetben érhetők el a következő alatt "pageResults": .

    Fontos

    A táblák címkézése nem támogatott. Ha a táblákat nem ismeri fel és nyeri ki automatikusan, csak kulcs/érték párként címkézheti őket. A táblák kulcs/érték párként való címkézésekor minden cellát egyedi értékként kell megjelölni.

  • Extrakciós fejlesztések.

  • Ez a kiadás tartalmazza az extrakciós fejlesztéseket és a pontossági fejlesztéseket, különösen azt a képességet, hogy több kulcs-/értékpárt címkézzen és nyerjen ki ugyanabban a szövegsorban.

  • A mintacímkézési eszköz mostantól nyílt forráskódú.

  • A dokumentumintelligencia-mintacímkézési eszköz már nyílt forráskódú projektként is elérhető. A megoldásokat integrálhatja, és ügyfélspecifikus módosításokat végezhet az igényeinek megfelelően.

  • A Dokumentumintelligencia-mintacímkézés eszközről a GitHubon elérhető dokumentációban talál további információt.

  • TLS 1.2 kényszerítés.

  • TLS Az 1.2-t a szolgáltatásnak küldött összes HTTP-kéréshez kényszeríti a szolgáltatás. További információ: Azure AI-szolgáltatások biztonsága.


Január 2020.

Ez a kiadás bemutatja a Document Intelligence 2.0-t. A következő szakaszokban további információkat talál az új funkciókról, fejlesztésekről és módosításokról.

  • Új funkciók

    • Egyéni modell

      • Betanítása címkékkel : Mostantól manuálisan címkézett adatokkal taníthat be egyéni modelleket. Ez a módszer jobb teljesítményű modelleket eredményez, és olyan modelleket hozhat létre, amelyek kulcsok nélküli értékeket tartalmazó összetett űrlapokkal vagy űrlapokkal működnek.
      • Aszinkron API Aszinkron API-hívások használatával taníthat be és elemezhet nagy adatkészleteket és fájlokat.
      • TIFF-fájlok támogatása Mostantól betanítása és kinyerése TIFF-dokumentumokból.
      • A kinyerési pontosság javítása.
    • Előre összeállított nyugtamodell

      • Tippösszegek Mostantól kinyerheti a tippösszegeket és más kézzel írt értékeket.
      • Sorelem-kinyerés : A sorelemek értékeit kinyerheti a visszaigazolásokból.
      • Megbízhatósági értékek : Megtekintheti a modell megbízhatóságát az egyes kinyert értékekhez.
      • A kinyerési pontosság javítása.
      • Elrendezés kinyerése Mostantól az Layout API használatával kinyerheti a szöveges adatokat és a táblázatadatokat az űrlapokból.
  • Egyéni modell API-változásai

    A betanításhoz és az egyéni modellek használatához használt összes API átnevezve van, és néhány szinkron metódus mostantól aszinkron. A főbb változások a következők:

    • A modell betanításának folyamata mostantól aszinkron. A betanítást a /custom/models API-híváson keresztül kezdeményezheti. Ez a hívás egy műveleti azonosítót ad vissza, amelyet a betanítási eredmények visszaadásához átadhat az egyéni/modelleknek/{modelID} -nek.
    • A kulcs/érték kinyerése most a /custom/models/{modelID}/analyze API-hívás által lett elindítva . Ez a hívás egy műveleti azonosítót ad vissza, amelyet a kinyerési eredmények visszaadásához átadhat egyéni/modelleknek/{modelID}/analyzeResults/{resultID} .
    • A betanítási művelet műveleti azonosítói a HTTP-válaszok Hely fejlécében találhatók, nem pedig az Operation-Location fejlécben.
  • A Nyugta API módosításai

    • A rendszer átnevezi az értékesítési visszaigazolások olvasására szolgáló API-kat.

    • A nyugtaadatok kinyerését most az /előre összeállított/nyugta/elemzési API-hívás kezdeményezi. Ez a hívás egy műveleti azonosítót ad vissza, amelyet az /előre összeállított/nyugta/analyzeResults/{resultID} fájlba továbbíthat a kinyerési eredmények visszaadásához.

  • Kimeneti formátum változásai

    • Az összes API-hívás JSON-válaszának új formátuma van. Egyes kulcsok és értékek hozzáadódnak, eltávolíthatók vagy átnevezhetők. Az aktuális JSON-formátumokra vonatkozó példákat a rövid útmutatókban talál.

Következő lépések