Az Azure AI-dokumentumintelligencia újdonságai
Ez a tartalom a következőre vonatkozik::v4.0 (előzetes verzió)v3.1 (GA)v3.0 (GA)v2.1 (GA)
A Document Intelligence szolgáltatás folyamatosan frissül. Könyvjelzővel jelenik meg a lap, hogy naprakész maradjon a kibocsátási megjegyzésekkel, a funkciófejlesztésekkel és a legújabb dokumentációval.
Fontos
Az előzetes verziójú API-verziók a GA API kiadása után megszűnnek. A 2023-02-28-as verziójú API-verzió kivonása folyamatban van, ha továbbra is az előzetes verziójú API-t vagy a kapcsolódó SDK-verziót használja, frissítse a kódot a legújabb 2023-07-31-es API-verzióra (GA).
2024. február
A Document Intelligence 2024-02-29-preview REST API már elérhető. Ez az előzetes verziójú API új és frissített képességeket vezet be:
A nyilvános előzetes verzió 2024-02-29 előzetes verziója jelenleg csak a következő Azure-régiókban érhető el:
- USA keleti régiója
- USA2 nyugati régiója
- Nyugat-Európa
Az elrendezési modell mostantól támogatja az ábraészlelést és a hierarchikus dokumentumstruktúra-elemzést (szakaszok és alszakaszok). Az olvasási sorrend és a logikai szerepkör-észlelés AI-minősége is javul.
-
- Az egyéni kinyerési modellek mostantól támogatják a cella-, sor- és táblaszintű megbízhatósági pontszámokat. További információ a táblázatról, a sorról és a cella megbízhatóságáról.
- Az egyéni extrakciós modellek AI-minőségi fejlesztésekkel rendelkeznek a mezőkinyeréshez.
- Az egyéni sablonkinyerési modell mostantól támogatja az átfedésben lévő mezők kinyerését. További információ az átfedésben lévő mezőkről és azok használatáról.
-
- Az egyéni besorolási modell mostantól támogatja a növekményes betanítást olyan forgatókönyvek esetében, ahol az osztályozómodellt további mintákkal vagy további osztályokkal kell frissítenie. További információ a növekményes betanításról.
- Az egyéni besorolási modell támogatja az Office-dokumentumtípusokat (.docx, .pptx és .xls). További információ a bővített dokumentumtípus támogatásáról.
-
- Új területi beállítások támogatása:
Területi beállítás Kód Arab ( ar
)Bolgár ( bg
)Görög ( el
)héber ( he
)Macedón ( mk
)Orosz ( ru
)Szerb cirill ( sr-cyrl
)Ukrán ( uk
)Thai ( th
)Török ( tr
)Vietnámi ( vi
)- Új pénznemkódok támogatása:
Pénznem Területi beállítás Kód BAM Bosnyák kabriójel ( ba
)BGN Bolgár Lev ( bg
)ILS Izraeli új sékel ( il
)MKD Macedón dénár ( mk
)RUB Orosz rubel ( ru
)THB Thai Baht ( th
)TRY Török líra ( tr
)UAH Ukrán hrivnya ( ua
)VND Vietnami dong ( vn
)- Az adótételek németországi (), spanyolországi (
de
es
),portugáliai (pt
), angol-kanadaien-CA
– bővülést támogatnak.
-
- Kiterjesztett támogatás az Európai Unió azonosítóihoz és jogosítványaihoz.
-
- Információk kinyerve az egységes lakáshitel-kérelemből (1003-at tartalmazó űrlap).
- Információk kinyerése egységes jegyzési és továbbítási összegzésből vagy 1008-ból.
- Információk kinyerése a jelzálog-záró közzétételből.
-
- Információk kinyerve a bankkártyákból.
🆕 Házassági anyakönyvi kivonat
- Új előre összeállított, a házassági anyakönyvi kivonatok adatainak kinyeréséhez.
2023. december
A REST API 2023-10-31 előzetes verzióját célzó Dokumentumintelligencia-ügyfélkódtárak már használhatók!
2023. november
A Document Intelligence 2023-10-31-preview REST API már elérhető. Ez az előzetes verziójú API új és frissített képességeket vezet be:
A nyilvános előzetes verzió 2023-10-31 előzetes verziója jelenleg csak a következő Azure-régiókban érhető el:
- USA keleti régiója
- USA2 nyugati régiója
- Nyugat-Európa
-
- Nyelvbővítés kézíráshoz: orosz(
ru
), arab(ar
), thai(th
). - Cyber Executive Order (EO) megfelelőség.
- Nyelvbővítés kézíráshoz: orosz(
-
- Office- és HTML-fájlok támogatása.
- Markdown-kimenet támogatása.
- A táblázat kinyerése, az olvasási sorrend és a szakaszfejléc-észlelés fejlesztései.
- A Document Intelligence 2023-10-31 előzetes verziójával az általános dokumentummodell (előre összeállított dokumentum) elavult. A kulcs-érték párok dokumentumokból való kinyeréséhez használja a
prebuilt-layout
modellt az opcionális lekérdezési sztringparaméterfeatures=keyValuePairs
engedélyezésével.
-
- Most kinyeri az összes árhoz kapcsolódó mező pénznemét.
Egészségbiztosítási kártya modell
- Új terület támogatása Medicare és Medicaid információk.
Usa-beli adódokumentum-modellek
- Új 1099 adómodell. Támogatja az 1099-es alapformát és a következő változatokat: A, B, C, CAP, DIV, G, H, INT, K, LS, LTC, MISC, NEC, OID, PATR, Q, QA, R, S, SA, SB.
-
KVK
A mező támogatása.BPAY
A mező támogatása.- Számos mező finomítása.
-
- Többnyelvű dokumentumok támogatása.
- Új oldalfelosztási beállítások: automatikus kiosztás, mindig felosztás oldal szerint, nincs felosztás.
-
- A lekérdezésmezők a
2023-10-31-preview
kiadással érhetők el. - A bővítmény képességei az olvasási modell kivételével minden modellben elérhetők.
- A lekérdezésmezők a
Feljegyzés
A 2022-08-31 API általános rendelkezésre állási (GA) kiadásával a társított előzetes API-k elavultak. Ha a 2021-09-30-preview, a 2022-01-30-preview vagy a 2022-06-30-preview API-verziót használja, frissítse alkalmazásait a 2022-08-31 API-verzióra. A migrálási útmutatóban néhány kisebb módosítás is szerepel. További információt a migrálási útmutatóban talál.
2023. július
Feljegyzés
A Form Recognizer mostantól Az Azure AI-dokumentumintelligencia!
- A dokumentum, az Azure AI-szolgáltatások magukban foglalják a korábban Cognitive Servicesnek és Azure-alkalmazás AI-szolgáltatásoknak nevezett összes szolgáltatást.
- A díjszabás nem változik.
- A Cognitive Services és a Azure-alkalmazás lied AI neve továbbra is használatos az Azure-számlázásban, a költségelemzésben, az árlistában és az ár API-kban.
- Az alkalmazásprogramozási felületek (API-k) és az ügyfélkódtárak nem változnak kompatibilitástörően.
- Egyes platformok továbbra is az átnevezési frissítésre várnak. A Dokumentációnkban a Form Recognizer vagy a Document Intelligence minden említése ugyanarra az Azure-szolgáltatásra vonatkozik.
Document Intelligence v3.1 (GA)
A Document Intelligence 3.1-es verziója már általánosan elérhető (GA)! Az API-verzió a következőnek felel meg 2023-07-31
: .
A v3.1 API új és frissített képességeket vezet be:
- A Dokumentumintelligencia API-k mostantól modulárisabbak, és támogatják az opcionális funkciókat. Mostantól testre szabhatja a kimenetet úgy, hogy kifejezetten tartalmazza a szükséges funkciókat. További információ az opcionális paraméterekről.
- Dokumentumbesorolási API egyetlen fájl különálló dokumentumokra való felosztásához. További információ a dokumentumbesorolásról.
- Előre összeállított szerződésmodell.
- Előre összeállított amerikai adóűrlap 1098 modell.
- Office-fájltípusok támogatása a Read API-val.
- Vonalkódfelismerés a dokumentumokban.
- Képletfelismerési bővítmény képessége.
- A betűfelismerési bővítmény képessége.
- Nagy felbontású dokumentumok támogatása.
- Az egyéni neurális modellek betanításához mostantól egyetlen címkével ellátott minta szükséges.
- Egyéni neurális modellek nyelvbővítése. Neurális modell betanítása 30 nyelven lévő dokumentumokhoz. A támogatott nyelvek teljes listájához tekintse meg a nyelvi támogatást .
- 🆕 Előre összeállított egészségbiztosítási kártyamodell.
- Előre összeállított számlamodell területi bővítése.
- Előre összeállított nyugtamodell nyelve és területi bővítése több mint 100 támogatott nyelvvel.
- Az előre összeállított azonosítómodell mostantól támogatja az európai azonosítókat.
Document Intelligence Studio UX Frissítések
✔️ Elemzési beállítások
A Dokumentumintelligencia mostantól támogatja a kifinomultabb elemzési képességeket, és a Studio lehetővé teszi egy belépési pontot (Elemzési beállítások gomb) a bővítmények egyszerű konfigurálásához.
A dokumentum kinyerési forgatókönyvétől függően konfigurálja az elemzési tartományt, a dokumentum oldaltartományát, az opcionális észlelést és a prémium szintű észlelési funkciókat.
Feljegyzés
A betűtípus-kinyerés nem vizualizálódik a Document Intelligence Studióban. A JSON-kimenet stílusszakaszában azonban ellenőrizheti a betűfelismerési eredményeket.
✔️ Dokumentumok automatikus címkézése előre összeállított modellekkel vagy saját modellek egyikével
Az egyéni extrakciós modell címkézési oldalán mostantól automatikusan címkézheti a dokumentumokat a Korábban betanított Dokumentumintelligens szolgáltatás egyik előre összeállított modellje vagy modellje használatával.
Egyes dokumentumok esetében az automatikus címke futtatása után ismétlődő címkék is lehetnek. Ügyeljen arra, hogy módosítsa a címkéket, hogy később ne legyenek ismétlődő címkék a címkézési lapon.
✔️ Táblák automatikus címkézése
Az egyéni extrakciós modell címkézési lapján mostantól automatikusan címkézheti a dokumentumban lévő táblákat anélkül, hogy manuálisan kellene címkéznie a táblákat.
✔️ Tesztfájlok hozzáadása közvetlenül a betanítási adatkészlethez
Miután betanított egy egyéni extrakciós modellt, használja a tesztlapot a modell minőségének javításához, ha szükséges, feltölti a tesztdokumentumokat a betanítási adatkészletbe.
Ha egyes címkék esetében alacsony megbízhatósági pontszámot ad vissza, győződjön meg arról, hogy megfelelően vannak címkézve. Ha nem, adja hozzá őket a betanítási adatkészlethez, és a modell minőségének javítása érdekében adja hozzá őket újracímkézéshez.
✔️ A dokumentumlista beállításainak és szűrőinek használata egyéni projektekben
Használja az egyéni extrakciós modell címkézési oldalát. Mostantól könnyedén navigálhat a betanítási dokumentumok között a keresés, a szűrés és a rendezés funkció alapján történő használatával.
A rácsnézet használatával megtekintheti a dokumentumokat, vagy a listanézet használatával egyszerűbben görgetheti végig a dokumentumokat.
✔️ Projektmegosztás
- Egyszerűen megoszthatja az egyéni kinyerési projekteket. További információ: Project sharing with custom models.
2023. május
A 2023-ban készült build frissített dokumentációjának bemutatása
🆕 A Dokumentumintelligencia áttekintése továbbfejlesztett navigáció, strukturált hozzáférési pontok és bővített képek.
🆕 A dokumentumintelligencia-modell kiválasztása útmutatást nyújt a projektek és munkafolyamatok legjobb Dokumentumintelligencia-megoldásának kiválasztásához.
2023. április
A Document Intelligence legújabb nyilvános előzetes verziójának bejelentése
A Document Intelligence REST API 2023-02-28-előzetes verziója támogatja a nyilvános előzetes verziójú kiadási ügyfélkódtárakat. Ez a kiadás a .NET/C# (4.1.0-béta-1), Java (4.1.0-beta-1), JavaScript (4.1.0-beta-1) és Python (3.3.0b.1) ügyfélkódtárakhoz elérhető új funkciókat és képességeket tartalmazza:
További információ: Document Intelligence SDK (nyilvános előzetes verzió) és 2023. márciusi kibocsátási megjegyzések
2023. március
Fontos
2023-02-28-preview
képességek jelenleg csak a következő régiókban érhetők el:
- Nyugat-Európa
- USA 2. nyugati régiója
- USA keleti régiója
- Az egyéni besorolási modell a Dokumentumintelligencia új képessége az
2023-02-28-preview
API-tól kezdve. Próbálja ki a dokumentumbesorolási képességet a Document Intelligence Studio vagy a REST API használatával. - Az Általános dokumentummodellhez hozzáadott lekérdezési mezők képességei az Azure OpenAI-modellek használatával nyernek ki konkrét mezőket a dokumentumokból. Próbálja ki az Általános dokumentumokat lekérdezésmezőkkel funkcióval a Document Intelligence Studióval. A lekérdezésmezők jelenleg csak a
East US
régióban lévő erőforrások esetében aktívak. - Bővítmények képességei:
- A betűtípus-kinyerés mostantól felismerhető az
2023-02-28-preview
API-val. - A képletek kinyerése mostantól felismerhető az
2023-02-28-preview
API-val. - A nagy felbontású kinyerés mostantól felismerhető az
2023-02-28-preview
API-val.
- A betűtípus-kinyerés mostantól felismerhető az
- Egyéni extrakciós modell frissítései:
- Az egyéni neurális modell mostantól támogatja a hozzáadott nyelveket a betanításhoz és elemzéshez. Neurális modellek betanítása holland, francia, német, olasz és spanyol nyelvre.
- Az egyéni sablonmodell mostantól továbbfejlesztett aláírásészlelési képességgel rendelkezik.
- A Document Intelligence Studio frissítései:
- AMellett, hogy az összes új funkció, például a besorolási és lekérdezési mezők támogatása mellett a Studio lehetővé teszi az egyéni modellprojektek projektmegosztását is.
- Új modell kiegészítések a kapus előzetes verzióban: Oltási kártyák, Szerződések, US Tax 1098, US Tax 1098-E és US Tax 1098-T. Ha hozzáférést szeretne kérni a kapus előnézeti modellekhez, töltse ki és küldje el a Document Intelligence privát előzetes verziós kéreleműrlapot.
- A nyugtamodell frissítései:
- A nyugtamodell támogatja a termikus nyugtákat.
- A nyugtamodell mostantól 18 nyelv és három regionális nyelv (angol, francia, portugál) nyelvi támogatását biztosítja.
- A nyugtamodell mostantól támogatja a
TaxDetails
kinyerési elemet.
- Az elrendezési modell mostantól javítja a táblafelismerést.
- Az olvasási modell mostantól továbbfejleszti az egyjegyű karakterfelismerést.
február 2023.
A 3.0-s verzió dokumentumintelligencia-tárolóinak kiválasztása már használható!
Jelenleg az Olvasás 3.0 és az Elrendezés v3.0 tárolók érhetők el.
További információ: Dokumentumintelligencia-tárolók telepítése és futtatása.
2023. január
Előre összeállított nyugtamodell – a hozzáadott nyelvek támogatottak. A nyugtamodell mostantól támogatja ezeket a hozzáadott nyelveket és területi beállításokat
- Japán - Japán (ja-JP)
- Francia – Kanada (fr-CA)
- Holland – Hollandia (nl-NL)
- Angol – Egyesült Arab Emírségek (en-AE)
- Portugál - Brazília (pt-BR)
Előre összeállított számlamodell – támogatott nyelvek. A számlamodell mostantól támogatja ezeket a hozzáadott nyelveket és területi beállításokat
- Angol – Egyesült Államok (en-US), Ausztrália (en-AU), Kanada (en-CA), Egyesült Királyság (en-UK), India (en-IN)
- Spanyol – Spanyolország (es-ES)
- Francia - Franciaország (fr-FR)
- Olasz - Olaszország (it-IT)
- Portugál - Portugália (pt-PT)
- Holland – Hollandia (nl-NL)
Előre összeállított számlamodell – felismert mezők hozzáadva. A számlamodell felismeri ezeket a hozzáadott mezőket
- Pénznemkód
- Fizetési lehetőségek
- Teljes kedvezmény
- Adótételek (csak en-IN)
Előre összeállított azonosítómodell – támogatott dokumentumtípusok. Az azonosítómodell mostantól támogatja ezeket a hozzáadott dokumentumtípusokat
- AMERIKAI katonai azonosító
Tipp.
A 2023. januári frissítések a REST API 2022-08-31-es (GA) verziójával érhetők el.
Előre összeállított nyugtamodell – további nyelvi támogatás:
Az előre összeállított nyugtamodell a következő nyelvek támogatását nyújtja:
- Angol – Egyesült Arab Emírségek (en-AE)
- Holland – Hollandia (nl-NL)
- Francia – Kanada (fr-CA)
- Német - (de-DE)
- Olasz - (it-IT)
- Japán - Japán (ja-JP)
- Portugál - Brazília (pt-BR)
Előre összeállított számlamodell – további nyelvi támogatás és mezők kinyerése
Az előre összeállított számlamodell támogatja a következő nyelveket:
- Angol – Ausztrália (en-AU), Kanada (en-CA), Egyesült Királyság (en-UK), India (en-IN)
- Portugál - Brazília (pt-BR)
Az előre összeállított számlamodell mostantól támogatja a következő mezőkinyeréseket:
- Pénznemkód
- Fizetési lehetőségek
- Teljes kedvezmény
- Adótételek (csak en-IN)
Előre összeállított azonosító dokumentummodell – további dokumentumtípusok támogatása
Az előre összeállított azonosítójú dokumentummodell mostantól támogatja a következő dokumentumtípusokat:
- Jogosítványbővítés Indiát, Kanadát, Az Egyesült Királyságot és Ausztráliát támogatva
- Amerikai katonai személyazonosító igazolványok és dokumentumok
- India id kártyák és dokumentumok (PAN és Aadhaar)
- Ausztrália személyazonosító igazolványai és dokumentumai (fényképkártya, kulcs-pass azonosító)
- Kanada személyi igazolványai és dokumentumai (azonosító kártya, juharkártya)
- Egyesült Királyság személyazonosító igazolványai és okmányai (nemzeti/regionális személyazonosító igazolvány)
2022. december
A Document Intelligence Studio frissítései
A Document Intelligence Studio decemberi kiadása tartalmazza a Document Intelligence Studio legújabb frissítéseit. A felhasználói élmény jelentős mértékben javul, elsősorban az egyéni modellcímkézés támogatásával.
Oldaltartomány. A Studio mostantól támogatja egy dokumentum adott lapjainak elemzését.
Egyéni modell címkézése:
Futtassa automatikusan az Layout API-t. Az egyéni modell beállítási folyamata során dönthet úgy, hogy automatikusan futtatja az Layout API-t a blobtárolóban lévő összes dokumentumhoz.
Keresés. A Studio mostantól keresési funkciókat is tartalmaz a szavak dokumentumon belüli megkereséséhez. Ez a fejlesztés lehetővé teszi a könnyebb navigációt címkézés közben.
Navigáció. Címkéket kijelölve megcélzhatja a címkézett szavakat a dokumentumban.
Automatikus táblázatcímkézés. Miután kiválasztotta a táblázat ikonját egy dokumentumban, a kibontott táblázatot feliratozási nézetben is automatikusan megjelölheti.
Címke altípusai és másodszintű altípusai A Studio mostantól támogatja a táblázatoszlopok, a táblázatsorok és a második szintű altípusok altípusait olyan típusok esetében, mint a dátumok és számok.
Az egyéni neurális modellek létrehozása mostantól támogatott az USA Gov Virginia régiójában.
Előzetes verziójú API-verziók
2022-01-30-preview
, és2021-09-30-preview
2023. január 31-én megszűnik. Frissítsen az2022-08-31
API-verzióra a szolgáltatáskimaradások elkerülése érdekében.
2022. november
- Az Azure AI Document Intelligence-kódtárak legújabb stabil kiadásának bejelentése
- Ez a kiadás fontos módosításokat és frissítéseket tartalmaz a .NET-, Java-, JavaScript- és Python-ügyfélkódtárakhoz. További információ: Azure SDK DevBlog.
- A legfontosabb fejlesztések a bevezetése két új ügyfelek, a
DocumentAnalysisClient
és aDocumentModelAdministrationClient
.
2022. október
Dokumentumintelligencia-verziójú tartalom
A Dokumentumintelligencia dokumentációja frissül, hogy egy verziószámozott felületet jelenítsen meg. Most kiválaszthatja, hogy megtekintse az élményt vagy a
v3.0 GA
v2.1 GA
felhasználói élményt célzó tartalmakat. A 3.0-s verziós felület az alapértelmezett.
Document Intelligence Studio mintakód
- A Document Intelligence Studio címkézési felületének mintakódja már elérhető a GitHubon. Az ügyfelek fejleszthetik és integrálhatják a Document Intelligencet a saját UX-jukba, vagy létrehozhatják saját új UX-jukat a Document Intelligence Studio mintakódjának használatával.
Nyelvbővítés
- A legújabb előzetes kiadással a Dokumentumintelligencia olvasási (OCR), elrendezési és egyéni sablonmodelljei 134 új nyelvet támogatnak. Ezek a nyelvi kiegészítések közé tartozik a görög, a lett, a szerb, a thai, az ukrán és a vietnami, valamint számos latin és cirill nyelv. A Dokumentumintelligencia jelenleg összesen 299 támogatott nyelvvel rendelkezik a legutóbbi ga és az új előzetes verzióban. A támogatott nyelvek megtekintéséhez tekintse meg a támogatott nyelvek oldalát.
- Használja a REST API paramétert
api-version=2022-06-30-preview
az API vagy a megfelelő SDK használatakor az alkalmazások új nyelveinek támogatásához.
Új előre összeállított szerződésmodell
- Egy új előre összeállított, amely adatokat nyer ki olyan szerződésekből, mint a felek, a cím, a szerződés azonosítója, a végrehajtási dátum stb. A szerződésmodell jelenleg előzetes verzióban érhető el, és itt kérhet hozzáférést.
Régióbővítés egyéni neurális modellek betanításához
- Az egyéni neurális modellek betanítása mostantól támogatott a hozzáadott régiókban.
- USA keleti régiója
- USA 2. keleti régiója
- USA-beli államigazgatás – Arizona
- Az egyéni neurális modellek betanítása mostantól támogatott a hozzáadott régiókban.
Szeptember 2022.
Feljegyzés
A 4.0.0-s verziótól kezdve új ügyfélkészletet vezetünk be a Dokumentumintelligencia szolgáltatás legújabb funkcióinak kihasználásához.
Az SDK 4.0.0 GA-verziójú kiadása a következő frissítéseket tartalmazza:
- 4.0.0 GA-verzió (2022-09-08)
- Támogatja a REST API 3.0-s és 2.0-s verziós ügyfeleit
Az egyéni neurális modellek betanításának régióbővítése mostantól hat új régióban támogatott
- Kelet-Ausztrália
- Az USA középső régiója
- Kelet-Ázsia
- Közép-Franciaország
- Az Egyesült Királyság déli régiója
- USA 2. nyugati régiója
Azoknak a régióknak a teljes listáját, ahol a betanítás támogatott, tekintse meg az egyéni neurális modelleket.
Document Intelligence SDK-verzió
4.0.0 GA
kiadása:- A Document Intelligence ügyfélkódtárak 4.0.0-s (.NET/C#, Java, JavaScript) és 3.2.0-s verzió (Python) általánosan elérhetők és használatra készek éles alkalmazásokban!.
- A Dokumentumintelligencia-ügyfélkódtárakról további információt az SDK áttekintésében talál.
- Frissítse alkalmazásait a programozási nyelv migrálási útmutatójával.
2022. augusztus
A Document Intelligence SDK 2022. augusztusi bétaverziójának előzetes kiadása a következő frissítéseket tartalmazza:
4.0.0-béta.5-ös verzió (2022-08-09)
A Document Intelligence v3.0 általánosan elérhető
- A Document Intelligence REST API 3.0-s verzió már általánosan elérhető és használatra kész éles alkalmazásokban! Frissítse alkalmazásait a REST API 2022-08-31-es verziójával.
A Document Intelligence Studio frissítései
- Következő lépések. Az egyes modelloldalakon a Studio most egy következő lépésekkel foglalkozó szakaszt tartalmaz. A felhasználók gyorsan hivatkozhatnak a mintakódra, hibaelhárítási irányelvekre és díjszabási információkra.
- Egyéni modellek. A Studio mostantól lehetővé teszi a címkék átrendezését egyéni modellprojektekben a címkézés hatékonyságának javítása érdekében.
- A Másolási modellek egyéni modellek átmásolhatók a Dokumentumintelligencia-szolgáltatások között a Studióban. A művelet lehetővé teszi a betanított modellek előléptetését más környezetek és régiók számára.
- Dokumentumok törlése. A Studio mostantól támogatja a dokumentumok törlését a címkézett adathalmazból az egyéni projektekben.
Dokumentumintelligencia-szolgáltatás frissítései
- előre összeállított olvasott. Az olvasási OCR-modell mostantól a Dokumentumintelligencia szolgáltatásban is elérhető, a két új funkció pedig a bekezdések és a nyelvfelismerés. A Dokumentumintelligencia olvasása a dokumentumintelligencia szélesebb körű dokumentumintelligencia-képességeihez igazodó speciális dokumentumforgatókönyveket céloz meg.
- előre összeállított elrendezés. Az Elrendezési modell kinyeri a bekezdéseket, és hogy a kinyert szöveg egy bekezdés, cím, szakaszfejléc, lábjegyzet, oldalfejléc, oldalláb vagy oldalszám.
- előre összeállított számla. A TotalVAT és a Line/Vat mezők mostantól a TotalTax és a Line/Tax meglévő mezőkre lesznek feloldva.
- előre összeállított-idDocument. Az usa államazonosítójának, társadalombiztosítási és zöld kártyáinak adatkinyerési támogatása. Útlevél vízuminformációk támogatása.
- előre összeállított nyugta. Kiterjesztett területi támogatás francia (fr-FR), spanyol (es-ES), portugál (pt-PT), olasz (it-IT) és német (de-DE) számára.
- előre összeállított businessCard. A cím elemzése támogatja a címösszetevők, például a cím, a város, az állam, az ország/régió és az irányítószám almezőinek kinyeréséhez.
Az AI minőségi fejlesztései
- előre összeállított olvasott. Az egykarakterek, kézzel írt dátumok, összegek, nevek, egyéb, a nyugtákban és számlákban gyakran használt kulcsadatok, valamint a digitális PDF-dokumentumok jobb feldolgozása fokozott támogatása.
- előre összeállított elrendezés. A körülvágott táblák, szegély nélküli táblák jobb észlelésének és a hosszú átnyúló cellák jobb felismerésének támogatása.
- előre összeállított dokumentum. Továbbfejlesztett érték- és jelölőnégyzetfelismerés.
- egyéni neurális. Nagyobb pontosság a táblaészleléshez és a kinyeréshez.
2022. június
- A Document Intelligence SDK 2022. júniusi előzetes verziójának bétaverziója a következő frissítéseket tartalmazza:
4.0.0-beta.4-es verzió (2022-06-08)
A Document Intelligence Studio júniusi kiadása a Document Intelligence Studio legújabb frissítése. A frissítés jelentős felhasználói élményt és akadálymentességet érintő fejlesztéseket tartalmaz:
- Kódminta JavaScripthez és C#-hoz. A Studio code lap mostantól JavaScript- és C#-kódmintákat is hozzáad a meglévő Pythonhoz.
- Új dokumentumfeltöltési felhasználói felület. A Studio mostantól támogatja a dokumentumok feltöltését az új feltöltési felhasználói felületre húzással.
- Új funkció egyéni projektekhez. Az egyéni projektek mostantól támogatják a tárfiókok és blobok létrehozását a projekt konfigurálásakor. Az egyéni projekt emellett mostantól támogatja a betanítási fájlok közvetlenül a Studióban való feltöltését és a meglévő egyéni modell másolását.
A Document Intelligence 2022-06-30 előzetes verziójú 3.0-s verziója széles körű frissítéseket tartalmaz a funkció API-kban:
- Az elrendezés kibővíti a struktúra kinyerési funkcióját. Az elrendezés mostantól tartalmaz további szerkezeti elemeket, például szakaszokat, szakaszfejléceket és bekezdéseket. Ez a frissítés részletesebb dokumentumszegmentálási forgatókönyveket tesz lehetővé. Az azonosított szerkezeti elemek teljes listájáért lásd a továbbfejlesztett struktúrát.
- Az egyéni neurális modell táblázatos mezői támogatják. Az egyéni dokumentummodellek mostantól támogatják a táblázatos mezőket. A táblázatos mezők alapértelmezés szerint többoldalasak is. Ha többet szeretne megtudni az egyéni neurális modellek táblázatos mezőiről, tekintse mega táblázatos mezőket.
- Az egyéni sablonmodell táblázatos mezői támogatják a többoldalas táblákat. Az egyéni űrlapmodellek mostantól több oldalon is támogatják a táblázatos mezőket. Ha többet szeretne megtudni az egyéni sablonmodellek táblázatos mezőiről, tekintse mega táblázatos mezőket.
- A számlamodell kimenete mostantól általános dokumentumkulcs-érték párokat tartalmaz. Ha a számlák az előre összeállított modellben szereplő mezőkön túl kötelező mezőket tartalmaznak, az általános dokumentummodell kulcs-érték párokkal kiegészíti a kimenetet. Tekintse mega kulcsértékpárokat.
- A számla nyelvének bővítése. A számlamodell kiterjesztett nyelvi támogatást tartalmaz. Lásd atámogatott nyelveket.
- Az előre összeállított névjegykártya mostantól japán nyelvű támogatást is tartalmaz. Lásd atámogatott nyelveket.
- Előre összeállított azonosítójú dokumentummodell. Az azonosító dokumentummodell most kinyeri a DateOfIssue, a Height, a Weight, az EyeColor, a HairColor és a DocumentDiscriminator fájlt az usa-beli illesztőprogram licenceiből. Lásd amezőkiemelést.
- Az olvasási modell mostantól támogatja a Microsoft Office gyakori dokumentumtípusokat. A Read API mostantól támogatja az olyan dokumentumtípusokat, mint a Word (docx), az Excel (xlsx) és a PowerPoint (pptx). Lásd: Adatkinyerés olvasása.
február 2022.
4.0.0-beta.3-s verzió (2022-02-10)
A Document Intelligence 3.0 előzetes verziójú kiadása számos új funkciót, képességet és fejlesztést vezet be:
- Az egyéni neurális modell vagy egyéni dokumentummodell egy új egyéni modell, amely szöveges és kijelölési jeleket nyer ki strukturált űrlapokból, félig strukturált és strukturálatlan dokumentumokból.
- A W-2 előre összeállított modell egy új előre összeállított modell, amely az adóbevallási és jövedelem-ellenőrzési forgatókönyvek W-2 űrlapjaiból nyer ki mezőket.
- A Read API kinyomtatott szövegsorokat, szavakat, szöveghelyeket, észlelt nyelveket és kézzel írt szöveget nyer ki, ha észleli.
- Az általános dokumentum-előre betanított modell frissült, hogy az API-szövegek, táblázatok, struktúra és kulcs-érték párok mellett az űrlapokból és dokumentumokból is támogassa a kijelölési jeleket.
- A Invoice API Számla előre összeállított modellje kibővíti a spanyol számlák támogatását.
- A Document Intelligence Studio új demókat ad hozzá az Olvasás, W2, Hotel nyugtamintákhoz, és támogatja az új egyéni neurális modellek betanítását.
- A nyelvbővítési dokumentumintelligencia olvasása, elrendezése és egyéni űrlapja 42 új nyelv, köztük az arab, hindi és egyéb nyelvek támogatását teszi lehetővé arab és devanagari szkriptek használatával, hogy a lefedettséget 164 nyelvre bővítse. A kézzel írt nyelvi támogatás japán és koreai nyelvre terjed ki.
Ismerkedés az új REST API-val, Pythonnal vagy .NET SDK-val a v3.0 előzetes verziójú API-hoz.
Dokumentumintelligencia-modell adatkinyerése:
Modell Szöveg kinyerése Kulcs-érték párok Kijelölési jelek Táblák Aláírások Olvasás ✓ Általános dokumentum ✓ ✓ ✓ ✓ Elrendezés ✓ ✓ ✓ Számla ✓ ✓ ✓ ✓ Nyugta ✓ ✓ ✓ Személyazonosító okmányok ✓ ✓ Névjegykártya ✓ ✓ Egyéni sablon ✓ ✓ ✓ ✓ ✓ Egyéni neurális ✓ ✓ ✓ ✓ A Document Intelligence SDK bétaverziójának előzetes kiadása a következő frissítéseket tartalmazza:
Egyéni dokumentummodellek és -módok:
- Egyéni sablon (korábban egyéni űrlap).
- Egyéni neurális.
- Egyéni modell – összeállítási mód.
W-2 előre összeállított modell (előre összeállított-tax.us.w2).
Előre összeállított modell olvasása (előre összeállított olvasás).
Előre összeállított számlamodell (spanyol) (előre összeállított számla).
2021. november
4.0.0-béta.2-es verzió (2021-11-09)
| Csomag (NuGet) | Changelog/Release History | API referenciadokumentáció
- A Document Intelligence 3.0-s előzetes verziójú SDK kiadási frissítése (béta.2) hibajavításokat és kisebb funkciók frissítését tartalmazza.
2021. október
A Document Intelligence 3.0 előzetes verziójú kiadásának 4.0.0-béta.1-es verziója (2021-10-07) számos új funkciót és funkciót vezet be:
Az általános dokumentummodell egy új API, amely előre betanított modellt használ szöveg, táblázatok, struktúra és kulcs-érték párok űrlapokból és dokumentumokból való kinyeréséhez.
Szállodai nyugtamodell hozzáadva az előre összeállított nyugtafeldolgozáshoz.
Az azonosító-modell által támogatott azonosító-dokumentum kibővített mezői támogatják a jóváhagyásokat, a korlátozásokat és a járműbesorolási kinyeréseket az EGYESÜLT Államok jogosítványaiból.
Az Aláírás mező egy új mezőtípus az egyéni űrlapokban, amely észleli az aláírás jelenlétét egy űrlapmezőben.
Nyelvbővítés támogatása 122 nyelvhez (nyomtatás) és 7 (kézzel írt) nyelvhez. A dokumentumintelligencia-elrendezés és az egyéni űrlap a legújabb előzetes verzióval 122-re bővíti a támogatott nyelveket . Az előzetes verzióban 49 új nyelven, például orosz, bolgár és más cirill és több latin nyelven található szöveg kinyerése látható. Emellett a kézzel írt szövegek kinyerése mostantól hét nyelvet támogat, amelyek tartalmazzák az angolt, valamint a kínai egyszerűsített, francia, német, olasz, portugál és spanyol nyelvű új előzetes verziókat.
A táblázatok és a szövegkinyerés fejlesztései Az elrendezés mostantól támogatja az egysoros táblák, más néven kulcs-érték táblák kinyerését. A szövegkinyerési fejlesztések közé tartozik a digitális PDF-fájlok és a gépi olvasható zóna (MRZ) szövegének jobb feldolgozása az identitásdokumentumokban, valamint az általános teljesítmény.
A Document Intelligence Studio A szolgáltatás használatának egyszerűsítése érdekében mostantól hozzáférhet a Document Intelligence Studióhoz a különböző előre összeállított modellek teszteléséhez vagy címkézéséhez és egyéni modellek betanításához.
Ismerkedés az új REST API-val, Pythonnal vagy .NET SDK-val a v3.0 előzetes verziójú API-hoz.
Dokumentumintelligencia-modell adatainak kinyerése
Modell Szöveg kinyerése Kulcs-érték párok Kijelölési jelek Táblák Általános dokumentum ✓ ✓ ✓ ✓ Elrendezés ✓ ✓ ✓ Számla ✓ ✓ ✓ ✓ Nyugta ✓ ✓ Személyazonosító okmányok ✓ ✓ Névjegykártya ✓ ✓ Egyéni ✓ ✓ ✓ ✓
2021. szeptember
Az Azure Metrics Explorer speciális funkciói az Azure Portal Dokumentumintelligencia-erőforrásáttekintő oldalán érhetők el.
Figyelési menü:
Diagramok:
Azonosító dokumentummodell frissítése: a megadott nevek, beleértve az utótagot, ponttal vagy anélkül (teljes leállítással) sikeresen feldolgozhatók:
Beviteli szöveg Eredmény frissítéssel William Isaac Kirby Jr. FirstName: William Isaac
LastName: Kirby Jr.Henry Caleb Ross Sr Utónév: Henry Caleb
LastName: Ross Sr.
2021. július
- Rendszer által hozzárendelt felügyelt identitás támogatása: Mostantól engedélyezheti a rendszer által hozzárendelt felügyelt identitásokat, hogy a Document Intelligence korlátozott hozzáférést biztosítson a privát tárfiókokhoz, beleértve a virtuális hálózattal, tűzfallal vagy saját tárhellyel (BYOS) védett fiókokat. További információ:Felügyelt identitás létrehozása és használata a Dokumentumintelligencia-erőforráshoz .
2021. június
A Dokumentumintelligencia-tárolók 2.1-ben megjelent, kapus előzetes verzióban, és mostantól hat funkciótároló támogatja: Elrendezés, Névjegykártya, Azonosító dokumentum, Nyugta, Számla és Egyéni. A használatukhoz online kérelmet kell küldenie, és jóváhagyást kell kapnia.
Előzetes verzióban megjelent Dokumentumintelligencia-összekötő: A Dokumentumintelligencia-összekötő integrálható az Azure Logic Apps, a Microsoft Power Automate és a Microsoft Power Apps szolgáltatással. Az összekötő támogatja a munkafolyamat-műveleteket és eseményindítókat a dokumentumadatok és -szerkezetek egyéni és előre összeállított űrlapokból, számlákból, nyugtákból, névjegykártyákból és azonosító dokumentumokból való kinyeréséhez és elemzéséhez.
A Document Intelligence SDK 3.1.0-s v3.1.1-s verzióra van javítva C#, Java és Python esetén. A javítás azokat a számlákat kezeli, amelyeknél nem észlelhetők alsorelemmezők, például
FormField
a withText
, de noBoundingBox
vagyPage
information.
2021. május
- 3.1.0-s verzió (2021-05-26)
Changelog/Release History| Reference documentation | NuGet package version 3.0.1 |
A Document Intelligence 2.1 általánosan elérhető. A GA-kiadás a korábbi, 2.1-es előzetes verziójú csomagverziókban bevezetett módosítások stabilitását jelzi. Ez a kiadás lehetővé teszi az információk és adatok észlelését és kinyerását a következő dokumentumtípusokból:
Első lépésként próbálja ki a dokumentumintelligencia-mintaeszközt , és kövesse a rövid útmutatót.
A frissített Layout API táblafunkció több sorra kiterjedő oszlopfejlécekkel bővíti a fejlécfelismerést. Minden táblázatcella rendelkezik egy attribútummal, amely jelzi, hogy egy fejléc része-e vagy sem. Ez a frissítés a tábla fejlécét alkotó sorok azonosítására használható.
április 2021.
NuGet-csomag 3.1.0-béta.4-es verziója
Új módszerek az identitásdokumentumokból származó adatok elemzésére:
StartRecognizeIdDocumentsFromUriAsync
StartRecognizeIdDocumentsAsync
A mezőértékek listájáért tekintse mega Dokumentumintelligencia dokumentációjában kinyert mezőket.
Kibontottuk a StartRecognizeContent metódushoz megadható dokumentumnyelveket.
Az alábbi osztályok által támogatott új tulajdonság
Pages
:RecognizeBusinessCardsOptions
RecognizeCustomFormsOptions
RecognizeInvoicesOptions
RecognizeReceiptsOptionsA
Pages
tulajdonság lehetővé teszi a többoldalas PDF- és TIFF-dokumentumok egyéni vagy többoldalas laptartományának kiválasztását. Az egyes oldalak esetében adja meg például3
az oldalszámot. Egy oldaltartományhoz (például a 2. és az 5-7. oldalhoz) írja be a p korszámokat és tartományokat vesszővel elválasztva:2, 5-7
.A következő osztályhoz támogatott új tulajdonság
ReadingOrder
:A
ReadingOrder
tulajdonság egy opcionális paraméter, amellyel megadhatja, hogy melyik olvasási sorrendi algoritmustbasic
natural
kell alkalmazni a szövegelemek kinyerésének sorrendjére. Ha nincs megadva, az alapértelmezett érték a következőbasic
: .
- Az API-verzió
2.1-preview.3
SDK előzetes frissítései funkciófrissítéseket és fejlesztéseket vezetnek be.
2021. március
A Document Intelligence v2.1 nyilvános előzetes verziójú v2.1-preview.3 megjelent, és a következő funkciókat tartalmazza:
Új előre összeállított azonosítómodell Az új előre összeállított azonosító modell lehetővé teszi az ügyfelek számára, hogy azonosítókat vegyenek fel, és strukturált adatokat adjanak vissza a feldolgozás automatizálásához. Egyesíti a hatékony optikai karakterfelismerési (OCR) képességeket az azonosító-értelmező modellekkel, hogy kulcsinformációkat nyerjen ki az útlevelekből és az egyesült államokbeli jogosítványokból.
További információ az előre összeállított azonosító modellről
Sorelem-kinyerés a számlamodellhez – Az előre összeállított számlamodell mostantól támogatja a sorelemek kinyerése; mostantól teljes cikkeket és azok részeit – leírást, összeget, mennyiséget, termékazonosítót, dátumot és egyebeket – nyer ki. Egy egyszerű API/SDK-hívással hasznos adatokat nyerhet ki a számlákból – szövegből, táblázatból, kulcs-érték párokból és sorelemekből.
Felügyelt táblacímkézés és betanítás , üres értékű címkézés – A Document Intelligence korszerű mélytanulási automatikus táblázatkiemelési képességei mellett mostantól lehetővé teszi az ügyfelek számára a táblák címkézését és betanítását. Ez az új kiadás magában foglalja a sorelemek/táblák címkézését és betanítása (dinamikus és rögzített), valamint egy egyéni modell betanítása kulcs-érték párok és sorelemek kinyerésére. A modell betanítása után a modell a documentResults szakaszban lévő JSON-kimenet részeként kinyeri a sorelemeket.
A táblák címkézése mellett mostantól üres értékeket és régiókat is címkézhet. Ha a betanítási csoport egyes dokumentumai nem tartalmaznak értékeket bizonyos mezőkhöz, címkézheti őket, hogy a modell megfelelően kinyerje az értékeket az elemzett dokumentumokból.
66 új nyelv támogatása – Az Layout API és a Document Intelligence egyéni modelljei mostantól 73 nyelvet támogatnak.
További információ a Dokumentumintelligencia nyelvi támogatásáról.
Természetes olvasási sorrend, kézírás-besorolás és oldalkijelölés – Ezzel a frissítéssel a szövegsorok kimeneteit természetes olvasási sorrendbe állíthatja az alapértelmezett balról jobbra és felülről lefelé rendezés helyett. Használja az új readingOrder lekérdezési paramétert, és állítsa "természetes" értékre az emberbarát olvasási sorrend kimenetéhez. Ezenkívül a latin nyelvek esetében a Dokumentumintelligencia kézzel írt stílusként osztályozza a szövegsorokat, és megbízhatósági pontszámot ad.
Előre összeállított nyugtamodell minőségi fejlesztései Ez a frissítés számos minőségi fejlesztést tartalmaz az előre összeállított nyugtamodellhez, különösen a sorelemek kinyerése körül.
2020. november
Megjelent a Document Intelligence 2.1-preview.2 verziója, amely a következő funkciókat tartalmazza:
Új előre összeállított számlamodell – Az új előre összeállított számlamodell lehetővé teszi az ügyfelek számára, hogy különböző formátumú számlákat készítsenek, és strukturált adatokat adjanak vissza a számlafeldolgozás automatizálásához. A hatékony optikai karakterfelismerési (OCR) képességeket ötvözi a számlafelismerési mélytanulási modellekkel, hogy a számlákból fő információkat nyerjen ki angol nyelven. Olyan kulcsszövegeket, táblázatokat és információkat nyer ki, mint az ügyfél, a szállító, a számlaazonosító, a számla határideje, az összeg, a fizetendő összeg, az adó összege, a szállítási és a számlázási adatok.
Továbbfejlesztett táblázatkinyerés – A Dokumentumintelligencia mostantól továbbfejlesztett táblázatkinyerési funkciót biztosít, amely ötvözi a hatékony optikai karakterfelismerési (OCR) képességeket egy mélytanulási táblázat kinyerési modellel. A Dokumentumintelligencia képes adatokat kinyerni a táblákból, beleértve az egyesített oszlopokat, sorokat, szegélyeket és egyebeket tartalmazó összetett táblákat is.
Ügyfélkódtár frissítése – A .NET, Python , Java és JavaScript ügyfélkódtárainak legújabb verziói támogatják a Document Intelligence 2.1 API-t.
Új nyelv támogatott: japán – A következő új nyelvek támogatottak: és
AnalyzeLayout
AnalyzeCustomForm
: japán (ja
). Nyelvi támogatás.Szövegsorstílus jelzése (kézzel írt/egyéb) (csak latin nyelvű) – A Dokumentumintelligencia mostantól egy
appearance
objektumot ad ki, amely osztályozza, hogy az egyes szövegsorok kézzel írt stílusok-e vagy sem, valamint egy megbízhatósági pontszámot. Ez a funkció csak latin nyelvek esetén támogatott.Minőségi fejlesztések – Extrakciós fejlesztések, beleértve az egyjegyű extrakciós fejlesztéseket.
A dokumentumintelligencia-minta- és címkézési eszköz új kipróbálási funkciója – Az előre összeállított számla-, nyugta- és névjegykártya-modellek és az Layout API kipróbálása a Dokumentumintelligencia-mintacímkéző eszközzel. Nézze meg, hogyan nyeri ki az adatokat kód írása nélkül.
A Dokumentumintelligencia-mintacímkéző eszköz kipróbálása
- Visszajelzési ciklus – Ha a mintacímkézési eszközzel elemzi a fájlokat, hozzáadhatja azt a betanítási csoporthoz, és szükség esetén módosíthatja a címkéket, és betanítással fejlesztheti a modellt.
- Dokumentumok automatikus címkézése – A projekt korábbi címkével ellátott dokumentumai alapján automatikusan felcímkézi a hozzáadott dokumentumokat.
2020. augusztus
**A dokumentumintelligencia
v2.1-preview.1
a következő funkciókat tartalmazza:- A REST API-referencia elérhető – Tekintse meg a
v2.1-preview.1 reference
. - Az angol mellett az alábbi nyelvek támogatottak:
Layout
Train Custom Model
angol (), kínai (en
egyszerűsített) (zh-Hans
), holland (), francia (nl
fr
), német (de
), olasz (it
), portugál (pt
) és spanyol (es
). - Jelölőnégyzet/ Kijelölésjel észlelése – A dokumentumintelligencia támogatja a kijelölési jelek, például a jelölőnégyzetek és a választógombok észlelését és kinyerását. A kijelölési jelek ki vannak nyerve
Layout
, és mostantól címkéket is címkézhet és betanított a Címkék betanítása területenTrain Custom Model
- a kijelölési jelek kulcs-érték párjainak kinyeréséhez. - Model Compose – lehetővé teszi több modell összeállítását és meghívását egyetlen modellazonosítóval. Amikor elküld egy dokumentumot, amelyet egy összeállított modellazonosítóval szeretne elemezni, a rendszer először egy besorolási lépést hajt végre, amely a megfelelő egyéni modellhez irányítja. A Model Compose a címkékkel való betanítása érdekében
Train Custom Model
- érhető el. - Modellnév – adjon hozzá egy rövid nevet az egyéni modellekhez a könnyebb felügyelet és nyomon követés érdekében.
- Új előre összeállított modell névjegykártyákhoz az angol nyelvű, nyelvi névjegykártyák gyakori mezőinek kinyerése érdekében.
- Az előre összeállított nyugták új területi beállításai az EN-US mellett mostantól az EN-AU, EN-CA, EN-GB és EN-IN esetén is elérhetők.
- Minőségi fejlesztések a
Layout
címkékTrain Custom Model
- nélküli betanításhoz és a címkékkel való betanításhoz.
- A REST API-referencia elérhető – Tekintse meg a
A 2.0-s verzió a következő frissítést tartalmazza:
- A NET, a Python, a Java és a JavaScript ügyfélkódtárai általánosan elérhetők.
Új minták érhetők el a GitHubon.
- A Tudáskinyerési receptek – Forms forgatókönyv összegyűjti az ajánlott eljárásokat a valódi Dokumentumintelligencia-ügyfelek előjegyzéseiből, és használható kódmintákat, ellenőrzőlistákat és mintafolyamatokat biztosít ezeknek a projekteknek a fejlesztéséhez.
- A mintacímkézési eszköz frissül az új v2.1-funkció támogatásához. Az eszköz használatának első lépéseit ebben a rövid útmutatóban tekintheti meg.
- Az Intelligens kioszk dokumentumintelligencia-minta bemutatja, hogyan integrálható
Analyze Receipt
ésTrain Custom Model
- tanítható be címkék nélkül.
2020. július
- A Document Intelligence 2.0-s referenciája elérhető – A v2.0 API-referencia és a .NET, Python, Java és JavaScript frissített ügyfélkódtárainak megtekintése.
Táblázatfejlesztések és extrakciós fejlesztések – a pontosság javításai és a táblázatkinyerés fejlesztései, különösen a táblafejlécek és -struktúrák elsajátítása a címkék nélküli egyéni betanításban.
Pénznemtámogatás – A globális pénznemszimbólumok észlelése és kinyerése.
Az Azure Gov – A dokumentumintelligencia mostantól az Azure Gov-ban is elérhető.
Továbbfejlesztett biztonsági funkciók:
- Saját kulcs használata – A Dokumentumintelligencia automatikusan titkosítja az adatokat, amikor a felhőben maradnak, hogy megvédjék őket, és segítsenek megfelelni a szervezeti biztonsági és megfelelőségi követelményeknek. Alapértelmezés szerint az előfizetés a Microsoft által felügyelt titkosítási kulcsokat használja. Most már saját titkosítási kulcsokkal is kezelheti előfizetését. Az ügyfél által felügyelt kulcsok, más néven a saját kulcs (BYOK) nagyobb rugalmasságot biztosítanak a hozzáférés-vezérlők létrehozásához, elforgatásához, letiltásához és visszavonásához. Továbbá az adatok védelméhez használt titkosítási kulcsok naplózására is lehetősége van.
- Privát végpontok – Lehetővé teszi, hogy egy virtuális hálózaton biztonságosan hozzáférjen az adatokhoz privát kapcsolaton keresztül.
2020. június
- CopyModel API hozzáadva az ügyfélkódtárakhoz – Mostantól az ügyfélkódtárak használatával modelleket másolhat egyik előfizetésből a másikba. A funkcióval kapcsolatos általános információkért tekintse meg a modellek biztonsági mentését és helyreállítását.
- Azure Active Directory-integráció – Mostantól az Azure AD-hitelesítő adataival hitelesítheti a Document Intelligence ügyfélobjektumait az ügyfélkódtárakban.
- SDK-specifikus módosítások – Ez a módosítás magában foglalja az apróbb funkciók hozzáadását és a kompatibilitástörő módosításokat is. További információt az SDK változásnaplóiban talál .
április 2020.
- SDK-támogatás a Document Intelligence API 2.0-s nyilvános előzetes verziójához – Ebben a hónapban bővítettük szolgáltatástámogatásunkat, hogy tartalmazza a Document Intelligence 2.0-s verziójához készült előzetes verziójú SDK-t. Az alábbi hivatkozások segítségével ismerkedhet meg a választott nyelvvel:
- .NET SDK
- Java SDK
- Python SDK
- JavaScript SDK
Az új SDK támogatja a v2.0 REST API for Document Intelligence összes funkcióját. Az ügyfélkódtárakra vonatkozó visszajelzéseit az SDK visszajelzési űrlapján oszthatja meg.
Egyéni modell másolása Mostantól modelleket másolhat régiók és előfizetések között az új Egyéni modell másolása funkcióval. Az egyéni modell másolása API meghívása előtt először meg kell szereznie a célerőforrásba való másoláshoz szükséges engedélyt. Ezt az engedélyezést úgy biztosítjuk, hogy meghívjuk a Másolás engedélyezése műveletet a célerőforrás-végponthoz.
Hozzon létre egy másolás-engedélyezési REST API-t.
Másolja ki az egyéni modell REST API-t.
Biztonsági fejlesztések.
Az ügyfél által felügyelt kulcsok mostantól elérhetők a FormRecognizerhez. További információ: Inaktív adattitkosítás a Dokumentumintelligencia szolgáltatásban.
Felügyelt identitások használata Azure-erőforrásokhoz való hozzáféréshez az Azure Active Directoryval. További információ: Hozzáférés engedélyezése felügyelt identitásokhoz.
2020. március
- A címkézés értéktípusai Mostantól megadhatja, hogy milyen típusú értékeket címkéz a dokumentumintelligencia-mintacímkézési eszközzel. Jelenleg a következő értéktípusok és -változatok támogatottak:
string
- alapértelmezett,
no-whitespaces
,alphanumeric
- alapértelmezett,
number
- Alapértelmezett
currency
- Alapértelmezett
date
- alapértelmezett,
dmy
, ,mdy
ymd
- alapértelmezett,
time
integer
A funkció használatának megismeréséhez tekintse meg a Mintacímkézés eszköz útmutatóját.
Táblázatvizualizáció A Mintacímkézés eszköz mostantól megjeleníti a dokumentumban felismert táblákat. Ez a funkció lehetővé teszi a felismert és kinyert táblák megtekintését a dokumentumból a címkézés és elemzés előtt. Ez a funkció be- és kikapcsolható a rétegek beállítással.
Az alábbi kép egy példa a táblák felismerésére és kinyerésének módjára:
A kinyert táblák a JSON-kimenetben érhetők el a következő alatt
"pageResults"
: .Fontos
A táblák címkézése nem támogatott. Ha a táblákat nem ismeri fel és nyeri ki automatikusan, csak kulcs/érték párként címkézheti őket. A táblák kulcs/érték párként való címkézésekor minden cellát egyedi értékként kell megjelölni.
Extrakciós fejlesztések.
Ez a kiadás tartalmazza az extrakciós fejlesztéseket és a pontossági fejlesztéseket, különösen azt a képességet, hogy több kulcs-/értékpárt címkézzen és nyerjen ki ugyanabban a szövegsorban.
A mintacímkézési eszköz mostantól nyílt forráskódú.
A dokumentumintelligencia-mintacímkézési eszköz már nyílt forráskódú projektként is elérhető. A megoldásokat integrálhatja, és ügyfélspecifikus módosításokat végezhet az igényeinek megfelelően.
A Dokumentumintelligencia-mintacímkézés eszközről a GitHubon elérhető dokumentációban talál további információt.
TLS
1.2 kényszerítés.TLS
Az 1.2-t a szolgáltatásnak küldött összes HTTP-kéréshez kényszeríti a szolgáltatás. További információ: Azure AI-szolgáltatások biztonsága.
Január 2020.
Ez a kiadás bemutatja a Document Intelligence 2.0-t. A következő szakaszokban további információkat talál az új funkciókról, fejlesztésekről és módosításokról.
Új funkciók
Egyéni modell
- Betanítása címkékkel : Mostantól manuálisan címkézett adatokkal taníthat be egyéni modelleket. Ez a módszer jobb teljesítményű modelleket eredményez, és olyan modelleket hozhat létre, amelyek kulcsok nélküli értékeket tartalmazó összetett űrlapokkal vagy űrlapokkal működnek.
- Aszinkron API Aszinkron API-hívások használatával taníthat be és elemezhet nagy adatkészleteket és fájlokat.
- TIFF-fájlok támogatása Mostantól betanítása és kinyerése TIFF-dokumentumokból.
- A kinyerési pontosság javítása.
Előre összeállított nyugtamodell
- Tippösszegek Mostantól kinyerheti a tippösszegeket és más kézzel írt értékeket.
- Sorelem-kinyerés : A sorelemek értékeit kinyerheti a visszaigazolásokból.
- Megbízhatósági értékek : Megtekintheti a modell megbízhatóságát az egyes kinyert értékekhez.
- A kinyerési pontosság javítása.
- Elrendezés kinyerése Mostantól az Layout API használatával kinyerheti a szöveges adatokat és a táblázatadatokat az űrlapokból.
Egyéni modell API-változásai
A betanításhoz és az egyéni modellek használatához használt összes API átnevezve van, és néhány szinkron metódus mostantól aszinkron. A főbb változások a következők:
- A modell betanításának folyamata mostantól aszinkron. A betanítást a /custom/models API-híváson keresztül kezdeményezheti. Ez a hívás egy műveleti azonosítót ad vissza, amelyet a betanítási eredmények visszaadásához átadhat az egyéni/modelleknek/{modelID} -nek.
- A kulcs/érték kinyerése most a /custom/models/{modelID}/analyze API-hívás által lett elindítva . Ez a hívás egy műveleti azonosítót ad vissza, amelyet a kinyerési eredmények visszaadásához átadhat egyéni/modelleknek/{modelID}/analyzeResults/{resultID} .
- A betanítási művelet műveleti azonosítói a HTTP-válaszok Hely fejlécében találhatók, nem pedig az Operation-Location fejlécben.
A Nyugta API módosításai
A rendszer átnevezi az értékesítési visszaigazolások olvasására szolgáló API-kat.
A nyugtaadatok kinyerését most az /előre összeállított/nyugta/elemzési API-hívás kezdeményezi. Ez a hívás egy műveleti azonosítót ad vissza, amelyet az /előre összeállított/nyugta/analyzeResults/{resultID} fájlba továbbíthat a kinyerési eredmények visszaadásához.
Kimeneti formátum változásai
- Az összes API-hívás JSON-válaszának új formátuma van. Egyes kulcsok és értékek hozzáadódnak, eltávolíthatók vagy átnevezhetők. Az aktuális JSON-formátumokra vonatkozó példákat a rövid útmutatókban talál.
Következő lépések
Próbálja meg feldolgozni saját űrlapjait és dokumentumait a Document Intelligence Studióval.
Végezze el a Dokumentumintelligencia rövid útmutatóját , és kezdje el létrehozni egy dokumentumfeldolgozó alkalmazást a választott fejlesztési nyelven.
Próbálja meg feldolgozni saját űrlapjait és dokumentumait a Dokumentumintelligencia mintacímkéző eszközzel.
Végezze el a Dokumentumintelligencia rövid útmutatóját , és kezdje el létrehozni egy dokumentumfeldolgozó alkalmazást a választott fejlesztési nyelven.