Dokumentumintelligencia házassági tanúsítványmodell
Ez a tartalom a következőre vonatkozik: 4.0-s verzió (előzetes verzió)
A Dokumentumintelligencia házassági tanúsítvány modellje hatékony optikai karakterfelismerési (OCR) képességekkel elemzi és kinyeri a fő mezőket a házassági tanúsítványokból. A házassági anyakönyvi kivonatok különböző formátumúak és minőségűek lehetnek, beleértve a telefonon rögzített képeket, a beolvasott dokumentumokat és a digitális PDF-eket. Az API elemzi a dokumentum szövegét; olyan kulcsfontosságú információkat nyer ki, mint a házastársak neve, a kibocsátás dátuma és a házasság helye; és strukturált JSON-adatábrázolást ad vissza. A modell jelenleg támogatja az angol nyelvű dokumentumformátumokat.
Automatizált házassági anyakönyvi kivonat feldolgozása
Az automatizált házassági tanúsítványfeldolgozás a fő mezők házassági tanúsítványokból való kinyerésének folyamata. A házassági anyakönyvi kivonat elemzési folyamatát korábban manuálisan, tehát nagyon időigényesen érik el. A házassági anyakönyvi kivonatok kulcsadatainak pontos kinyerése általában a házassági tanúsítványok automatizálásának első és egyik legkritikusabb lépése.
Fejlesztési lehetőségek
A Document Intelligence v4.0 (2024-07-31-preview) a következő eszközöket, alkalmazásokat és kódtárakat támogatja:
Szolgáltatás | Források | Modellazonosító |
---|---|---|
prebuilt-marriageCertificate.us | • Document Intelligence Studio • REST API • C# SDK • Python SDK • Java SDK • JavaScript SDK |
prebuilt-marriageCertificate.us |
Bemeneti követelmények
Támogatott fájlformátumok:
Modell PDF Kép: JPEG/JPG
,PNG
,BMP
,TIFF
HEIF
Microsoft Office:
Word (DOCX
), Excel (XLSX
), PowerPoint (PPTX
), HTMLOlvasás ✔ ✔ ✔ Elrendezés ✔ ✔ ✔ (2024-07-31-preview, 2024-02-29-preview, 2023-10-31-preview) Általános dokumentum ✔ ✔ Előre összeállított ✔ ✔ Egyéni kinyerés ✔ ✔ Egyéni besorolás ✔ ✔ ✔ (2024-07-31-preview, 2024-02-29-preview) A legjobb eredmény érdekében dokumentumonként egy tiszta fényképet vagy kiváló minőségű vizsgálatot biztosít.
PDF és TIFF esetén legfeljebb 2000 oldal dolgozható fel (ingyenes szintű előfizetéssel csak az első két oldal dolgozható fel).
A dokumentumok elemzéséhez használt fájlméret 500 MB a fizetős (S0) szint, az
4
ingyenes (F0) szint esetén pedig MB.A képméreteknek 50 képpont x 50 képpont és 10 000 képpont x 10 000 képpont között kell lenniük.
Ha a PDF-eket jelszó védi, akkor beküldés előtt el kell távolítania a védelmet.
A kinyerni kívánt szöveg minimális magassága 12 képpont egy 1024 x 768 képpontos képhez. Ez a dimenzió körülbelül
8
150 pont/hüvelyk (DPI) pontszövegnek felel meg.Egyéni modell betanítása esetén a betanítási adatok oldalainak maximális száma az egyéni sablonmodell esetében 500, az egyéni neurális modell esetében pedig 50 000.
Egyéni extrakciós modell betanítása esetén a betanítási adatok teljes mérete 50 MB a sablonmodellhez, a neurális modellhez pedig
1
GB.Egyéni besorolási modell betanítása esetén a betanítási adatok
1
teljes mérete GB, legfeljebb 10 000 oldal. A 2024-07-31-es és újabb verziókban a betanítási adatok2
teljes mérete GB, legfeljebb 10 000 oldal.
Házassági anyakönyvi kivonatok adatainak kinyerése
A házassági anyakönyvi kártya szolgáltatás adatkinyerésének működéséhez a következő erőforrásokra van szüksége:
Azure-előfizetés – ingyenesen létrehozhat egyet.
Dokumentumintelligencia-példány az Azure Portalon. A szolgáltatás kipróbálásához használhatja az ingyenes tarifacsomagot (
F0
). Az erőforrás üzembe helyezése után válassza az Ugrás az erőforráshoz lehetőséget a kulcs és a végpont lekéréséhez.
Document Intelligence Studio
A Document Intelligence Studio kezdőlapján válassza a Házassági tanúsítvány lehetőséget.
Elemezheti a házassági mintatanúsítványokat, vagy feltöltheti saját fájljait.
Válassza az Elemzés futtatása gombot, és szükség esetén konfigurálja az Elemzési beállításokat:
Támogatott nyelvek és területi beállítások
A támogatott nyelvek teljes listáját az előre összeállított modell nyelvtámogatási oldalán találja.
Mező kinyerése
A támogatott dokumentumkinyerési mezőkért tekintse meg a házassági tanúsítványmodell sémalapját a GitHub-mintaadattárban.
A házassági anyakönyvi kivonat kulcs-érték párjai és a kinyert sorelemek a
documentResults
JSON-kimenet szakaszában találhatók.
Következő lépések
Próbálja meg feldolgozni saját űrlapjait és dokumentumait a Document Intelligence Studióval.
Végezze el a Dokumentumintelligencia rövid útmutatóját , és kezdje el létrehozni egy dokumentumfeldolgozó alkalmazást a választott fejlesztési nyelven.