Document Intelligence névjegykártya-modell
Fontos
A Document Intelligence 4.0-s (előzetes verzió) verziójától kezdve a névjegykártya-modell (előre összeállított-businessCard) elavult. A névjegykártya-formátumok adatainak kinyeréséhez használja a következőket:
Szolgáltatás | Verzió | Modellazonosító |
---|---|---|
Névjegykártya-modell | • v3.1:2023-07-31 (GA) • v3.0:2022-08-31 (GA) • v2.1 (GA) |
prebuilt-businessCard |
Ez a tartalom a következőre vonatkozik: v3.0 (GA) | Legújabb verziók: v4.0 (előzetes verzió) v3.1 | Korábbi verzió: 2.1-es verzió
Ez a tartalom a következőre vonatkozik: v2.1 | Legújabb verzió: 4.0-s verzió (előzetes verzió)
A Dokumentumintelligencia névjegykártya-modell hatékony optikai karakterfelismerési (OCR) képességeket és mélytanulási modelleket kombinál a névjegykártya-rendszerképek adatainak elemzéséhez és kinyeréséhez. Az API elemzi a nyomtatott névjegykártyákat; kinyeri a legfontosabb információkat, például az utónevet, a vezetéknevet, a cégnevet, az e-mail-címet és a telefonszámot; és strukturált JSON-adatábrázolást ad vissza.
Névjegykártya-adatok kinyerése
A névjegykártyák kiválóan alkalmasak üzleti vagy szakmai képviseletre. A névjegykártyákon található céges embléma, betűtípusok és háttérképek segítenek a cég arculatának népszerűsítésében és másoktól való megkülönböztetésében. Az OCR és a gépi tanuláson alapuló technikák alkalmazása a névjegykártyák vizsgálatának automatizálására gyakori képfeldolgozási forgatókönyv. Az értékesítési és marketingcsapatok által használt nagyvállalati rendszerek általában névjegykártya-adatkinyerési képességgel rendelkeznek a felhasználók javára.
A Document Intelligence Studióval feldolgozott minta névjegykártya
A dokumentumintelligencia-mintacímkéző eszközzel feldolgozott mintavállalat
Fejlesztési lehetőségek
A Document Intelligence v3.1:2023-07-31 (GA) a következő eszközöket, alkalmazásokat és kódtárakat támogatja:
Szolgáltatás | Források | Modellazonosító |
---|---|---|
Névjegykártya-modell | • Document Intelligence Studio • REST API • C# SDK • Python SDK • Java SDK • JavaScript SDK |
előre összeállított-businessCard |
A Document Intelligence v3.0:2022-08-31 (GA) a következő eszközöket, alkalmazásokat és kódtárakat támogatja:
Szolgáltatás | Források | Modellazonosító |
---|---|---|
Névjegykártya-modell | • Document Intelligence Studio • REST API • C# SDK • Python SDK • Java SDK • JavaScript SDK |
előre összeállított-businessCard |
A Document Intelligence v2.1 (GA) a következő eszközöket, alkalmazásokat és kódtárakat támogatja:
Szolgáltatás | Források |
---|---|
Névjegykártya-modell | • Dokumentumintelligencia-címkézési eszköz • REST API • Ügyféloldali kódtár SDK • Document Intelligence Docker-tároló |
Névjegykártya-adatok kinyerésének kipróbálás
Megtudhatja, hogyan nyeri ki a névjegykártyákból az adatokat, beleértve a nevet, a beosztást, a címet, az e-mail-címet és a cégnevet. A következő erőforrásokra van szüksége:
Azure-előfizetés – ingyenesen létrehozhat egyet
Dokumentumintelligencia-példány az Azure Portalon. A szolgáltatás kipróbálásához használhatja az ingyenes tarifacsomagot (
F0
). Az erőforrás üzembe helyezése után válassza az Ugrás az erőforráshoz lehetőséget a kulcs és a végpont lekéréséhez.
Document Intelligence Studio
Feljegyzés
A Document Intelligence Studio 3.1-s és 3.0-s verziójú API-kkal érhető el.
A Document Intelligence Studio kezdőlapján válassza a Névjegykártyák lehetőséget.
Elemezheti a minta névjegykártyát, vagy feltöltheti saját fájljait.
Válassza a Futtatás elemzés gombot, és szükség esetén konfigurálja az Elemzési beállításokat :
Dokumentumintelligencia-mintacímkéző eszköz
Lépjen a dokumentumintelligencia-mintaeszközre.
A mintaeszköz kezdőlapján válassza az Előre összeállított modell használata lehetőséget az adatcsempék lekéréséhez.
Válassza ki az elemezni kívánt űrlaptípust a legördülő menüből.
Válassza ki az elemezni kívánt fájl URL-címét az alábbi lehetőségek közül:
A Forrás mezőben válassza az URL-címet a legördülő menüből, illessze be a kijelölt URL-címet, és válassza a Beolvasás gombot.
A Dokumentumintelligencia szolgáltatás végpont mezőjébe illessze be a Dokumentumintelligencia-előfizetéssel beszerzett végpontot.
A kulcsmezőbe illessze be a Dokumentumintelligencia-erőforrásból beszerzett kulcsot.
Válassza a Futtatás elemzése lehetőséget. A dokumentumintelligencia-mintacímkézési eszköz meghívja az Elemzés előre összeállított API-t, és elemzi a dokumentumot.
Az eredmények megtekintése – megtekintheti a kinyert kulcs-érték párokat, a sorelemeket, a kibontott kiemelt szöveget és a táblákat.
Feljegyzés
A Mintacímke eszköz nem támogatja a BMP fájlformátumot. Ez nem a Dokumentumintelligencia-szolgáltatás, hanem az eszköz korlátozása.
Bemeneti követelmények
A legjobb eredmény érdekében dokumentumonként egy tiszta fényképet vagy kiváló minőségű vizsgálatot biztosít.
Támogatott fájlformátumok:
Modell PDF Kép:
JPEG/JPG, PNG, BMP, TIFF, HEIFMicrosoft Office:
Word (DOCX), Excel (XLSX), PowerPoint (PPTX) és HTMLOlvasás ✔ ✔ ✔ Elrendezés ✔ ✔ ✔ (2024-02-29-preview, 2023-10-31-preview) Általános dokumentum ✔ ✔ Előre összeállított ✔ ✔ Egyéni kinyerés ✔ ✔ Egyéni besorolás ✔ ✔ ✔ (2024-02-29-preview) PDF és TIFF esetén legfeljebb 2000 oldal dolgozható fel (ingyenes szintű előfizetéssel csak az első két oldal dolgozható fel).
A dokumentumok elemzéséhez használt fájlméret 500 MB a fizetős (S0) és 4 MB az ingyenes (F0) szint esetén.
A képméreteknek 50 x 50 képpont és 10 000 képpont x 10 000 képpont között kell lenniük.
Ha a PDF-eket jelszó védi, akkor beküldés előtt el kell távolítania a védelmet.
A kinyerni kívánt szöveg minimális magassága 12 képpont egy 1024 x 768 képpontos képhez. Ez a dimenzió körülbelül
8
150 pont/hüvelyk (DPI) pont szövegnek felel meg.Egyéni modell betanítása esetén a betanítási adatok oldalainak maximális száma az egyéni sablonmodell esetében 500, az egyéni neurális modell esetében pedig 50 000.
Egyéni extrakciós modell betanítása esetén a betanítási adatok teljes mérete sablonmodell esetén 50 MB, a neurális modell esetében pedig 1G-MB.
Egyéni besorolási modell betanítása esetén a betanítási adatok
1GB
teljes mérete legfeljebb 10 000 oldal lehet.
- A támogatott fájlformátumok: JPEG, PNG, PDF és TIFF
- A PDF és a TIFF legfeljebb 2000 oldalt dolgoz fel. Az ingyenes szintű előfizetők számára csak az első két oldal feldolgozása történik meg.
- A fájlméretnek 50 MB-nál kisebbnek és legalább 50 x 50 képpont méretűnek és legfeljebb 10 000 x 10 000 képpontnak kell lennie.
Támogatott nyelvek és területi beállítások
A támogatott nyelvek teljes listáját a Nyelvi támogatás oldalon találja.
Mezőkinyerések
Név | Típus | Leírás | Szabványosított kimenet |
---|---|---|---|
ContactNames | Objektumok tömbje | Kapcsolattartó neve | |
FirstName | Sztring | A kapcsolattartó első (adott) neve | |
LastName | Sztring | A kapcsolattartó vezetékneve (családi) neve | |
CompanyNames | Sztringek tömbje | Cég neve | |
Osztályok | Sztringek tömbje | Kapcsolattartási részleg vagy szervezet | |
JobTitles | Sztringek tömbje | A partner listában szereplő beosztása | |
E-mailek | Sztringek tömbje | Kapcsolattartási e-mail-cím | |
Webhelyek | Sztringek tömbje | Vállalat webhelye | |
Címek | Sztringek tömbje | Névjegykártyából kinyert cím | |
Mobiltelefonok | Telefonszámok tömbje | Mobiltelefonszám névjegykártyáról | +1 xxx xxx xxxx |
Faxok | Telefonszámok tömbje | Faxszám névjegykártyáról | +1 xxx xxx xxxx |
WorkPhone-ok | Telefonszámok tömbje | Munkahelyi telefonszám névjegykártyáról | +1 xxx xxx xxxx |
Egyéb telefonok | Telefonszámok tömbje | Egyéb telefonszám névjegykártyáról | +1 xxx xxx xxxx |
Kinyert mezők
Név | Típus | Leírás | Szöveges |
---|---|---|---|
ContactNames | objektumtömb | Névjegykártyából kinyert partnernév | [{ "FirstName": "John", "LastName": "Doe" }] |
FirstName | húr | A kapcsolattartó első (adott) neve | "János" |
LastName | húr | A kapcsolattartó vezetékneve (családi) neve | "Doe" |
CompanyNames | sztringek tömbje | Névjegykártyából kinyert cégnév | ["Contoso"] |
Osztályok | sztringek tömbje | Kapcsolattartási részleg vagy szervezet | ["R&D"] |
JobTitles | sztringek tömbje | A partner listában szereplő beosztása | ["Szoftvermérnök"] |
E-mailek | sztringek tömbje | Névjegykártyából kinyert e-mail-cím | ["johndoe@contoso.com"] |
Webhelyek | sztringek tömbje | Névjegykártyából kinyert webhely | ["https://www.contoso.com"] |
Címek | sztringek tömbje | Névjegykártyából kinyert cím | ["123 Main Street, Redmond, Washington 98052"] |
Mobiltelefonok | telefonszámok tömbje | Névjegykártyából kinyert mobiltelefonszám | ["+19876543210"] |
Faxok | telefonszámok tömbje | Névjegykártyából kinyert faxszám | ["+19876543211"] |
WorkPhone-ok | telefonszámok tömbje | Névjegykártyából kinyert munkahelyi telefonszám | ["+19876543231"] |
Egyéb telefonok | telefonszámok tömbje | Névjegykártyából kinyert egyéb telefonszám | ["+19876543233"] |
Támogatott területi beállítások
Az előre összeállított névjegykártyák v2.1 a következő területi beállításokat támogatják:
- en-us
- en-au
- en-ca
- en-gb
- beadás
Migrálási útmutató és REST API 3.1-es verzió
Következő lépések
Saját űrlapok és dokumentumok feldolgozása a Document Intelligence Studióval
Végezze el a Dokumentumintelligencia rövid útmutatóját , és kezdje el létrehozni egy dokumentumfeldolgozó alkalmazást a választott fejlesztési nyelven.
Próbálja meg feldolgozni saját űrlapjait és dokumentumait a Dokumentumintelligencia mintacímkéző eszközzel
Végezze el a Dokumentumintelligencia rövid útmutatóját , és kezdje el létrehozni egy dokumentumfeldolgozó alkalmazást a választott fejlesztési nyelven.
Visszajelzés
https://aka.ms/ContentUserFeedback.
Hamarosan elérhető: 2024-ben fokozatosan kivezetjük a GitHub-problémákat a tartalom visszajelzési mechanizmusaként, és lecseréljük egy új visszajelzési rendszerre. További információ:Visszajelzés küldése és megtekintése a következőhöz: