Szerkesztés

Megosztás a következőn keresztül:


Gyakori kérdések

Ez a tartalom a következőre vonatkozik: Sakk v4.0 (előzetes verzió) Sakk v3.1 (GA) Sakk v3.0 (GA) Sakk v2.1 (GA)

Az Azure AI Document Intelligence egy felhőalapú szolgáltatás, amely gépi tanulási modelleket használ kulcs-/érték párok, szöveg és táblázatok kinyeréséhez a dokumentumokból. A visszaadott eredmény strukturált JSON-kimenet. A dokumentumintelligencia-használati esetek közé tartozik az automatizált adatfeldolgozás, a továbbfejlesztett adatvezérelt stratégiák és a bővített dokumentumkeresési képességek.

Áttekintés

Az Azure AI-dokumentumintelligencia és az Azure AI Form Recognizer ugyanaz a szolgáltatás?

Bizony.

Az Azure AI-dokumentumintelligencia és az Azure AI Form Recognizer ugyanaz a szolgáltatás. A szolgáltatást 2023 júliusában átnevezték az Azure AI Form Recognizerről az Azure AI Document Intelligencere. A szolgáltatás ugyanazokat a képességeket és funkciókat biztosítja, mint az átnevezés előtt.

  • Díjszabási változások: A díjszabás nem változik. A Cognitive Services és az Alkalmazott AI-szolgáltatások neve továbbra is használatos az Azure-számlázásban, a költségelemzésben, az árlistákban és az ár API-kban.

  • Kompatibilitástörő változások: Az API-k és az ügyfélkódtárak nem változnak. A REST API-k és az SDK 2024-02-29-preview, 2023-10-31-preview és újabb verzióit document intelligenceátnevezik.

Integrálható a Dokumentumintelligencia más Microsoft-szolgáltatások?

Bizony.

A Document Intelligence a következő szolgáltatásokkal integrálható:

AI-képességek

Használhatom a dokumentumintelligencia-t generatív AI-vel a dokumentumfeldolgozáshoz?

Bizony.

A Dokumentumintelligencia mostantól egyéni generatív kinyerési modellt is tartalmaz, amely Generatív AI-t és nagy nyelvi modelleket (LLM-eket) használ a mezők dokumentumokból való kinyeréséhez. Korábban RAG (retrieveal augmented generation) mintát használt a mezők kinyeréséhez. Az új modell kiváló minőségű eredményeket biztosít egyetlen API-hívással. Dokumentumgeneratív AI-megoldással cseveghet a dokumentumaival (RAG), magával ragadó tartalmakat hozhat létre ezekből a dokumentumokból, és hozzáférhet az Adatok Azure OpenAI-szolgáltatásmodelljeihez.

  • Az Azure AI-dokumentumintelligencia és az Azure OpenAI együttes használatával létrehozhat egy nagyvállalati alkalmazást, amellyel zökkenőmentesen kezelheti dokumentumait természetes nyelven. Könnyen megtalálhatja a válaszokat, értékes megállapításokat szerezhet, és új és vonzó tartalmakat hozhat létre a meglévő dokumentumokból.

  • A lekéréses kiterjesztett generációs mintáról itt talál további részleteket.

Segíthet a dokumentumintelligencia a dokumentumok szemantikai adattömbeinek lekéréses-bővített generációhoz való használatával?

Bizony.

A dokumentumintelligencia építőelemeket biztosít a szemantikai adattömbök engedélyezéséhez. A szemantikai adattömbök kulcsfontosságú lépés a lekérésesen kibővített generáció (RAG) esetében, hogy biztosítsák a környezet sűrű adattömbjeinek és a relevancia javulásának biztosítását.

  • A Dokumentumintelligencia egy elrendezési modellt biztosít, amely a dokumentum vizuális felbontását biztosítja vonalak, bekezdések, szakaszok, élőfejek és élőlábakká.

  • Ezután kiválaszthatja, hogy markdown formátumban szeretné lekérni az eredményeket, hogy tovább tagozza a dokumentumot a szakasz- vagy bekezdéshatárokon.

További információ: RAG a Dokumentumintelligencia szolgáltatásban

Document Intelligence Studio

Szükségem van bizonyos engedélyekre a Document Intelligence Studio eléréséhez?

Bizony.

A Document Intelligence Studio eléréséhez aktív Azure-fiókra és előfizetésre van szüksége, amely legalább olvasói szerepkörrel rendelkezik.

A dokumentumelemzéshez és az előre összeállított modellekhez az alábbi szerepkör-követelmények szükségesek a felhasználói forgatókönyvekhez:

  • Alap

  • Felsőfokú

    • Közreműködő: Erre a szerepkörre van szüksége egy erőforráscsoport vagy egy dokumentumintelligencia-erőforrás létrehozásához.

Egyéni modellprojektek esetében a felhasználói forgatókönyvek szerepkörkövetelményei a következők:

  • Alap

    • Cognitive Services-felhasználó: Szüksége van erre a szerepkörre egy dokumentumintelligencia - vagy Cognitive Services-többszolgáltatásos erőforráshoz egy egyéni modell betanítása vagy betanított modellekkel való elemzéshez.

    • Storage Blob-adatszolgáltató: Erre a szerepkörre szüksége van egy tárfiókhoz projekt- és címkeadatok létrehozásához.

  • Felsőfokú

    • Tárfiók közreműködője: Szüksége van erre a szerepkörre a tárfiókhoz a forrásközi erőforrás-megosztási (CORS) beállítások beállításához. Ez egyszeri munka, ha ugyanazt a tárfiókot használja újra.

    • Közreműködő: Erőforráscsoport és erőforrások létrehozásához szüksége van erre a szerepkörre. A közreműködői vagy tárfiók-közreműködői szerepkör nem biztosít hozzáférést a dokumentumintelligencia-erőforrás vagy tárfiók használatához, ha a helyi (kulcsalapú) hitelesítés le van tiltva. A Document Intelligence Studio funkcióinak használatához továbbra is szüksége van az alapvető szerepkörökre (Cognitive Services felhasználói és tárolási adatblob-közreműködő).

További információkért tekintse meg a Microsoft Entra beépített szerepköreit és az Azure-szerepkör-hozzárendelésekkel kapcsolatos szakaszokat a Document Intelligence Studio rövid útmutatójában.

Feldolgozhatok kétnál több oldalt tartalmazó dokumentumokat a Document Intelligence Studióban?

Igen, fizetős szintű erőforrások esetén.

Nem, az ingyenes szintű erőforrásokhoz.

  • Az ingyenes szintű (F0) erőforrások esetében a rendszer csak az első két oldalt elemzi, függetlenül attól, hogy a Document Intelligence Studiót, a REST API-t vagy az ügyfélkódtárakat használja.

  • Ha egy dokumentum összes lapját szeretné elemezni, váltson fizetős (S0) erőforrásra. A Document Intelligence Studióban válassza a Beállítások (fogaskerék) gombot, válassza az Erőforrások lapot, és ellenőrizze a dokumentumok elemzéséhez használni kívánt árszintet.

Módosíthatok könyvtárakat vagy előfizetéseket a Document Intelligence Studióban?

Bizony.

  • Ha módosítani szeretne egy könyvtárat a Document Intelligence Studióban, válassza a Beállítások (fogaskerék) gombot. A Címtár területen válassza ki a címtárat a listából, majd válassza a Címtár váltása lehetőséget. A címtár váltása után jelentkezzen be újra.

  • Előfizetés vagy erőforrás módosításához nyissa meg az Erőforrás lapot a Beállítások területen.

Használhatom a Document Intelligence Studiót tűzfallal vagy virtuális hálózattal konfigurált erőforrással?

Bizony.

Ha a Dokumentumintelligencia-erőforrás tűzfallal vagy virtuális hálózattal van konfigurálva, hozzá kell adnia a 20.3.165.95 dedikált IP-címet a dokumentumintelligencia-erőforrás tűzfalengedélyezési listájához. Az egyéni projektek egyes függvényei (például az automatikus címke, a projektkezelés és az ember a hurokban) nem működnek, ha a nyilvános hálózati hozzáférés le van tiltva.

Amikor feltöltök egy fájlt a Document Intelligence Studióba a "Beolvasás URL-címről" függvénnyel, használhatok URL-címet a blobtárolómból?

Bizony.

Ha az Azure Blob Storage URL-címe SAS-jogkivonatot tartalmaz, és nyilvános hálózatokról érhető el. Nem használhatja a Fetch függvényt olyan tárfiókokhoz, ahol a kulcshozzáférés le van tiltva, vagy tűzfal/virtuális hálózat mögött.

Újra felhasználhatom vagy testre szabhatom a Document Intelligence Studio címkézési felületét, és saját alkalmazásomba építhetem?

Bizony.

A Document Intelligence Studio címkézési felülete nyílt forráskód az Eszközkészlet adattárában.

Vannak külön URL-végpontok a dokumentumintelligencia szuverén felhőrégióihoz?

Bizony.

A Document Intelligence Studio különálló URL-végpontokkal rendelkezik a szuverén felhőrégiókhoz:

Alkalmazásfejlesztés

Fejleszthetek alkalmazásokat az Azure AI Document Intelligence használatával a legújabb fejlesztési lehetőségek használatával?

Bizony.

A Document Intelligence a legújabb fejlesztési lehetőségeket kínálja a következő platformokon:

Migrálhatom az alkalmazást a Dokumentumintelligencia legújabb verziójára?

Bizony.

Az alábbi táblázat a Dokumentumintelligencia legújabb verziójára való migrálás részletes utasításaira mutató hivatkozásokat tartalmaz:

Nyelv/API Migrálási útmutató
REST API v3
C#/.NET 4.0.0
Java 4.0.0
JavaScript 4.0.0
Python 3.2.0

Megadhatok egy dokumentumban elemezendő oldaltartományt?

Bizony.

Használja a pages paramétert (a REST API 2.1-es, 3.0-s és újabb verzióiban támogatott), és adja meg a többoldalas PDF- és TIFF-dokumentumok lapjait. Az elfogadott bemenet a következő tartományokat tartalmazza:

  • Egyoldalas. Ha például megadja 1, 2, az 1. és a 2. oldal feldolgozása történik.
  • Véges tartományok. Ha például megadja 2-5, a 2–5. oldal feldolgozása történik.
  • Nyitott végű tartományok. Ha például megadja 5-, az 5. oldal összes lapja feldolgozásra kerül. Ha megadja -10, az 1–10. oldal feldolgozása történik.

Ezeket a paramétereket kombinálhatja, és a tartományok átfedésben lehetnek. Ha például megadja -5, 1, 3, 5-10, az 1–10. oldal feldolgozása történik.

A szolgáltatás elfogadja a kérést, ha a dokumentum legalább egy oldalát feldolgozhatja. Egy ötoldalas dokumentum használata 5-100 például érvényes bemenet, ami azt jelenti, hogy az 5. oldal feldolgozása folyamatban van.

Ha nem ad meg oldaltartományt, a teljes dokumentum feldolgozásra kerül.

Javasolja a Document Intelligence Studio használatát a projekt FOTT-mintacímkéző eszköze helyett?

Bizony.

Az idő nagy részében a Document Intelligence Studiót javasoljuk, mert csökkentheti a Dokumentumintelligencia-erőforrások és -tárolási szolgáltatások konfigurálásának idejét.

Csak az űrlaptesztelő eszközt (FOTT) érdemes használni a következő forgatókönyvekhez:

  • Az adatoknak egyetlen gépen belül kell maradniuk. Használja az FOTT-mintacímkéző eszközt és egy dokumentumintelligencia-tárolót.

  • A projekt nagymértékben függ a Document Intelligence V2.1-hez, és továbbra is a v2.1 API-kat szeretné használni.

Vannak ajánlott eljárások a szabályozás csökkentésére?

Bizony.

A Dokumentumintelligencia automatikus skálázással biztosítja a szükséges számítási erőforrásokat igény szerint, miközben az ügyfelek költségei alacsonyak maradnak. Az automatikus skálázás során a szabályozás csökkentése érdekében a következő megközelítést javasoljuk:

  • Implementáljon újrapróbálkozási logikát az alkalmazásba.

  • Ha úgy találja, hogy szabályozva van a kérelmek száma POST , érdemes lehet késleltetni a kérések között.

  • Fokozatosan növelje a munkaterhelést. Kerülje az éles változásokat.

  • Hozzon létre egy támogatási kérést a másodpercenkénti tranzakciók (TPS) korlátjának növeléséhez.

További információ a Document Intelligence szolgáltatás kvótáiról és korlátairól.

Egyéni modellek

Javíthatok egy egyéni modell becsült pontossági pontszámán?

Bizony.

A dokumentumok vizuális szerkezetének varianciái befolyásolhatják a modell pontosságát. Íme néhány tipp:

  • A betanítási adathalmazba belefoglalja a dokumentum összes változatát. A változatok különböző formátumokat tartalmaznak; például a digitális és a beolvasott PDF-fájlok esetében.

  • Különítse el a vizuálisan eltérő dokumentumtípusokat, és tanítsa be a különböző modelleket.

  • Győződjön meg arról, hogy nincsenek felesleges címkéi.

  • Aláírás- és régiócímkékhez ne adja meg a környező szöveget.

További információ: Pontossági és megbízhatósági pontszámok.

Átképezhetek egy egyéni modellt?

Nem.

  • A Dokumentumintelligencia nem rendelkezik explicit újratanítási művelettel. Minden betanítási művelet létrehoz egy új modellt.

  • Ha úgy találja, hogy a modellnek újra kell tanítania, további mintákat adhat hozzá a betanítási adatkészlethez, és betanítást végezhet egy új modellen.

  • Létrehozhat egy új modellt is az eredeti modellhez az alábbiak szerint:

    1. Hozzon létre egy adatkészletet az új sablonhoz.

    2. Új modell címkézése és betanítása.

    3. Ellenőrizze, hogy az új modell megfelelően működik-e az adott dokumentumtípusokhoz.

    4. Írja össze az új modellt a meglévő modellel egyetlen végpontba. A dokumentumintelligencia ezután meghatározhatja az elemezni kívánt dokumentumok legjobb modelljét.

    További információkért tekintse meg a komponált modelleket.

Áthelyezhetem a betanított modelleimet egyik környezetből (például bétaverzióból) egy másikba (például éles környezetbe)?

Bizony.

A Copy API használatával egyéni modelleket másolhat egy Dokumentumintelligencia-fiókból másba, amelyek bármely támogatott földrajzi régióban léteznek. Részletes útmutatásért lásd a vészhelyreállítást.

A másolási művelet a modellek másolására korlátozódik azon a felhőkörnyezeten belül, ahol a modellt betanította. Például a modellek másolása a nyilvános felhőből az Azure Government-felhőbe nem támogatott.

Díjat számítok fel egyéni modellek betanításakor?

Bizony.

A betanítás ingyenes minden egyéni generatív és egyéni sablonmodellhez. Az összes modell betanítási adatkészletének létrehozásához azonban az Elrendezés modellt kell futtatni a betanítási dokumentumokon. A költségekért az ügyfelek felelősek.

Az egyéni generatív modellek az automatikus címkézési funkcióra is támaszkodnak a címkézett adathalmaz létrehozásának felgyorsítása érdekében. Ennek a műveletnek van egy költsége. Bár a sablon- és generatív modellek buildelési művelete ingyenes, a címkézett adathalmaz létrehozása minimális költségekkel járhat.

Az v4.0 2024-07-31-previewegyéni neurális modellek legfeljebb 10 órán keresztül ingyenesen taníthatók be. Akár egyetlen modellt tanít be a 10 órára, akár több modellt tanít be összesen 10 órára, az első 10 órában nem kell fizetnie. Az ingyenes 10 óra használata után automatikusan megterheli a plusz betanítási óra. Az árakkal kapcsolatos részletekért tekintse meg a díjszabási oldalt. Ez az új fizetős betanítási funkció hosszabb ideig teszi lehetővé a betanítási modellek számára a nagyobb dokumentumok feldolgozását. A fizetős betanítási funkcióval kapcsolatos további információkért tekintse meg az egyéni neurális modell számlázási szakaszát.

v3.1 2023-07-31Az v3.0 2022-08-31 egyéni neurális modelleket legfeljebb 20 edzésen taníthatja be ingyenesen, és minden egyes munkamenet 30 perces betanítási időtartammal van leképezve. Ha mind a 20 képzési munkamenetet kihasználja, beküldhet Azure-támogatás jegyet a betanítási munkamenet korlátjának növeléséhez. A korlát növeléséhez a két képzés egy képzési óra, és két munkamenet/egy képzési óra után számítunk fel díjat. Az árakkal kapcsolatos részletekért tekintse meg a [díjszabási oldalt]. A korlát növelésének módjáról további információt az egyéni neurális modell számlázási szakaszában talál. v3.1A v3.0 fizetős betanítási funkció nem érhető el. Az egyéni neurális modell fizetős betanítási funkciója csak a következőn v4.0érhető el: .

Tárfiók

Lejárt a tárfiók hitelesítéséhez használt közös hozzáférésű jogosultságkód (SAS) jogkivonat lejárati ideje?

Bizony.

Közös hozzáférésű jogosultságkód (SAS) létrehozásakor az alapértelmezett időtartam 48 óra. 48 óra elteltével létre kell hoznia egy új jogkivonatot.

Érdemes lehet hosszabb időtartamot beállítani arra az időre, amíg a tárfiókot a Dokumentumintelligencia szolgáltatással használja.

A Dokumentumintelligencia hozzáférhet a tárfiókom adataihoz, ha az virtuális hálózat vagy tűzfal mögött található?

Nem, nem közvetlenül.

A dokumentumintelligencia nem fér hozzá a tárfiókhoz, ha virtuális hálózat vagy tűzfal védi.

A privát Azure Storage-fiókok hozzáférése és hitelesítése azonban támogatja az Azure-erőforrások felügyelt identitását. Felügyelt identitás használata esetén a Dokumentumintelligencia-szolgáltatás egy hozzárendelt hitelesítő adatokkal férhet hozzá a tárfiókhoz.

Ha az FOTT használatával szeretné elemezni a privát tárfiók adatait, telepítenie kell az eszközt a virtuális hálózat vagy tűzfal mögött.

Megtudhatja, hogyan hozhat létre és használhat felügyelt identitást a Dokumentumintelligencia-erőforráshoz.

Tárolók

Van különbség a leválasztott és a csatlakoztatott tárolók között?

Bizony.

Bár a modell képességei azonosak a csatlakoztatott és a leválasztott tárolók esetében, a számlázási és a csatlakozási módszerek eltérőek:

  • A csatlakoztatott tárolók egy Dokumentumintelligencia-erőforrás használatával küldenek számlázási adatokat az Azure-nak az Azure-fiókban. Csatlakoztatott tárolók esetén internetkapcsolat szükséges a számlázási adatok Azure-ba való küldéséhez. A Dokumentumintelligencia-összekapcsolt tárolók számlázási adatokat küldenek az Azure-nak egy Dokumentumintelligencia-erőforrás használatával az Azure-fiókban. A csatlakoztatott tárolók nem küldenek ügyféladatokat, például az elemezni kívánt képet vagy szöveget a Microsoftnak. A csatlakoztatott tárolók által a Microsoftnak számlázás céljából küldött információkra példaként tekintse meg az Azure AI-tárolóval kapcsolatos gyakori kérdéseket.

  • A leválasztott tárolók lehetővé teszik az internetről leválasztott API-k használatát. A számlázási adatokat a rendszer nem küldi el az interneten keresztül. A díjak ehelyett egy megvásárolt kötelezettségvállalási szinten alapulnak. A leválasztott tárolóhasználat jelenleg a Document Intelligence egyéni és számlamodelljeihez érhető el.

Használhatok helyi tárolót a Dokumentumintelligencia-mintacímkéző eszköz (FOTT) tárolóhoz?

Bizony.

Az FOTT egy helyi tárolót használó verzióval rendelkezik. A verziót windowsos gépen kell telepíteni. Innen telepítheti.

A projektlapon adja meg a címkemappa URI-ját /shared vagy /shared/sub-dir formátumban, ha a címkéző fájlok alkönyvtárban találhatók. Minden más dokumentumintelligencia-mintacímkéző eszköz viselkedése megegyezik az üzemeltetett szolgáltatással.

Van ajánlott eljárás a vertikális felskálázáshoz?

Bizony.

Aszinkron hívások esetén több tárolót is futtathat megosztott tárterülettel. Az elemzési POST hívást feldolgozó tároló tárolja a kimenetet a tárolóban. Ezután bármely más tároló lekérheti az eredményeket a tárolóból, és kiszolgálhatja a GET hívásokat. A kérelem azonosítója nincs tárolóhoz kötve.

Szinkron hívások esetén több tárolót is futtathat, de csak egy tároló szolgál ki egy kérést. Mivel ez egy blokkoló hívás, a készlet bármely tárolója kiszolgálhatja a kérést, és elküldheti a választ. Itt egyszerre csak egy tároló van egy kérelemhez kötve, és nincs szükség lekérdezésre.

Beállíthatok megosztott tárolóval rendelkező tárolókat?

Bizony.

A tárolók a tulajdonságot használják a Mounts: Shared megosztott tároló megadásához a feldolgozási fájlok tárolásához. A tulajdonság használatának megtekintéséhez tekintse meg a tárolók dokumentációját.

Biztonság és adatvédelem

A Document Intelligence tárolja az adataimat?

Igen, röviden.

Minden funkció esetében a Document Intelligence ideiglenesen tárolja az adatokat és az eredményeket az Azure Storage-ban, ugyanabban a régióban, mint a kérés. Az adatok ezután az elemzési kérelem elküldése után 24 órán belül törlődnek.

További információ a dokumentumintelligencia adatairól, adatvédeleméről és biztonságáról.

Betanított egyéni modellek esetén az elemzést és címkézést követő köztes kimenetek ugyanabban az Azure Storage-helyen vannak tárolva, ahol a betanítási adatokat tárolja. A betanított egyéni modellek ugyanabban a régióban vannak tárolva az Azure Storage-ban, és logikailag el vannak különítve az Azure-előfizetéssel és az API-hitelesítő adatokkal.

További súgó és támogatás

Vannak más erőforrások is, amelyek megoldást nyújtanak az Azure AI-dokumentumintelligencia-kérdésekre?

Bizony.

A Microsoft Q&A a microsoftos technikai kérdések és válaszok otthona. Szűrheti a dokumentumintelligencia-specifikus lekérdezéseket.

Küldhetek közvetlen visszajelzést, ha a szolgáltatás nem ismer fel bizonyos szöveget, vagy helytelenül ismeri fel a dokumentumokat?

Bizony.

Folyamatosan frissítjük és fejlesztjük a dokumentumintelligencia-modelleket. E-mailben elküldheti a dokumentumintelligencia-csapatnak. Ha lehetséges, ossza meg a mintadokumentumot a kiemelt problémával.