Share via


Első lépések: Document Intelligence Studio

Ez a tartalom a következőre vonatkozik::Sakkv4.0 (előzetes verzió) | Korábbi verziók:kék pipav3.1 (GA)kék pipav3.0 (GA)

A Document Intelligence Studio egy online eszköz a Document Intelligence szolgáltatás funkcióinak vizuális feltárására, megértésére és integrálására az alkalmazásokban. Első lépésként megismerheti az előre betanított modelleket mintával vagy saját dokumentumaival. Létrehozhat olyan projekteket is, amelyek egyéni sablonmodelleket hoznak létre, és a Python SDK-val és más rövid útmutatókkal hivatkozhatnak az alkalmazások modelljeire.

Új felhasználók előfeltételei

Tipp.

Azure AI-szolgáltatási erőforrás létrehozása, ha több Azure AI-szolgáltatást szeretne elérni egyetlen végpont/kulcs alatt. Csak dokumentumintelligencia-hozzáféréshez hozzon létre egy dokumentumintelligencia-erőforrást. Vegye figyelembe, hogy a Microsoft Entra-hitelesítés használatához egy egyszolgáltatásos erőforrásra lesz szüksége.

Azure-szerepkör-hozzárendelések

A dokumentumelemzéshez és az előre összeállított modellekhez a különböző forgatókönyvekhez a következő szerepkör-hozzárendelések szükségesek.

  • Alapvető
    • Cognitive Services-felhasználó: Erre a szerepkörre van szüksége a Dokumentumintelligencia vagy az Azure AI-szolgáltatások erőforrásához az elemzési lap megadásához.
  • Speciális
    • Közreműködő: erre a szerepkörre van szüksége az erőforráscsoport, a Dokumentumintelligencia szolgáltatás vagy az Azure AI-szolgáltatások erőforrásának létrehozásához.

Az engedélyezésről további információt a Document Intelligence Studio engedélyezési szabályzatai című témakörben talál.

Modellek

Az előre összeállított modellek segítségével dokumentumintelligencia-funkciókat adhat hozzá az alkalmazásokhoz anélkül, hogy saját modelleket kellene létrehoznia, betanítása és közzététele nélkül. Számos előre összeállított modell közül választhat, amelyek mindegyike saját támogatott adatmezővel rendelkezik. Az elemzési művelethez használandó modell kiválasztása az elemezni kívánt dokumentum típusától függ. A Document Intelligence jelenleg a következő előre összeállított modelleket támogatja:

Dokumentumelemzés

  • Elrendezés: szöveg, táblázatok, kijelölési jelek és szerkezeti információk kinyerése dokumentumokból (PDF, TIFF) és képekből (JPG, PNG, BMP).
  • Olvasás: szövegsorok, szavak, helyük, észlelt nyelvek és kézzel írt stílus kinyerése dokumentumokból (PDF, TIFF) és képekből (JPG, PNG, BMP).

Előre összeállított

  • Számla: szöveg, kijelölési jelek, táblázatok, kulcs-érték párok és kulcsinformációk kinyerése a számlákból.
  • Nyugta: szöveg és kulcsadatok kinyerése a nyugtákból.
  • Egészségbiztosítási kártya: a biztosító, a tag, a vény, a csoport száma és egyéb kulcsfontosságú információk kinyerése az AMERIKAI egészségbiztosítási kártyákból.
  • W-2: szöveges és kulcsinformációk kinyerése a W-2 adózási űrlapokból.
  • Személyazonosító okmány: szöveg és kulcsadatok kinyerése a jogosítványokból és a nemzetközi útlevelekből.

Egyéni

  • Egyéni kinyerési modellek: adatok kinyerése űrlapokból és dokumentumokból egyéni kinyerési modellekkel. A modell gyors betanításához legfeljebb öt mintadokumentumot címkézzen fel.
  • Egyéni besorolási modell: betaníthat egy egyéni osztályozót az alkalmazások különböző dokumentumtípusainak megkülönböztetéséhez. Gyorsan betanított egy modellt, amely legfeljebb két osztályból és osztályonként öt mintával rendelkezik.

Az előfeltételek elvégzése után lépjen a Document Intelligence Studióba.

  1. Válassza ki a Dokumentumintelligencia szolgáltatás egyik funkcióját a Studio kezdőlapján.

  2. Ez a lépés egyszeri folyamat, kivéve, ha már kiválasztotta a szolgáltatáserőforrást a korábbi használatból. Válassza ki az Azure-előfizetést, az erőforráscsoportot és az erőforrást. (Az erőforrásokat bármikor módosíthatja a felső menü "Gépház" elemében.) Tekintse át és erősítse meg a kijelöléseket.

  3. Az Elemzés gombra kattintva elemzést futtathat a mintadokumentumon, vagy kipróbálhatja a dokumentumot a Hozzáadás paranccsal.

  4. A képernyő alján található vezérlőkkel nagyíthatja és kicsinyítheti a dokumentumnézetet, és elforgathatja azt.

  5. Figyelje meg a kiemelt kibontott tartalmat a dokumentumnézetben. A részletek megtekintéséhez vigye az egérmutatót a kulcsok és értékek fölé.

  6. A kimeneti szakasz Eredmény lapján keresse meg a JSON-kimenetet a szolgáltatás válaszformátumának megértéséhez.

  7. A Kód lapon tallózással keresse meg a mintakódot az integrációhoz. Első lépésként másolja és töltse le.

Az egyéni projektek előfeltételei hozzáadva

Az Azure-fiók és a Dokumentumintelligencia vagy az Azure AI-szolgáltatások erőforrásán kívül a következőkre van szüksége:

Azure Blob Storage-tároló

Standard teljesítményűAzure Blob Storage-fiók. Tárolókat hozhat létre a betanítási dokumentumok tárfiókban való tárolásához és rendszerezéséhez. Ha nem tudja, hogyan hozhat létre Azure Storage-fiókot egy tárolóval, kövesse az alábbi rövid útmutatókat:

  • Tárfiók létrehozása. A tárfiók létrehozásakor mindenképpen válassza a Standard teljesítményt a Példány részletei → Teljesítmény mezőben.
  • Hozzon létre egy tárolót. A tároló létrehozásakor az Új tároló ablakban állítsa a Nyilvános hozzáférési szint mezőt Tároló (tárolók és blobok névtelen olvasási hozzáférése) értékre.

Azure-szerepkör-hozzárendelések

Egyéni projektek esetén a következő szerepkör-hozzárendelések szükségesek a különböző forgatókönyvekhez.

  • Alapvető
    • Cognitive Services-felhasználó: Erre a szerepkörre van szüksége a Dokumentumintelligencia vagy az Azure AI-szolgáltatások erőforrásához az egyéni modell betanítása vagy a betanított modellek elemzésének elvégzéséhez.
    • Storage Blob-adatok közreműködője: Erre a szerepkörre van szüksége a tárfiókhoz egy projekt létrehozásához és az adatok címkézéséhez.
  • Speciális
    • Tárfiók közreműködője: A tárfióknak erre a szerepkörre van szüksége a CORS-beállítások beállításához (ez egyszeri munka, ha ugyanazt a tárfiókot újra felhasználják).
    • Közreműködő: Erőforráscsoport és erőforrások létrehozásához szüksége van erre a szerepkörre.

A CORS konfigurálása

A CORS-t (forrásközi erőforrásmegosztást) az Azure Storage-fiókban kell konfigurálni ahhoz, hogy elérhető legyen a Document Intelligence Studióból. A CORS Azure Portalon való konfigurálásához hozzá kell férnie a tárfiók CORS lapjához.

  1. Válassza a tárfiók CORS fülét.

    Képernyőkép az Azure Portal CORS beállítási menüjéről.

  2. Először hozzon létre egy új CORS-bejegyzést a Blob szolgáltatásban.

  3. Állítsa be az engedélyezett forrást a következőre https://documentintelligence.ai.azure.com: .

    A tárfiók CORS-konfigurációját bemutató képernyőkép.

    Tipp.

    A "*" helyettesítő karaktert használhatja a megadott tartomány helyett, hogy az összes forrástartomány kéréseket küldjön a CORS-on keresztül.

  4. Válassza ki az engedélyezett metódusok összes rendelkezésre álló 8 lehetőségét.

  5. Hagyja jóvá az összes engedélyezett fejlécet és a közzétett fejléceket úgy, hogy minden mezőben egy *-t ad meg.

  6. Állítsa be a maximális életkort 120 másodpercre vagy bármilyen elfogadható értékre.

  7. A módosítások mentéséhez kattintson a lap tetején található Mentés gombra.

A CORS-t most úgy kell konfigurálni, hogy a Document Intelligence Studióból használja a tárfiókot.

Mintadokumentumok beállítása

  1. Jelentkezzen be az Azure Portalra, és navigáljon a tárfiók>adattároló-tárolóihoz.>

    Képernyőkép az Azure Portal Adattárolás menüjéről.

  2. Válasszon egy tárolót a listából.

  3. Válassza a Feltöltés lehetőséget a lap tetején található menüből.

    Képernyőkép az Azure Portal tárolófeltöltési gombjáról.

  4. Megjelenik a Blob feltöltése ablak.

  5. Válassza ki a feltölteni kívánt fájl(oka)t.

    Képernyőkép az Azure Portal blobfeltöltési ablakáról.

Feljegyzés

Alapértelmezés szerint a Studio a tároló gyökerében található dokumentumokat fogja használni. A mappákba rendezett adatokat azonban használhatja az egyéni űrlapprojekt létrehozásának lépéseiben megadott mappa elérési útjának megadásával. Lásd: Adatok rendszerezése almappákban

Egyéni modellek

Egyéni modellek létrehozásához először konfigurálja a projektet:

  1. A Studio kezdőlapján válassza az Egyéni modell kártyát az Egyéni modellek lap megnyitásához.

  2. Az új projektkonfigurációs varázsló elindításához használja a "Projekt létrehozása" parancsot.

  3. Adja meg a projekt részleteit, válassza ki az Azure-előfizetést és -erőforrást, valamint az adatokat tartalmazó Azure Blob Storage-tárolót.

  4. Tekintse át és küldje el a beállításokat a projekt létrehozásához.

  5. A címkézési folyamat gyors elindításához használja az automatikus címkézési funkciót a már betanított modell vagy az egyik előre összeállított modell címkézéséhez.

  6. Az alapoktól való manuális címkézéshez adja meg a kinyerni kívánt címkéket és azok típusait.

  7. Jelölje ki a dokumentum szövegét, és válassza ki a címkét a legördülő listából vagy a címkék panelről.

  8. További négy dokumentum címkézése legalább öt címkével ellátott dokumentum beszerzéséhez.

  9. Válassza a Betanítás parancsot, és adja meg a modell nevét, majd adja meg, hogy a neurális (ajánlott) vagy sablonmodell elindítsa-e az egyéni modell betanítását.

  10. Ha a modell elkészült, a Teszt paranccsal érvényesítheti a tesztdokumentumokkal, és megfigyelheti az eredményeket.

Document Intelligence Custom model demo

Címkézés táblákként

Feljegyzés

  1. A Törlés paranccsal törölheti a szükségtelen modelleket.

  2. Töltse le a modell részleteit offline megtekintésre.

  3. Jelöljön ki több modellt, és írja be őket egy új modellbe, amelyet használni szeretne az alkalmazásokban.

Táblák használata vizualizációs mintaként:

Egyéni űrlapmodellek esetén előfordulhat, hogy az egyéni modellek létrehozásakor adatgyűjtéseket kell kinyernie a dokumentumokból. Az adatgyűjtések több formátumban is megjelenhetnek. Táblák használata vizualizációs mintaként:

  • Értékek (sorok) dinamikus vagy változószáma adott mezőkészlethez (oszlopokhoz)

  • Adott mezőkészlet (oszlopok és/vagy sorok) értékeinek adott gyűjteménye

Címke dinamikus táblázatként

Dinamikus táblák használatával kinyeri az értékek (sorok) változószámát egy adott mezőkészlethez (oszlopokhoz):

  1. Adjon hozzá egy új "Táblázat" típusú címkét, válassza a "Dinamikus táblázat" típust, és adja meg a címkét.

  2. Adja hozzá a szükséges oszlopok (mezők) és sorok számát (az adatokhoz).

  3. Jelölje ki a szöveget a lapon, majd válassza ki a szöveghez rendelendő cellát. Ismételje meg az összes dokumentum összes sorát és oszlopát.

Példa a dokumentumintelligencia-címkézésre dinamikus táblaként

Címke rögzített táblázatként

Rögzített táblák használata adott mezők (oszlopok és/vagy sorok) értékeinek adott gyűjteményének kinyeréséhez:

  1. Hozzon létre egy új "Táblázat" típusú címkét, válassza a "Rögzített táblázat" típust, és nevezze el.

  2. Adja hozzá a két mezőkészletnek megfelelő oszlopok és sorok számát.

  3. Jelölje ki a szöveget a lapon, majd a cellát választva rendelje hozzá a szöveghez. Ismételje meg a többi dokumentumot.

Dokumentumintelligencia-címkézés rögzített táblaként

Aláírásészlelés

Feljegyzés

Az aláírásmezők jelenleg csak egyéni sablonmodellekhez támogatottak. Egyéni neurális modell betanításakor a címkézett aláírásmezők figyelmen kívül lesznek hagyva.

Aláírásészlelés címkézése: (csak egyéni űrlap)

  1. A címkézési nézetben hozzon létre egy új "Signature" típusú címkét, és nevezze el.

  2. A Régió paranccsal téglalap alakú régiót hozhat létre az aláírás várt helyén.

  3. Jelölje ki a rajzolt régiót, és válassza az Aláírás típuscímkét a rajzolt régióhoz való hozzárendeléséhez. Ismételje meg a többi dokumentumot.

Dokumentumintelligencia-címkézés aláírásészlelési példához

Következő lépések

  • Kövesse a Document Intelligence 3.1-es verziójú migrálási útmutatóját a REST API korábbi verziójától való különbségek megismeréséhez.
  • A v3.0 SDK rövid útmutatói segítségével kipróbálhatja az alkalmazások 3.0-s funkcióit az új SDK-k használatával.
  • Tekintse meg a 3.0-s verziós REST API-gyorsútmutatókat a v3.0-s funkciók kipróbálásához az új REST API használatával.

Ismerkedés a Document Intelligence Studióval.