Megosztás a következőn keresztül:


Dokumentumintelligencia egyéni besorolási modellje

Fontos

  • A Document Intelligence nyilvános előzetes verziójú kiadásai korai hozzáférést biztosítanak az aktív fejlesztés alatt lévő funkciókhoz. A funkciók, a megközelítések és a folyamatok az általános rendelkezésre állás (GA) előtt változhatnak a felhasználói visszajelzések alapján.
  • A Document Intelligence ügyfélkódtárak nyilvános előzetes verziója alapértelmezés szerint a REST API 2024-07-31-preview verziója.
  • A nyilvános előzetes verzió 2024-07-31 előzetes verziója jelenleg csak a következő Azure-régiókban érhető el. Vegye figyelembe, hogy az AI Studio egyéni generatív (dokumentummező-kinyerési) modellje csak az USA északi középső régiójában érhető el:
    • USA keleti régiója
    • USA2 nyugati régiója
    • Nyugat-Európa
    • USA északi középső régiója

Ez a tartalom a következőre vonatkozik:Sakk v4.0 (előzetes verzió) | Korábbi verzió: kék pipa v3.1 (GA)

Ez a tartalom a következőre vonatkozik: Sakk v3.1 (GA) | Legújabb verzió: lila pipa v4.0 (előzetes verzió)

Fontos

  • Az 2024-07-31-preview API, az egyéni besorolási modell alapértelmezés szerint nem osztja fel a dokumentumokat az elemzési folyamat során.
  • A tulajdonságot explicit módon automatikusra kell állítania splitMode , hogy megőrizze a korábbi kiadások viselkedését. Az alapértelmezett érték a splitMode következő none: .
  • Ha a bemeneti fájl több dokumentumot tartalmaz, engedélyeznie kell a felosztást a splitMode autokövetkező beállítással: .

Az Azure AI Document Intelligence egy felhőalapú Azure AI-szolgáltatás, amely lehetővé teszi intelligens dokumentumfeldolgozási megoldások létrehozását. A Dokumentumintelligencia API-k képeket, PDF-eket és más dokumentumfájlokat elemeznek a különböző tartalmak, elrendezések, stílusok és szemantikai elemek kinyeréséhez és észleléséhez.

Az egyéni besorolási modellek olyan mélytanulási modelltípusok, amelyek az elrendezést és a nyelvi funkciókat kombinálva pontosan észlelik és azonosítják az alkalmazásban feldolgozott dokumentumokat. Az egyéni besorolási modellek egyszerre egy oldalon végzik a bemeneti fájlok besorolását, hogy azonosítsák a bennük lévő dokumentumokat, és egy bemeneti fájlon belül több dokumentumot vagy több példányt is azonosíthatnak.

Modell képességei

Feljegyzés

  • Az API-tól kezdve az 2024-02-29-preview egyéni clasification modellek támogatják a növekményes betanítást. Hozzáadhat új mintákat a meglévő osztályokhoz, vagy új osztályokat is hozzáadhat egy meglévő osztályozóra való hivatkozással.

Az egyéni besorolási modellek elemezhetnek egy- vagy többfájlos dokumentumokat annak megállapításához, hogy a betanított dokumentumtípusok bármelyike egy bemeneti fájlban található-e. A jelenleg támogatott forgatókönyvek a következők:

  • Egyetlen fájl, amely egyetlen dokumentumtípust tartalmaz, például egy hitelkérelmezési űrlapot.

  • Egyetlen fájl, amely több dokumentumtípust tartalmaz. Például egy hitelkérelem-csomagot, amely hiteligénylési űrlapot, fizetési feltételeket és bankszámlakivonatot tartalmaz.

  • Egyetlen fájl, amely ugyanazon dokumentum több példányát tartalmazza. Például a beolvasott számlák gyűjteménye.

✔️ Az egyéni osztályozók betanításához five legalább two különböző osztályokra és osztályonként legalább dokumentummintákra van szükség. A modell válasza az egyes azonosított dokumentumosztályok oldaltartományait tartalmazza.

✔️ Az osztályok maximális engedélyezett száma .500 Az osztályonkénti dokumentumminták maximális száma .100

A modell – ha nincs megadva – a bemeneti dokumentum minden oldalát a címkézett adathalmaz egyik osztályára sorolja. A bemeneti dokumentumban is megadhatja az elemezni kívánt oldalszámokat. Az alkalmazás küszöbértékének beállításához használja a válasz megbízhatósági pontszámát.

Növekményes betanítás

Az egyéni modellek esetében meg kell őriznie a betanítási adatkészlethez való hozzáférést, hogy egy meglévő osztály új mintáival frissítse az osztályozót, vagy új osztályokat vegyen fel. Az osztályozó modellek mostantól támogatják a növekményes betanítást, ahol hivatkozhat egy meglévő osztályozóra, és új mintákat fűzhet hozzá egy meglévő osztályhoz, vagy új osztályokat vehet fel mintákkal. A növekményes betanítás olyan forgatókönyveket tesz lehetővé, ahol az adatmegőrzés kihívást jelent, és az osztályozót frissíteni kell a változó üzleti igényeknek megfelelően. A növekményes betanítást az API-verzióval és újabb verzióval 2024-02-29-preview betanított modellek támogatják.

Fontos

A növekményes betanítást csak ugyanazzal az API-verzióval betanított modellek támogatják. Ha egy modellt próbál kibővíteni, használja azt az API-verziót, amellyel az eredeti modell be lett tanítva a modell kibővítéséhez. A növekményes betanítás csak az API 2024-07-31-preview vagy újabb verziójával támogatott.

A növekményes betanításhoz meg kell adnia az eredeti modellazonosítót.baseClassifierId További információ a növekményes betanítás használatáról.

Office-dokumentumtípus támogatása

Az osztályozók mostantól különböző formátumú dokumentumtípusok felismerésére taníthatók be, például PDF, képek, Word, PowerPoint és Excel formátumban. A betanítási adatkészlet összeállításakor bármilyen támogatott típusú dokumentumot hozzáadhat. Az osztályozó nem követeli meg, hogy explicit módon címkézzen fel bizonyos típusokat. Ajánlott eljárásként győződjön meg arról, hogy a betanítási adatkészlet minden formátumból legalább egy mintával rendelkezik a modell általános pontosságának javítása érdekében.

Egyéni besorolás és összeállított modellek összehasonlítása

Az egyéni besorolási modellek bizonyos helyzetekben lecserélhetnek egy komponált modellt , de néhány különbséget figyelembe kell venni:

Funkció Egyéni osztályozó folyamata A modell összeállítása
Elemezze a kinyerési modell feldolgozására betanított egyik típushoz tartozó ismeretlen típusú egyetlen dokumentumot. ● Több hívást igényel.
● Hívja meg a besorolási modellt a dokumentumosztály alapján. Ez a lépés lehetővé teszi a megbízhatósági alapú ellenőrzést a kinyerési modell elemzésének meghívása előtt.
● Hívja meg a kinyerési modellt.
● Egyetlen hívást igényel a bemeneti dokumentum típusának megfelelő modellt tartalmazó, összeállított modellhez.
Elemezzen egyetlen ismeretlen típusú dokumentumot, amely több, a kinyerési modell feldolgozására betanított típushoz tartozik. ●Több hívást igényel.
● Hívja meg az osztályozót, amely figyelmen kívül hagyja a kijelölt típusnak nem megfelelő dokumentumokat a kinyeréshez.
● Hívja meg a kinyerési modellt.
● Egyetlen hívást igényel egy komponált modellhez. A szolgáltatás a legmagasabb egyezésű egyéni modellt választja ki a komponált modellen belül.
● A komponált modellek nem hagyhatják figyelmen kívül a dokumentumokat.
Elemezze a kinyerési modell feldolgozására betanított egyik típushoz tartozó több ismert vagy ismeretlen típusú dokumentumot tartalmazó fájlt. ● Több hívást igényel.
● Hívja meg a kinyerési modellt a bemeneti fájl minden azonosított dokumentumához.
● Hívja meg a kinyerési modellt.
● Egyetlen hívást igényel egy komponált modellhez.
● A komponált modell egyszer hívja meg az összetevőmodellt a dokumentum első példányán.
●A rendszer figyelmen kívül hagyja a többi dokumentumot.

Nyelvi támogatás

A besorolási modellek jelenleg csak az angol nyelvű dokumentumokat támogatják.

A besorolási modellek mostantól különböző nyelvű dokumentumokon taníthatók be. A teljes listát a támogatott nyelvek között találja.

Bemeneti követelmények

Támogatott fájlformátumok:

Modell PDF Képek:
jpeg/jpg, png, bmp, tiffheif
Microsoft Office:
Word (docx), Excel (xlxs), PowerPoint (pptx)
Olvasás
Elrendezés ✔ (2024-02-29-preview, 2023-10-31-preview és újabb)
Általános dokumentum
Előre összeállított
Egyéni kinyerés
Egyéni besorolás
  • A legjobb eredmény érdekében dokumentumtípusonként öt tiszta fényképet vagy kiváló minőségű vizsgálatot biztosít.

  • PDF és TIFF esetén legfeljebb 2000 oldal dolgozható fel (ingyenes szintű előfizetéssel csak az első két oldal dolgozható fel).

  • A dokumentumok elemzéséhez használt fájlméret 500 MB a fizetős (S0) és 4 MB az ingyenes (F0) szint esetén.

  • A képméreteknek 50 x 50 képpont és 10 000 képpont x 10 000 képpont között kell lenniük.

  • Ha a PDF-eket jelszó védi, akkor beküldés előtt el kell távolítania a védelmet.

  • A kinyerni kívánt szöveg minimális magassága 12 képpont egy 1024 x 768 képpontos képhez. Ez a dimenzió körülbelül 8-pont szövegnek felel meg 150 pont/hüvelyk (DPI).

  • Egyéni modell betanítása esetén a betanítási adatok oldalainak maximális száma az egyéni sablonmodell esetében 500, az egyéni neurális modell esetében pedig 50 000.

  • Egyéni extrakciós modell betanítása esetén a betanítási adatok teljes mérete sablonmodell esetén 50 MB, a neurális modell esetében pedig 1G-MB.

  • Egyéni besorolási modell betanítása esetén a betanítási adatok teljes mérete 1 GB, legfeljebb 10 000 oldal.

Dokumentum felosztása

Ha egy fájlban több dokumentum található, az osztályozó azonosíthatja a bemeneti fájlban található különböző dokumentumtípusokat. Az osztályozó válasz tartalmazza a fájlban található összes azonosított dokumentumtípus oldaltartományait. Ez a válasz több, azonos dokumentumtípusú példányt is tartalmazhat.

A analyze művelet most már tartalmaz egy splitMode tulajdonságot, amely részletes vezérlést biztosít a felosztási viselkedés felett.

  • Ha a teljes bemeneti fájlt egyetlen dokumentumként szeretné kezelni a besoroláshoz, állítsa a splitMode értéket a következőre none: . Ha így tesz, a szolgáltatás csak egy osztályt ad vissza a teljes bemeneti fájlhoz.
  • A bemeneti fájl minden oldalának besorolásához állítsa a splitMode értéket a következőre perPage: . A szolgáltatás minden lapot egyéni dokumentumként próbál besorolni.
  • Állítsa be a splitMode értéket, auto és a szolgáltatás azonosítja a dokumentumokat és a kapcsolódó oldaltartományokat.

Ajánlott eljárások

Az egyéni besorolási modellek betanítása osztályonként legalább öt mintát igényel. Ha az osztályok hasonlóak, a további betanítási minták hozzáadása javítja a modell pontosságát.

Az osztályozó megkísérli hozzárendelni az egyes dokumentumokat az egyik osztályhoz, ha azt várja, hogy a modell nem a betanítási adathalmaz részét képező osztályokban látja a dokumentumtípusokat, érdemes a besorolási pontszám küszöbértékét beállítani, vagy néhány reprezentatív dokumentumtípus-mintát hozzáadni egy "other" osztályhoz. Az osztály hozzáadása "other" biztosítja, hogy a szükségtelen dokumentumok ne befolyásolják az osztályozó minőségét.

Modell betanítása

Az egyéni besorolási modelleket a 4.0-s verzió támogatja: 2024-02-29-preview, 2024-07-31-preview és v3.1: 2023-07-31 (GA) API-k. A Document Intelligence Studio kód nélküli felhasználói felületet biztosít az egyéni osztályozók interaktív betanítása érdekében. Az első lépésekhez kövesse az útmutatót .

A REST API használatakor, ha mappák szerint rendezi a dokumentumokat, a azureBlobSource kérelem tulajdonságával betanított egy besorolási modellt.


https://{endpoint}/documentintelligence/documentClassifiers:build?api-version=2024-02-29-preview

{
  "classifierId": "demo2.1",
  "description": "",
  "docTypes": {
    "car-maint": {
        "azureBlobSource": {
            "containerUrl": "SAS URL to container",
            "prefix": "sample1/car-maint/"
            }
    },
    "cc-auth": {
        "azureBlobSource": {
            "containerUrl": "SAS URL to container",
            "prefix": "sample1/cc-auth/"
            }
    },
    "deed-of-trust": {
        "azureBlobSource": {
            "containerUrl": "SAS URL to container",
            "prefix": "sample1/deed-of-trust/"
            }
    }
  }
}

https://{endpoint}/formrecognizer/documentClassifiers:build?api-version=2023-07-31

{
  "classifierId": "demo2.1",
  "description": "",
  "docTypes": {
    "car-maint": {
        "azureBlobSource": {
            "containerUrl": "SAS URL to container",
            "prefix": "{path to dataset root}/car-maint/"
            }
    },
    "cc-auth": {
        "azureBlobSource": {
            "containerUrl": "SAS URL to container",
            "prefix": "{path to dataset root}/cc-auth/"
            }
    },
    "deed-of-trust": {
        "azureBlobSource": {
            "containerUrl": "SAS URL to container",
            "prefix": "{path to dataset root}/deed-of-trust/"
            }
    }
  }
}

Másik lehetőségként, ha egy egyszerű fájllistával rendelkezik, vagy csak az egyes mappákban lévő néhány fájl kiválasztását tervezi a modell betanítása érdekében, a azureBlobFileListSource tulajdonsággal betanítsa a modellt. Ehhez a lépéshez JSON-sorok formátumra van szükség file list . Minden osztályhoz adjon hozzá egy új fájlt a betanításhoz elküldendő fájlok listájával.

{
  "classifierId": "demo2",
  "description": "",
  "docTypes": {
    "car-maint": {
      "azureBlobFileListSource": {
        "containerUrl": "SAS URL to container",
        "fileList": "{path to dataset root}/car-maint.jsonl"
      }
    },
    "cc-auth": {
      "azureBlobFileListSource": {
        "containerUrl": "SAS URL to container",
        "fileList": "{path to dataset root}/cc-auth.jsonl"
      }
    },
    "deed-of-trust": {
      "azureBlobFileListSource": {
        "containerUrl": "SAS URL to container",
        "fileList": "{path to dataset root}/deed-of-trust.jsonl"
      }
    }
  }
}

A fájllista car-maint.jsonl például a következő fájlokat tartalmazza.

{"file":"classifier/car-maint/Commercial Motor Vehicle - Adatum.pdf"}
{"file":"classifier/car-maint/Commercial Motor Vehicle - Fincher.pdf"}
{"file":"classifier/car-maint/Commercial Motor Vehicle - Lamna.pdf"}
{"file":"classifier/car-maint/Commercial Motor Vehicle - Liberty.pdf"}
{"file":"classifier/car-maint/Commercial Motor Vehicle - Trey.pdf"}

Modell felülírása

Feljegyzés

Az API-tól kezdve az 2024-07-31-preview egyéni besorolási modellek támogatják a modellek felülírását a helyben.

Mostantól helyben frissítheti az egyéni besorolást. A modell közvetlen felülírása elveszítené a modellminőség összehasonlításának képességét, mielőtt a meglévő modell lecserélése mellett döntene. A modell felülírása akkor engedélyezett, ha a allowOverwrite tulajdonság explicit módon van megadva a kérelem törzsében. A művelet végrehajtása után lehetetlen helyreállítani a felülírt, eredeti modellt.



{
  "classifierId": "existingClassifierName",
  "allowOverwrite": true,  // Default=false
  ...
}

Modell másolása

Feljegyzés

Az API-tól kezdve az 2024-07-31-preview egyéni besorolási modellek támogatják a modellek másolását az alábbi régiókba és régiókba:

  • USA keleti régiója
  • USA2 nyugati régiója
  • Nyugat-Európa

A REST API-val vagy a Document Intelligence Studióval másolhat egy modellt egy másik régióba.

Másolási engedélyezési kérelem létrehozása

A következő HTTP-kérés a célerőforrás másolási engedélyezését kéri le. Fejlécként meg kell adnia a célerőforrás végpontját és kulcsát.

POST https://myendpoint.cognitiveservices.azure.com/documentintelligence/documentClassifiers:authorizeCopy?api-version=2024-07-31-preview
Ocp-Apim-Subscription-Key: {<your-key>}

Kérés törzse

{
  "classifierId": "targetClassifier",
  "description": "Target classifier description"
}

Egy válaszkódot kap a 200 válasz törzsével, amely tartalmazza a másolat indításához szükséges JSON hasznos adatokat.

{
  "targetResourceId": "/subscriptions/targetSub/resourceGroups/targetRG/providers/Microsoft.CognitiveServices/accounts/targetService",
  "targetResourceRegion": "targetResourceRegion",
  "targetClassifierId": "targetClassifier",
  "targetClassifierLocation": "https://targetEndpoint.cognitiveservices.azure.com/documentintelligence/documentClassifiers/targetClassifier",
  "accessToken": "accessToken",
  "expirationDateTime": "timestamp"
}

Másolási művelet indítása

A következő HTTP-kérés elindítja a másolási műveletet a forráserőforráson. Url-címként és fejlécként meg kell adnia a forráserőforrás végpontját és kulcsát. Figyelje meg, hogy a kérelem URL-címe tartalmazza a másolni kívánt forrásosztályozó osztályozóazonosítóját.

POST {endpoint}/documentintelligence/documentClassifiers/{classifierId}:copyTo?api-version=2024-07-31-preview
Ocp-Apim-Subscription-Key: {<your-key>}

A kérés törzse az előző lépés válasza.

{
  "targetResourceId": "/subscriptions/targetSub/resourceGroups/targetRG/providers/Microsoft.CognitiveServices/accounts/targetService",
  "targetResourceRegion": "targetResourceRegion",
  "targetClassifierId": "targetClassifier",
  "targetClassifierLocation": "https://targetEndpoint.cognitiveservices.azure.com/documentintelligence/documentClassifiers/targetClassifier",
  "accessToken": "accessToken",
  "expirationDateTime": "timestamp"
}

Modell válasza

Bemeneti fájl elemzése a dokumentumbesorolási modellel.

https://{endpoint}/documentintelligence/documentClassifiers/{classifier}:analyze?api-version=2024-02-29-preview

Az API-tól 2024-07-31-preview kezdve megadhatja a bemeneti dokumentumból elemezni kívánt oldalakat a kérelem lekérdezési pages paraméterével.

https://{service-endpoint}/formrecognizer/documentClassifiers/{classifier}:analyze?api-version=2023-07-31

A válasz tartalmazza a válasz dokumentumok szakaszában található társított oldaltartományokkal rendelkező azonosított dokumentumokat.

{
  ...

    "documents": [
      {
        "docType": "formA",
        "boundingRegions": [
          { "pageNumber": 1, "polygon": [...] },
          { "pageNumber": 2, "polygon": [...] }
        ],
        "confidence": 0.97,
        "spans": []
      },
      {
        "docType": "formB",
        "boundingRegions": [
          { "pageNumber": 3, "polygon": [...] }
        ],
        "confidence": 0.97,
        "spans": []
      }, ...
    ]
  }

Következő lépések

Ismerje meg, hogyan hozhat létre egyéni besorolási modelleket: