A Dokumentumintelligencia növekményes osztályozóinak használata
Ez a tartalom a következőre vonatkozik: 4.0-s verzió (előzetes verzió)
Az Azure AI Document Intelligence egy felhőalapú Azure AI-szolgáltatás, amely lehetővé teszi intelligens dokumentumfeldolgozási megoldások létrehozását. A Dokumentumintelligencia API-k képeket, PDF-eket és más dokumentumfájlokat elemeznek a különböző tartalmak, elrendezések, stílusok és szemantikai elemek kinyeréséhez és észleléséhez.
A Document Intelligence egyéni besorolási modelljei olyan mélytanulási modelltípusok, amelyek az elrendezési és nyelvi funkciókat kombinálva pontosan észlelik és azonosítják az alkalmazásokban feldolgozott dokumentumokat. Az egyéni besorolási modellek egyszerre egy oldalon végzik a bemeneti fájlok besorolását, hogy azonosítsák a bennük lévő dokumentumokat, és egy bemeneti fájlon belül több dokumentumot vagy több példányt is azonosíthatnak.
A dokumentumintelligencia-dokumentumosztályozók azonosítják a fájlok ismert dokumentumtípusát. Ha több dokumentumtípusú bemeneti fájlt dolgoz fel, vagy ha nem ismeri a dokumentumtípust, használjon osztályozót a dokumentum azonosításához. Az osztályozókat rendszeresen frissíteni kell, amikor a következő változások történnek:
- Új sablonokat adhat hozzá egy meglévő osztályhoz.
- Új dokumentumtípusokat adhat hozzá a felismeréshez.
- Az osztályozó megbízhatósága alacsony.
Bizonyos esetekben már nem használhatja az osztályozó betanítása során használt eredeti dokumentumkészletet. Növekményes betanítással frissítheti az osztályozót csak az új címkével ellátott mintákkal.
Feljegyzés
A növekményes betanítás csak a dokumentumosztályozó modellekre vonatkozik, az egyéni modellekre nem.
A növekményes betanítás akkor hasznos, ha javítani szeretné az egyéni osztályozók minőségét. A meglévő osztályok új betanítási mintáinak hozzáadása növeli a modell megbízhatóságát a meglévő dokumentumtípusok esetében. Ha például egy meglévő űrlap új verzióját adja hozzá, vagy új dokumentumtípussal rendelkezik. Ilyen lehet például, ha az alkalmazás egy új dokumentumtípust támogat érvényes bemenetként.
Bevezetés a növekményes betanításba
A növekményes betanítás nem vezet be új API-végpontokat.
A
documentClassifiers:build
kérelem hasznos adatai a növekményes betanítás támogatására módosulnak.A növekményes betanítás egy új osztályozómodell létrehozását eredményezi, amely a meglévő osztályozót érintetlenül hagyja.
Az új osztályozó a régi osztályozó összes dokumentummintáját és típusát, valamint az újonnan megadott mintákat is megjeleníti. Meg kell győződnie arról, hogy az alkalmazás frissítéseket biztosít az újonnan betanított osztályozóval való együttműködéshez.
Feljegyzés
Az osztályozók másolási művelete jelenleg nem érhető el.
Növekményes osztályozó buildkérelmének létrehozása
A növekményes osztályozó összeállítási kérése hasonló a classify document
buildelési kérelemhez , de az új baseClassifierId
tulajdonságot is tartalmazza. A baseClassifierId
kiterjeszteni kívánt meglévő osztályozóra van állítva. Emellett meg kell adnia a docTypes
mintakészlet különböző dokumentumtípusainak típusát is. A baseClassifierben található minta megadásával docType
a rendszer hozzáadja a kérelemben megadott mintákat az alaposztályozó betanításakor megadott mintákhoz. A növekményes betanításban hozzáadott új docType
értékek csak az új osztályozóhoz lesznek hozzáadva. A minták megadásának folyamata változatlan marad. További információ: osztályozómodell betanítása.
Post-mintakérés
Mintakérés POST
növekményes dokumentumosztályozó létrehozásához
POST
{your-endpoint}/documentintelligence/documentClassifiers:build?api-version=2024-02-29-preview
{
"classifierId": "myAdaptedClassifier",
"description": "Classifier description",
"baseClassifierId": "myOriginalClassifier",
"docTypes": {
"formA": {
"azureBlobSource": {
"containerUrl": "https://myStorageAccount.blob.core.windows.net/myContainer?mySasToken",
"prefix": "formADocs/"
}
},
"formB": {
"azureBlobFileListSource": {
"containerUrl": "https://myStorageAccount.blob.core.windows.net/myContainer?mySasToken",
"fileList": "formB.jsonl"
}
}
}
}
POST válasz
Minden Dokumentumintelligencia API aszinkron, a visszaadott művelet helyének lekérdezése állapotot biztosít a buildelési művelethez. Az osztályozók gyorsan betaníthatók, és az osztályozó egy-két perc alatt használható.
Sikeres befejezés esetén:
- A sikeres
POST
metódus egy202 OK
válaszkódot ad vissza, amely jelzi, hogy a szolgáltatás létrehozta a kérést. - A lefordított dokumentumok a céltárolóban találhatók.
- A
POST
kérés válaszfejléceket is visszaad, beleértve aOperation-Location
. Ennek az élőfejnek az értéke olyanresultId
lekérdezést tartalmaz, amely lekérdezhető az aszinkron művelet állapotának lekéréséhez és az eredmények lekéréséhez ugyanazzalGET
az erőforrás-előfizetési kulccsal rendelkező kéréssel.
GET-mintakérés
Mintakérés GET
egy növekményes dokumentumosztályozó eredményének lekéréséhez
GET
{your-endpoint}/documentintelligence/documentClassifiers/{classifierId}/analyzeResults/{resultId}?api-version=2024-02-29-preview
{
"classifierId": "myAdaptedClassifier",
"description": "Classifier description",
"createdDateTime": "2022-07-30T00:00:00Z",
"expirationDateTime": "2023-01-01T00:00:00Z",
"apiVersion": "2024-02-29-preview",
"baseClassifierId": "myOriginalClassifier",
"docTypes": {
"formA": {
"azureBlobSource": {
"containerUrl": "https://myStorageAccount.blob.core.windows.net/myContainer",
"prefix": "formADocs/"
}
},
"formB": {
"azureBlobFileListSource": {
"containerUrl": "https://myStorageAccount.blob.core.windows.net/myContainer",
"fileList": "formB.jsonl"
}
}
}
}
GET válasz
A GET
növekményesen betanított osztályozó válasza eltér a standard osztályozó GET
válaszától. A növekményesen betanított osztályozó nem adja vissza az összes támogatott dokumentumtípust. Visszaadja a növekményes betanítási lépésben hozzáadott vagy frissített dokumentumtípusokat és a kiterjesztett alaposztályozót. A dokumentumtípusok teljes listájának lekéréséhez az alaposztályozónak szerepelnie kell a listában. Az alaposztályozó törlése nem befolyásolja a növekményesen betanított osztályozó használatát.
Korlátok
A növekményes betanítás csak akkor működik, ha az alaposztályozó és a növekményesen betanított osztályozó is ugyanabban az API-verzióban van betanítve. Ennek eredményeképpen a növekményesen betanított osztályozó ugyanolyan modelléletciklussal rendelkezik, mint az alaposztályozó.
A növekményes osztályozóra vonatkozó betanítási adathalmaz méretkorlátjai megegyeznek a többi osztályozómodell méretkorlátjaival. A vonatkozó korlátok teljes listáját a szolgáltatáskorlátok között találja.