Megosztás a következőn keresztül:


A Dokumentumintelligencia növekményes osztályozóinak használata

Ez a tartalom a következőre vonatkozik: Sakk 4.0-s verzió (előzetes verzió) Sakk

Az Azure AI Document Intelligence egy felhőalapú Azure AI-szolgáltatás, amely lehetővé teszi intelligens dokumentumfeldolgozási megoldások létrehozását. A Dokumentumintelligencia API-k képeket, PDF-eket és más dokumentumfájlokat elemeznek a különböző tartalmak, elrendezések, stílusok és szemantikai elemek kinyeréséhez és észleléséhez.

A Document Intelligence egyéni besorolási modelljei olyan mélytanulási modelltípusok, amelyek az elrendezési és nyelvi funkciókat kombinálva pontosan észlelik és azonosítják az alkalmazásokban feldolgozott dokumentumokat. Az egyéni besorolási modellek egyszerre egy oldalon végzik a bemeneti fájlok besorolását, hogy azonosítsák a bennük lévő dokumentumokat, és egy bemeneti fájlon belül több dokumentumot vagy több példányt is azonosíthatnak.

A dokumentumintelligencia-dokumentumosztályozók azonosítják a fájlok ismert dokumentumtípusát. Ha több dokumentumtípusú bemeneti fájlt dolgoz fel, vagy ha nem ismeri a dokumentumtípust, használjon osztályozót a dokumentum azonosításához. Az osztályozókat rendszeresen frissíteni kell, amikor a következő változások történnek:

  • Új sablonokat adhat hozzá egy meglévő osztályhoz.
  • Új dokumentumtípusokat adhat hozzá a felismeréshez.
  • Az osztályozó megbízhatósága alacsony.

Bizonyos esetekben már nem használhatja az osztályozó betanítása során használt eredeti dokumentumkészletet. Növekményes betanítással frissítheti az osztályozót csak az új címkével ellátott mintákkal.

Feljegyzés

A növekményes betanítás csak a dokumentumosztályozó modellekre vonatkozik, az egyéni modellekre nem.

A növekményes betanítás akkor hasznos, ha javítani szeretné az egyéni osztályozók minőségét. A meglévő osztályok új betanítási mintáinak hozzáadása növeli a modell megbízhatóságát a meglévő dokumentumtípusok esetében. Ha például egy meglévő űrlap új verzióját adja hozzá, vagy új dokumentumtípussal rendelkezik. Ilyen lehet például, ha az alkalmazás egy új dokumentumtípust támogat érvényes bemenetként.

Bevezetés a növekményes betanításba

  • A növekményes betanítás nem vezet be új API-végpontokat.

  • A documentClassifiers:build kérelem hasznos adatai a növekményes betanítás támogatására módosulnak.

  • A növekményes betanítás egy új osztályozómodell létrehozását eredményezi, amely a meglévő osztályozót érintetlenül hagyja.

  • Az új osztályozó a régi osztályozó összes dokumentummintáját és típusát, valamint az újonnan megadott mintákat is megjeleníti. Meg kell győződnie arról, hogy az alkalmazás frissítéseket biztosít az újonnan betanított osztályozóval való együttműködéshez.

    Feljegyzés

    Az osztályozók másolási művelete jelenleg nem érhető el.

Növekményes osztályozó buildkérelmének létrehozása

A növekményes osztályozó összeállítási kérése hasonló a classify document buildelési kérelemhez , de az új baseClassifierId tulajdonságot is tartalmazza. A baseClassifierId kiterjeszteni kívánt meglévő osztályozóra van állítva. Emellett meg kell adnia a docTypes mintakészlet különböző dokumentumtípusainak típusát is. A baseClassifierben található minta megadásával docType a rendszer hozzáadja a kérelemben megadott mintákat az alaposztályozó betanításakor megadott mintákhoz. A növekményes betanításban hozzáadott új docType értékek csak az új osztályozóhoz lesznek hozzáadva. A minták megadásának folyamata változatlan marad. További információ: osztályozómodell betanítása.

Post-mintakérés

Mintakérés POST növekményes dokumentumosztályozó létrehozásához

POST {your-endpoint}/documentintelligence/documentClassifiers:build?api-version=2024-02-29-preview

{
  "classifierId": "myAdaptedClassifier",
  "description": "Classifier description",
  "baseClassifierId": "myOriginalClassifier",
  "docTypes": {
    "formA": {
      "azureBlobSource": {
        "containerUrl": "https://myStorageAccount.blob.core.windows.net/myContainer?mySasToken",
        "prefix": "formADocs/"
      }
    },
    "formB": {
      "azureBlobFileListSource": {
        "containerUrl": "https://myStorageAccount.blob.core.windows.net/myContainer?mySasToken",
        "fileList": "formB.jsonl"
      }
    }
  }
}

POST válasz

Minden Dokumentumintelligencia API aszinkron, a visszaadott művelet helyének lekérdezése állapotot biztosít a buildelési művelethez. Az osztályozók gyorsan betaníthatók, és az osztályozó egy-két perc alatt használható.

Sikeres befejezés esetén:

  • A sikeres POST metódus egy 202 OK válaszkódot ad vissza, amely jelzi, hogy a szolgáltatás létrehozta a kérést.
  • A lefordított dokumentumok a céltárolóban találhatók.
  • A POST kérés válaszfejléceket is visszaad, beleértve a Operation-Location. Ennek az élőfejnek az értéke olyan resultId lekérdezést tartalmaz, amely lekérdezhető az aszinkron művelet állapotának lekéréséhez és az eredmények lekéréséhez ugyanazzal GET az erőforrás-előfizetési kulccsal rendelkező kéréssel.

GET-mintakérés

Mintakérés GET egy növekményes dokumentumosztályozó eredményének lekéréséhez

GET {your-endpoint}/documentintelligence/documentClassifiers/{classifierId}/analyzeResults/{resultId}?api-version=2024-02-29-preview


{
  "classifierId": "myAdaptedClassifier",
  "description": "Classifier description",
  "createdDateTime": "2022-07-30T00:00:00Z",
  "expirationDateTime": "2023-01-01T00:00:00Z",
  "apiVersion": "2024-02-29-preview",

  "baseClassifierId": "myOriginalClassifier",

  "docTypes": {
    "formA": {
      "azureBlobSource": {
        "containerUrl": "https://myStorageAccount.blob.core.windows.net/myContainer",
        "prefix": "formADocs/"
      }
    },
    "formB": {
      "azureBlobFileListSource": {
        "containerUrl": "https://myStorageAccount.blob.core.windows.net/myContainer",
        "fileList": "formB.jsonl"
      }
    }
  }
}

GET válasz

A GET növekményesen betanított osztályozó válasza eltér a standard osztályozó GET válaszától. A növekményesen betanított osztályozó nem adja vissza az összes támogatott dokumentumtípust. Visszaadja a növekményes betanítási lépésben hozzáadott vagy frissített dokumentumtípusokat és a kiterjesztett alaposztályozót. A dokumentumtípusok teljes listájának lekéréséhez az alaposztályozónak szerepelnie kell a listában. Az alaposztályozó törlése nem befolyásolja a növekményesen betanított osztályozó használatát.

Korlátok

  • A növekményes betanítás csak akkor működik, ha az alaposztályozó és a növekményesen betanított osztályozó is ugyanabban az API-verzióban van betanítve. Ennek eredményeképpen a növekményesen betanított osztályozó ugyanolyan modelléletciklussal rendelkezik, mint az alaposztályozó.

  • A növekményes osztályozóra vonatkozó betanítási adathalmaz méretkorlátjai megegyeznek a többi osztályozómodell méretkorlátjaival. A vonatkozó korlátok teljes listáját a szolgáltatáskorlátok között találja.

Következő lépések

  • További információ a dokumentumbesorolásról