Egyéni elnevezett entitásfelismerési definíciók és kifejezések

Cikk
10/16/2024

Ebből a cikkből megismerheti az egyéni NER használatakor esetlegesen előforduló definíciókat és kifejezéseket.

Entitás

Az entitások olyan szövegtartományok, amelyek bizonyos típusú információkat jeleznek. A szövegtartomány egy vagy több szóból állhat. Az egyéni NER hatókörében az entitások azok az információk, amelyeket a felhasználó ki szeretne nyerni a szövegből. A fejlesztők megjelölik az adataikban lévő entitásokat a szükséges entitásokkal, mielőtt átadják őket a modellnek a betanításhoz. Például: "Számlaszám", "Kezdő dátum", "Szállítási szám", "Születési hely", "Forrás város", "Szállító neve" vagy "Ügyfél címe".

A "John 25 000 USD-t kért kölcsön Fredtől" mondatban például a következő entitások lehetnek:

Entitás neve/típusa	Entitás
Hitelfelvevő neve	John
Hitelező neve	Fred
Hitelösszeg	25 000 USD

F1 pontszám

Az F1 pontszám a pontosság és a visszahívás függvénye. Erre akkor van szükség, ha egyensúlyt keres a pontosság és a visszahívás között.

Modell

A modell egy olyan objektum, amely be van tanítva egy adott feladat végrehajtására, ebben az esetben az egyéni entitásfelismerésre. A modelleket úgy tanítjuk be, hogy címkézett adatokat ad meg a tanuláshoz, így később felhasználhatók a felismerési feladatokhoz.

A modellbetanítás az a folyamat, amely megtanítja a modellnek, hogy mit nyerjen ki a címkézett adatok alapján.
A modell kiértékelése az a folyamat, amely közvetlenül a betanítás után történik, hogy megtudja, milyen jól teljesít a modell.
Az üzembe helyezés a modell üzembe helyezéshez való hozzárendelésének folyamata, amely elérhetővé teszi azt az előrejelzési API-val.

Pontosság

Azt méri, hogy mennyire pontos/pontos a modell. Ez a helyesen azonosított pozitívok (valódi pozitívok) és az összes azonosított pozitív közötti arány. A pontossági metrika megmutatja, hogy az előrejelzett osztályok közül hány megfelelően van megjelölve.

Project

A projekt az adatokon alapuló egyéni ml-modellek készítésének munkaterülete. A projektet csak Ön és mások érhetik el, akik hozzáférnek a használt Azure-erőforráshoz. Az egyéni entitás-kinyerési projekt létrehozásának előfeltételeként az erőforrást egy tárfiókhoz kell csatlakoztatnia az adatkészlettel egy új projekt létrehozásakor. A projekt automatikusan tartalmazza a .txt tárolóban elérhető összes fájlt.

A projekten belül a következő műveleteket hajthatja végre:

Adatok címkézése: Az adatok címkézésének folyamata, hogy a modell betanításakor megtudja, mit szeretne kinyerni.
A modell összeállítása és betanítása: A projekt alapvető lépése, amelyben a modell elkezd tanulni a címkézett adatokból.
Modellértékelés részleteinek megtekintése: Tekintse át a modell teljesítményét, és döntse el, hogy van-e még hova fejlődnie, vagy elégedett az eredménnyel.
Üzembe helyezés: Miután áttekintette a modell teljesítményét, és eldöntötte, hogy használható a környezetben, hozzá kell rendelnie egy üzembe helyezéshez a használatához. A modell üzembe helyezéshez való hozzárendelése elérhetővé teszi az előrejelzési API-val való használatra.
Modell tesztelése: A modell üzembe helyezése után tesztelje az üzembe helyezést a Language Studióban, hogy lássa, hogyan teljesít az éles környezetben.

Visszavonás

A modell tényleges pozitív osztályok előrejelzési képességét méri. Ez az előrejelzett valódi pozitív értékek és a ténylegesen címkézett értékek aránya. A visszahívási metrika megmutatja, hogy az előrejelzett osztályok közül hány helyes.

Megosztás a következőn keresztül: