Egyéni elnevezett entitásfelismerési definíciók és kifejezések
Ebből a cikkből megismerheti az egyéni NER használatakor esetlegesen előforduló definíciókat és kifejezéseket.
Entitás
Az entitások olyan szövegtartományok, amelyek bizonyos típusú információkat jeleznek. A szövegtartomány egy vagy több szóból állhat. Az egyéni NER hatókörében az entitások azok az információk, amelyeket a felhasználó ki szeretne nyerni a szövegből. A fejlesztők megjelölik az adataikban lévő entitásokat a szükséges entitásokkal, mielőtt átadják őket a modellnek a betanításhoz. Például: "Számlaszám", "Kezdő dátum", "Szállítási szám", "Születési hely", "Forrás város", "Szállító neve" vagy "Ügyfél címe".
A "John 25 000 USD-t kért kölcsön Fredtől" mondatban például a következő entitások lehetnek:
Entitás neve/típusa | Entitás |
---|---|
Hitelfelvevő neve | John |
Hitelező neve | Fred |
Hitelösszeg | 25 000 USD |
F1 pontszám
Az F1 pontszám a pontosság és a visszahívás függvénye. Erre akkor van szükség, ha egyensúlyt keres a pontosság és a visszahívás között.
Modell
A modell egy olyan objektum, amely be van tanítva egy adott feladat végrehajtására, ebben az esetben az egyéni entitásfelismerésre. A modelleket úgy tanítjuk be, hogy címkézett adatokat ad meg a tanuláshoz, így később felhasználhatók a felismerési feladatokhoz.
- A modellbetanítás az a folyamat, amely megtanítja a modellnek, hogy mit nyerjen ki a címkézett adatok alapján.
- A modell kiértékelése az a folyamat, amely közvetlenül a betanítás után történik, hogy megtudja, milyen jól teljesít a modell.
- Az üzembe helyezés a modell üzembe helyezéshez való hozzárendelésének folyamata, amely elérhetővé teszi azt az előrejelzési API-val.
Pontosság
Azt méri, hogy mennyire pontos/pontos a modell. Ez a helyesen azonosított pozitívok (valódi pozitívok) és az összes azonosított pozitív közötti arány. A pontossági metrika megmutatja, hogy az előrejelzett osztályok közül hány megfelelően van megjelölve.
Project
A projekt az adatokon alapuló egyéni ml-modellek készítésének munkaterülete. A projektet csak Ön és mások érhetik el, akik hozzáférnek a használt Azure-erőforráshoz.
Az egyéni entitás-kinyerési projekt létrehozásának előfeltételeként az erőforrást egy tárfiókhoz kell csatlakoztatnia az adatkészlettel egy új projekt létrehozásakor. A projekt automatikusan tartalmazza a .txt
tárolóban elérhető összes fájlt.
A projekten belül a következő műveleteket hajthatja végre:
- Adatok címkézése: Az adatok címkézésének folyamata, hogy a modell betanításakor megtudja, mit szeretne kinyerni.
- A modell összeállítása és betanítása: A projekt alapvető lépése, amelyben a modell elkezd tanulni a címkézett adatokból.
- Modellértékelés részleteinek megtekintése: Tekintse át a modell teljesítményét, és döntse el, hogy van-e még hova fejlődnie, vagy elégedett az eredménnyel.
- Üzembe helyezés: Miután áttekintette a modell teljesítményét, és eldöntötte, hogy használható a környezetben, hozzá kell rendelnie egy üzembe helyezéshez a használatához. A modell üzembe helyezéshez való hozzárendelése elérhetővé teszi az előrejelzési API-val való használatra.
- Modell tesztelése: A modell üzembe helyezése után tesztelje az üzembe helyezést a Language Studióban, hogy lássa, hogyan teljesít az éles környezetben.
Visszavonás
A modell tényleges pozitív osztályok előrejelzési képességét méri. Ez az előrejelzett valódi pozitív értékek és a ténylegesen címkézett értékek aránya. A visszahívási metrika megmutatja, hogy az előrejelzett osztályok közül hány helyes.