Egyéni elnevezett entitásfelismerő definíciók és kifejezések
Ebből a cikkből megismerheti az egyéni NER használatakor esetlegesen előforduló definíciókat és kifejezéseket.
Entitás
Az entitások olyan szövegtartományok, amelyek bizonyos típusú információkat jeleznek. A szövegtartomány egy vagy több szóból állhat. Az egyéni NER hatókörében az entitások azok az információk, amelyeket a felhasználó ki szeretne nyerni a szövegből. A fejlesztők az adataikban lévő entitásokat a szükséges entitásokkal címkézik meg, mielőtt átadják őket a modellnek a betanításhoz. Például :"Számlaszám", "Kezdés dátuma", "Szállítási szám", "Születési hely", "Forrás város", "Szállító neve" vagy "Ügyfél címe".
A "János 25 000 USD-t kölcsönzött Fredtől" mondatban például a következő entitások lehetnek:
Entitás neve/típusa | Entitás |
---|---|
Hitelfelvevő neve | John |
Hitelező neve | Fred |
Kölcsön összege | 25 000 USD |
F1 pontszám
Az F1 pontszám a Pontosság és a Visszahívás függvénye. Erre akkor van szükség, ha egyensúlyt keres a pontosság és a visszahívás között.
Modellezés
A modell egy olyan objektum, amely be van tanítva egy adott feladat végrehajtására, ebben az esetben az egyéni entitások felismerésére. A modellek betanítása úgy végezhető el, hogy címkézett adatokat ad meg a tanuláshoz, hogy később felismerési feladatokhoz is felhasználhatók legyenek.
- A modellbetanítás a modellnek a címkézett adatok alapján történő kinyerésére szolgáló tanítási folyamat.
- A modell kiértékelése az a folyamat, amely közvetlenül a betanítás után történik, hogy megtudja, milyen jól teljesít a modell.
- Az üzembe helyezés a modell üzembe helyezéshez való hozzárendelésének folyamata, amely az előrejelzési API-val teszi elérhetővé.
Pontosság
Azt méri, hogy mennyire pontos/pontos a modell. Ez a helyesen azonosított pozitívok (valódi pozitívok) és az összes azonosított pozitívok aránya. A pontossági metrika megmutatja, hogy az előrejelzett osztályok közül hány megfelelően van címkézve.
Project
A projektek olyan munkaterületek, ahol az adatok alapján egyéni ML-modelleket lehet létrehozni. A projekthez csak Ön és mások férhetnek hozzá, akik hozzáférnek a használt Azure-erőforráshoz.
Az egyéni entitáskinyerési projekt létrehozásának előfeltételeként az erőforrást egy tárfiókhoz kell csatlakoztatnia az adatkészlethez egy új projekt létrehozásakor. A projekt automatikusan tartalmazza a .txt
tárolóban elérhető összes fájlt.
A projekten belül a következő műveleteket hajthatja végre:
- Adatok címkézése: Az adatok címkézésének folyamata, hogy a modell betanításakor megtudja, mit szeretne kinyerni.
- A modell összeállítása és betanítása: A projekt alapvető lépése, amelyben a modell elkezd tanulni a címkézett adatokból.
- Modellértékelés részleteinek megtekintése: Tekintse át a modell teljesítményét, és döntse el, hogy van-e még mit javítania, vagy elégedett az eredménnyel.
- Üzembe helyezés: Miután áttekintette a modell teljesítményét, és úgy döntött, hogy használható a környezetben, hozzá kell rendelnie egy üzembe helyezéshez a használatához. A modell üzembe helyezéshez való hozzárendelése elérhetővé teszi az előrejelzési API-val való használatra.
- Modell tesztelése: A modell üzembe helyezése után tesztelje az üzembe helyezést a Language Studióban , hogy lássa, hogyan teljesít az éles környezetben.
Recall
Azt méri, hogy a modell képes-e tényleges pozitív osztályok előrejelzésére. Ez az előrejelzett valódi pozitívok és a ténylegesen címkézett értékek aránya. A visszahívási metrika megmutatja, hogy az előrejelzett osztályok közül hány helyes.
Következő lépések
Visszajelzés
https://aka.ms/ContentUserFeedback.
Hamarosan elérhető: 2024-ben fokozatosan kivezetjük a GitHub-problémákat a tartalom visszajelzési mechanizmusaként, és lecseréljük egy új visszajelzési rendszerre. További információ:Visszajelzés küldése és megtekintése a következőhöz: