Megosztás a következőn keresztül:


Egyéni elnevezett entitásfelismerő definíciók és kifejezések

Ebből a cikkből megismerheti az egyéni NER használatakor esetlegesen előforduló definíciókat és kifejezéseket.

Entitás

Az entitások olyan szövegtartományok, amelyek bizonyos típusú információkat jeleznek. A szövegtartomány egy vagy több szóból állhat. Az egyéni NER hatókörében az entitások azok az információk, amelyeket a felhasználó ki szeretne nyerni a szövegből. A fejlesztők az adataikban lévő entitásokat a szükséges entitásokkal címkézik meg, mielőtt átadják őket a modellnek a betanításhoz. Például :"Számlaszám", "Kezdés dátuma", "Szállítási szám", "Születési hely", "Forrás város", "Szállító neve" vagy "Ügyfél címe".

A "János 25 000 USD-t kölcsönzött Fredtől" mondatban például a következő entitások lehetnek:

Entitás neve/típusa Entitás
Hitelfelvevő neve John
Hitelező neve Fred
Kölcsön összege 25 000 USD

F1 pontszám

Az F1 pontszám a Pontosság és a Visszahívás függvénye. Erre akkor van szükség, ha egyensúlyt keres a pontosság és a visszahívás között.

Modellezés

A modell egy olyan objektum, amely be van tanítva egy adott feladat végrehajtására, ebben az esetben az egyéni entitások felismerésére. A modellek betanítása úgy végezhető el, hogy címkézett adatokat ad meg a tanuláshoz, hogy később felismerési feladatokhoz is felhasználhatók legyenek.

  • A modellbetanítás a modellnek a címkézett adatok alapján történő kinyerésére szolgáló tanítási folyamat.
  • A modell kiértékelése az a folyamat, amely közvetlenül a betanítás után történik, hogy megtudja, milyen jól teljesít a modell.
  • Az üzembe helyezés a modell üzembe helyezéshez való hozzárendelésének folyamata, amely az előrejelzési API-val teszi elérhetővé.

Pontosság

Azt méri, hogy mennyire pontos/pontos a modell. Ez a helyesen azonosított pozitívok (valódi pozitívok) és az összes azonosított pozitívok aránya. A pontossági metrika megmutatja, hogy az előrejelzett osztályok közül hány megfelelően van címkézve.

Project

A projektek olyan munkaterületek, ahol az adatok alapján egyéni ML-modelleket lehet létrehozni. A projekthez csak Ön és mások férhetnek hozzá, akik hozzáférnek a használt Azure-erőforráshoz. Az egyéni entitáskinyerési projekt létrehozásának előfeltételeként az erőforrást egy tárfiókhoz kell csatlakoztatnia az adatkészlethez egy új projekt létrehozásakor. A projekt automatikusan tartalmazza a .txt tárolóban elérhető összes fájlt.

A projekten belül a következő műveleteket hajthatja végre:

  • Adatok címkézése: Az adatok címkézésének folyamata, hogy a modell betanításakor megtudja, mit szeretne kinyerni.
  • A modell összeállítása és betanítása: A projekt alapvető lépése, amelyben a modell elkezd tanulni a címkézett adatokból.
  • Modellértékelés részleteinek megtekintése: Tekintse át a modell teljesítményét, és döntse el, hogy van-e még mit javítania, vagy elégedett az eredménnyel.
  • Üzembe helyezés: Miután áttekintette a modell teljesítményét, és úgy döntött, hogy használható a környezetben, hozzá kell rendelnie egy üzembe helyezéshez a használatához. A modell üzembe helyezéshez való hozzárendelése elérhetővé teszi az előrejelzési API-val való használatra.
  • Modell tesztelése: A modell üzembe helyezése után tesztelje az üzembe helyezést a Language Studióban , hogy lássa, hogyan teljesít az éles környezetben.

Recall

Azt méri, hogy a modell képes-e tényleges pozitív osztályok előrejelzésére. Ez az előrejelzett valódi pozitívok és a ténylegesen címkézett értékek aránya. A visszahívási metrika megmutatja, hogy az előrejelzett osztályok közül hány helyes.

Következő lépések