Az egyéni szövegbesorolásban használt kifejezések és definíciók

Cikk
12/19/2023

Ebből a cikkből megismerhet néhány definíciót és kifejezést, amelyekkel egyéni szövegbesorolás használatakor találkozhat.

Osztály

Az osztály egy felhasználó által definiált kategória, amely a szöveg általános besorolását jelzi. A fejlesztők megjelölik az adataikat az osztályokkal, mielőtt átadják őket a modellnek betanítás céljából.

F1 pontszám

Az F1 pontszám a pontosság és a visszahívás függvénye. Erre akkor van szükség, ha egyensúlyt keres a pontosság és a felidézés között.

Modellezés

A modell egy olyan objektum, amely be van tanítva egy bizonyos feladat elvégzésére, ebben az esetben a szövegbesorolási feladatokra. A modellek betanítása címkézett adatokkal végezhető el, amelyekből tanulhatnak, így később felhasználhatók besorolási feladatokhoz.

A modellbetanítás az a folyamat, amely bemutatja a modellnek, hogyan osztályozhatja a dokumentumokat a címkézett adatok alapján.
A modell kiértékelése az a folyamat, amely közvetlenül a betanítás után következik be, hogy megtudja, mennyire teljesít jól a modell.
Az üzembe helyezés a modell üzembe helyezéshez való hozzárendelésének folyamata, amely az előrejelzési API-val teszi elérhetővé.

Pontosság

Azt méri, hogy mennyire pontos/pontos a modell. Ez a helyesen azonosított pozitívok (valódi pozitívok) és az összes azonosított pozitív közötti arány. A pontossági metrika megmutatja, hogy az előrejelzett osztályok közül hány megfelelően van címkézve.

Project

A projektek olyan munkaterületek, ahol az adatok alapján egyéni ML-modelleket lehet létrehozni. A projekthez csak Ön és mások férhetnek hozzá, akik hozzáférnek a használt Azure-erőforráshoz. Az egyéni szövegbesorolási projektek létrehozásának előfeltételeként egy új projekt létrehozásakor az erőforrást egy tárfiókhoz kell csatlakoztatnia az adatkészlettel. A projekt automatikusan tartalmazza a .txt tárolóban elérhető összes fájlt.

A projekten belül a következőket teheti:

Adatok címkézése: Az adatok címkézésének folyamata, hogy a modell betanításakor megtanulja, mit szeretne kinyerni.
A modell összeállítása és betanítása: A projekt alapvető lépése, amelyben a modell elkezd tanulni a címkézett adatokból.
Modellértékelés részleteinek megtekintése: Tekintse át a modell teljesítményét, és döntse el, hogy van-e még hova fejlődnie, vagy elégedett az eredményekkel.
Üzembe helyezés: Miután áttekintette a modell teljesítményét, és úgy döntött, hogy megfelelő a környezetben való használathoz; a lekérdezéshez hozzá kell rendelnie egy üzemelő példányhoz. A modell üzembe helyezéshez való hozzárendelése lehetővé teszi, hogy az előrejelzési API-val használható legyen.
Modell tesztelése: A modell üzembe helyezése után ezt a műveletet használhatja a Language Studióban , hogy kipróbálja az üzembe helyezést, és ellenőrizze, hogyan teljesítene éles környezetben.

Projekttípusok

Az egyéni szövegbesorolás két típusú projektet támogat

Egycímkés besorolás – egyetlen osztályt rendelhet az adathalmaz minden dokumentumához. Egy filmszkript például csak "Romantikus" vagy "Komédiás" besorolású lehet.
Többcímkés besorolás – az adathalmaz minden dokumentumához több osztályt is hozzárendelhet. Egy filmszkript például "Komédia" vagy "Romantika" és "Komédia" besorolású lehet.

Recall

A modell tényleges pozitív osztályok előrejelzésének képességét méri. Ez az előrejelzett valódi pozitívok és a ténylegesen címkézett értékek aránya. A visszahívási metrika megmutatja, hogy az előrejelzett osztályok közül hány helyes.

Megosztás a következőn keresztül: