Az egyéni szövegbesorolásban használt kifejezések és definíciók
Ebből a cikkből megismerhet néhány definíciót és kifejezést, amelyekkel egyéni szövegbesorolás használatakor találkozhat.
Osztály
Az osztály egy felhasználó által definiált kategória, amely a szöveg általános besorolását jelzi. A fejlesztők megjelölik az adataikat az osztályokkal, mielőtt átadják őket a modellnek betanítás céljából.
F1 pontszám
Az F1 pontszám a pontosság és a visszahívás függvénye. Erre akkor van szükség, ha egyensúlyt keres a pontosság és a felidézés között.
Modellezés
A modell egy olyan objektum, amely be van tanítva egy bizonyos feladat elvégzésére, ebben az esetben a szövegbesorolási feladatokra. A modellek betanítása címkézett adatokkal végezhető el, amelyekből tanulhatnak, így később felhasználhatók besorolási feladatokhoz.
- A modellbetanítás az a folyamat, amely bemutatja a modellnek, hogyan osztályozhatja a dokumentumokat a címkézett adatok alapján.
- A modell kiértékelése az a folyamat, amely közvetlenül a betanítás után következik be, hogy megtudja, mennyire teljesít jól a modell.
- Az üzembe helyezés a modell üzembe helyezéshez való hozzárendelésének folyamata, amely az előrejelzési API-val teszi elérhetővé.
Pontosság
Azt méri, hogy mennyire pontos/pontos a modell. Ez a helyesen azonosított pozitívok (valódi pozitívok) és az összes azonosított pozitív közötti arány. A pontossági metrika megmutatja, hogy az előrejelzett osztályok közül hány megfelelően van címkézve.
Project
A projektek olyan munkaterületek, ahol az adatok alapján egyéni ML-modelleket lehet létrehozni. A projekthez csak Ön és mások férhetnek hozzá, akik hozzáférnek a használt Azure-erőforráshoz.
Az egyéni szövegbesorolási projektek létrehozásának előfeltételeként egy új projekt létrehozásakor az erőforrást egy tárfiókhoz kell csatlakoztatnia az adatkészlettel. A projekt automatikusan tartalmazza a .txt
tárolóban elérhető összes fájlt.
A projekten belül a következőket teheti:
- Adatok címkézése: Az adatok címkézésének folyamata, hogy a modell betanításakor megtanulja, mit szeretne kinyerni.
- A modell összeállítása és betanítása: A projekt alapvető lépése, amelyben a modell elkezd tanulni a címkézett adatokból.
- Modellértékelés részleteinek megtekintése: Tekintse át a modell teljesítményét, és döntse el, hogy van-e még hova fejlődnie, vagy elégedett az eredményekkel.
- Üzembe helyezés: Miután áttekintette a modell teljesítményét, és úgy döntött, hogy megfelelő a környezetben való használathoz; a lekérdezéshez hozzá kell rendelnie egy üzemelő példányhoz. A modell üzembe helyezéshez való hozzárendelése lehetővé teszi, hogy az előrejelzési API-val használható legyen.
- Modell tesztelése: A modell üzembe helyezése után ezt a műveletet használhatja a Language Studióban , hogy kipróbálja az üzembe helyezést, és ellenőrizze, hogyan teljesítene éles környezetben.
Projekttípusok
Az egyéni szövegbesorolás két típusú projektet támogat
- Egycímkés besorolás – egyetlen osztályt rendelhet az adathalmaz minden dokumentumához. Egy filmszkript például csak "Romantikus" vagy "Komédiás" besorolású lehet.
- Többcímkés besorolás – az adathalmaz minden dokumentumához több osztályt is hozzárendelhet. Egy filmszkript például "Komédia" vagy "Romantika" és "Komédia" besorolású lehet.
Recall
A modell tényleges pozitív osztályok előrejelzésének képességét méri. Ez az előrejelzett valódi pozitívok és a ténylegesen címkézett értékek aránya. A visszahívási metrika megmutatja, hogy az előrejelzett osztályok közül hány helyes.
Következő lépések
Visszajelzés
https://aka.ms/ContentUserFeedback.
Hamarosan elérhető: 2024-ben fokozatosan kivezetjük a GitHub-problémákat a tartalom visszajelzési mechanizmusaként, és lecseréljük egy új visszajelzési rendszerre. További információ:Visszajelzés küldése és megtekintése a következőhöz: