Automatikus címkézés használata egyéni szövegbesoroláshoz
A címkézési folyamat fontos része az adathalmaz előkészítésének. Mivel ez a folyamat sok időt és energiát igényel, az automatikus címkézési funkcióval automatikusan címkézheti a dokumentumokat a kategorizálni kívánt osztályokkal. Jelenleg a GPT-modellek használatával indíthat el automatikus címkézési feladatokat egy modell alapján, ahol azonnal elindíthat egy automatikus címkézési feladatot a modell előzetes betanítása nélkül. Ezzel a funkcióval időt és energiát takaríthat meg a dokumentumok manuális címkézésével.
Előfeltételek
Mielőtt használhatja az automatikus címkézést a GPT-vel, a következőkre van szüksége:
- Sikeresen létrehozott egy projektet egy konfigurált Azure Blob Storage-fiókkal.
- A tárfiókba feltöltött szöveges adatok.
- Jelentéssel bíró osztálynevek. A GPT-modellek a megadott osztályok neve alapján címkézik fel a dokumentumokat.
- A címkézett adatokra nincs szükség.
- Egy Azure OpenAI-erőforrás és üzembe helyezés.
Automatikus címkézési feladat aktiválása
Amikor aktivál egy automatikus címkézési feladatot a GPT-vel, a használatnak megfelelően megterheljük az Azure OpenAI-erőforrás díját. Az automatikusan felcímkézett dokumentumokban lévő tokenek számának becslését számítjuk fel. A különböző modellek jogkivonatonkénti díjszabásának részletes lebontásához tekintse meg az Azure OpenAI díjszabási oldalát .
A bal oldali navigációs menüben válassza az Adatok címkézése lehetőséget.
Válassza az Automatikus címke gombot a tevékenységpanel alatt, az oldal jobb oldalán.
Válassza az Autolabel with GPT (Automatikus címke a GPT-vel) lehetőséget, és válassza a Tovább gombot.
Válassza ki az Azure OpenAI-erőforrást és -üzembe helyezést. A folytatáshoz létre kell hoznia egy Azure OpenAI-erőforrást, és üzembe kell helyeznie egy modellt .
Válassza ki azokat az osztályokat, amelyeket fel szeretne venni az automatikus címkézési feladatba. Alapértelmezés szerint az összes osztály ki van jelölve. Az osztályok leíró nevei, valamint az egyes osztályokra vonatkozó példák használata ajánlott a GPT-vel való jó minőségű címkézés érdekében.
Válassza ki az automatikusan címkézni kívánt dokumentumokat. Javasoljuk, hogy válassza ki a címkézetlen dokumentumokat a szűrőből.
Megjegyzés
- Ha egy dokumentumot automatikusan címkéztek, de ezt a címkét már felhasználó definiálta, akkor csak a felhasználó által megadott címkét használja a rendszer.
- A dokumentumokat a dokumentum nevére kattintva tekintheti meg.
Válassza a Feladat indítása lehetőséget az automatikus címkézési feladat aktiválásához. A rendszer az automatikus címkézési feladatokat megjelenítő automatikus címkézési lapra irányítja. Az automatikus címkézési feladatok a belefoglalt dokumentumok számától függően néhány másodperctől néhány percig is eltarthatnak.
Az automatikusan címkézett dokumentumok áttekintése
Ha az automatikus címkézési feladat befejeződött, a kimeneti dokumentumokat a Language Studio Adatcímkézés lapján tekintheti meg. Az Automatikus címkével ellátott szűrővel rendelkező dokumentumok megtekintéséhez válassza a Dokumentumok áttekintése automatikus címkével lehetőséget.
Az automatikusan besorolt dokumentumok javasolt címkéi lila színnel vannak kiemelve a tevékenységpanelen. Minden javasolt címke két választóval (pipával és megszakítási ikonnal) rendelkezik, amelyek lehetővé teszik az automatikus címke elfogadását vagy elutasítását.
A címke elfogadása után a lila szín az alapértelmezett kékre változik, és a címke bekerül minden további modellbetanításba, amely felhasználó által definiált címkévé válik.
Miután elfogadta vagy elutasította az automatikusan címkézett dokumentumok címkéinek használatát, válassza a Címkék mentése lehetőséget a módosítások alkalmazásához.
Megjegyzés
- Javasoljuk, hogy elfogadásuk előtt érvényesítse az automatikusan címkézett dokumentumokat.
- A modell betanításakor a rendszer törli az összes nem elfogadott címkét.
Következő lépések
- További információ az adatok címkézéséről.