Mi az egyéni szövegbesorolás?
Az egyéni szövegbesorolás az Azure AI Language által kínált egyéni funkciók egyike. Ez egy felhőalapú API-szolgáltatás, amely gépi tanulási intelligenciát alkalmaz, hogy lehetővé tegye egyéni modellek készítését a szövegbesorolási feladatokhoz.
Az egyéni szövegbesorolás lehetővé teszi, hogy a felhasználók egyéni AI-modelleket készítsenek a szöveg felhasználó által előre meghatározott egyéni osztályokba való besorolásához. Egyéni szövegbesorolási projekt létrehozásával a fejlesztők iteratív módon címkézhetik meg az adatokat, betanítást, kiértékelhetnek és javíthatnak a modell teljesítményének, mielőtt elérhetővé tennék azt felhasználás céljából. A címkézett adatok minősége nagyban befolyásolja a modell teljesítményét. A modell létrehozásának és testreszabásának egyszerűsítése érdekében a szolgáltatás egy egyéni webportált kínál, amely a Language Studióban érhető el. A gyorsútmutató lépéseit követve egyszerűen megkezdheti a szolgáltatást.
Az egyéni szövegbesorolás kétféle projektet támogat:
- Egycímkés besorolás – egyetlen osztályt rendelhet hozzá az adathalmaz minden dokumentumához. Egy filmszkript például csak "Romantikus" vagy "Vígjáték" besorolású lehet.
- Többcímke-besorolás – az adathalmaz minden dokumentumához több osztályt rendelhet. Egy filmszkript például "Vígjáték" vagy "Romantikus" és "Komédia" besorolású lehet.
Ez a dokumentáció a következő cikktípusokat tartalmazza:
- A rövid útmutatók első lépések, amelyek végigvezetik a szolgáltatás kéréseinek teljesítésén.
- A fogalmak a szolgáltatás funkcióit és funkcióit ismertetik.
- Az útmutatók konkrétabb vagy testre szabottabb módon tartalmazzák a szolgáltatás használatára vonatkozó utasításokat.
Példa használati forgatókönyvekre
Az egyéni szövegbesorolás több különböző iparágban is használható:
Automatikus e-mailek vagy jegyátvétel
Minden típusú támogatási központ nagy mennyiségű e-mailt vagy jegyet kap, amely strukturálatlan, szabadkézett szöveget és mellékleteket tartalmaz. A belső csapatokon belüli témaszakértőknek való időben történő felülvizsgálat, visszaigazolás és útválasztás kritikus fontosságú. Az ilyen szintű e-mail-osztályozás megköveteli, hogy a felhasználók áttekinthessék és átirányítják a megfelelő részlegeket, ami időt és erőforrásokat igényel. Az egyéni szövegbesorolás használható a bejövő szövegek elemzésére, valamint a tartalom osztályozására és kategorizálására, hogy a tartalom automatikusan a megfelelő részlegekhez legyen irányítva további műveletek céljából.
Tudásbányászat a szemantikai keresés fejlesztéséhez/bővítéséhez
A keresés minden olyan alkalmazás alapja, amely szöveges tartalmat jelenít meg a felhasználók számára. Gyakori forgatókönyvek például a katalógus- vagy dokumentumkeresések, a kiskereskedelmi termékkeresések vagy az adatelemzési ismeretek bányászata. Számos vállalat különböző iparágakban arra törekszik, hogy gazdag keresési élményt hozzon létre privát, heterogén tartalmakon keresztül, amelyek strukturált és strukturálatlan dokumentumokat is tartalmaznak. A folyamat részeként a fejlesztők egyéni szövegbesorolással kategorizálhatják a szöveget az iparáguk szempontjából releváns osztályokba. Az előrejelzett osztályok a fájl indexelésének kibővítésére használhatók a testre szabottabb keresési élmény érdekében.
Projektfejlesztési életciklus
Egyéni szövegbesorolási projekt létrehozása általában több különböző lépésből áll.
Kövesse az alábbi lépéseket, hogy a lehető legtöbbet hozhassa ki a modellből:
A séma meghatározása: Ismerje meg az adatokat, és azonosítsa azokat az osztályokat , amelyek között különbséget szeretne tenni a kétértelműség elkerülése érdekében.
Az adatok címkézése: Az adatok címkézésének minősége kulcsfontosságú tényező a modell teljesítményének meghatározásában. Az ugyanahhoz az osztályhoz tartozó dokumentumoknak mindig ugyanazzal az osztálysal kell rendelkezniük, ha olyan dokumentuma van, amely két osztályba sorolható, többcímke-besorolási projekteket használ. Kerülje az osztályok kétértelműségét, győződjön meg arról, hogy az osztályok egyértelműen elválaszthatók egymástól, különösen az egycímkés besorolási projektek esetében.
A modell betanítása: A modell elkezd tanulni a címkézett adatokból.
A modell teljesítményének megtekintése: Tekintse meg a modell kiértékelési adatait annak megállapításához, hogy milyen jól teljesít az új adatok bevezetésekor.
A modell üzembe helyezése: A modell üzembe helyezése elérhetővé teszi az Analyze API-n keresztül.
Szöveg osztályozása: Egyéni modell használata egyéni szövegbesorolási feladatokhoz.
Referenciadokumentáció és kódminták
Az egyéni szövegbesorolás használata során tekintse meg a következő referenciadokumentációt és -mintákat az Azure AI-nyelvhez:
Fejlesztési lehetőség / nyelv | Referenciadokumentáció | Példák |
---|---|---|
REST API-k (szerzői) | REST API-dokumentáció | |
REST API-k (futtatókörnyezet) | REST API-dokumentáció | |
C# (futtatókörnyezet) | C#-dokumentáció | C# minták – Egycímkés besorolású C# minták – Többcímke-besorolás |
Java (futtatókörnyezet) | Java-dokumentáció | Java-minták – Egycímke-besorolású Java-minták – Többcímke-besorolás |
JavaScript (futtatókörnyezet) | A JavaScript dokumentációja | JavaScript-minták – Egycímke-besorolású JavaScript-minták – Többcímke-besorolás |
Python (futtatókörnyezet) | Python-dokumentáció | Python-minták – Egycímkés besorolású Python-minták – Többcímke-besorolás |
Felelős AI
Az AI-rendszerek nem csak a technológiát, hanem a felhasználókat is magukban foglalják, a felhasználókat, akiket érint majd, és a környezet, amelyben üzembe helyezik. Az egyéni szövegbesorolás átláthatósági megjegyzésében megismerheti a felelős AI-használatot és üzembe helyezést a rendszerekben. További információért az alábbi cikkeket is megtekintheti:
- Átláthatósági megjegyzés az Azure AI-nyelvhez
- Integráció és felelősségteljes használat
- Adatok, adatvédelem és biztonság
Következő lépések
Az egyéni szövegbesorolás használatának megkezdéséhez használja a rövid útmutatót .
Ahogy végighalad a projektfejlesztési életcikluson, tekintse át a szószedetet , hogy többet tudjon meg a funkció dokumentációjában használt kifejezésekről.
Ne felejtse el megtekinteni az olyan információk szolgáltatáskorlátait , mint a regionális rendelkezésre állás.