Mi az az egyéni nevesített entitásfelismerés?
Az Egyéni NER az Azure AI Language egyik egyéni funkciója. Ez egy felhőalapú API-szolgáltatás, amely gépi tanulási intelligenciát alkalmaz, hogy egyéni modelleket hozzon létre az egyéni nevesített entitásfelismerési feladatokhoz.
Az egyéni NER lehetővé teszi, hogy a felhasználók egyéni AI-modelleket készítsenek, hogy tartományspecifikus entitásokat nyerjenek ki strukturálatlan szövegekből, például szerződésekből vagy pénzügyi dokumentumokból. Egyéni NER-projekt létrehozásával a fejlesztők iteratív módon címkézhetik fel az adatokat, betaníthatják, kiértékelhetik és javíthatják a modell teljesítményét, mielőtt használatba vehetővé tennék. A címkézett adatok minősége nagyban befolyásolja a modell teljesítményét. A modell létrehozásának és testreszabásának egyszerűsítése érdekében a szolgáltatás egy egyéni webportált kínál, amely a Language Studión keresztül érhető el. A szolgáltatás használatának megkezdéséhez kövesse az ebben a rövid útmutatóban ismertetett lépéseket.
Ez a dokumentáció a következő cikktípusokat tartalmazza:
- A rövid útmutatók az első lépéseket ismertetik, amelyek végigvezetik a szolgáltatás felé irányuló kérések teljesítésén.
- A fogalmak magyarázatot nyújtanak a szolgáltatás funkcióira és funkcióira.
- Az útmutatók útmutatást tartalmaznak a szolgáltatás konkrétabb vagy testre szabott módon történő használatához.
Példa használati forgatókönyvek
Az egyéni elnevezett entitások felismerése több forgatókönyvben is használható különböző iparágakban:
Információkinyerés
Számos pénzügyi és jogi szervezet napi rendszerességgel kinyeri és normalizálja az adatokat több ezer összetett, strukturálatlan szövegforrásból. Ilyen források például a bankszámlakivonatok, a jogi megállapodások vagy a banki űrlapok. Például a jelzálog-alkalmazásadatok emberi véleményezők által manuálisan végzett kinyerése több napot is igénybe vehet. Ezeknek a lépéseknek az automatizálása egy egyéni NER-modell létrehozásával leegyszerűsíti a folyamatot, és költség-, idő- és munkamegtakarítást takarít meg.
Tudásbányászat a szemantikai keresés javításához/bővítéséhez
A keresés minden olyan alkalmazás számára alapvető fontosságú, amely szöveges tartalmat jelenít meg a felhasználóknak. Gyakori forgatókönyvek például a katalógus- vagy dokumentumkeresés, a kiskereskedelmi termékkeresés vagy az adatelemzési tudásbányászat. Számos vállalat különböző iparágakban szeretne gazdag keresési élményt létrehozni privát, heterogén tartalmakon keresztül, amelyek strukturált és strukturálatlan dokumentumokat is tartalmaznak. A folyamat részeként a fejlesztők egyéni NER-t használhatnak az iparáguk szempontjából releváns entitások kinyerésére. Ezek az entitások a fájl indexelésének bővítésére használhatók a testre szabottabb keresési élmény érdekében.
Naplózás és megfelelőség
Ahelyett, hogy manuálisan tekintenek át jelentősen hosszú szöveges fájlokat a szabályzatok naplózásához és alkalmazásához, a pénzügyi vagy jogi vállalatok informatikai részlegei egyéni NER-t használhatnak automatizált megoldások létrehozásához. Ezek a megoldások hasznosak lehetnek a megfelelőségi szabályzatok kikényszerítéséhez és a szükséges üzleti szabályok beállításához a strukturált és strukturálatlan tartalmakat feldolgozó tudásbányászati folyamatok alapján.
Projektfejlesztési életciklus
Az egyéni NER használata általában több különböző lépésből áll.
A séma meghatározása: Ismerje meg az adatokat, és azonosítsa a kinyerni kívánt entitásokat . Kerülje a kétértelműséget.
Adatok címkézése: Az adatok címkézése kulcsfontosságú tényező a modell teljesítményének meghatározásában. Pontosan, következetesen és teljesen címkézzen.
- Pontos címkézés: Minden entitást mindig a megfelelő típusra címkézzen. Csak a kinyerni kívánt adatokat foglalja bele, kerülje a felesleges adatokat a címkékben.
- Következetes címkézés: Ugyanazon entitásnak minden fájlban ugyanazzal a címkével kell rendelkeznie.
- Teljes címkézés: Címkézze fel az entitás összes példányát az összes fájlban.
A modell betanítása: A modell elkezd tanulni a címkézett adatokból.
A modell teljesítményének megtekintése: A betanítás befejezése után tekintse meg a modell kiértékelési részleteit, teljesítményét és a továbbfejlesztésére vonatkozó útmutatást.
A modell üzembe helyezése: A modell üzembe helyezése elérhetővé teszi az Analyze API-n keresztül.
Entitások kinyerése: Használja az egyéni modelleket entitáskinyerési feladatokhoz.
Referenciadokumentáció és kódminták
Az egyéni NER használata során tekintse meg a következő referenciadokumentációt és -mintákat az Azure AI-nyelvhez:
Fejlesztési lehetőség/ nyelv | Referenciadokumentáció | Példák |
---|---|---|
REST API-k (szerzői műveletek) | REST API-dokumentáció | |
REST API-k (futtatókörnyezet) | REST API-dokumentáció | |
C# (futtatókörnyezet) | C#-dokumentáció | C#-minták |
Java (futtatókörnyezet) | Java-dokumentáció | Java-minták |
JavaScript (futtatókörnyezet) | A JavaScript dokumentációja | JavaScript-minták |
Python (futtatókörnyezet) | Python-dokumentáció | Python-példák |
Felelősségteljes MI
Az AI-rendszerek nem csak a technológiát, hanem a felhasználókat is magukban foglalják, akik használni fogják, azokat, akiket érinteni fog, valamint a környezetet, amelyben üzembe helyezik. Az egyéni NER átláthatósági megjegyzésében megismerheti a felelősségteljes AI-használatot és -üzembe helyezést a rendszerekben. További információért tekintse meg a következő cikkeket is:
- Az Azure AI-nyelv átláthatósági megjegyzése
- Integráció és felelős használat
- Adatok, adatvédelem és biztonság
Következő lépések
A rövid útmutatóban megkezdheti az egyéni elnevezett entitások felismerését.
Miközben végighalad a projektfejlesztési életcikluson, tekintse át a szószedetet , hogy többet tudjon meg a funkció dokumentációjában használt kifejezésekről.
Ne felejtse el megtekinteni az olyan információk szolgáltatási korlátait , mint a regionális elérhetőség.