Share via


Mi az az egyéni nevesített entitásfelismerés?

Az Egyéni NER az Azure AI Language egyik egyéni funkciója. Ez egy felhőalapú API-szolgáltatás, amely gépi tanulási intelligenciát alkalmaz, hogy egyéni modelleket hozzon létre az egyéni nevesített entitásfelismerési feladatokhoz.

Az egyéni NER lehetővé teszi, hogy a felhasználók egyéni AI-modelleket készítsenek, hogy tartományspecifikus entitásokat nyerjenek ki strukturálatlan szövegekből, például szerződésekből vagy pénzügyi dokumentumokból. Egyéni NER-projekt létrehozásával a fejlesztők iteratív módon címkézhetik fel az adatokat, betaníthatják, kiértékelhetik és javíthatják a modell teljesítményét, mielőtt használatba vehetővé tennék. A címkézett adatok minősége nagyban befolyásolja a modell teljesítményét. A modell létrehozásának és testreszabásának egyszerűsítése érdekében a szolgáltatás egy egyéni webportált kínál, amely a Language Studión keresztül érhető el. A szolgáltatás használatának megkezdéséhez kövesse az ebben a rövid útmutatóban ismertetett lépéseket.

Ez a dokumentáció a következő cikktípusokat tartalmazza:

  • A rövid útmutatók az első lépéseket ismertetik, amelyek végigvezetik a szolgáltatás felé irányuló kérések teljesítésén.
  • A fogalmak magyarázatot nyújtanak a szolgáltatás funkcióira és funkcióira.
  • Az útmutatók útmutatást tartalmaznak a szolgáltatás konkrétabb vagy testre szabott módon történő használatához.

Példa használati forgatókönyvek

Az egyéni elnevezett entitások felismerése több forgatókönyvben is használható különböző iparágakban:

Információkinyerés

Számos pénzügyi és jogi szervezet napi rendszerességgel kinyeri és normalizálja az adatokat több ezer összetett, strukturálatlan szövegforrásból. Ilyen források például a bankszámlakivonatok, a jogi megállapodások vagy a banki űrlapok. Például a jelzálog-alkalmazásadatok emberi véleményezők által manuálisan végzett kinyerése több napot is igénybe vehet. Ezeknek a lépéseknek az automatizálása egy egyéni NER-modell létrehozásával leegyszerűsíti a folyamatot, és költség-, idő- és munkamegtakarítást takarít meg.

A keresés minden olyan alkalmazás számára alapvető fontosságú, amely szöveges tartalmat jelenít meg a felhasználóknak. Gyakori forgatókönyvek például a katalógus- vagy dokumentumkeresés, a kiskereskedelmi termékkeresés vagy az adatelemzési tudásbányászat. Számos vállalat különböző iparágakban szeretne gazdag keresési élményt létrehozni privát, heterogén tartalmakon keresztül, amelyek strukturált és strukturálatlan dokumentumokat is tartalmaznak. A folyamat részeként a fejlesztők egyéni NER-t használhatnak az iparáguk szempontjából releváns entitások kinyerésére. Ezek az entitások a fájl indexelésének bővítésére használhatók a testre szabottabb keresési élmény érdekében.

Naplózás és megfelelőség

Ahelyett, hogy manuálisan tekintenek át jelentősen hosszú szöveges fájlokat a szabályzatok naplózásához és alkalmazásához, a pénzügyi vagy jogi vállalatok informatikai részlegei egyéni NER-t használhatnak automatizált megoldások létrehozásához. Ezek a megoldások hasznosak lehetnek a megfelelőségi szabályzatok kikényszerítéséhez és a szükséges üzleti szabályok beállításához a strukturált és strukturálatlan tartalmakat feldolgozó tudásbányászati folyamatok alapján.

Projektfejlesztési életciklus

Az egyéni NER használata általában több különböző lépésből áll.

A fejlesztési életciklus

  1. A séma meghatározása: Ismerje meg az adatokat, és azonosítsa a kinyerni kívánt entitásokat . Kerülje a kétértelműséget.

  2. Adatok címkézése: Az adatok címkézése kulcsfontosságú tényező a modell teljesítményének meghatározásában. Pontosan, következetesen és teljesen címkézzen.

    1. Pontos címkézés: Minden entitást mindig a megfelelő típusra címkézzen. Csak a kinyerni kívánt adatokat foglalja bele, kerülje a felesleges adatokat a címkékben.
    2. Következetes címkézés: Ugyanazon entitásnak minden fájlban ugyanazzal a címkével kell rendelkeznie.
    3. Teljes címkézés: Címkézze fel az entitás összes példányát az összes fájlban.
  3. A modell betanítása: A modell elkezd tanulni a címkézett adatokból.

  4. A modell teljesítményének megtekintése: A betanítás befejezése után tekintse meg a modell kiértékelési részleteit, teljesítményét és a továbbfejlesztésére vonatkozó útmutatást.

  5. A modell üzembe helyezése: A modell üzembe helyezése elérhetővé teszi az Analyze API-n keresztül.

  6. Entitások kinyerése: Használja az egyéni modelleket entitáskinyerési feladatokhoz.

Referenciadokumentáció és kódminták

Az egyéni NER használata során tekintse meg a következő referenciadokumentációt és -mintákat az Azure AI-nyelvhez:

Fejlesztési lehetőség/ nyelv Referenciadokumentáció Példák
REST API-k (szerzői műveletek) REST API-dokumentáció
REST API-k (futtatókörnyezet) REST API-dokumentáció
C# (futtatókörnyezet) C#-dokumentáció C#-minták
Java (futtatókörnyezet) Java-dokumentáció Java-minták
JavaScript (futtatókörnyezet) A JavaScript dokumentációja JavaScript-minták
Python (futtatókörnyezet) Python-dokumentáció Python-példák

Felelősségteljes MI

Az AI-rendszerek nem csak a technológiát, hanem a felhasználókat is magukban foglalják, akik használni fogják, azokat, akiket érinteni fog, valamint a környezetet, amelyben üzembe helyezik. Az egyéni NER átláthatósági megjegyzésében megismerheti a felelősségteljes AI-használatot és -üzembe helyezést a rendszerekben. További információért tekintse meg a következő cikkeket is:

Következő lépések