Entitásösszetevők az állapotra vonatkozó egyéni szövegelemzésben
Az custom Text Analytics for health az entitások a strukturálatlan bemeneti szövegből kinyert releváns információk. Az entitások különböző módszerekkel nyerhetők ki. A kontextuson keresztül, listából egyeztetve, vagy előre összeállított felismert entitás észleli őket. A projekt minden entitása egy vagy több ilyen metódusból áll, amelyek az entitás összetevőiként vannak definiálva. Ha egy entitást több összetevő határoz meg, az előrejelzéseik átfedésben lehetnek. Az entitás-előrejelzés viselkedését akkor határozhatja meg, ha az összetevői átfedésben vannak az Entitás beállításaiban megadott rögzített beállításkészlettel.
Összetevőtípusok
Az entitásösszetevő meghatározza az entitás kinyerésére szolgáló módot. Az entitások tartalmazhatnak egy összetevőt, amely meghatározná az entitás kinyeréséhez használt egyetlen metódust, vagy több összetevőt az entitás definiálásának és kinyerésének módjainak kibontásához.
Az állapotentitások Text Analytics automatikusan betöltődnek a projektbe előre összeállított összetevőkkel rendelkező entitásokként. Előre összeállított összetevőkkel rendelkező entitások listaösszetevőit definiálhatja, de tanult összetevőket nem. Hasonlóképpen létrehozhat új entitásokat a tanult és listaösszetevőkkel, de nem töltheti fel őket további előre összeállított összetevőkkel.
Tanult összetevő
A tanult összetevő a szöveggel címkézett entitáscímkéket használja a gépi megtanult modell betanítása érdekében. A modell megtanulja előre jelezni az entitás helyét a szövegkörnyezet alapján. A címkék példákat adnak arra, hogy az entitás várhatóan hol jelenik meg a szövegben a körülötte lévő szavak jelentése és a címkézett szavak alapján. Ez az összetevő csak akkor van definiálva, ha címkéket ad hozzá az entitás adataihoz. Ha nem címkéz fel adatokat, az nem rendelkezik tanult összetevővel.
Az állapotentitások Text Analytics, amelyek alapértelmezés szerint előre összeállított összetevőkkel rendelkeznek, nem bővíthetők ki tanult összetevőkkel, ami azt jelenti, hogy nem igényelnek vagy fogadnak el további címkézést a működéshez.
Listaösszetevő
A listaösszetevő a kapcsolódó szavak rögzített, zárt készletét jelöli a szinonimáikkal együtt. Az összetevő pontos szövegegyezést végez a szinonimákként megadott értékek listájával. Minden szinonima egy "listakulcshoz" tartozik, amely a szinonimák normalizált, standard értékeként használható, amely a listaösszetevő egyeztetése esetén a kimenetben lesz visszaadva. A listakulcsok nem használhatók az egyeztetéshez.
Többnyelvű projektekben különböző szinonimákat adhat meg az egyes nyelvekhez. Az előrejelzési API használata során megadhatja a bemeneti kérelem nyelvét, amely csak az adott nyelvhez társított szinonimáknak felel meg.
Előre összeállított összetevő
Az állapotentitások Text Analytics automatikusan betöltődnek a projektbe előre összeállított összetevőkkel rendelkező entitásokként. Előre összeállított összetevőkkel rendelkező entitások listaösszetevőit definiálhatja, de tanult összetevőket nem adhat hozzá. Hasonlóképpen létrehozhat új entitásokat a tanult és listaösszetevőkkel, de nem töltheti fel őket további előre összeállított összetevőkkel. Az előre összeállított összetevőkkel rendelkező entitások előre betanítottak, és címkék nélkül képesek kinyerni a kategóriáikra vonatkozó információkat.
Entitásbeállítások
Ha egy entitáshoz több összetevő van definiálva, az előrejelzéseik átfedésben lehetnek. Átfedés esetén az egyes entitások végső előrejelzését az alábbi lehetőségek egyike határozza meg.
Összetevők egyesítése
Egyesítse az összetevőket egyetlen entitásként, ha átfedésben vannak az összes összetevő egyesítése által.
Ezzel az összes összetevőt kombinálhatja, ha átfedésben vannak. Az összetevők kombinálásakor minden további információt megkap, amely egy listához vagy egy előre összeállított összetevőhöz van kötve, amikor azok jelen vannak.
Példa
Tegyük fel, hogy van egy Szoftver nevű entitása, amely tartalmaz egy listaösszetevőt, amely bejegyzésként tartalmazza a "Proseware OS" kifejezést. A bemeneti adatokban a "Proseware OS 9-et szeretnék megvásárolni", a "Proseware OS 9" címkével pedig Szoftver:
Az összetevők kombinálásával az entitás a teljes környezettel a "Proseware OS 9" értéket adja vissza a listaösszetevő kulcsával együtt:
Tegyük fel, hogy ugyanazzal a kimondott szövegrészsel rendelkezett, de a tanult összetevő csak az "OS 9"-et előrejelezte:
Az összetevők kombinálásával az entitás továbbra is "Proseware OS 9" néven tér vissza a listaösszetevő kulcsával:
Összetevők nem kombinálása
Minden átfedésben lévő összetevő az entitás különálló példányaként jelenik meg. Alkalmazza a saját logikáját az előrejelzés után ezzel a beállítással.
Példa
Tegyük fel, hogy van egy Szoftver nevű entitása, amely tartalmaz egy listaösszetevőt, amely bejegyzésként tartalmazza a "Proseware Desktop" kifejezést. A címkézett adatokban a "Proseware Desktop Pro-t szeretnék megvásárolni", szoftver címkével ellátott "Proseware Desktop Pro" címkével:
Ha nem egyesít összetevőket, az entitás kétszer ad vissza:
Összetevők és beállítások használata
Az összetevők rugalmasan definiálják az entitást több módon is. Az összetevők kombinálásakor győződjön meg arról, hogy minden összetevő képviseltetve van, és csökkenti az előrejelzésekben visszaadott entitások számát.
Gyakori eljárás egy előre összeállított összetevő kiterjesztése olyan értékek listájával, amelyeket az előre elkészített összetevő esetleg nem támogat. Ha például rendelkezik egy Gyógyszernév entitással, amelyhez egy előre összeállított összetevő van Medication.Name
hozzáadva, előfordulhat, hogy az entitás nem jelzi előre a tartományra vonatkozó összes gyógyszernevet. A listaösszetevővel kiterjesztheti a Gyógyszernév entitás értékeit, és így kiterjesztheti az előre összeállított értéket a saját Gyógyszernevek értékeivel.
Máskor előfordulhat, hogy egy entitást olyan kontextuson keresztül szeretne kinyerni, mint egy orvosi eszköz. Az orvosi eszköz tanult összetevőjének címkéje alapján megtudhatja, hogy hol található egy orvosi eszköz a mondaton belüli pozíciója alapján. Előfordulhat, hogy rendelkezik azoknak az orvosi eszközöknek a listájával is, amelyeket már a kéz előtt tud, amelyeket mindig ki szeretne nyerni. A két összetevő egyetlen entitásban való kombinálásával mindkét lehetőséget lekérheti az entitáshoz.
Ha nem egyesít összetevőket, minden összetevő számára lehetővé teszi, hogy független entitáselszívóként működjön. Ennek a beállításnak az egyik módja, ha elkülöníti a listából kinyert entitásokat a tanult vagy előre összeállított összetevőkön keresztül kinyert entitásoktól, hogy másképp kezeljék és kezeljék őket.
Következő lépések
Visszajelzés
https://aka.ms/ContentUserFeedback.
Hamarosan elérhető: 2024-ben fokozatosan kivezetjük a GitHub-problémákat a tartalom visszajelzési mechanizmusaként, és lecseréljük egy új visszajelzési rendszerre. További információ:Visszajelzés küldése és megtekintése a következőhöz: