Entitás-összetevők

A Beszélgetési Language Understanding az entitások a kimondott szövegekből kinyert releváns információdarabok. Az entitások különböző módszerekkel nyerhetők ki. A kontextuson keresztül, listából egyeztetve, vagy előre összeállított felismert entitás észleli őket. A projekt minden entitása egy vagy több ilyen metódusból áll, amelyek az entitás összetevőiként vannak definiálva. Ha egy entitást több összetevő határoz meg, az előrejelzéseik átfedésben lehetnek. Az entitás-előrejelzés viselkedését akkor határozhatja meg, ha az összetevői átfedésben vannak az Entitás beállításaiban megadott rögzített beállításkészlettel.

Összetevőtípusok

Az entitásösszetevő meghatározza az entitás kinyerésére szolgáló módot. Az entitások tartalmazhatnak egy összetevőt, amely meghatározná az entitás kinyeréséhez használt egyetlen metódust, vagy több összetevőt az entitás definiálásának és kinyerésének módjainak kibontásához.

Tanult összetevő

A tanult összetevő azokat az entitáscímkéket használja, amellyel a kimondott szövegeket a gépi megtanult modell betanításához címkézheti. A modell megtanulja előre jelezni az entitás helyét a kimondott szövegkörnyezet alapján. A címkék példákat mutatnak be arra, hogy az entitás várhatóan hol lesz jelen egy kimondott szövegben a körülötte lévő szavak jelentése és a címkézett szavak alapján. Ez az összetevő csak akkor van definiálva, ha címkéket ad hozzá az entitás beszédelemeinek címkézésével. Ha nem címkéz meg beszédelemeket az entitással, az nem rendelkezik tanult összetevővel.

Képernyőkép az entitások tanult összetevőiről.

Listaösszetevő

A listaösszetevő a kapcsolódó szavak rögzített, zárt készletét jelöli a szinonimáikkal együtt. Az összetevő pontos szövegegyezést végez a szinonimákként megadott értékek listájával. Minden szinonima egy "listakulcshoz" tartozik, amely a szinonimák normalizált, standard értékeként használható, amely a listaösszetevő egyeztetése esetén a kimenetben lesz visszaadva. A listakulcsok nem használhatók az egyeztetéshez.

Többnyelvű projektekben különböző szinonimákat adhat meg az egyes nyelvekhez. Az előrejelzési API használata során megadhatja a bemeneti kérelem nyelvét, amely csak az adott nyelvhez társított szinonimáknak felel meg.

Képernyőkép az entitások listaösszetevőiről.

Előre összeállított összetevő

Az előre összeállított összetevő lehetővé teszi, hogy olyan gyakori típusú kódtárak közül válasszon, mint a számok, a dátumidők és a nevek. Amikor hozzáadja, a rendszer automatikusan észlel egy előre összeállított összetevőt. Entitásonként legfeljebb öt előre összeállított összetevő lehet. További információért tekintse meg a támogatott előre összeállított összetevők listáját .

Képernyőkép az entitások előre összeállított összetevőiről.

Regex-összetevő

A regex összetevő megegyezik a reguláris kifejezésekkel, hogy konzisztens mintákat rögzítsen. Ha hozzáadja, a normál kifejezésnek megfelelő szöveg ki lesz nyerve. Ugyanazon entitáson belül több reguláris kifejezés is lehet, amelyek mindegyike más kulcsazonosítóval rendelkezik. Egy egyeztetett kifejezés az előrejelzési válasz részeként adja vissza a kulcsot.

Többnyelvű projektekben különböző kifejezéseket adhat meg az egyes nyelvekhez. Az előrejelzési API használata során megadhatja a bemeneti kérelem nyelvét, amely csak az adott nyelvhez társított reguláris kifejezésnek felel meg.

Képernyőkép az entitások regex összetevőiről.

Entitásbeállítások

Ha egy entitáshoz több összetevő van definiálva, az előrejelzéseik átfedésben lehetnek. Átfedés esetén az egyes entitások végső előrejelzését az alábbi lehetőségek egyike határozza meg.

Összetevők egyesítése

Egyesítse az összetevőket egyetlen entitásként, ha átfedésben vannak az összes összetevő egyesítése által.

Ezzel az összes összetevőt kombinálhatja, ha átfedésben vannak. Az összetevők kombinálásakor minden további információt megkap, amely egy listához vagy egy előre összeállított összetevőhöz van kötve, amikor azok jelen vannak.

Példa

Tegyük fel, hogy van egy Szoftver nevű entitása, amely tartalmaz egy listaösszetevőt, amely bejegyzésként tartalmazza a "Proseware OS" kifejezést. A kimondott szöveg adataiban a "Proseware OS 9-et szeretnék megvásárolni", a "Proseware OS 9" címkével pedig Szoftver:

Képernyőkép a tanult és a lista entitásáról.

Az összetevők kombinálásával az entitás a teljes környezettel a "Proseware OS 9" értéket adja vissza a listaösszetevő kulcsával együtt:

Képernyőkép egy kombinált összetevő eredményéről.

Tegyük fel, hogy ugyanazzal a kimondott szövegrészsel rendelkezett, de a tanult összetevő csak az "OS 9"-et előrejelezte:

Képernyőkép a tanult összetevő által előrejelzett O S 9 beszédelemről.

Az összetevők kombinálásával az entitás továbbra is "Proseware OS 9" néven tér vissza a listaösszetevő kulcsával:

Képernyőkép a visszaadott szoftverentitásról.

Összetevők nem egyesítése

Minden átfedésben lévő összetevő az entitás különálló példányaként jelenik meg. Alkalmazza a saját logikáját az előrejelzés után ezzel a beállítással.

Példa

Tegyük fel, hogy van egy Szoftver nevű entitása, amely tartalmaz egy listaösszetevőt, amely bejegyzésként tartalmazza a "Proseware Desktop" kifejezést. A kimondott szöveg adataiban a "Proseware Desktop Pro-t szeretném megvásárolni" szoftver címkével ellátott "Proseware Desktop Pro" címkével rendelkezik:

Képernyőkép a tanult és lista entitás átfedéséről.

Ha nem egyesít összetevőket, az entitás kétszer ad vissza:

Képernyőkép a kétszer visszaadott entitásról.

Szükséges összetevők

Az entitásokat néha több összetevő is definiálhatja, de egy vagy több összetevőnek jelen kell lennie. Minden összetevő beállítható igény szerint, ami azt jelenti, hogy az entitás nem lesz visszaadva, ha az összetevő nem volt jelen. Ha például rendelkezik egy listaösszetevővel és egy szükséges tanult összetevővel rendelkező entitással, akkor garantált, hogy minden visszaadott entitás tartalmaz egy tanult összetevőt; ha nem, az entitás nem lesz visszaadva.

A szükséges összetevőket leggyakrabban a tanult összetevőknél használják, mivel a többi összetevőtípust egy adott környezetre korlátozhatják, amely általában a szerepkörökhöz van társítva. Azt is megkövetelheti az összes összetevőtől, hogy minden összetevő jelen legyen egy entitáshoz.

A Language Studióban az entitások minden összetevője mellett van egy kapcsoló, amely lehetővé teszi, hogy szükség szerint állítsa be.

Példa

Tegyük fel, hogy van egy Jegymennyiség nevű entitása, amely megpróbálja kinyerni a repülőjegyekre lefoglalni kívánt jegyek számát olyan beszédelemekhez, mint a " Két jegy lefoglalása holnap Kairóba".

Általában egy előre összeállított összetevőt adna hozzá a Quantity.Number elemhez, amely már kinyeri az összes számot. Ha azonban az entitást csak az előre összeállított értékkel definiálták, akkor a Jegymennyiség entitás részeként más számokat is kinyer, például " Két jegy lefoglalása holnap Kairóba 15 :00-kor".

A probléma megoldásához a betanítási adatokban fel kell tüntetnie egy tanult összetevőt a jegymennyiségnek szánt összes számra. Az entitásnak most már 2 összetevője van, az előre összeállított, amely ismeri az összes számot, és a tanult, amely előre jelzi, hogy hol van a jegymennyiség egy mondatban. Ha szüksége van a tanult összetevőre, győződjön meg arról, hogy a Jegymennyiség csak akkor tér vissza, ha a tanult összetevő a megfelelő környezetben előrejelzi azt. Ha az előre összeállított összetevőre is szüksége van, akkor garantálhatja, hogy a visszaadott Jegymennyiség entitás egyszerre szám és a megfelelő pozícióban van.

Összetevők és beállítások használata

Az összetevők rugalmasan definiálják az entitást több módon is. Az összetevők kombinálásakor győződjön meg arról, hogy minden összetevő képviseltetve van, és csökkenti az előrejelzésekben visszaadott entitások számát.

Gyakori eljárás egy előre összeállított összetevő kiterjesztése olyan értékek listájával, amelyeket az előre elkészített összetevő esetleg nem támogat. Ha például rendelkezik egy Szervezeti entitással, amelyhez egy General.Organization előre összeállított összetevő van hozzáadva, előfordulhat, hogy az entitás nem jelzi előre a tartományra jellemző összes szervezetet. A listaösszetevővel kibővítheti a Szervezeti entitás értékeit, és így kiterjesztheti az előre összeállítottt a saját szervezeteivel.

Más esetekben előfordulhat, hogy egy entitást olyan kontextuson keresztül szeretne kinyerni, mint egy kereskedelmi projektben lévő termék . A termék tanult összetevőjének címkéje alapján megtudhatja, hogy hol található egy termék a mondaton belüli pozíciója alapján. Előfordulhat, hogy rendelkezik olyan termékek listájával is, amelyeket már a kéz előtt ismer, amelyeket mindig ki szeretne nyerni. A két összetevő egyetlen entitásban való kombinálásával mindkét lehetőséget lekérheti az entitáshoz.

Ha nem egyesít összetevőket, minden összetevő számára lehetővé teszi, hogy független entitáselszívóként működjön. Ennek a beállításnak az egyik módja, ha elkülöníti a listából kinyert entitásokat a tanult vagy előre összeállított összetevőkön keresztül kinyert entitásoktól, hogy másképp kezeljék és kezeljék őket.

Megjegyzés

Korábban a szolgáltatás nyilvános előzetes verziója alatt 4 lehetőség közül választhatott: Leghosszabb átfedés, Pontos átfedés, Union overlap és Return all külön. A leghosszabb átfedés és a pontos átfedés elavult, és csak azoknál a projekteknél támogatott, amelyekben korábban ezek a lehetőségek voltak kiválasztva. Az összevonási átfedés át lett nevezve az Összetevők egyesítése névre, míg a Return all külön lett átnevezve Az összetevők összevonásának tiltása névre.

Következő lépések

Támogatott előre összeállított összetevők