A közös szókincs és fogalmak nyelvfelismerési szószedete
Fontos
A LUIS 2025. október 1-jén megszűnik, és 2023. április 1-től nem hozhat létre új LUIS-erőforrásokat. Javasoljuk, hogy a LUIS-alkalmazásokat a beszélgetési nyelv megértésére migrálja, hogy kihasználhassa a terméktámogatás és a többnyelvű képességek előnyeit.
A Language Understanding (LUIS) szószedet ismerteti azokat a kifejezéseket, amelyekkel a LUIS szolgáltatás használata során találkozhat.
Aktív verzió
Az aktív verzió az alkalmazás azon verziója , amely akkor frissül, amikor módosítja a modellt a LUIS-portálon. A LUIS-portálon, ha nem aktív verziójú verziót szeretne módosítani, először aktívként kell beállítania a verziót.
Aktív tanulás
Az aktív tanulás a gépi tanulás egyik technikája, amelyben a gépi tanulás modellje a címkézendő informatív új példák azonosítására szolgál. A LUIS-ban az aktív tanulás arra utal, hogy kimondott szövegeket ad hozzá a végponti forgalomból, amelyek jelenlegi előrejelzései nem egyértelműek a modell továbbfejlesztése érdekében. Válassza a "végponti kimondott szövegek áttekintése" lehetőséget a címkéhez tartozó kimondott szövegek megtekintéséhez.
Lásd még:
- Elméleti információk
- Oktatóanyag a végponti kimondott szövegek áttekintéséről
- A LUIS-alkalmazás fejlesztése végponti kimondott szövegek áttekintésével
Alkalmazás (alkalmazás)
A LUIS-ban az alkalmazás vagy alkalmazás gépi tanulású modellek gyűjteménye, amelyek ugyanarra az adatkészletre épülnek, és egy adott forgatókönyv szándékainak és entitásainak előrejelzésére működnek együtt. Minden alkalmazásnak külön előrejelzési végpontja van.
Ha HR-robotot készít, előfordulhat, hogy több szándéka is van, például a "Szabadság ütemezése", az "előnyökre vonatkozó kíváncsiság" és a "személyes adatok frissítése", valamint az egyes szándékok entitásai, amelyeket egyetlen alkalmazásba csoportosít.
Tartalomkészítés
A szerzői funkció lehetővé teszi LUIS-alkalmazások létrehozását, kezelését és üzembe helyezését a LUIS-portál vagy a szerzői API-k használatával.
Szerzői kulcs
A szerkesztőkulcs az alkalmazás létrehozásához használható. Éles szintű végpontlekérdezésekhez nem használható. További információ: erőforráskorlátok.
Erőforrás készítése
A LUIS szerzői erőforrása egy kezelhető elem, amely az Azure-on keresztül érhető el. Az erőforrás az Azure-szolgáltatás kapcsolódó szerzői, betanítási és közzétételi képességeihez való hozzáférés. Az erőforrás tartalmazza a kapcsolódó Azure-szolgáltatás eléréséhez szükséges hitelesítési, engedélyezési és biztonsági információkat.
A szerzői erőforrás azure-beli LUIS-Authoring
"fajta" típusú.
Batch-teszt
A kötegelt tesztelés lehetővé teszi egy aktuális LUIS-alkalmazás modelljeinek ellenőrzését a felhasználói kimondott szövegek konzisztens és ismert tesztkészletével. A kötegteszt egy JSON formátumú fájlban van definiálva.
Lásd még:
- Alapelvek
- Kötegelt teszt futtatása
- Oktatóanyag – kötegteszt létrehozása és futtatása
F-mérték
Kötegelt tesztelés esetén a teszt pontosságának mértéke.
Hamis negatív (FN)
A kötegtesztelés során az adatpontok kimondott szövegeket jelölnek, amelyekben az alkalmazás helytelenül előrejelezte a cél szándék/entitás hiányát.
Hamis pozitív (FP)
A kötegelt tesztelés során az adatpontok kimondott szövegeket jelölnek, amelyekben az alkalmazás helytelenül előrejelezte a cél szándék/entitás meglétét.
Pontosság
A kötegtesztelés során a pontosság (más néven pozitív prediktív érték) a lekért kimondott szövegek közötti releváns kimondott szövegek töredéke.
Az állatkísérletek egyik példája az előrejelzett juhok száma az állatok (juhok és nem juhok) teljes számával osztva.
Visszavonás
A kötegelt tesztelésben a visszahívás (más néven bizalmasság) a LUIS általánosításának képessége.
Egy állatköteg-vizsgálatra példa az előrejelzett juhok száma és a rendelkezésre álló juhok teljes száma.
Igaz negatív (TN)
A valódi negatív az, ha az alkalmazás helyesen jelez előre nem egyezést. A kötegtesztelés során valódi negatív érték jelenik meg, ha az alkalmazás előre jelez egy szándékot vagy entitást egy olyan példához, amely nem lett megjelölve ezzel a szándékkal vagy entitással.
Valódi pozitív (TP)
Valódi pozitív (TP) A valódi pozitív az, amikor az alkalmazás helyesen jelez előre egyezést. A kötegtesztelés során a valódi pozitív érték akkor fordul elő, ha az alkalmazás egy szándékot vagy entitást jelez előre egy példához, amelyet ezzel a szándékkal vagy entitással címkéznek meg.
Osztályozó
Az osztályozó egy gépi tanult modell, amely előrejelzi, hogy a bemenet milyen kategóriába vagy osztályba illeszkedik.
A szándék egy osztályozó példája.
Közreműködő
A közreműködők fogalmilag megegyeznek a közreműködővel. A közreműködő akkor kap hozzáférést, ha egy tulajdonos hozzáadja a közreműködő e-mail-címét egy olyan alkalmazáshoz, amely nem azure-beli szerepköralapú hozzáférés-vezérléssel (Azure RBAC) van szabályozva. Ha továbbra is közreműködőket használ, migrálnia kell a LUIS-fiókját, és a LUIS szerzői erőforrásaival kezelheti a közreműködőket az Azure RBAC-vel.
Közreműködő
A közreműködő nem az alkalmazás tulajdonosa , de ugyanazokkal az engedélyekkel rendelkezik a szándékok, entitások, kimondott szövegek hozzáadásához, szerkesztéséhez és törléséhez. A közreműködők azure-beli szerepköralapú hozzáférés-vezérlést (Azure RBAC) biztosítanak egy LUIS-alkalmazáshoz.
Lásd még:
Leíró
A leíró az a kifejezés, amelyet korábban egy gépi tanulási funkcióhoz használtak.
Tartomány
A LUIS-környezetben a tartomány a tudás területe. A tartománya az Ön forgatókönyvéhez tartozik. A különböző tartományok konkrét nyelvet és terminológiát használnak, amelyeknek jelentésük van a tartomány kontextusában. Ha például egy alkalmazást hoz létre zene lejátszására, az alkalmazás a zenére vonatkozó kifejezésekkel és nyelvekkel rendelkezik – például "dal, zeneszám, album, dalszöveg, b-side, előadó". Példák a tartományokra, lásd az előre összeállított tartományokat.
Végpont
Végpont készítése
A LUIS szerzői végpontJÁNAK URL-címe az alkalmazás létrehozása, betanítása és közzététele. A végpont URL-címe tartalmazza a közzétett alkalmazás régióját vagy egyéni altartományát, valamint az alkalmazásazonosítót.
További információ az alkalmazás programozott készítéséről a fejlesztői referencia alapján
Előrejelzési végpont
A LUIS előrejelzési végpontJÁNAK URL-címe az, ahol a LUIS-lekérdezéseket a LUIS-alkalmazás létrehozása és közzététele után küldi el. A végpont URL-címe tartalmazza a közzétett alkalmazás régióját vagy egyéni altartományát, valamint az alkalmazásazonosítót. A végpontot az alkalmazás Azure-erőforrások lapján találja, vagy lekérheti a végpont URL-címét az Alkalmazásadatok lekérése API-ból.
Az előrejelzési végponthoz való hozzáférés a LUIS előrejelzési kulccsal engedélyezett.
Entitás
Az entitások kimondott szövegekben szereplő szavak, amelyek a szándék teljesítéséhez vagy azonosításához használt információkat írják le. Ha az entitás összetett, és azt szeretné, hogy a modell meghatározott részeket azonosítsa, a modellt alösszetevőkre bonthatja. Például azt szeretné, hogy a modell előre jelezzen egy címet, de az utca, a város, az állam és az irányítószám alhálózatait is. Az entitások a modellek funkcióiként is használhatók. A LUIS-alkalmazás válasza tartalmazza az előrejelzett szándékokat és az összes entitást.
Entitás-kinyerő
Az entitáselszívó néha csak elszívóként ismert, az entitások előrejelzésére használt gépi tanult modell típusa, amelyet a LUIS használ az entitások előrejelzésére.
Entitásséma
Az entitásséma az a struktúra, amelyet a gépileg tanult entitások alösszetevőkkel definiál. Az előrejelzési végpont visszaadja a sémában definiált összes kinyert entitást és alhálózatot.
Az entitás alhálózata
Az alentitás egy gépi tanulási entitás gyermek entitása.
Nem gépi tanulási entitás
Olyan entitás, amely szövegmegfeleltetés használatával nyer ki adatokat:
- Listaentitás
- Reguláriskifejezés-entitás
Listaentitás
A listaentitások a kapcsolódó szavak rögzített, zárt készletét jelölik a szinonimáikkal együtt. A listaentitások pontos egyezések, ellentétben a gépi tanult entitásokkal.
Az entitás előrejelezhető, ha a listaentitásban szerepel egy szó a listában. Ha például van egy "size" nevű listaentitása, és a listában a "kicsi, közepes, nagy" szó szerepel, akkor a méretentitást minden olyan kimondott szöveghez előrejelzi, ahol a "kicsi", a "közepes" vagy a "nagy" szavakat használja a környezettől függetlenül.
Reguláris kifejezés
A reguláris kifejezés entitása egy reguláris kifejezést jelöl. A reguláris kifejezési entitások pontos egyezések, ellentétben a gépi tanult entitásokkal.
Előre összeállított entitás
Az előre összeállított entitáshoz lásd az előre összeállított modell bejegyzését.
Funkciók
A gépi tanulásban a funkció olyan jellemző, amely segít a modellnek felismerni egy adott fogalmat. Ez egy tipp, amelyet a LUIS használhat, de nem egy kemény szabály.
Ezt a kifejezést gépi tanulási funkciónak is nevezik.
Ezek a tippek a címkékkel együtt az új adatok előrejelzésére szolgálnak. A LUIS támogatja a kifejezéslistákat, és más modelleket is használ funkciókként.
Kötelező funkció
A szükséges funkciók a LUIS-modellek kimenetének korlátozására szolgálnak. Ha egy entitáshoz tartozó szolgáltatás kötelezőként van megjelölve, a funkciónak jelen kell lennie a példában ahhoz, hogy az entitás előrejelezhető legyen, függetlenül attól, hogy a gépi tanult modell mit jelez előre.
Vegyünk egy példát, ahol egy előre összeállított szám funkcióval rendelkezik, amelyet kötelezőként jelölt meg egy menürendezési robot mennyiségi entitásán. Amikor a robot látja I want a bajillion large pizzas?
, a bajillion nem lesz előrejelzett mennyiség, függetlenül attól, hogy milyen környezetben jelenik meg. A Bajillion nem érvényes szám, és az előre összeállított szám entitás nem fogja előrejelezni.
Szándék
A szándék egy olyan feladatot vagy műveletet jelöl, amelyet a felhasználó végre szeretne hajtani. Ez egy olyan cél vagy cél, amely egy felhasználó bemenetében van kifejezve, például repülőjegy foglalása vagy számlafizetés. A LUIS-ban a kimondott szöveg egésze szándékként van besorolva, de a kimondott szöveg egyes részei entitásokként lesznek kinyerve.
Példák címkézésre
A címkézés vagy megjelölés egy pozitív vagy negatív példa modellel való társításának folyamata.
Szándékok címkézése
A LUIS-ban az alkalmazáson belüli szándékok kölcsönösen kizárják egymást. Ez azt jelenti, hogy amikor kimondott szöveget ad hozzá egy szándékhoz, az az adott szándék pozitív és negatív példája az összes többi szándéknak. A negatív példákat nem szabad összekeverni a "Nincs" szándékkal, amely az alkalmazás hatókörén kívül eső kimondott szövegeket jelöl.
Entitások címkézése
A LUIS-ban pozitív példaként megjelölhet egy szót vagy kifejezést egy szándék példamondatában egy entitással. A címkézés azt a szándékot jeleníti meg, amelyet előre kell jeleznie az adott kimondott szöveghez. A feliratos kimondott szövegek a szándék betanítására szolgálnak.
LUIS-alkalmazás
Tekintse meg az alkalmazás (alkalmazás) definícióját.
Modell
A (gépi tanult) modell olyan függvény, amely előrejelzést készít a bemeneti adatokról. A LUIS-ban a szándékosztályozókra és az entitáselszívókra általánosan "modellekként" hivatkozunk, és olyan modellek gyűjteményére hivatkozunk, amelyeket "alkalmazásként" tanítunk be, teszünk közzé és kérdezünk le együtt.
Normalizált érték
Értékeket adhat hozzá a listaentitásokhoz . Mindegyik érték rendelkezhet egy vagy több szinonimalistával. A válaszban csak a normalizált érték lesz visszaadva.
Túlillesztés
A túlillesztés akkor fordul elő, ha a modell az adott példákon van javítva, és nem képes általánosítani.
Tulajdonos
Minden alkalmazásnak van egy tulajdonosa, aki az alkalmazást létrehozó személy. A tulajdonos az Azure Portalon kezeli az alkalmazás engedélyeit.
Kifejezéslista
A kifejezéslista egy adott típusú gépi tanulási funkció, amely egy értékcsoportot (szavakat vagy kifejezéseket) tartalmaz, amelyek ugyanahhoz az osztályhoz tartoznak, és hasonlóan kell kezelni őket (például városok vagy termékek neve).
Előre összeállított modell
Az előre összeállított modell szándék, entitás vagy gyűjtemény mindkettőből, címkézett példákkal együtt. Ezek a gyakori előre összeállított modellek hozzáadhatók az alkalmazáshoz az alkalmazáshoz szükséges modellfejlesztési munka csökkentése érdekében.
Előre összeállított tartomány
Az előre összeállított tartomány egy luis-alkalmazás, amely egy adott tartományhoz van konfigurálva, például az otthoni automatizáláshoz (HomeAutomation) vagy az éttermi foglalásokhoz (RestaurantReservation). A szándékok, kimondott szövegek és entitások ehhez a tartományhoz vannak konfigurálva.
Előre összeállított entitás
Az előre összeállított entitások olyan entitások, amelyekhez a LUIS olyan gyakori típusú információkat biztosít, mint a szám, az URL-cím és az e-mail. Ezek nyilvános adatok alapján jönnek létre. Dönthet úgy, hogy egy előre összeállított entitást önálló entitásként vagy szolgáltatásként ad hozzá egy entitáshoz.
Előre összeállított szándék
Az előre összeállított szándék egy szándék, a LUIS általános információtípusokat biztosít, és saját címkézett példaszövegekkel rendelkezik.
előrejelzés
Az előrejelzés egy REST-kérés az Azure LUIS előrejelzési szolgáltatáshoz, amely új adatokat (felhasználói kimondott szöveget) vesz fel, és a betanított és közzétett alkalmazást alkalmazza az adatokra annak meghatározására, hogy milyen szándékok és entitások találhatók.
Előrejelzési kulcs
Az előrejelzési kulcs az Azure-ban létrehozott LUIS-szolgáltatáshoz társított kulcs, amely engedélyezi az előrejelzési végpont használatát.
Ez a kulcs nem a szerzői kulcs. Ha rendelkezik előrejelzési végpontkulccsal, az a szerzői kulcs helyett minden végpontkéréshez használható. Az aktuális előrejelzési kulcs a végpont URL-címében, az Azure-erőforrások lap alján látható a LUIS webhelyén. Ez az előfizetéskulcs-név/érték pár értéke.
Előrejelzési erőforrás
A LUIS-előrejelzési erőforrás egy kezelhető elem, amely az Azure-on keresztül érhető el. Az erőforrás az Azure-szolgáltatás kapcsolódó előrejelzéséhez való hozzáférés. Az erőforrás előrejelzéseket is tartalmaz.
Az előrejelzési erőforrás azure-beli LUIS
"típusa" van.
Előrejelzési pontszám
A pontszám egy 0 és 1 közötti szám, amely annak mértéke, hogy a rendszer mennyire biztos abban, hogy egy adott bemeneti kimondott szöveg megfelel egy adott szándéknak. Az 1-hez közelebbi pontszám azt jelenti, hogy a rendszer nagyon biztos a kimenetében, és a 0-hoz közelebbi pontszám azt jelenti, hogy a rendszer biztos abban, hogy a bemenet nem egyezik meg egy adott kimenettel. A középen lévő pontszámok azt jelentik, hogy a rendszer nagyon nem biztos abban, hogy hogyan döntsön.
Vegyünk például egy modellt, amely annak azonosítására szolgál, hogy egy ügyfélszöveg tartalmaz-e élelmiszer-rendelést. Lehet, hogy a pontszám 1 a "Szeretnék rendelni egy kávét" (a rendszer nagyon biztos abban, hogy ez egy megrendelés), és a pontszám 0 "a csapat nyerte a játékot tegnap este" (a rendszer nagyon biztos abban, hogy ez nem egy megrendelés). És lehet, hogy a pontszám 0,5 a "vegyünk egy kis teát" (nem biztos benne, hogy ez egy megrendelés, vagy sem).
Programozott kulcs
Közzététel
A közzététel azt jelenti, hogy a LUIS aktív verziója elérhetővé válik az előkészítési vagy az éles végponton.
Kvóta
A LUIS-kvóta az Azure-előfizetési szint korlátozása. A LUIS-kvótát a másodpercenkénti kérések (HTTP-állapot 429) és a havi összes kérelem (HTTP Status 403) is korlátozhatják.
Séma
A séma tartalmazza a szándékokat és az entitásokat, valamint az alhálózatokat. A séma eredetileg az idő előre megtervezése után lesz megtervezve. A séma nem tartalmaz alkalmazásbeállításokat, funkciókat vagy példaszövegeket.
Hangulatelemzés
A hangulatelemzés a Nyelvi szolgáltatás által biztosított kimondott szövegek pozitív vagy negatív értékeit biztosítja.
Beszéd betanítása
A beszédfelfedés javítja a Beszédszolgáltatásokban gyakran használt beszélt szavak és kifejezések felismerését. A beszédfelismerést engedélyező alkalmazások esetében minden LUIS-címkével ellátott példa a beszédfelismerés pontosságának javítására szolgál, ha ehhez az alkalmazáshoz létrehoz egy testreszabott beszédmodellt. Egy sakkjátékban például meg szeretné győződni arról, hogy amikor a felhasználó a "Lovag áthelyezése" szöveget mondja, akkor a rendszer nem a "Mozgás éjszakája" kifejezést értelmezi. A LUIS-alkalmazásnak példákat kell tartalmaznia, amelyekben a "knight" entitásként van megjelölve.
Kezdőkulcs
A LUIS használatának első indításakor használható ingyenes kulcs.
Szinonimák
A LUIS-lista entitásaiban létrehozhat egy normalizált értéket, amely mindegyike rendelkezhet szinonimák listájával. Ha például olyan méretentitást hoz létre, amely normalizált értékeket tartalmaz kis, közepes, nagy és extra-nagy értékekkel. Az alábbihoz hasonló szinonimákat hozhat létre az egyes értékekhez:
Nomalizált érték | Szinonimák |
---|---|
Small | a kicsi, 8 uncia |
Közepes | normál, 12 uncia |
Nagy | nagy, 16 uncia |
Xtra nagy | a legnagyobb, 24 uncia |
A modell az entitás normalizált értékét adja vissza, ha a bemenetben szinonimák jelennek meg.
Teszt
A LUIS-alkalmazások tesztelése modell-előrejelzések megtekintését jelenti.
Időzóza eltolása
A végpont tartalmazza a timezoneOffsetet. Ez az a percekben megadott szám, amelyet fel szeretne venni vagy el szeretne távolítani a datetimeV2 előre összeállított entitásból. Ha például a kimondott szöveg "mikor van most?", akkor a visszaadott datetimeV2 az ügyfélkérés aktuális ideje. Ha az ügyfélkérés olyan robottól vagy más alkalmazástól származik, amely nem ugyanaz, mint a robot felhasználója, akkor át kell adnia a robot és a felhasználó közötti eltolást.
Lásd: Az előre összeállított datetimeV2 entitás időzónájának módosítása.
Jogkivonat
A jogkivonat a LUIS által felismerhető legkisebb szövegegység. Ez némileg eltér a nyelvektől.
Az angol nyelv esetében a jogkivonat betűk és számok folytonos (szóközök és írásjelek nélküli) kiterjedése. A szóköz NEM jogkivonat.
Kifejezés | Jogkivonatok száma | Magyarázat |
---|---|---|
Dog |
0 | Egyetlen szó írásjelek és szóközök nélkül. |
RMT33W |
0 | Rekord lokátorszáma. Lehet, hogy számokkal és betűkkel rendelkezik, de nincs írásjele. |
425-555-5555 |
5 | Egy telefonszám. Minden írásjel egyetlen jogkivonat, tehát 425-555-5555 5 jogkivonat:425 - 555 - 5555 |
https://luis.ai |
7 | https : / / luis . ai |
Betanítás
A betanítás a LUIS tanításának folyamata az aktív verzió legutóbbi betanítása óta történt változásairól.
Betanítási adatok
A betanítási adatok a modell betanításához szükséges információk. Ez magában foglalja a sémát, a címkézett kimondott szövegeket, a funkciókat és az alkalmazásbeállításokat.
Betanítási hibák
A betanítási hibák olyan előrejelzések a betanítási adatokon, amelyek nem felelnek meg a címkéknek.
Beszédelem
A kimondott szöveg olyan felhasználói bevitel, amely egy beszélgetésben lévő mondat rövid szöveges képviselője. Ez egy természetes nyelvi kifejezés, mint a "könyv 2 jegyek Seattle jövő kedden". Példa kimondott szövegeket ad hozzá a modell betanításához, és a modell futásidőben előrejelzi az új kimondott szövegeket.
Verzió
A LUIS-verzió a LUIS-alkalmazásazonosítóhoz és a közzétett végponthoz társított LUIS-alkalmazás adott példánya. Minden LUIS-alkalmazásnak legalább egy verziója van.