Nyelvi támogatás a beszélgetési nyelvfelismeréshez

Ebből a cikkből megismerheti a CLU szolgáltatás által jelenleg támogatott nyelveket.

Többnyelvű beállítás

Tipp

A modell betanításáról a többnyelvű projektekhez használandó betanítási móddal kapcsolatos információkért lásd: Modell betanítása.

A beszélgetési nyelv megértésével betanított egy modellt egy nyelven, és a használatával előrejelezheti a szándékokat és entitásokat a kimondott szövegekből egy másik nyelven. Ez a funkció azért hatékony, mert időt és energiát takarít meg. Ahelyett, hogy minden nyelvhez külön projekteket hoz létre, egy projektben többnyelvű adatkészletet is kezelhet. Az adathalmaznak nem kell teljesen azonos nyelven lennie, de a projekt beállításainak létrehozásakor vagy későbbi létrehozásakor engedélyeznie kell a többnyelvű beállítást a projekthez. Ha azt tapasztalja, hogy a modell gyenge teljesítményt mutat bizonyos nyelveken a kiértékelési folyamat során, fontolja meg további adatok hozzáadását ezeken a nyelveken a betanítási készlethez.

A projektet teljes egészében angol nyelvű beszédelemekkel taníthatja be, és lekérdezheti a következő helyen: francia, német, mandarin, japán, koreai és egyéb. A társalgási nyelv megértése megkönnyíti a projektek több nyelvre való skálázását többnyelvű technológia használatával a modellek betanítása érdekében.

Ha azt állapítja meg, hogy egy adott nyelv nem teljesít, valamint más nyelveket is, kimondott szövegeket adhat hozzá a projekthez. A Language Studióban a kimondott szövegek címkelapján kiválaszthatja a hozzáadni kívánt kimondott szöveg nyelvét. Amikor példákat mutat be erre a nyelvre a modellben, az az adott nyelv szintaxisának nagyobb részét mutatja be, és megtanulja jobban előrejelezni.

Nem várható, hogy minden nyelvhez ugyanannyi beszédelem legyen hozzáadva. A projekt nagy részét egy nyelven kell felépítenie, és csak néhány kimondott szöveget kell hozzáadnia azokhoz a nyelvekhez, amelyek nem teljesítenek jól. Ha olyan projektet hoz létre, amely elsősorban angolul van, és francia, német és spanyol nyelven kezdi el tesztelni, megfigyelheti, hogy a német nem teljesít olyan jól, mint a másik két nyelv. Ebben az esetben fontolja meg az eredeti angol példák 5%-ának német nyelvű hozzáadását, egy új modell betanítása és ismét német nyelven történő tesztelés. Jobb eredményeket kell látnia a német lekérdezésekhez. Minél több kimondott szöveget ad hozzá, annál valószínűbb, hogy az eredmények jobbak lesznek.

Ha más nyelven ad hozzá adatokat, nem várható, hogy az negatív hatással lesz más nyelvekre.

Több nyelven listázni és előre összeállított összetevőket

A több nyelvet engedélyező projektek lehetővé teszik a szinonimák nyelvenkénti megadását minden listakulcshoz. Attól függően, hogy milyen nyelven kérdezi le a projektet, csak az adott nyelv szinonimáival fog egyezéseket kapni a listaösszetevőhöz. Amikor lekérdezi a projektet, megadhatja a nyelvet a kérelem törzsében:

"query": "{query}"
"language": "{language code}"

Ha nem ad meg nyelvet, az visszaáll a projekt alapértelmezett nyelvére.

Az előre összeállított összetevők hasonlóak, ahol előrejelzéseket kell kapniuk az előre összeállított összetevőkről, amelyek bizonyos nyelveken érhetők el. A kérés nyelve ismét meghatározza, hogy mely összetevőket próbálják előrejelezni.

A beszélgetési nyelvfelismerés által támogatott nyelvek

A társalgási nyelv megértése a következő nyelveken támogatja a kimondott szövegeket:

Nyelv Nyelvkód
Búr af
Amhara am
Arab ar
Asszámi as
Azerbajdzsáni az
Belorusz be
Bolgár bg
Bengáli bn
Breton br
bosnyák bs
Katalán ca
Cseh cs
Walesi cy
Dán da
Német de
Görög el
Angol (US) en-us
Angol (Egyesült Királyság) en-gb
Eszperantó eo
Spanyol es
Észt et
Baszk eu
Perzsa fa
Finn fi
Francia fr
Nyugati fríz fy
Ír ga
Skót gaelic gd
Gallego gl
Gudzsaráti gu
Hausa ha
héber he
Hindi hi
Horvát hr
Magyar hu
Örmény hy
Indonéz id
Olasz it
Japán ja
Jávai jv
Grúz ka
Kazak kk
Khmer km
Kannada kn
Koreai ko
Kurd (Kurmanji) ku
Kirgiz ky
Latin la
Lao lo
Litván lt
Lett lv
Málgas mg
Macedón mk
Malajálam ml
Mongol mn
Marathi mr
Maláj ms
Burmai my
Nepáli ne
Holland nl
Norvég (Bokmal) nb
Odia or
Pandzsábi pa
Lengyel pl
Pastu ps
Portugál (Brazília) pt-br
Portugál (Portugália) pt-pt
Román ro
Orosz ru
Szanszkrit sa
Szindi sd
Singhalese si
Szlovák sk
Szlovén sl
Szomáli so
Albán sq
szerb sr
Sundanese su
Svéd sv
Szuahéli sw
Tamil ta
Telugu te
Thai th
Filipino tl
Török tr
Ujgur ug
Ukrán uk
urdu ur
Üzbég uz
Vietnámi vi
Xhosza xh
Jiddis yi
Kínai (egyszerűsített) zh-hans
Kínai (hagyományos) zh-hant
Zulu zu

Következő lépések