Nyelvi támogatás a beszélgetési nyelvfelismeréshez
Ebből a cikkből megismerheti a CLU szolgáltatás által jelenleg támogatott nyelveket.
Többnyelvű beállítás
Tipp
A modell betanításáról a többnyelvű projektekhez használandó betanítási móddal kapcsolatos információkért lásd: Modell betanítása.
A beszélgetési nyelv megértésével betanított egy modellt egy nyelven, és a használatával előrejelezheti a szándékokat és entitásokat a kimondott szövegekből egy másik nyelven. Ez a funkció azért hatékony, mert időt és energiát takarít meg. Ahelyett, hogy minden nyelvhez külön projekteket hoz létre, egy projektben többnyelvű adatkészletet is kezelhet. Az adathalmaznak nem kell teljesen azonos nyelven lennie, de a projekt beállításainak létrehozásakor vagy későbbi létrehozásakor engedélyeznie kell a többnyelvű beállítást a projekthez. Ha azt tapasztalja, hogy a modell gyenge teljesítményt mutat bizonyos nyelveken a kiértékelési folyamat során, fontolja meg további adatok hozzáadását ezeken a nyelveken a betanítási készlethez.
A projektet teljes egészében angol nyelvű beszédelemekkel taníthatja be, és lekérdezheti a következő helyen: francia, német, mandarin, japán, koreai és egyéb. A társalgási nyelv megértése megkönnyíti a projektek több nyelvre való skálázását többnyelvű technológia használatával a modellek betanítása érdekében.
Ha azt állapítja meg, hogy egy adott nyelv nem teljesít, valamint más nyelveket is, kimondott szövegeket adhat hozzá a projekthez. A Language Studióban a kimondott szövegek címkelapján kiválaszthatja a hozzáadni kívánt kimondott szöveg nyelvét. Amikor példákat mutat be erre a nyelvre a modellben, az az adott nyelv szintaxisának nagyobb részét mutatja be, és megtanulja jobban előrejelezni.
Nem várható, hogy minden nyelvhez ugyanannyi beszédelem legyen hozzáadva. A projekt nagy részét egy nyelven kell felépítenie, és csak néhány kimondott szöveget kell hozzáadnia azokhoz a nyelvekhez, amelyek nem teljesítenek jól. Ha olyan projektet hoz létre, amely elsősorban angolul van, és francia, német és spanyol nyelven kezdi el tesztelni, megfigyelheti, hogy a német nem teljesít olyan jól, mint a másik két nyelv. Ebben az esetben fontolja meg az eredeti angol példák 5%-ának német nyelvű hozzáadását, egy új modell betanítása és ismét német nyelven történő tesztelés. Jobb eredményeket kell látnia a német lekérdezésekhez. Minél több kimondott szöveget ad hozzá, annál valószínűbb, hogy az eredmények jobbak lesznek.
Ha más nyelven ad hozzá adatokat, nem várható, hogy az negatív hatással lesz más nyelvekre.
Több nyelven listázni és előre összeállított összetevőket
A több nyelvet engedélyező projektek lehetővé teszik a szinonimák nyelvenkénti megadását minden listakulcshoz. Attól függően, hogy milyen nyelven kérdezi le a projektet, csak az adott nyelv szinonimáival fog egyezéseket kapni a listaösszetevőhöz. Amikor lekérdezi a projektet, megadhatja a nyelvet a kérelem törzsében:
"query": "{query}"
"language": "{language code}"
Ha nem ad meg nyelvet, az visszaáll a projekt alapértelmezett nyelvére.
Az előre összeállított összetevők hasonlóak, ahol előrejelzéseket kell kapniuk az előre összeállított összetevőkről, amelyek bizonyos nyelveken érhetők el. A kérés nyelve ismét meghatározza, hogy mely összetevőket próbálják előrejelezni.
A beszélgetési nyelvfelismerés által támogatott nyelvek
A társalgási nyelv megértése a következő nyelveken támogatja a kimondott szövegeket:
Nyelv | Nyelvkód |
---|---|
Búr | af |
Amhara | am |
Arab | ar |
Asszámi | as |
Azerbajdzsáni | az |
Belorusz | be |
Bolgár | bg |
Bengáli | bn |
Breton | br |
bosnyák | bs |
Katalán | ca |
Cseh | cs |
Walesi | cy |
Dán | da |
Német | de |
Görög | el |
Angol (US) | en-us |
Angol (Egyesült Királyság) | en-gb |
Eszperantó | eo |
Spanyol | es |
Észt | et |
Baszk | eu |
Perzsa | fa |
Finn | fi |
Francia | fr |
Nyugati fríz | fy |
Ír | ga |
Skót gaelic | gd |
Gallego | gl |
Gudzsaráti | gu |
Hausa | ha |
héber | he |
Hindi | hi |
Horvát | hr |
Magyar | hu |
Örmény | hy |
Indonéz | id |
Olasz | it |
Japán | ja |
Jávai | jv |
Grúz | ka |
Kazak | kk |
Khmer | km |
Kannada | kn |
Koreai | ko |
Kurd (Kurmanji) | ku |
Kirgiz | ky |
Latin | la |
Lao | lo |
Litván | lt |
Lett | lv |
Málgas | mg |
Macedón | mk |
Malajálam | ml |
Mongol | mn |
Marathi | mr |
Maláj | ms |
Burmai | my |
Nepáli | ne |
Holland | nl |
Norvég (Bokmal) | nb |
Odia | or |
Pandzsábi | pa |
Lengyel | pl |
Pastu | ps |
Portugál (Brazília) | pt-br |
Portugál (Portugália) | pt-pt |
Román | ro |
Orosz | ru |
Szanszkrit | sa |
Szindi | sd |
Singhalese | si |
Szlovák | sk |
Szlovén | sl |
Szomáli | so |
Albán | sq |
szerb | sr |
Sundanese | su |
Svéd | sv |
Szuahéli | sw |
Tamil | ta |
Telugu | te |
Thai | th |
Filipino | tl |
Török | tr |
Ujgur | ug |
Ukrán | uk |
urdu | ur |
Üzbég | uz |
Vietnámi | vi |
Xhosza | xh |
Jiddis | yi |
Kínai (egyszerűsített) | zh-hans |
Kínai (hagyományos) | zh-hant |
Zulu | zu |