Nyelvi támogatás a társalgási nyelv megértéséhez
Ebből a cikkből megismerheti a CLU szolgáltatás által jelenleg támogatott nyelveket.
Többnyelvű beállítás
Tipp.
A modell betanításáról további információt a többnyelvű projektekhez használandó betanítási módról talál.
A társalgási nyelv megértésével egy modellt taníthat be egy nyelven, és egy másik nyelven lévő kimondott szövegekből származó szándékok és entitások előrejelzésére használható. Ez a funkció hatékony, mert segít időt és energiát megtakarítani. Ahelyett, hogy minden nyelvhez külön projekteket hoz létre, többnyelvű adatkészletet is kezelhet egy projektben. Az adathalmaznak nem kell teljesen azonos nyelven lennie, de a projekt beállításainak létrehozásakor vagy későbbi létrehozásakor engedélyeznie kell a többnyelvű beállítást a projekthez. Ha azt tapasztalja, hogy a modell bizonyos nyelveken rosszul teljesít a kiértékelési folyamat során, fontolja meg, hogy ezeken a nyelveken további adatokat adjon hozzá a betanítási csoporthoz.
A projektet teljes egészében angol nyelvű kimondott szövegekkel taníthatja be, és lekérdezheti a következőkkel: francia, német, mandarin, japán, koreai és más. A beszélgetési nyelv megértése megkönnyíti a projektek több nyelvre való skálázását többnyelvű technológiával a modellek betanítása érdekében.
Ha azt állapítja meg, hogy egy adott nyelv nem teljesít, valamint más nyelvek, a projektben kimondott szövegeket adhat hozzá az adott nyelvhez. A Language Studio kimondott szövegek címkéi lapján kiválaszthatja a hozzáadni kívánt kimondott szöveg nyelvét. Amikor példákat mutat be erre a nyelvre a modellben, az a nyelv szintaxisának nagyobb részét mutatja be, és megtanulja jobban előrejelezni.
Nem várható, hogy minden nyelvhez ugyanannyi kimondott szöveget adjon hozzá. A projekt többségét egy nyelven kell létrehoznia, és csak néhány kimondott szöveget kell hozzáadnia a megfigyelt nyelvekhez, amelyek nem teljesítenek jól. Ha olyan projektet hoz létre, amely elsősorban angolul, és franciául, németül és spanyolul kezdi tesztelni, megfigyelheti, hogy a német nem teljesít olyan jól, mint a másik két nyelv. Ebben az esetben fontolja meg, hogy az eredeti angol példák 5%-át német nyelven adja hozzá, betanítsa az új modellt, és tesztelje újra német nyelven. Jobb eredményeket kell látnia a német lekérdezésekhez. Minél több kimondott szöveget ad hozzá, annál valószínűbb, hogy az eredmények jobbak lesznek.
Ha más nyelven ad hozzá adatokat, nem szabad azt várnia, hogy az negatívan befolyásolja a többi nyelvet.
Összetevők listázása és előre összeállítottak több nyelven
A többnyelvű projektek lehetővé teszik, hogy nyelvenként szinonimákat adjon meg minden listakulcshoz. Attól függően, hogy milyen nyelven kérdezi le a projektet, csak az adott nyelv szinonimáival fog egyezéseket kapni a listaösszetevőhöz. A projekt lekérdezésekor megadhatja a kérés törzsének nyelvét:
"query": "{query}"
"language": "{language code}"
Ha nem ad meg nyelvet, az vissza fog esni a projekt alapértelmezett nyelvére.
Az előre összeállított összetevők hasonlóak, ahol előre összeállított összetevőkre vonatkozó előrejelzéseket kell kapnia, amelyek bizonyos nyelveken érhetők el. A kérés nyelve ismét meghatározza, hogy mely összetevőket próbálják előrejelezni.
A beszélgetési nyelv megértése által támogatott nyelvek
A társalgási nyelv megértése a következő nyelveken támogatja a kimondott szövegeket:
Nyelv | Nyelvkód |
---|---|
Búr | af |
Amhara | am |
Arab | ar |
asszámi | as |
Azerbajdzsáni | az |
Belorusz | be |
Bolgár | bg |
Bengáli | bn |
Breton | br |
bosnyák | bs |
Katalán | ca |
Cseh | cs |
Walesi | cy |
Dán | da |
Német | de |
Görög | el |
Angol (Egyesült Államok) | en-us |
Angol (Egyesült Királyság) | en-gb |
Eszperantó | eo |
Spanyol | es |
Észt | et |
Baszk | eu |
Perzsa | fa |
finn | fi |
Francia | fr |
Nyugati fríz | fy |
Ír | ga |
Skót gael | gd |
Gallego | gl |
Gudzsaráti | gu |
Hausza | ha |
héber | he |
Hindi | hi |
Horvát | hr |
Magyar | hu |
Örmény | hy |
Indonéz | id |
Olasz | it |
Japán | ja |
Jávai | jv |
Grúz | ka |
Kazak | kk |
Khmer | km |
Kannada | kn |
Koreai | ko |
Kurd (Kurmanji) | ku |
Kirgiz | ky |
Latin | la |
Lao | lo |
Litván | lt |
Lett | lv |
Madagaszkári | mg |
Macedón | mk |
Malajálam | ml |
Mongol | mn |
Marathi | mr |
Maláj | ms |
Burmai | my |
Nepáli | ne |
Holland | nl |
Norvég (Bokmal) | nb |
Odia | or |
Pandzsábi | pa |
Lengyel | pl |
Pastu | ps |
Portugál (Brazília) | pt-br |
Portugál (Portugália) | pt-pt |
Román | ro |
Orosz | ru |
Szanszkrit | sa |
Szindhi | sd |
Sinhala | si |
Szlovák | sk |
Szlovén | sl |
Szomália | so |
Albán | sq |
szerb | sr |
Sundanese | su |
Svéd | sv |
Szuahéli | sw |
Tamil | ta |
Telugu | te |
Thai | th |
Filipino | tl |
Török | tr |
Ujgur | ug |
Ukrán | uk |
urdu | ur |
Üzbég | uz |
Vietnámi | vi |
Xhosza | xh |
Jiddis | yi |
Kínai (egyszerűsített) | zh-hans |
Kínai (hagyományos) | zh-hant |
Zulu | zu |