Podpora jazyka pro porozumění konverzačnímu jazyku
V tomto článku se dozvíte o jazycích aktuálně podporovaných funkcí CLU.
Vícejazyčná možnost
Tip
Informace o tom, který režim trénování byste měli použít pro vícejazyčné projekty, najdete v tématu Postup trénování modelu .
Díky porozumění konverzačnímu jazyku můžete vytrénovat model v jednom jazyce a použít k předpovídání záměrů a entit z promluv v jiném jazyce. Tato funkce je výkonná, protože pomáhá šetřit čas a úsilí. Místo vytváření samostatných projektů pro každý jazyk můžete zpracovávat vícejazyčnou datovou sadu v jednom projektu. Vaše datová sada nemusí být úplně ve stejném jazyce, ale při vytváření nebo později v nastavení projektu byste měli povolit možnost více jazyků pro váš projekt. Pokud si během procesu vyhodnocení všimnete, že váš model v určitých jazycích nefunguje správně, zvažte přidání dalších dat v těchto jazycích do trénovací sady.
Projekt můžete vytrénovat výhradně pomocí anglických promluv a dotazovat se na něj ve francouzštině, němčině, mandarínštině, japonštině, korejštině a dalších. Porozumění konverzačnímu jazyku usnadňuje škálování projektů na více jazyků pomocí vícejazyčné technologie pro trénování modelů.
Kdykoli zjistíte, že konkrétní jazyk nefunguje stejně jako jiné jazyky, můžete do projektu přidat promluvy pro tento jazyk. Na stránce značek promluv v nástroji Language Studio můžete vybrat jazyk přidávané promluvy. Když do modelu představíte příklady pro tento jazyk, seznámí se s větší syntaxí tohoto jazyka a naučí se ho lépe predikovat.
Neočekává se, že přidáte stejný počet promluv pro každý jazyk. Většinu projektu byste měli sestavit v jednom jazyce a přidat jenom několik výroků v jazycích, u kterých zjistíte, že nefungují dobře. Pokud vytvoříte projekt, který je primárně v angličtině, a začnete ho testovat ve francouzštině, němčině a španělštině, můžete si všimnout, že němčina nefunguje stejně dobře jako ostatní dva jazyky. V takovém případě zvažte přidání 5 % původních anglických příkladů v němčině, natrénování nového modelu a opětovné testování v němčině. U německých dotazů byste měli vidět lepší výsledky. Čím více promluv přidáte, tím pravděpodobnější je, že výsledky budou lepší.
Když přidáte data v jiném jazyce, neměli byste očekávat, že to bude mít negativní vliv na jiné jazyky.
Seznam a předem připravené komponenty v několika jazycích
Projekty s více povolenými jazyky vám umožní zadat synonyma pro každý jazyk pro každý klíč seznamu. V závislosti na jazyce, pomocí kterého se na projekt dotazujete, získáte pouze shody pro komponentu seznamu se synonymy tohoto jazyka. Při dotazování projektu můžete v textu požadavku zadat jazyk:
"query": "{query}"
"language": "{language code}"
Pokud jazyk nezadáte, vrátí se zpět do výchozího jazyka projektu.
Předem připravené komponenty jsou podobné a měli byste očekávat, že budete dostávat předpovědi pro předem připravené komponenty, které jsou k dispozici v konkrétních jazycích. Jazyk požadavku znovu určuje, které komponenty se pokouší předpovědět.
Jazyky podporované porozuměním konverzačnímu jazyku
Porozumění konverzačnímu jazyku podporuje promluvy v následujících jazycích:
Jazyk | Kód jazyka |
---|---|
Afrikánština | af |
Amharština | am |
Arabština | ar |
Ásámštinu | as |
Ázerbájdžánština | az |
Běloruština | be |
Bulharština | bg |
Bengálština | bn |
Breton | br |
Bosenština | bs |
Katalánština | ca |
Čeština | cs |
Velština | cy |
Dánština | da |
Němčina | de |
Řečtina | el |
Angličtina (USA) | en-us |
Angličtina (Uk) | en-gb |
Esperanto | eo |
Španělština | es |
Estonština | et |
Baskičtina | eu |
Perština | fa |
Finština | fi |
Francouzština | fr |
Západní Fríština | fy |
Irština | ga |
Skotská gaelová | gd |
Galicijština | gl |
Gudžarátština | gu |
Hausa | ha |
Hebrejština | he |
Hindština | hi |
Chorvatština | hr |
Maďarština | hu |
Arménština | hy |
Indonéština | id |
Italština | it |
Japonština | ja |
Javánština | jv |
Gruzínština | ka |
Kazaština | kk |
Khmer | km |
Kannadština | kn |
Korejština | ko |
Kurdština (Kurmandží) | ku |
Kyrgyzština | ky |
Latinské | la |
Laoskou | lo |
Litevština | lt |
Lotyština | lv |
Malagasy | mg |
Makedonština | mk |
Malajalámština | ml |
Mongolština | mn |
Maráthština | mr |
Malajština | ms |
Barmské | my |
Nepálština | ne |
Nizozemština | nl |
Norština (Bokmal) | nb |
Odia | or |
Paňdžábština | pa |
Polština | pl |
Pašto | ps |
Portugalština (Brazílie) | pt-br |
portugalština (Portugalsko) | pt-pt |
Rumunština | ro |
Ruština | ru |
Sanskrt | sa |
Sindhština | sd |
Sinhala | si |
Slovenština | sk |
Slovinština | sl |
Somálské | so |
Albánština | sq |
Srbština | sr |
Sundánština | su |
Švédština | sv |
Svahilština | sw |
Tamilština | ta |
Telugština | te |
Thajština | th |
Filipino | tl |
Turečtina | tr |
Ujgurské | ug |
Ukrajinština | uk |
Urdština | ur |
Uzbečtina | uz |
Vietnamština | vi |
Xhoština | xh |
Jidiš | yi |
Čínština (zjednodušená) | zh-hans |
Čínština (tradiční) | zh-hant |
Zulština | zu |