Podpora jazyka Pro analýzu mínění a dolování názorů

V tomto článku se dozvíte, které jazyky jsou podporovány analýzou mínění a dolováním názorů. Cloudové rozhraní API i kontejnery Dockeru podporují stejné jazyky.

Podpora jazyka Sentiment Analysis

Celkový počet podporovaných kódů jazyků: 94

Jazyk Kód jazyka Notes
Afrikánština af
Albánština sq
Amharština am
Arabština ar
Arménština hy
Ásámština as
Ázerbájdžánština az
Baskičtina eu
Běloruský (nový) be
Bengálština bn
Bosenština bs
Breton (nový) br
Bulharština bg
Barmské my
Katalánština ca
Čínština (zjednodušená) zh-hans zh přijato také
Čínština (tradiční) zh-hant
Chorvatština hr
Čeština cs
Dánština da
Nizozemština nl
Angličtina en
Esperanto (nové) eo
Estonština et
Filipino fil
Finština fi
Francouzština fr
Galicijština gl
Gruzínština ka
Němčina de
Řečtina el
Gudžarátština gu
Hausa (nové) ha
Hebrejština he
Hindština hi
Maďarština hu
Indonéština id
Irština ga
Italština it
japonština ja
Javanese (nový) jv
Kannadština kn
Kazaština kk
Khmer km
Korejština ko
Kurština (Kurmanji) ku
Kyrgyzština ky
Laoskou lo
Latinka (nová) la
Lotyština lv
Litevština lt
Makedonština mk
Malgaština mg
Malajština ms
Malajalámština ml
Maráthština mr
Mongolština mn
Nepálština ne
Norština no
Udijština or
Oromo (nový) om
Pashto ps
Perština fa
Polština pl
Portugalština (Portugalsko) pt-PT pt přijato také
Portugalština (Brazílie) pt-BR
Paňdžábština pa
Rumunština ro
Ruština ru
Sanskrit (nový) sa
Skotská Gaelic (nová) gd
Srbština sr
Sindhi (nový) sd
Sinhala (nový) si
Slovenština sk
Slovinština sl
Somálské so
Španělština es
Sundanese (nový) su
Svahilština sw
Švédština sv
Tamilština ta
Telugština te
Thajština th
Turečtina tr
Ukrajinština uk
Urdština ur
Ujgurština ug
Uzbečtina uz
Vietnamština vi
Velština cy
Západní Frisian (nový) fy
Xhosa (nový) xh
Yiddish (nový) yi

Podpora jazyka dolování názorů

Celkový počet podporovaných kódů jazyků: 94

Jazyk Kód jazyka Notes
Afrikaans (nový) af
Albánská (nová) sq
Amharic (nový) am
Arabština ar
Arménská (nová) hy
Assamese (nový) as
Ázerbájdžánština (nové) az
Baskičtina (nová) eu
Běloruský (nový) be
Bengálština bn
Bosenština (nový) bs
Breton (nový) br
Bulharština (nový) bg
Burmština (nový) my
Katalánština (nová) ca
Čínština (zjednodušená) zh-hans zh přijato také
Čínština (tradiční) (nová) zh-hant
Chorvatština (nové) hr
Čeština (nová) cs
Dánština da
Nizozemština nl
Angličtina en
Esperanto (nové) eo
Estonština (nové) et
Filipínština (nové) fil
Finština fi
Francouzština fr
Galicijština (nový) gl
Georgian (new) ka
Němčina de
Řečtina el
Gujarati (nové) gu
Hausa (nové) ha
Hebrejština (nová) he
Hindština hi
Maďarština hu
Indonéština id
Irská (nová) ga
Italština it
japonština ja
Javanese (nový) jv
Kannada (nový) kn
Kazaština (nová) kk
Khmer (nový) km
Korejština ko
Kurština (Kurmanji) ku
Kyrgyz (nový) ky
Lao (nový) lo
Latinka (nová) la
Lotyština (nové) lv
Litevština (nové) lt
Makedonština (nový) mk
Malagasy (nové) mg
Malajá (nová) ms
Malajálam (nový) ml
Maráthština mr
Mongolština (nové) mn
Nepálština (nová) ne
Norština no
Odia (nový) or
Oromo (nový) om
Pashto (nový) ps
Perština (nová) fa
Polština pl
Portugalština (Portugalsko) pt-PT pt přijato také
Portugalština (Brazílie) pt-BR
Punjabi (nový) pa
Rumunština (nový) ro
Ruština ru
Sanskrit (nový) sa
Skotská Gaelic (nová) gd
Srbština (nový) sr
Sindhi (nový) sd
Sinhala (nový) si
Slovenština (nový) sk
Slovinština (nové) sl
Somali (nové) so
Španělština es
Sundanese (nový) su
Swahili (nový) sw
Švédština sv
Tamilština ta
Telugština te
Thajština (nové) th
Turečtina tr
Ukrajinština (nový) uk
Urdu (nový) ur
Uyghur (nový) ug
Uzbečtina (nový) uz
Vietnamština (nové) vi
Welsh (nový) cy
Západní Frisian (nový) fy
Xhosa (nový) xh
Yiddish (nový) yi

Vícejazyčná možnost (pouze analýza vlastního mínění)

Pomocí analýzy vlastního mínění můžete vytrénovat model v jednom jazyce a použít ke klasifikaci dokumentů v jiném jazyce. Tato funkce je užitečná, protože pomáhá ušetřit čas a úsilí. Místo vytváření samostatných projektů pro každý jazyk můžete zpracovávat vícejazyčnou datovou sadu v jednom projektu. Vaše datová sada nemusí být úplně ve stejném jazyce, ale při vytváření nebo pozdějším vytváření projektu byste měli povolit vícejazyčnou možnost pro váš projekt. Pokud si během procesu vyhodnocení všimnete, že váš model funguje špatně v určitých jazycích, zvažte přidání dalších dat v těchto jazycích do trénovací sady.

Projekt můžete vytrénovat zcela s anglickými dokumenty a dotazovat se na něj v: francouzštině, němčině, mandarínštině, japonštině, korejštině a dalších. Analýza vlastního mínění usnadňuje škálování projektů do více jazyků pomocí vícejazyčné technologie pro trénování modelů.

Kdykoli zjistíte, že konkrétní jazyk nefunguje ani jiné jazyky, můžete do projektu přidat další dokumenty pro daný jazyk.

Neočekává se, že byste přidali stejný počet dokumentů pro každý jazyk. Většinu projektu byste měli sestavit v jednom jazyce a přidat jenom několik dokumentů v jazycích, které sledujete, nefungují dobře. Pokud vytvoříte projekt, který je primárně v angličtině, a začnete ho testovat ve francouzštině, němčině a španělštině, můžete vidět, že němčina nefunguje stejně jako ostatní dva jazyky. V takovém případě zvažte přidání 5 % původních anglických dokumentů v němčině, vytrénování nového modelu a testování v němčině znovu. Měli byste vidět lepší výsledky pro německé dotazy. Čím více dokumentů s popiskem přidáte, tím pravděpodobnější bude, že výsledky budou lepší.

Když přidáváte data v jiném jazyce, neměli byste očekávat, že budou mít negativní vliv na jiné jazyky.

Další kroky