Obsługa języka analizy tonacji i wyszukiwania opinii

Skorzystaj z tego artykułu, aby dowiedzieć się, które języki są obsługiwane przez analizę tonacji i wyszukiwania opinii. Zarówno oparty na chmurze interfejs API, jak i kontenery platformy Docker obsługują te same języki.

Obsługa języka analizy tonacji

Łączna liczba obsługiwanych kodów języków: 94

Język Kod języka Uwagi
Afrikaans af
Albański sq
Amharski am
Arabski ar
Armeński hy
Assamski as
Azerski az
Baskijski eu
Białorusin (nowy) be
Bengalski bn
Bośniacki bs
Breton (nowy) br
bułgarski bg
Birmański my
kataloński ca
Chiński (uproszczony) zh-hans zh zaakceptowane również
chiński (tradycyjny) zh-hant
chorwacki hr
Czeski cs
Duński da
niderlandzki nl
angielski en
Starsza (nowa) eo
estoński et
Filipino fil
Fiński fi
Francuski fr
Galicyjski gl
Gruziński ka
Niemiecki de
Grecki el
Gudżarati gu
Hausa (nowy) ha
Hebrajski he
hindi hi
Węgierski hu
indonezyjski id
Irlandzki ga
Włoski it
japoński ja
Javanese (nowy) jv
Kannada kn
Kazachski kk
Khmer km
Koreański ko
Kurdyjski (Kurmjski) ku
Kirgiski ky
Lao lo
Łaciński (nowy) la
łotewski lv
litewski lt
Macedoński mk
Madagaskaru mg
malajski ms
Malayalam ml
Marathi mr
Mongolski mn
Nepalski ne
norweski no
Odia or
Oromo (nowy) om
Paszto ps
Perski fa
Polski pl
portugalski (Portugalia) pt-PT pt zaakceptowane również
portugalski (Brazylia) pt-BR
Pendżabski pa
rumuński ro
Rosyjski ru
Sanskrit (nowy) sa
Szkocki Gaelic (nowy) gd
Serbski sr
Sindhi (nowy) sd
Sinhala (nowy) si
słowacki sk
słoweński sl
Somalii so
Hiszpański es
Sundanese (nowy) su
Suahili sw
Szwedzki sv
Tamilski ta
Telugu te
tajski th
Turecki tr
ukraiński uk
Urdu ur
Ujgurski ug
Uzbecki uz
Wietnamski vi
Walijski cy
Western Frisian (nowy) fy
Xhosa (nowy) xh
Yiddish (nowy) yi

Obsługa języka wyszukiwania opinii

Łączna liczba obsługiwanych kodów języków: 94

Język Kod języka Uwagi
Afrikaans (nowy) af
Albański (nowy) sq
Amharic (nowy) am
Arabski ar
Ormiański (nowy) hy
Assamese (nowy) as
Azerbejdżan (nowy) az
Baskijski (nowy) eu
Białorusin (nowy) be
Bengalski bn
Bośniacki (nowy) bs
Breton (nowy) br
Bułgarski (nowy) bg
Birmański (nowy) my
Kataloński (nowy) ca
Chiński (uproszczony) zh-hans zh zaakceptowane również
Chiński (tradycyjny) (nowy) zh-hant
Chorwacki (nowy) hr
Czeski (nowy) cs
Duński da
niderlandzki nl
angielski en
Starsza (nowa) eo
Estoński (nowy) et
Filipino (nowy) fil
Fiński fi
Francuski fr
Galicjan (nowy) gl
Gruziński (nowy) ka
Niemiecki de
Grecki el
Gujarati (nowy) gu
Hausa (nowy) ha
Hebrajski (nowy) he
hindi hi
Węgierski hu
indonezyjski id
Irlandzki (nowy) ga
Włoski it
japoński ja
Javanese (nowy) jv
Kannada (nowy) kn
Kazachski (nowy) kk
Khmer (nowy) km
Koreański ko
Kurdyjski (Kurmjski) ku
Kyrgyz (nowy) ky
Lao (nowy) lo
Łaciński (nowy) la
Łotewski (nowy) lv
Litewski (nowy) lt
Macedoński (nowy) mk
Malagasy (nowy) mg
Malajski (nowy) ms
Malayalam (nowy) ml
Marathi mr
Mongolski (nowy) mn
Nepalski (nowy) ne
norweski no
Odia (nowy) or
Oromo (nowy) om
Pashto (nowy) ps
Perski (nowy) fa
Polski pl
portugalski (Portugalia) pt-PT pt zaakceptowane również
portugalski (Brazylia) pt-BR
Punjabi (nowy) pa
Rumuński (nowy) ro
Rosyjski ru
Sanskrit (nowy) sa
Szkocki Gaelic (nowy) gd
Serbski (nowy) sr
Sindhi (nowy) sd
Sinhala (nowy) si
Słowacki (nowy) sk
Słoweniec (nowy) sl
Somalia (nowa) so
Hiszpański es
Sundanese (nowy) su
Swahili (nowy) sw
Szwedzki sv
Tamilski ta
Telugu te
Tajski (nowy) th
Turecki tr
Ukraiński (nowy) uk
Urdu (nowy) ur
Uygur (nowy) ug
Uzbek (nowy) uz
Wietnamski (nowy) vi
Walijski (nowy) cy
Western Frisian (nowy) fy
Xhosa (nowy) xh
Yiddish (nowy) yi

Opcja wielojęzyczna (tylko analiza tonacji niestandardowej)

Dzięki analizie tonacji niestandardowej można wytrenować model w jednym języku i użyć go do klasyfikowania dokumentów w innym języku. Ta funkcja jest przydatna, ponieważ pomaga zaoszczędzić czas i nakład pracy. Zamiast kompilować oddzielne projekty dla każdego języka, można obsługiwać wielojęzyczny zestaw danych w jednym projekcie. Zestaw danych nie musi być całkowicie w tym samym języku, ale należy włączyć opcję wielojęzyczną dla projektu podczas tworzenia lub nowszych ustawień projektu. Jeśli podczas procesu oceny zauważysz, że model działa słabo w niektórych językach, rozważ dodanie większej ilości danych w tych językach do zestawu szkoleniowego.

Możesz wytrenować swój projekt w całości przy użyciu dokumentów angielskich i wykonywać na nim zapytania: francuski, niemiecki, mandaryński, japoński, koreański i inne. Niestandardowa analiza tonacji ułatwia skalowanie projektów do wielu języków przy użyciu technologii wielojęzycznej do trenowania modeli.

Za każdym razem, gdy określisz, że dany język nie działa, a także inne języki, możesz dodać więcej dokumentów dla tego języka w projekcie.

Nie oczekuje się dodania tej samej liczby dokumentów dla każdego języka. Większość projektu należy utworzyć w jednym języku i dodać tylko kilka dokumentów w językach, które obserwujesz, nie działają prawidłowo. Jeśli utworzysz projekt, który jest głównie w języku angielskim i zaczniesz testować go w języku francuskim, niemieckim i hiszpańskim, możesz zauważyć, że język niemiecki nie działa, a także inne dwa języki. W takim przypadku rozważ dodanie 5% oryginalnych dokumentów w języku angielskim w języku niemieckim, wytrenuj nowy model i ponownie przetestuj go w języku niemieckim. Powinny zostać wyświetlone lepsze wyniki dla niemieckich zapytań. Tym bardziej oznaczone dokumenty, tym bardziej prawdopodobne, że wyniki będą lepsze.

Podczas dodawania danych w innym języku nie należy oczekiwać, że będzie ona negatywnie wpływać na inne języki.

Następne kroki