Obsługa języka analizy tonacji i wyszukiwania opinii

Artykuł
12/19/2023

Skorzystaj z tego artykułu, aby dowiedzieć się, które języki są obsługiwane przez analizę tonacji i wyszukiwania opinii. Zarówno oparty na chmurze interfejs API, jak i kontenery platformy Docker obsługują te same języki.

Obsługa języka analizy tonacji

Łączna liczba obsługiwanych kodów języków: 94

Język	Kod języka	Uwagi
Afrikaans	`af`
Albański	`sq`
Amharski	`am`
Arabski	`ar`
Armeński	`hy`
Assamski	`as`
Azerski	`az`
Baskijski	`eu`
Białorusin (nowy)	`be`
Bengalski	`bn`
Bośniacki	`bs`
Breton (nowy)	`br`
bułgarski	`bg`
Birmański	`my`
kataloński	`ca`
Chiński (uproszczony)	`zh-hans`	`zh` zaakceptowane również
chiński (tradycyjny)	`zh-hant`
chorwacki	`hr`
Czeski	`cs`
Duński	`da`
niderlandzki	`nl`
angielski	`en`
Starsza (nowa)	`eo`
estoński	`et`
Filipino	`fil`
Fiński	`fi`
Francuski	`fr`
Galicyjski	`gl`
Gruziński	`ka`
Niemiecki	`de`
Grecki	`el`
Gudżarati	`gu`
Hausa (nowy)	`ha`
Hebrajski	`he`
hindi	`hi`
Węgierski	`hu`
indonezyjski	`id`
Irlandzki	`ga`
Włoski	`it`
japoński	`ja`
Javanese (nowy)	`jv`
Kannada	`kn`
Kazachski	`kk`
Khmer	`km`
Koreański	`ko`
Kurdyjski (Kurmjski)	`ku`
Kirgiski	`ky`
Lao	`lo`
Łaciński (nowy)	`la`
łotewski	`lv`
litewski	`lt`
Macedoński	`mk`
Madagaskaru	`mg`
malajski	`ms`
Malayalam	`ml`
Marathi	`mr`
Mongolski	`mn`
Nepalski	`ne`
norweski	`no`
Odia	`or`
Oromo (nowy)	`om`
Paszto	`ps`
Perski	`fa`
Polski	`pl`
portugalski (Portugalia)	`pt-PT`	`pt` zaakceptowane również
portugalski (Brazylia)	`pt-BR`
Pendżabski	`pa`
rumuński	`ro`
Rosyjski	`ru`
Sanskrit (nowy)	`sa`
Szkocki Gaelic (nowy)	`gd`
Serbski	`sr`
Sindhi (nowy)	`sd`
Sinhala (nowy)	`si`
słowacki	`sk`
słoweński	`sl`
Somalii	`so`
Hiszpański	`es`
Sundanese (nowy)	`su`
Suahili	`sw`
Szwedzki	`sv`
Tamilski	`ta`
Telugu	`te`
tajski	`th`
Turecki	`tr`
ukraiński	`uk`
Urdu	`ur`
Ujgurski	`ug`
Uzbecki	`uz`
Wietnamski	`vi`
Walijski	`cy`
Western Frisian (nowy)	`fy`
Xhosa (nowy)	`xh`
Yiddish (nowy)	`yi`

Obsługa języka wyszukiwania opinii

Łączna liczba obsługiwanych kodów języków: 94

Język	Kod języka	Uwagi
Afrikaans (nowy)	`af`
Albański (nowy)	`sq`
Amharic (nowy)	`am`
Arabski	`ar`
Ormiański (nowy)	`hy`
Assamese (nowy)	`as`
Azerbejdżan (nowy)	`az`
Baskijski (nowy)	`eu`
Białorusin (nowy)	`be`
Bengalski	`bn`
Bośniacki (nowy)	`bs`
Breton (nowy)	`br`
Bułgarski (nowy)	`bg`
Birmański (nowy)	`my`
Kataloński (nowy)	`ca`
Chiński (uproszczony)	`zh-hans`	`zh` zaakceptowane również
Chiński (tradycyjny) (nowy)	`zh-hant`
Chorwacki (nowy)	`hr`
Czeski (nowy)	`cs`
Duński	`da`
niderlandzki	`nl`
angielski	`en`
Starsza (nowa)	`eo`
Estoński (nowy)	`et`
Filipino (nowy)	`fil`
Fiński	`fi`
Francuski	`fr`
Galicjan (nowy)	`gl`
Gruziński (nowy)	`ka`
Niemiecki	`de`
Grecki	`el`
Gujarati (nowy)	`gu`
Hausa (nowy)	`ha`
Hebrajski (nowy)	`he`
hindi	`hi`
Węgierski	`hu`
indonezyjski	`id`
Irlandzki (nowy)	`ga`
Włoski	`it`
japoński	`ja`
Javanese (nowy)	`jv`
Kannada (nowy)	`kn`
Kazachski (nowy)	`kk`
Khmer (nowy)	`km`
Koreański	`ko`
Kurdyjski (Kurmjski)	`ku`
Kyrgyz (nowy)	`ky`
Lao (nowy)	`lo`
Łaciński (nowy)	`la`
Łotewski (nowy)	`lv`
Litewski (nowy)	`lt`
Macedoński (nowy)	`mk`
Malagasy (nowy)	`mg`
Malajski (nowy)	`ms`
Malayalam (nowy)	`ml`
Marathi	`mr`
Mongolski (nowy)	`mn`
Nepalski (nowy)	`ne`
norweski	`no`
Odia (nowy)	`or`
Oromo (nowy)	`om`
Pashto (nowy)	`ps`
Perski (nowy)	`fa`
Polski	`pl`
portugalski (Portugalia)	`pt-PT`	`pt` zaakceptowane również
portugalski (Brazylia)	`pt-BR`
Punjabi (nowy)	`pa`
Rumuński (nowy)	`ro`
Rosyjski	`ru`
Sanskrit (nowy)	`sa`
Szkocki Gaelic (nowy)	`gd`
Serbski (nowy)	`sr`
Sindhi (nowy)	`sd`
Sinhala (nowy)	`si`
Słowacki (nowy)	`sk`
Słoweniec (nowy)	`sl`
Somalia (nowa)	`so`
Hiszpański	`es`
Sundanese (nowy)	`su`
Swahili (nowy)	`sw`
Szwedzki	`sv`
Tamilski	`ta`
Telugu	`te`
Tajski (nowy)	`th`
Turecki	`tr`
Ukraiński (nowy)	`uk`
Urdu (nowy)	`ur`
Uygur (nowy)	`ug`
Uzbek (nowy)	`uz`
Wietnamski (nowy)	`vi`
Walijski (nowy)	`cy`
Western Frisian (nowy)	`fy`
Xhosa (nowy)	`xh`
Yiddish (nowy)	`yi`

Opcja wielojęzyczna (tylko analiza tonacji niestandardowej)

Dzięki analizie tonacji niestandardowej można wytrenować model w jednym języku i użyć go do klasyfikowania dokumentów w innym języku. Ta funkcja jest przydatna, ponieważ pomaga zaoszczędzić czas i nakład pracy. Zamiast kompilować oddzielne projekty dla każdego języka, można obsługiwać wielojęzyczny zestaw danych w jednym projekcie. Zestaw danych nie musi być całkowicie w tym samym języku, ale należy włączyć opcję wielojęzyczną dla projektu podczas tworzenia lub nowszych ustawień projektu. Jeśli podczas procesu oceny zauważysz, że model działa słabo w niektórych językach, rozważ dodanie większej ilości danych w tych językach do zestawu szkoleniowego.

Możesz wytrenować swój projekt w całości przy użyciu dokumentów angielskich i wykonywać na nim zapytania: francuski, niemiecki, mandaryński, japoński, koreański i inne. Niestandardowa analiza tonacji ułatwia skalowanie projektów do wielu języków przy użyciu technologii wielojęzycznej do trenowania modeli.

Za każdym razem, gdy określisz, że dany język nie działa, a także inne języki, możesz dodać więcej dokumentów dla tego języka w projekcie.

Nie oczekuje się dodania tej samej liczby dokumentów dla każdego języka. Większość projektu należy utworzyć w jednym języku i dodać tylko kilka dokumentów w językach, które obserwujesz, nie działają prawidłowo. Jeśli utworzysz projekt, który jest głównie w języku angielskim i zaczniesz testować go w języku francuskim, niemieckim i hiszpańskim, możesz zauważyć, że język niemiecki nie działa, a także inne dwa języki. W takim przypadku rozważ dodanie 5% oryginalnych dokumentów w języku angielskim w języku niemieckim, wytrenuj nowy model i ponownie przetestuj go w języku niemieckim. Powinny zostać wyświetlone lepsze wyniki dla niemieckich zapytań. Tym bardziej oznaczone dokumenty, tym bardziej prawdopodobne, że wyniki będą lepsze.

Podczas dodawania danych w innym języku nie należy oczekiwać, że będzie ona negatywnie wpływać na inne języki.

Następne kroki

jak wywołać interfejs API , aby uzyskać więcej informacji.
Szybki start: korzystanie z biblioteki klienta analizy tonacji i interfejsu API REST

Share via

Obsługa języka analizy tonacji i wyszukiwania opinii