Delen via


Ondersteuning voor sentimentanalyse en meninganalysetaal

Gebruik dit artikel om te leren welke talen worden ondersteund door Sentimentanalyse en Meninganalyse. Zowel de cloud-API als dockercontainers ondersteunen dezelfde talen.

Ondersteuning voor sentimentanalysetaal

Totaal aantal ondersteunde taalcodes: 94

Taal Taalcode Opmerkingen
Afrikaans af
Albanees sq
Amhaars am
Arabisch ar
Armeens hy
Assamees as
Azerbeidzjaans az
Baskisch eu
Wit-Wit-Rusland (nieuw) be
Bengaals bn
Bosnisch bs
Bretagne (nieuw) br
Bulgaars bg
Birmaans my
Catalaans ca
Chinees (Vereenvoudigd) zh-hans zh ook geaccepteerd
Chinees (traditioneel) zh-hant
Kroatisch hr
Tsjechisch cs
Deens da
Nederlands nl
Engels en
Azure (nieuw) eo
Ests et
Filipino fil
Fins fi
Frans fr
Galicisch gl
Georgisch ka
Duits de
Grieks el
Gujarati gu
Hausa (nieuw) ha
Hebreeuws he
Hindi hi
Hongaars hu
Indonesisch id
Iers ga
Italiaans it
Japans ja
Javaans (nieuw) jv
Kannada kn
Kazachs kk
Khmer km
Koreaans ko
Koerdisch (Kurmanji) ku
Kirgizisch ky
Laotiaans lo
Latijns (nieuw) la
Lets lv
Litouws lt
Macedonisch mk
Malagasy mg
Maleisisch ms
Malayalam ml
Mahrati mr
Mongools mn
Nepalees ne
Noors no
Odia or
Oromo (nieuw) om
Pasjtoe ps
Perzisch fa
Pools pl
Portugees (Portugal) pt-PT pt ook geaccepteerd
Portugees (Brazilië) pt-BR
Punjabi pa
Roemeens ro
Russisch ru
Sanskrit (nieuw) sa
Schotse Gaelic (nieuw) gd
Servisch sr
Sindhi (nieuw) sd
Sinhala (nieuw) si
Slowaaks sk
Sloveens sl
Somali so
Spaans es
Sundanese (nieuw) su
Swahili sw
Zweeds sv
Tamil ta
Telugu te
Thai th
Turks tr
Oekraïens uk
Urdu ur
Oeigoers ug
Oezbeeks uz
Vietnamees vi
Welsh cy
West-Fries (nieuw) fy
Xhosa (nieuw) xh
Yiddish (nieuw) yi

Taalondersteuning voor meninganalyse

Totaal aantal ondersteunde taalcodes: 94

Taal Taalcode Opmerkingen
Afrikaans (nieuw) af
Albanese (nieuw) sq
Amharisch (nieuw) am
Arabisch ar
Armeens (nieuw) hy
Assamese (nieuw) as
Azerbeidzjaans (nieuw) az
Baskisch (nieuw) eu
Wit-Wit-Rusland (nieuw) be
Bengaals bn
Bosnisch (nieuw) bs
Bretagne (nieuw) br
Bulgaars (nieuw) bg
Burmese (nieuw) my
Catalaans (nieuw) ca
Chinees (Vereenvoudigd) zh-hans zh ook geaccepteerd
Chinees (traditioneel) (nieuw) zh-hant
Kroatisch (nieuw) hr
Tsjechisch (nieuw) cs
Deens da
Nederlands nl
Engels en
Azure (nieuw) eo
Ests (nieuw) et
Filipijns (nieuw) fil
Fins fi
Frans fr
Galicisch (nieuw) gl
Georgisch (nieuw) ka
Duits de
Grieks el
Gujarati (nieuw) gu
Hausa (nieuw) ha
Hebreeuws (nieuw) he
Hindi hi
Hongaars hu
Indonesisch id
Iers (nieuw) ga
Italiaans it
Japans ja
Javaans (nieuw) jv
Kannada (nieuw) kn
Kazachs (nieuw) kk
Khmer (nieuw) km
Koreaans ko
Koerdisch (Kurmanji) ku
Kirgizisch (nieuw) ky
Lao (nieuw) lo
Latijns (nieuw) la
Lets (nieuw) lv
Litouws (nieuw) lt
Macedonisch (nieuw) mk
Malagasy (nieuw) mg
Maleis (nieuw) ms
Malayalam (nieuw) ml
Mahrati mr
Mongools (nieuw) mn
Nepalee (nieuw) ne
Noors no
Odia (nieuw) or
Oromo (nieuw) om
Pashto (nieuw) ps
Perzisch (nieuw) fa
Pools pl
Portugees (Portugal) pt-PT pt ook geaccepteerd
Portugees (Brazilië) pt-BR
Punjabi (nieuw) pa
Roemeens (nieuw) ro
Russisch ru
Sanskrit (nieuw) sa
Schotse Gaelic (nieuw) gd
Servisch (nieuw) sr
Sindhi (nieuw) sd
Sinhala (nieuw) si
Slowaaks (nieuw) sk
Sloveens (nieuw) sl
Somalië (nieuw) so
Spaans es
Sundanese (nieuw) su
Swahili (nieuw) sw
Zweeds sv
Tamil ta
Telugu te
Thai (nieuw) th
Turks tr
Oekraïens (nieuw) uk
Urdu (nieuw) ur
Uyghur (nieuw) ug
Oezbeeks (nieuw) uz
Vietnamees (nieuw) vi
Welsh (nieuw) cy
West-Fries (nieuw) fy
Xhosa (nieuw) xh
Yiddish (nieuw) yi

Optie voor meerdere talen (alleen aangepaste sentimentanalyse)

Met aangepaste sentimentanalyse kunt u een model trainen in één taal en gebruiken om documenten in een andere taal te classificeren. Deze functie is handig omdat het helpt tijd en moeite te besparen. In plaats van afzonderlijke projecten te bouwen voor elke taal, kunt u meerdere linguïsuele gegevenssets in één project afhandelen. Uw gegevensset hoeft niet volledig in dezelfde taal te staan, maar u moet de optie voor meerdere talen voor uw project inschakelen tijdens het maken of later in projectinstellingen. Als u merkt dat uw model slecht presteert in bepaalde talen tijdens het evaluatieproces, kunt u overwegen om meer gegevens in deze talen toe te voegen aan uw trainingsset.

U kunt uw project volledig trainen met Engelse documenten en er query's op uitvoeren in: Frans, Duits, Mandarijn, Japans, Koreaans en andere documenten. Met aangepaste sentimentanalyse kunt u uw projecten eenvoudig schalen naar meerdere talen met behulp van meertalige technologie om uw modellen te trainen.

Wanneer u identificeert dat een bepaalde taal niet goed presteert en andere talen, kunt u meer documenten toevoegen voor die taal in uw project.

U verwacht niet dat u voor elke taal hetzelfde aantal documenten toevoegt. U moet het merendeel van uw project in één taal bouwen en slechts enkele documenten toevoegen in talen die u ziet, presteren niet goed. Als u een project maakt dat zich voornamelijk in het Engels bevindt en begint met het testen ervan in het Frans, Duits en Spaans, ziet u mogelijk dat Het Duits niet goed presteert en de andere twee talen. In dat geval kunt u overwegen om 5% van uw oorspronkelijke Engelse documenten in het Duits toe te voegen, een nieuw model te trainen en opnieuw in het Duits te testen. U ziet betere resultaten voor Duitse query's. Hoe meer gelabelde documenten u toevoegt, hoe waarschijnlijker de resultaten worden.

Wanneer u gegevens in een andere taal toevoegt, moet u niet verwachten dat deze negatieve gevolgen hebben voor andere talen.

Volgende stappen