다음을 통해 공유


감정 분석 및 의견 마이닝 언어 지원

이 문서를 사용하여 감정 분석 및 오피니언 마이닝에서 지원하는 언어를 알아봅니다. 클라우드 기반 API와 Docker 컨테이너는 모두 동일한 언어를 지원합니다.

감정 분석 언어 지원

총 지원 언어 코드: 94

언어 언어 코드 주의
아프리칸스어 af
알바니아어 sq
암하라어 am
아랍어 ar
아르메니아 hy
아삼어 as
아제르바이잔어 az
바스크어 eu
벨라루스어(신규) be
벵골어 bn
보스니아 헤르체고비나어 bs
브르타뉴어(신규) br
불가리아어 bg
Burmese my
카탈로니아어 ca
중국어(간체) zh-hans zh도 허용됨
중국어(번체) zh-hant
크로아티아어 hr
체코어 cs
덴마크어 da
네덜란드어 nl
영어 en
에스페란토(신규) eo
에스토니아어 et
필리핀어 fil
핀란드어 fi
프랑스어 fr
갈리시아어 gl
그루지야 문자 ka
독일어 de
그리스어 el
구자라트어 gu
하우사어(신규) ha
히브리어 he
힌디어 hi
헝가리어 hu
인도네시아어 id
아일랜드어 ga
이탈리아어 it
일본어 ja
자바어(신규) jv
칸나다어 kn
카자흐어 kk
크메르어 km
한국어 ko
쿠르드어(쿠르만지) ku
키르기스어 ky
라오스어 lo
라틴어(신규) la
라트비아어 lv
리투아니아어 lt
마케도니아어 mk
말라가시어 mg
말레이어 ms
말라얄람어 ml
마라티어 mr
몽골어 mn
네팔어 ne
노르웨이어 no
오디아어 or
오로모어(신규) om
파슈토어 ps
페르시아어 fa
폴란드어 pl
포르투갈어(포르투갈) pt-PT pt도 허용됨
포르투갈어(브라질) pt-BR
펀잡어 pa
루마니아어 ro
러시아어 ru
산스크리트어(신규) sa
스코틀랜드 게일어(신규) gd
세르비아어 sr
신디어(신규) sd
신할라어(신규) si
슬로바키아어 sk
슬로베니아어 sl
소말리아어 so
스페인어 es
선다네스어(신규) su
스와힐리어 sw
스웨덴어 sv
타밀어 ta
텔루구어 te
태국어 th
터키어 tr
우크라이나어 uk
우르두어 ur
위구르어 ug
우즈베크어 uz
베트남어 vi
웨일스어 cy
서부 프리지아어(신규) fy
반투어(신규) xh
이디시어(신규) yi

오피니언 마이닝 언어 지원

총 지원 언어 코드: 94

언어 언어 코드 주의
아프리칸스어(신규) af
알바니아어(신규) sq
암하라어(신규) am
아랍어 ar
아르메니아어(신규) hy
아삼어(신규) as
아제르바이잔어(신규) az
바스크어(신규) eu
벨라루스어(신규) be
벵골어 bn
보스니아어(신규) bs
브르타뉴어(신규) br
불가리아어(신규) bg
버마어(신규) my
카탈로니아어(신규) ca
중국어(간체) zh-hans zh도 허용됨
중국어 - 번체(신규) zh-hant
크로아티아어(신규) hr
체코어(신규) cs
덴마크어 da
네덜란드어 nl
영어 en
에스페란토(신규) eo
에스토니아어(신규) et
필리핀어(신규) fil
핀란드어 fi
프랑스어/French fr
갈리시아어(신규) gl
조지아어(신규) ka
독일어 de
그리스어 el
구자라트어(신규) gu
하우사어(신규) ha
히브리어(신규) he
힌디어 hi
헝가리어 hu
인도네시아어 id
아일랜드어(신규) ga
이탈리아어 it
일본어 ja
자바어(신규) jv
칸나다어(신규) kn
카자흐어(신규) kk
크메르어(신규) km
한국어 ko
쿠르드어(쿠르만지) ku
키르기스어(신규) ky
라오어(신규) lo
라틴어(신규) la
라트비아어(신규) lv
리투아니아어(신규) lt
마케도니아어(신규) mk
마다가스카르어(신규) mg
말레이어(신규) ms
말라얄람어(신규) ml
마라티어 mr
몽골어(신규) mn
네팔어(신규) ne
노르웨이어 no
오디아어(신규) or
오로모어(신규) om
파슈토어(신규) ps
페르시아어(신규) fa
폴란드어 pl
포르투갈어(포르투갈) pt-PT pt도 허용됨
포르투갈어(브라질) pt-BR
펀잡어(신규) pa
루마니아어(신규) ro
러시아어 ru
산스크리트어(신규) sa
스코틀랜드 게일어(신규) gd
세르비아어(신규) sr
신디어(신규) sd
신할라어(신규) si
슬로바키아어(신규) sk
슬로베니아어(신규) sl
소말리어(신규) so
스페인어 es
선다네스어(신규) su
스와힐리어(신규) sw
스웨덴어 sv
타밀어 ta
텔루구어 te
태국어(신규) th
터키어 tr
우크라이나어(신규) uk
우르두어(신규) ur
위구르어(신규) ug
우즈베크어(신규) uz
베트남어(신규) vi
웨일스어(신규) cy
서부 프리지아어(신규) fy
반투어(신규) xh
이디시어(신규) yi

다국어 옵션(사용자 지정 감정 분석만 해당)

사용자 지정 감정 분석을 사용하면 모델을 한 언어로 학습시킬수 있으며 또 다른 언어로 문서를 분류하는 데 사용할 수 있습니다. 이 기능은 시간과 노력을 절약하는 데 도움이 되므로 유용합니다. 모든 언어에 대해 별도의 프로젝트를 빌드하는 대신 한 프로젝트에서 다국어 데이터 세트를 처리할 수 있습니다. 데이터 세트가 완전히 동일한 언어일 필요는 없지만 만드는 동안 또는 나중에 프로젝트 설정에서 프로젝트에 대해 다국어 옵션을 사용하도록 설정해야 합니다. 평가 프로세스 중에 모델이 특정 언어에서 제대로 수행되지 않는 경우 이 언어로 된 데이터를 학습 세트에 추가하는 것이 좋습니다.

프로젝트를 완전히 영어 문서로 학습시키고 프랑스어, 독일어, 북경어, 일본어, 한국어 등으로 쿼리할 수 있습니다. 사용자 지정 감정 분석은 다국어 기술로 모델을 학습시켜서 프로젝트를 여러 언어로 쉽게 스케일링할 수 있습니다.

특정 언어가 다른 언어만큼 수행되지 않는 것을 확인할 때마다 프로젝트에 해당 언어에 대한 문서를 더 추가할 수 있습니다.

모든 언어에 대해 동일한 수의 문서를 추가할 필요는 없습니다. 대부분의 프로젝트를 하나의 언어로 빌드해야 하며 잘 수행되지 않은 것으로 관찰되는 언어로 몇 가지 문서를 추가하면 됩니다. 주로 영어로 된 프로젝트를 만들고 프랑스어, 독일어 및 스페인어로 테스트를 시작하는 경우 독일어가 다른 두 언어만큼 잘 수행되지 않는다는 것을 알 수 있습니다. 이 경우 원본 영어 문서의 5%를 독일어로 추가하고, 새 모델을 학습시키고, 독일어로 다시 테스트하는 것이 좋습니다. 독일어 쿼리에 대해 더 나은 결과를 볼 수 있습니다. 더 많은 레이블이 지정된 문서를 추가할수록 더 좋은 결과를 얻을 가능성이 높습니다.

다른 언어로 데이터를 추가하는 경우 다른 언어에 부정적인 영향을 주지 않습니다.

다음 단계