다음을 통해 공유


사용자 지정 건강 텍스트 분석 언어 지원

이 문서를 사용하여 현재 사용자 지정 건강 텍스트 분석에서 지원되는 언어에 관해 알아봅니다.

다국어 옵션

사용자 지정 건강 텍스트 분석을 사용하면 모델을 한 언어로 학습시키고 다른 언어의 문서에서 엔터티를 추출하는 데 사용할 수 있습니다. 이 기능을 사용하면 각 언어에 대해 별도의 프로젝트를 빌드하는 대신 단일 프로젝트에서 데이터 세트를 결합하여 프로젝트를 여러 언어로 쉽게 확장할 수 있습니다. 프로젝트를 완전히 영어 문서로 학습시키고 프랑스어, 독일어, 이탈리아어 등으로 쿼리할 수 있습니다. 프로젝트 만들기 프로세스의 일부로 또는 나중에 프로젝트 설정을 통해 다국어 옵션을 사용하도록 설정할 수 있습니다.

모든 언어에 대해 동일한 수의 문서를 추가할 필요는 없습니다. 대부분의 프로젝트를 하나의 언어로 빌드해야 하며 잘 수행되지 않은 것으로 관찰되는 언어로 몇 가지 문서를 추가하면 됩니다. 주로 영어로 된 프로젝트를 만들고 프랑스어, 독일어 및 스페인어로 테스트를 시작하는 경우 독일어가 다른 두 언어만큼 잘 수행되지 않는다는 것을 알 수 있습니다. 이 경우 원본 영어 문서의 5%를 독일어로 추가하고, 새 모델을 학습시키고, 독일어로 다시 테스트하는 것이 좋습니다. Language Studio의 데이터 레이블 지정 페이지에서 추가할 문서의 언어를 선택할 수 있습니다. 독일어 쿼리에 대해 더 나은 결과를 볼 수 있습니다. 더 많은 레이블이 지정된 문서를 추가할수록 더 좋은 결과를 얻을 가능성이 높습니다. 다른 언어로 데이터를 추가하는 경우 다른 언어에 부정적인 영향을 주지 않습니다.

히브리어는 다국어 프로젝트에서 지원되지 않습니다. 프로젝트의 기본 언어가 히브리어인 경우 다른 언어로 학습 데이터를 추가하거나 다른 언어로 모델을 쿼리할 수 없습니다. 마찬가지로 프로젝트의 기본 언어가 히브리어가 아닌 경우 히브리어로 학습 데이터를 추가하거나 히브리어로 모델을 쿼리할 수 없습니다.

언어 지원

사용자 지정 건강 텍스트 분석에서는 .txt 파일을 다음 언어로 지원합니다.

언어 언어 코드
English en
프랑스어 fr
독일어 de
스페인어 es
이탈리아어 it
포르투갈어(포르투갈) pt-pt
히브리어 he

다음 단계