단어 분리기 및 형태소 분석기
단어 분리기와 형태소 분석기는 모든 전체 텍스트 인덱싱된 데이터에 대해 언어 분석을 수행합니다. 언어 분석에는 단어 경계 찾기(단어 분리) 및 동사 변화(형태소 분석)가 있습니다. 이 분석 규칙은 언어마다 다르며 전체 텍스트 인덱스화된 각 열마다 다른 언어를 지정할 수 있습니다. 각 언어의 단어 분리기는 해당 언어에 맞는 정확한 결과를 반환할 수 있게 합니다. 해당 언어군의 단어 분리기만 있고 특정 하위 언어의 단어 분리기가 없으면 주 언어가 사용됩니다. 예를 들어 프랑스어 단어 분리기를 사용하여 프랑스어(캐나다) 텍스트를 처리합니다. 특정 언어의 단어 분리기를 사용할 수 없으면 중립 단어 분리기가 사용됩니다. 중립 단어 분리기를 사용하면 공백 및 문장 부호 표시와 같은 중립 문자에서 단어가 분리됩니다.
Microsoft SQL Server 2005에는 23개 로캘에 대한 단어 분리기가 있습니다. 전체 텍스트 검색에서 지원하는 언어 목록은 sys.fulltext_languages(Transact-SQL)를 참조하십시오.
쿼리 중인 전체 텍스트 인덱싱된 열의 언어에 따라 전체 텍스트 쿼리 함수 CONTAINS, FREETEXT, CONTAINSTABLE 및 FREETEXTTABLE의 인수에 대해 수행되는 언어 분석이 결정됩니다. 열에 언어를 지정하지 않으면 기본 구성 옵션 default full-text language의 값이 사용됩니다.
다른 언어로 번역된 SQL Server의 경우 해당 언어가 있으면 SQL Server 설치 프로그램에서 default full-text language 옵션을 서버 언어로 설정합니다. 번역되지 않은 SQL Server 버전의 경우 default full-text language 옵션이 영어입니다.
[!참고] 쿼리에 LANGUAGE 옵션을 지정하지 않은 경우 하나의 전체 텍스트 쿼리 함수 절에 있는 모든 열은 동일한 언어를 사용해야 합니다.