전체 텍스트 인덱스 구조
전체 텍스트 인덱스 구조를 올바로 이해하면 SQL Server용 Microsoft 전체 텍스트 검색 엔진(MSFTESQL) 서비스의 작동 방법을 이해하는 데 도움이 됩니다. 다음은 Adventure Works의 Document 테이블에서 두 개의 열(DocumentID 및 Title 열)과 3개의 행을 발췌한 것입니다.
이 예에서는 Title 열에 대해 전체 텍스트 인덱스를 만들었다고 가정합니다.
DocumentID | Title |
---|---|
1 |
Crank Arm and Tire Maintenance |
2 |
Front Reflector Bracket and Reflector Assembly 3 |
3 |
Front Reflector Bracket Installation |
아래 표에서는 Document 테이블의 Title 열에 대해 만든 전체 텍스트 인덱스의 내용을 보여 줍니다.
[!참고] 전체 텍스트 인덱스에는 이 표에 있는 것보다 많은 정보가 포함되어 있습니다. 아래 표는 데모용으로만 제공됩니다.
Keyword | ColId | DocId | Occ |
---|---|---|---|
Crank |
1 |
1 |
1 |
Arm |
1 |
1 |
2 |
Tire |
1 |
1 |
4 |
Maintenance |
1 |
1 |
5 |
Front |
1 |
2 |
1 |
Front |
1 |
3 |
1 |
Reflector |
1 |
2 |
2 |
Reflector |
1 |
2 |
5 |
Reflector |
1 |
3 |
2 |
Bracket |
1 |
2 |
3 |
Bracket |
1 |
3 |
3 |
Assembly |
1 |
2 |
6 |
3 |
1 |
2 |
7 |
Installation |
1 |
3 |
4 |
Keyword 열에는 인덱싱할 때 추출한 단일 토큰이 표시됩니다. 토큰을 구성하는 요소는 단어 분리기에 의해 결정됩니다.
ColId 열에는 전체 텍스트 인덱싱된 특정 테이블과 열에 해당하는 값이 포함됩니다.
DocId 열에는 전체 텍스트 인덱싱된 테이블의 특정 전체 텍스트 키 값에 매핑되는 4바이트 정수 값이 포함됩니다. 검색 조건을 만족하는 DocId 값이 MSFTESQL 서비스에서 데이터베이스 엔진으로 전달되고 여기서 쿼리되는 기본 테이블의 전체 텍스트 키 값에 매핑됩니다.
Occ 열에는 정수 값이 포함됩니다. 각 DocId 값에는 해당 DocId 내의 특정 키워드에 대한 상대적 단어 오프셋에 해당하는 발생 빈도 값의 목록이 있습니다. 발행 빈도 값은 구 또는 근접 단어 일치를 확인하는 데 유용합니다. 예를 들어 구는 발생 빈도 값의 숫자가 서로 인접해 있습니다. 발생 빈도 값은 관련성을 평가하는 데에도 유용합니다. 예를 들어 DocId의 키워드 발생 빈도를 평가 시 사용할 수 있습니다.
참고 항목
개념
SQL Server용 Microsoft 전체 텍스트 검색 엔진
전체 텍스트 검색 기본 사항
전체 텍스트 인덱스
관련 자료
CREATE FULLTEXT INDEX(Transact-SQL)