다음을 통해 공유


CREATE FULLTEXT INDEX(Transact-SQL)

적용 대상: SQL Server Azure SQL 데이터베이스 Azure SQL Managed Instance

SQL Server에서 데이터베이스의 테이블 또는 인덱싱된 뷰에서 전체 텍스트 인덱스를 만듭니다. 테이블 또는 인덱싱된 뷰당 하나의 전체 텍스트 인덱스만 허용되고 각 전체 텍스트 인덱스는 하나의 테이블 또는 인덱싱된 뷰에 적용됩니다. 전체 텍스트 인덱스는 최대 1024개의 열을 포함할 수 있습니다.

Transact-SQL 구문 표기 규칙

구문

CREATE FULLTEXT INDEX ON table_name
   [ ( { column_name
             [ TYPE COLUMN type_column_name ]
             [ LANGUAGE language_term ]
             [ STATISTICAL_SEMANTICS ]
        } [ , ...n ]
      ) ]
    KEY INDEX index_name
    [ ON <catalog_filegroup_option> ]
    [ WITH ( <with_option> [ , ...n ] ) ]
[;]

<catalog_filegroup_option>::=
 {
    fulltext_catalog_name
 | ( fulltext_catalog_name , FILEGROUP filegroup_name )
 | ( FILEGROUP filegroup_name , fulltext_catalog_name )
 | ( FILEGROUP filegroup_name )
 }

<with_option>::=
 {
   CHANGE_TRACKING [ = ] { MANUAL | AUTO | OFF [ , NO POPULATION ] }
 | STOPLIST [ = ] { OFF | SYSTEM | stoplist_name }
 | SEARCH PROPERTY LIST [ = ] property_list_name
 }

인수

table_name

전체 텍스트 인덱스에 포함된 열 또는 열을 포함하는 테이블 또는 인덱싱된 뷰의 이름입니다.

column_name

전체 텍스트 인덱스로 포함된 열의 이름입니다. char, varchar, nchar, nvarchar, text, ntext, image, xmlvarbinary(max) 타입의 열만 전체 텍스트 검색을 위해 인덱싱될 수 있습니다. 여러 열을 지정하려면 다음과 같이 column_name 절을 반복합니다.

CREATE FULLTEXT INDEX ON table_name (column_name1 [...], column_name2 [...]) ...

TYPE COLUMN type_column_name

varbinary(max) 또는 이미지 문서에 대한 문서 형식을 보유하는 데 사용되는 테이블 열 type_column_name 이름을 지정합니다. 유형 열이라고 하는 이 열에는 사용자 제공 파일 확장명(.doc, .pdf, .xls 등)이 포함됩니다. 형식 열은 char, nchar, varchar또는 nvarchar형식이어야 합니다.

형식 열 type_column_namecolumn_namevarbinary(max) 또는 image 열을 지정하여 데이터가 이진 데이터로 저장되는 경우에만 지정합니다. 그렇지 않으면 SQL Server에서 오류가 반환됩니다.

참고

인덱싱할 때 전체 텍스트 엔진은 각 테이블 행의 유형 열에 있는 약어를 사용하여 column_name의 문서에 사용할 전체 텍스트 검색 필터를 식별합니다. 이 필터는 문서를 이진 스트림으로 로드하고 서식 정보를 제거하며 문서의 텍스트를 단어 분리기 구성 요소로 보냅니다. 자세한 내용은 고급 분석 확장 구성 및 관리를 참조하세요.

LANGUAGE language_term

column_name 저장된 데이터의 언어입니다.

language_term은 선택적이며 언어의 LCID(로캘 ID)에 해당하는 문자열, 정수 또는 16진수 값으로 지정할 수 있습니다. 값을 지정하지 않으면 SQL Server 인스턴스의 기본 언어가 사용됩니다.

language_term 지정한 경우 나타내는 언어는 char, nchar, varchar, nvarchar, textntext 열에 저장된 데이터를 인덱싱하는 데 사용됩니다. 이 언어는 language_term 열에 대한 전체 텍스트 조건자의 일부로 지정되지 않은 경우 쿼리 시간에 사용되는 기본 언어입니다.

문자열 로 지정하면 language_term 시스템 테이블의 별칭 열 값에 sys.syslanguages 해당합니다. 문자열은 'language_term'과 같이 작은따옴표로 묶어야 합니다. 정수로 지정하는 경우 language_term은 언어를 식별하는 실제 LCID입니다. 16진수 값 으로 지정하면 language_term 0x 뒤에 LCID의 16진수 값이 잇습니다. 16진수 값은 선행 0을 포함하여 8자리 수를 초과할 수 없습니다.

값이 DBCS(더블바이트 문자 집합) 형식인 경우 SQL Server에서는 값을 유니코드로 변환합니다.

단어 분리기 및 형태소 분석기와 같은 리소스는 language_term으로 지정된 언어에 사용해야 합니다. 이러한 리소스가 지정된 언어를 지원하지 않으면 SQL Server에서 오류를 반환합니다.

저장 프로시저를 sp_configure 사용하여 Microsoft SQL Server 인스턴스의 기본 전체 텍스트 언어에 대한 정보에 액세스합니다. 자세한 내용은 sp_configure(Transact-SQL)를 참조하세요.

여러 언어로 된 텍스트 데이터를 포함하는 비 BLOB 및 비 XML 열의 경우 또는 열에 저장된 텍스트의 언어를 알 수 없는 경우 중립(0x0) 언어 리소스를 사용하는 것이 적절할 수 있습니다. 그러나 먼저 중립(0x0) 언어 리소스를 사용할 경우 발생할 수 있는 결과를 이해해야 합니다. 중립(0x0) 언어 리소스를 사용할 때 발생할 수 있는 해결 방법 및 결과에 대한 자세한 내용은 전체 텍스트 인덱스를 만들 때 언어 선택을 참조하세요.

XML 또는 BLOB 형식 열에 저장된 문서의 경우 인덱싱 시 문서 내의 언어 인코딩이 사용됩니다. 예를 들어 XML 열 xml:lang 에서 XML 문서의 특성은 언어를 식별합니다. 쿼리할 때 language_term이 전체 텍스트 쿼리의 일부로 지정되지 않은 경우에는 language_term에 지정된 이전 값이 전체 텍스트 쿼리의 기본 언어로 사용됩니다.

STATISTICAL_SEMANTICS

적용 대상: SQL Server(SQL Server 2012(11.x) 이상)

통계 의미 체계 인덱싱의 일부인 추가 키 구 및 문서 유사성 인덱스를 만듭니다. 자세한 내용은 의미 체계 검색(SQL Server)을 참조하세요.

KEY INDEX index_name

table_name 고유 키 인덱스의 이름입니다. KEY INDEX는 고유하며 Null을 허용하지 않는 단일 키 열이어야 합니다. 전체 텍스트 고유 키에 대해 가장 작은 고유 키 인덱스를 선택합니다. 최상의 성능을 위해 전체 텍스트 키에 정수 데이터 형식을 사용하는 것이 좋습니다.

fulltext_catalog_name

전체 텍스트 인덱스용으로 사용되는 전체 텍스트 카탈로그입니다. 카탈로그는 데이터베이스에 이미 있어야 합니다. 이 절은 옵션입니다. 지정하지 않으면 기본 카탈로그가 사용됩니다. 기본 카탈로그가 없으면 SQL Server에서 오류를 반환합니다.

FILEGROUP filegroup_name

주어진 파일 그룹에 지정된 전체 텍스트 인덱스를 만듭니다. 파일 그룹은 이미 존재해야 합니다. FILEGROUP 절을 지정하지 않으면 전체 텍스트 인덱스가 분할되지 않은 테이블의 기본 테이블 또는 뷰와 동일한 파일 그룹에 배치되거나 분할된 테이블의 기본 파일 그룹에 배치됩니다.

CHANGE_TRACKING [ = ] { MANUAL | AUTO | OFF [ , NO POPULATION ] }

SQL Server에서 전체 텍스트 인덱스가 적용되는 테이블 열의 변경 내용(업데이트, 삭제 또는 삽입)을 해당 전체 텍스트 인덱스로 전파할지 여부를 지정합니다. WRITETEXT 및 UPDATETEXT를 통한 데이터 변경 내용은 전체 텍스트 인덱스로 반영되지 않으며 변경 내용 추적으로 선택되지 않습니다.

  • MANUAL

    ALTER FULLTEXT INDEX START UPDATE POPULATION Transact-SQL 문을 호출하면 추적된 변경 내용이 수동으로 전파되도록 지정합니다(수동 채우기). SQL Server 에이전트를 사용하여 이 Transact-SQL 문을 주기적으로 호출할 수 있습니다.

  • AUTO

    데이터가 기본 테이블(자동 채우기)에서 수정될 때 추적된 변경 내용이 자동으로 전파되도록 지정합니다. 변경 내용은 자동으로 전파되지만 전체 텍스트 인덱스에 즉시 반영되지 않을 수 있습니다. 기본값은 AUTO입니다.

OFF [ , 채우기 없음 ]

SQL Server가 인덱싱된 데이터에 대한 변경 내용 목록을 유지하지 않도록 지정합니다. NO POPULATION을 지정하지 않으면 SQL Server는 인덱스를 만든 후 인덱스를 완전히 채웁니다.

NO POPULATION 옵션은 CHANGE_TRACKING이 OFF일 경우에만 사용할 수 있습니다. NO POPULATION을 지정하면 SQL Server는 인덱스를 만든 후에는 채웁 수 없습니다. 사용자가 ALTER FULLTEXT INDEX 명령에 START FULL POPULATION 또는 START INCREMENTAL POPULATION 절을 실행한 후에만 인덱스가 채워집니다.

STOPLIST [ = ] { OFF | SYSTEM | stoplist_name }

전체 텍스트 중지 목록을 인덱스와 연결합니다. 인덱스는 지정된 중지 목록의 일부인 토큰으로 채워지지 않습니다. STOPLIST를 지정하지 않으면 SQL Server는 시스템 전체 텍스트 중지 목록을 인덱스와 연결합니다.

  • OFF

    중지 목록이 전체 텍스트 인덱스와 연결되지 않도록 지정합니다.

  • SYSTEM

    기본 전체 텍스트 시스템 STOPLIST가 이 전체 텍스트 인덱스에 사용되도록 지정합니다.

  • stoplist_name

    전체 텍스트 인덱스와 연결할 중지 목록의 이름을 지정합니다.

SEARCH PROPERTY LIST [ = ] property_list_name

적용 대상: SQL Server(SQL Server 2012(11.x) 이상)

검색 속성 목록을 인덱스와 연결합니다.

  • OFF

    속성 목록이 전체 텍스트 인덱스와 연결되지 않음을 지정합니다.

  • property_list_name

    전체 텍스트 인덱스와 연결할 검색 속성 목록의 이름을 지정합니다.

설명

xml 열에서는 XML 요소의 내용을 인덱싱하지만 XML 태그를 무시하는 전체 텍스트 인덱스를 만들 수 있습니다. 특성 값은 숫자 값이 아니면 전체 텍스트 인덱싱됩니다. 요소 태그는 토큰 경계로 사용됩니다. 여러 언어를 포함하는 올바른 형식의 XML 또는 HTML 문서와 조각이 지원됩니다. 자세한 내용은 XML 열에 전체 텍스트 검색 사용을 참조하세요.

인덱스 키 열에는 정수 데이터 형식을 사용하는 것이 좋습니다. 이렇게 하면 쿼리 실행 시간이 최적화됩니다.

CREATE FULLTEXT INDEX는 사용자 트랜잭션 내에 배치할 수 없습니다. 이 문은 자체 암시적 트랜잭션에서 실행되어야 합니다.

전체 텍스트 인덱스에 대한 자세한 내용은 전체 텍스트 인덱스 만들기 및 관리를 참조하세요.

변경 내용 추적 및 NO POPULATION 매개 변수의 상호 작용

전체 텍스트 인덱스가 채워지는지 여부는 변경 내용 추적이 설정되어 있는지 여부와 ALTER FULLTEXT INDEX 문에 WITH NO POPULATION이 지정되어 있는지 여부에 따라 달라집니다. 다음 표에서는 이러한 상호 작용의 결과를 요약합니다.

변경 내용 추적 WITH NO POPULATION 결과
설정 안 됨 지정되지 않음 인덱스에 대해 전체 채우기가 수행됩니다.
설정 안 됨 지정됨 ALTER FULLTEXT INDEX...START POPULATION 문이 실행될 때까지 인덱스 채우기가 발생하지 않습니다.
사용 지정됨 오류가 발생하고 인덱스가 변경되지 않습니다.
사용 지정되지 않음 인덱스에 대해 전체 채우기가 수행됩니다.

전체 텍스트 인덱스에 대한 자세한 내용은 전체 텍스트 인덱스 채우기를 참조하세요.

사용 권한

사용자는 전체 텍스트 카탈로그에 대한 REFERENCES 권한과 테이블 뷰 또는 인덱싱된 뷰에 대한 ALTER 권한을 가지거나 sysadmin 고정 서버 역할, db_owner 또는 db_ddladmin 고정 데이터베이스 역할의 구성원이어야 합니다.

SET STOPLIST를 지정한 경우 사용자가 지정된 중지 목록에 대한 REFERENCES 권한이 있어야 합니다. 이 사용 권한은 STOPLIST 소유자가 부여할 수 있습니다.

참고

public에는 SQL Server의 기본 중지 목록에 대한 REFERENCE 권한이 부여됩니다.

예제

A. 고유 인덱스, 전체 텍스트 카탈로그 및 전체 텍스트 인덱스 만들기

다음 예제에서는 AdventureWorks2022 샘플 데이터베이스 테이블의 HumanResources.JobCandidate 열에 JobCandidateID 고유한 인덱스를 만듭니다. 그런 다음 기본 전체 텍스트 카탈로그 ft를 만듭니다. 마지막으로 Resume 카탈로그 및 시스템 중지 목록을 사용하여 ft 열에 대한 전체 텍스트 인덱스를 만듭니다.

CREATE UNIQUE INDEX ui_ukJobCand ON HumanResources.JobCandidate(JobCandidateID);
CREATE FULLTEXT CATALOG ft AS DEFAULT;
CREATE FULLTEXT INDEX ON HumanResources.JobCandidate(Resume)
   KEY INDEX ui_ukJobCand
   WITH STOPLIST = SYSTEM;
GO

B. 여러 테이블 열에 전체 텍스트 인덱스 만들기

다음 예에서는 production_catalog 예제 데이터베이스에 전체 텍스트 카탈로그 AdventureWorks를 만듭니다. 그런 다음 이 새 카탈로그를 사용하는 전체 텍스트 인덱스를 만듭니다. 전체 텍스트 인덱스는 ReviewerNameComments EmailAddressProduction.ProductReview. 이 예에서는 각 열에 대해 해당 열의 데이터 언어인 영어 LCID 1033을 지정합니다. 이 전체 텍스트 인덱스는 기존의 고유 키 인덱스인 PK_ProductReview_ProductReviewID를 사용합니다. 권장한 대로 이 인덱스 키는 정수 열 ProductReviewID에 있습니다.

CREATE FULLTEXT CATALOG production_catalog;
GO

CREATE FULLTEXT INDEX ON Production.ProductReview (
    ReviewerName LANGUAGE 1033,
    EmailAddress LANGUAGE 1033,
    Comments LANGUAGE 1033
) KEY INDEX PK_ProductReview_ProductReviewID ON production_catalog;
GO

C. 입력하지 않고 검색 속성 목록을 사용하여 전체 텍스트 인덱스 만들기

다음 예에서는 Title 테이블의 DocumentSummary, DocumentProduction.Document 열에서 전체 텍스트 인덱스를 만듭니다. 이 예에서는 열의 데이터 언어인 영어 LCID 1033을 지정합니다. 이 전체 텍스트 인덱스는 기본 전체 텍스트 카탈로그 및 기존의 고유 키 인덱스 PK_Document_DocumentID를 사용합니다. 권장한 대로 이 인덱스 키는 정수 열 DocumentID에 있습니다.

이 예에서는 SYSTEM 중지 목록을 지정합니다. 또한 검색 속성 목록 DocumentPropertyList를 지정합니다. 이 검색 속성 목록을 만드는 예는 CREATE SEARCH PROPERTY LIST(Transact-SQL)를 참조하세요.

이 예에서는 채우기 작업을 수행하지 않고 변경 내용 추적이 해제되도록 지정하며 나중에 사용률이 낮은 시간에 ALTER FULLTEXT INDEX 문을 사용하여 새 인덱스에 대해 전체 채우기를 시작하고 변경 내용 자동 추적을 사용하도록 설정합니다.

CREATE FULLTEXT INDEX ON Production.Document (
    Title LANGUAGE 1033,
    DocumentSummary LANGUAGE 1033,
    Document TYPE COLUMN FileExtension LANGUAGE 1033
) KEY INDEX PK_Document_DocumentID
WITH STOPLIST = SYSTEM,
    SEARCH PROPERTY LIST = DocumentPropertyList,
    CHANGE_TRACKING OFF,
    NO POPULATION;
GO

다음과 같이 나중에 사용률이 낮은 시간에 인덱스가 채워집니다.

ALTER FULLTEXT INDEX ON Production.Document SET CHANGE_TRACKING AUTO;
GO

참고 항목