다음을 통해 공유


검색 필터 구성 및 관리

적용 대상: SQL Server Azure SQL 데이터베이스

varbinary, varbinary(max), image 또는 xml 데이터 형식 열의 문서를 인덱싱하려면 추가 처리가 필요합니다. 이 처리는 필터에 의해 수행되어야 합니다. 필터는 문서에서 텍스트 정보를 추출합니다(서식 제거). 그런 다음 필터는 표 열과 연결된 언어의 단어 분리기 구성 요소에 텍스트를 보냅니다.

필터 및 문서 유형

지정된 필터는 지정된 문서 유형(.doc, .pdf, .xls, .xml 등)에만 해당됩니다. 이러한 필터는 IFilter 인터페이스를 구현합니다. 이러한 문서 유형에 대한 자세한 내용을 보려면 sys.fulltext_document_types 카탈로그 뷰를 쿼리하세요.

이진 문서는 단일 varbinary(max) 또는 image 열에 저장할 수 있습니다. SQL Server는 각 문서에 대해 파일 확장명을 기준으로 사용할 필터를 정확히 선택합니다. 파일이 varbinary(max) 또는 image 열에 저장될 때 파일 확장명은 표시되지 않으므로 파일 확장명(.doc, .xls, .pdf 등)은 형식 열이라고 하는 테이블의 별도 열에 저장되어야 합니다. 이 형식 열은 모든 문자 기반 데이터 형식이 될 수 있고 Microsoft Word 문서를 나타내는 .doc와 같은 문서 파일 확장명을 포함합니다. Adventure Works의 문서 테이블에서 문서 열은 varbinary(max) 형식이고 형식 열인 FileExtensionnvarchar(8) 형식입니다.

기존 전체 텍스트 인덱스 형식 열을 보려면

참고 항목

필터는 구현에 따라 부모 개체에 포함된 개체를 처리할 수 있습니다. 그러나 SQL Server는 다른 개체에 대한 링크를 따라가도록 필터를 구성하지 않습니다.

설치된 필터

SQL Server는 자체 XML 및 HTML 필터를 설치합니다. 또한 운영 체제에 이미 설치된 Microsoft 전용 형식(.doc, .xdoc, .ppt 등)에 대한 필터도 SQL Server에서 로드됩니다. SQL Server 인스턴스에 현재 로드된 필터를 식별하려면 다음과 같이 sp_help_fulltext_system_components 저장 프로시저를 사용합니다.

EXEC sp_help_fulltext_system_components 'filter';   

참고 항목

.xlsx 지원을 제공하는 최신 버전의 Office 필터 팩이 있더라도 SQL Server는 엄격한 Open XML 스프레드시트를 지원하지 않습니다. 오류가 반환되지 않습니다. SQL Server는 엄격한 Open XML 스프레드시트의 내용을 인덱싱하지 못합니다.

비 Microsoft 필터

하지만 Microsoft 형식 이외의 다른 형식용 필터를 사용하려면 수동으로 서버 인스턴스에 로드해야 합니다. 추가 필터를 설치하는 방법에 대한 자세한 내용은 등록된 필터 및 단어 분리기 보기 또는 변경을 참조하세요.

참고 항목

sys.fulltext_index_columns(Transact-SQL)
FILESTREAM과 기타 SQL Server 기능 간 호환성