Udostępnij za pośrednictwem


Filtry wyszukiwanie pełnego tekstu

Indeksowanie dokumentów w varbinary, varbinary(max), image, lub xml Kolumna typu danych wymaga dodatkowego przetwarzania. To przetwarzanie należy wykonać za pomocą filtrowania.Filtr wyodrębnia informacje tekstowe z dokumentu (usuwanie formatowania).Filtr wysyła następnie tekst do składnika dzielenie wyrazów w języku skojarzona kolumna tabela.

Dany filtr jest specyficzne dla typu danego dokumentu (.doc, .pdf, .xls, XML i tak dalej).Te filtry implementować interfejs IFilter.Aby uzyskać więcej informacji dotyczących tych typów dokumentów, należy zbadać sys.fulltext_document_types Służy do wyświetlania katalogu.

Dokumentów w formacie binarnym można przechowywać w jednym varbinary(max) lub image Kolumna. Dla każdego dokumentu SQL Server wybiera prawidłowy filtr, na podstawie rozszerzenia pliku. Ponieważ rozszerzenie pliku nie jest widoczny kiedy plik jest przechowywany w varbinary(max) lub image kolumna, rozszerzenie pliku (.doc, .xls, .pdf i tak dalej) muszą być przechowywane w oddzielnych kolumnach tabela o nazwie kolumna typu. Kolumna tego typu może być dowolnego typu danych znakowych i zawiera rozszerzenie pliku dokumentu, takie jak doc dla Microsoft Dokument programu Word. W Dokument tabela in Adventure Works, Dokument kolumna jest typu varbinary(max), a kolumny typu Rozszerzenie_plikujest typu ,nvarchar(8). Aby uzyskać więcej informacji na temat schematu tej tabela zobacz Tabela dokument (AdventureWorks).

Uwaga

Filtr może być możliwe do obsługi obiekty osadzone w obiekcie nadrzędnym, w zależności od jego wykonania.Jednak SQL Server nie konfiguruje filtry, należy postępować zgodnie z łączami do innych obiektów.

SQL Server 2008 instaluje własne filtry XML i HTML.Ponadto dowolne filtry dla Microsoft własnościowych formatów (doc, .xdoc, ppt i tak dalej), które są już zainstalowane w systemie operacyjnym również są ładowane przez SQL Server. Aby zidentyfikować filtrów, które są aktualnie załadowane na wystąpienie SQL Server, należy użyć sp_help_fulltext_system_components przechowywanej procedury, w następujący sposób:

EXEC sp_help_fulltext_system_components 'filter'; 

Zanim będzie można użyć filtrów dla innych niż Microsoft formaty, jednak należy ręcznie załadować je do wystąpienie serwera. Aby uzyskać informacje na temat instalowania dodatkowych filtrów Zobacz How to: Alter the List of Registered Word Breakers and Filters (Transact-SQL).

Aby wyświetlić kolumna Typ istniejący indeks pełnotekstowy

Historia zmian

Microsoft Learning

Dodano informacje dotyczące instalowania filtrów.