Обновление полнотекстового поиска

Область применения:SQL ServerAzure SQL Database

SQL Server обновляет полнотекстовый поиск во время установки или при подключении, восстановлении или копировании файлов базы данных и полнотекстовых каталогов из более ранней версии SQL Server.

Обновление экземпляра сервера

Для обновления на месте экземпляр SQL Server настраивается параллельно со старой версией SQL Server, а данные переносятся. Если в старой версии SQL Server установлен полнотекстовый поиск, автоматически устанавливается новая версия полнотекстового поиска. Параллельное установка означает, что каждый из следующих компонентов существует на уровне экземпляра SQL Server.

Средства разбиения по словам, парадигматические модули и фильтры
Теперь каждый экземпляр SQL Server использует отдельный комплект средств разбиения по словам, парадигматические модули и фильтры, а не те версии этих компонентов, которые предоставляет операционная система. Более того, это облегчает регистрацию и конфигурацию этих компонентов. Дополнительные сведения см. в разделах Настройка и управление средством разбиения на слова и парадигматические модули для поиска и Настройка и управление фильтрами для поиска.

Узел управляющей программы фильтрации
Узлы управляющей программы полнотекстовой фильтрации — это процессы, которые безопасно загружают внешние расширяемые компоненты индексов и запросов (например: средства разбиения по словам, парадигматические модули и фильтры), и позволяют использовать их, не нарушая целостности средства полнотекстового поиска. Экземпляр сервера использует многопоточный процесс для всех многопоточных фильтров и однопоточный процесс для однопоточных фильтров.

Заметка

SQL Server 2008 (10.0.x) представил учетную запись службы для службы запуска FDHOST (MSSQLFDLauncher). Эта служба распространяет сведения об учетной записи службы в процессы управляющей программы фильтра определенного экземпляра SQL Server. Сведения о настройке учетной записи службы см. в разделе Настройка учетной записи службы средства запуска управляющей программы полнотекстовой фильтрации.

В SQL Server 2005 (9.x) каждый полнотекстовый индекс находится в полнотекстовом каталоге, который принадлежит файловой группе, имеет физический путь и обрабатывается как файл базы данных. В SQL Server 2008 (10.0.x) и более поздних версиях полнотекстовый каталог представляет собой логический или виртуальный объект, содержащий группу полнотекстовых индексов. В связи с этим новые полнотекстовые каталоги не обрабатываются как файлы базы данных с физическим путем. Однако при обновлении любого полнотекстового каталога, содержащего файлы данных, новая файловая группа создается на том же диске. Это обеспечивает соблюдение старого поведения дискового ввода-вывода после обновления. Если существует корневой путь, то любой полнотекстовый индекс размещается в новой файловой группе. Если старый путь полнотекстового каталога недействителен, то обновление будет хранить полнотекстовый индекс в той же файловой группе, в которой хранится базовая таблица, либо, в случае с секционированной таблицей, в первичной файловой группе.

Параметры обновления полнотекстового поиска

При обновлении экземпляра SQL Server пользовательский интерфейс позволяет выбрать один из следующих вариантов полнотекстового обновления.

Импорт
Полнотекстовые индексы импортируются. Обычно импорт производится значительно быстрее перестроения. Например, если используется только один ЦП, то импорт выполняется в 10 раз быстрее, чем перестроение. Однако импортированный полнотекстовый каталог не использует новые средства разбиения слов, установленные с последней версией SQL Server. Для обеспечения согласованности результатов запроса необходимо перестроить полнотекстовые каталоги повторно.

Заметка

Перестроение может выполняться в многопоточном режиме; если доступно более 10 процессоров, то перестроение может выполниться быстрее импорта, если будет разрешено использовать все процессоры.

Если полнотекстовый каталог недоступен, перестраиваются связанные полнотекстовые индексы. Этот параметр доступен только для баз данных SQL Server 2005 (9.x).

Дополнительные сведения о влиянии импорта полнотекстового индекса см. в подразделе «Замечания по выбору режима полнотекстового обновления» далее в этом разделе.

Перестроение
Полнотекстовые каталоги перестраиваются с помощью новых и улучшенных средств разбиения по словам. Перестроение индексов может занять длительное время, а после обновления может потребоваться значительный объем ресурсов ЦП и памяти.

Сбросить
Полнотекстовые каталоги сбрасываются. При обновлении с SQL Server 2005 (9.x) файлы полнотекстового каталога удаляются, но метаданные полнотекстовых каталогов и полнотекстовых индексов сохраняются. После обновления для всех полнотекстовых индексов отключается отслеживание изменений и сканирование не запускается автоматически. После завершения обновления каталог останется пустым, пока не будет вручную запущено полное заполнение.

Замечания по выбору режима обновления полнотекстового поиска

При выборе режима обновления необходимо учитывать следующие соображения.

  • Требуется ли согласованность в результатах запроса?

    SQL Server устанавливает новые средства разбиения слов для использования полнотекстового и семантического поиска. Средства разбиения по словам используются как во время индексирования, так и при выполнении запросов. Если не выполнить перепостроение полнотекстовых каталогов, результаты поиска могут быть несогласованными. Если вы выдаете полнотекстовый запрос, который ищет фразу, которая разбивается по-разному с помощью средства разбиения слов в предыдущей версии SQL Server и текущего средства разбиения слов, документ или строка, содержащая фразу, может не быть извлечена. Это связано с тем, что индексированные фразы были разбиты с помощью логики, которая не соответствует логике, используемой в запросе. Решение заключается в том, чтобы заполнить полнотекстовые каталоги повторно (перестроить их) с помощью новых средств разбиения по словам, чтобы при индексировании и выполнении запросов использовалась одинаковая логика. Для реализации данного решения можно выбрать параметр перестроения или выполнить перестроения вручную после выбора параметра импорта.

  • Были ли полнотекстовые индексы построены в целочисленных столбцах полнотекстовых ключей?

    Перестроение выполняет внутренние оптимизации, которые в некоторых случаях могут увеличить производительность запросов обновленных полнотекстовых индексов. В частности, если в полнотекстовых каталогах пользователя содержатся полнотекстовые индексы, у которых полнотекстовый ключевой столбец базовой таблицы имеет тип данных integer, то при перестроении достигается идеальная производительность полнотекстовых запросов. В данном случае рекомендуется использовать параметр Перестроение .

    Заметка

    Применительно к полнотекстовым индексам рекомендуется, чтобы столбец, который служит полнотекстовым ключом, имел целочисленный тип данных. Дополнительные сведения см. в разделе Улучшение производительности полнотекстовых индексов.

  • Насколько важно перевести сервер в режим «в сети»?

    Импорт или перестроение отнимает много ресурсов процессора, что задерживает обновление остальных частей экземпляра сервера и перевод его в режим «в сети». Если важно перевести экземпляр сервера в режим «в сети» как можно скорее, а пользователь способен выполнить после обновления заполнение вручную, то целесообразно будет использовать режим Сброс .

Обеспечение согласованности результатов запроса после импорта полнотекстового индекса

Если при обновлении базы данных SQL Server 2005 (9.x) импортирован полнотекстовый каталог, несоответствия между запросом и содержимым полнотекстового индекса могут возникнуть из-за различий в поведении старых и новых разбиений слов. В данном случае для обеспечения полного соответствия между запросами и содержимым полнотекстового индекса следует выбрать один из следующих параметров:

  • Выполнить повторное создание полнотекстового каталога, содержащего полнотекстовый индекс (ALTER FULLTEXT CATALOGимя_каталога REBUILD).

  • Выполнить инструкцию FULL POPULATION для полнотекстового индекса (ALTER FULLTEXT INDEX ON имя_таблицы START FULL POPULATION).

Дополнительные сведения о средствах разбиения по словам см. в разделе Настройка и управление средством разбиения на слова и парадигматические модули для поиска.

Обновление файлов пропускаемых слов до списков стоп-слов

При обновлении базы данных с SQL Server 2005 (9.x) файлы шумных слов больше не используются. Однако старые файлы шумового слова хранятся в папке FTDATA\ FTNoiseThesaurusBak , и их можно использовать позже при обновлении или создании соответствующих списков стоп-слов SQL Server.

После обновления с SQL Server 2005 (9.x):

  • Если вы никогда не добавляли, не изменяли или не удаляли какие-либо файлы шумового слова в установке SQL Server 2005 (9.x), системный список стоп-слов должен соответствовать вашим потребностям.

  • Если файлы шум-word были изменены в SQL Server 2005 (9.x), эти изменения будут потеряны во время обновления. Чтобы воссоздать эти изменения, необходимо вручную внести их в соответствующий список стоп-слов . Дополнительные сведения см. в разделе ALTER FULLTEXT STOPLIST (Transact-SQL).

  • Если вы не хотите применять стоп-слова к полнотекстовых индексам (например, если вы удалили или стерли файлы шум-слов в установке SQL Server 2005 (9.x), необходимо отключить список стоп-слов для каждого обновленного полнотекстового индекса. Выполните следующую инструкцию Transact-SQL (заменив базу данных именем обновленной базы данных и таблицы именем таблицы):

    Use database;   
    ALTER FULLTEXT INDEX ON table  
       SET STOPLIST OFF;  
    GO  
    

    Предложение STOPLIST OFF удаляет фильтрацию по стоп-словам; таблица будет заполняться без фильтрации неучитываемых слов.

Резервные копии полнотекстовых каталогов и импортированные полнотекстовые каталоги

Для полнотекстовых каталогов, которые были восстановлены или сброшены во время обновления (и для новых полнотекстовых каталогов) полнотекстовый каталог является логическим понятием. Он не располагается в файловой группе. Следовательно, чтобы создать резервную копию полнотекстового каталога, следует определить все файловые группы, содержащие полнотекстовый индекс каталога, а затем последовательно создать резервные копии каждой из этих групп. Дополнительные сведения см. в разделе Создание резервных копий и восстановление полнотекстовых каталогов и индексов.

Для полнотекстовых каталогов, импортированных из SQL Server 2005 (9.x), полнотекстовый каталог по-прежнему является файлом базы данных в собственной файловой группе. Процесс резервного копирования SQL Server 2005 (9.x) для полнотекстовых каталогов по-прежнему применяется, за исключением того, что служба MSFTESQL не существует в SQL Server. Сведения о процессе SQL Server 2005 (9.x) см. в статье "Резервное копирование и восстановление полнотекстовых каталогов " в электронной документации ПО SQL Server 2005.

Перенос полнотекстовых индексов при обновлении базы данных

Файлы базы данных и полнотекстовые каталоги из предыдущей версии SQL Server можно обновить до существующего экземпляра с помощью подключения, восстановления или мастера копирования базы данных. Полнотекстовые индексы SQL Server 2005 (9.x) импортируются, сбрасываются или перестраиваются. Свойство сервера upgrade_option определяет, какой из режимов обновления полнотекстового поиска будет использоваться экземпляром сервера при обновлении базы данных.

После присоединения, восстановления или копирования любой базы данных SQL Server 2005 (9.x) более новый экземпляр база данных становится доступной немедленно и затем автоматически обновляется. В зависимости от объема индексируемых данных процесс импорта может занять несколько часов, а перестроение — в несколько (до десяти) раз больше. Обратите внимание, что если при обновлении выбран режим «Импортировать», а полнотекстовый каталог недоступен, то связанные с ним полнотекстовые индексы будут перестроены.

Изменение поведения полнотекстового обновления на экземпляре сервера

Рекомендации по восстановлению полнотекстового каталога SQL Server 2005 (9.x)

Одним из способов обновления полнотекстовых данных из базы данных SQL Server 2005 (9.x) является восстановление полной резервной копии базы данных до нового экземпляра SQL Server.

При импорте полнотекстового каталога SQL Server 2005 (9.x) можно создать резервную копию и восстановить базу данных и файл каталога. Такое же поведение, как в SQL Server 2005 (9.x):

  • В полную резервную копию базы данных будет включен полнотекстовый каталог. Чтобы ссылаться на полнотекстовый каталог, используйте его имя файла SQL Server 2005 (9.x), sysft_+catalog-name.

  • Если полнотекстовый каталог находится в режиме «вне сети», то резервное копирование завершится ошибкой.

Дополнительные сведения о резервном копировании и восстановлении полнотекстовых каталогов SQL Server 2005 (9.x) см . в электронной документации по резервному копированию и восстановлению полнотекстовых каталогови восстановлению и восстановлению полнотекстовых каталоговSQL Server 2005 (9.x).

При восстановлении базы данных в более новом экземпляре SQL Server будет создан новый файл базы данных для полнотекстового каталога. По умолчанию данный файл имеет имя ftrow_имя-каталога.ndf. Например, если вы используете имяcat1каталога, то имя по умолчанию файла базы данных SQL Server будет ftrow_cat1.ndf. Но если имя по умолчанию уже используется в целевом каталоге, новый файл базы данных будет назван ftrow_имя-каталога{GUID}.ndf(где GUID — это глобальный уникальный идентификатор нового файла).

После импорта каталогов обновляются представления sys.database_files и sys.master_files: удаляются записи каталога и устанавливается значение NULL для столбца path (путь) в sys.fulltext_catalogs .

Создание резервной копии базы данных

Восстановление резервной копии базы данных

пример

В следующем примере используется предложение MOVE в инструкции RESTORE для восстановления базы данных ftdb1SQL Server 2005 (9.x). Базы данных, журналы и файлы каталога SQL Server 2005 (9.x) перемещаются в новые расположения экземпляра СЕРВЕРА SQL Server следующим образом:

  • Файл базы данных ftdb1.mdfперемещается по адресу C:\Program Files\Microsoft SQL Server\MSSQL.1MSSQL13.MSSQLSERVER\MSSQL\DATA\ftdb1.mdf.

  • Файл журнала ftdb1_log.ldfперемещается в каталог журналов на диске журналов: log_drive:\log_directory\ftdb1_log.ldf.

  • Файлы каталогов, соответствующие каталогу sysft_cat90 , перемещаются по адресу C:\temp. После того как был выполнен импорт полнотекстовых каталогов, они будут автоматически размещены в файле базы данных «C:\ftrow_sysft_cat90.ndf», а каталог «C:\temp» будет удален.

RESTORE DATABASE [ftdb1] FROM  DISK = N'C:\temp\ftdb1.bak' WITH  FILE = 1,  
   MOVE N'ftdb1' TO N'C:\Program Files\Microsoft SQL Server\MSSQL12.MSSQLSERVER\MSSQL\DATA\ftdb1.mdf',  
    MOVE N'ftdb1_log' TO N'log_drive:\log_directory\ftdb1_log.ldf',  
    MOVE N'sysft_cat90' TO N'C:\temp';  

Присоединение базы данных SQL Server 2005

В SQL Server 2008 (10.0.x) и более поздних версиях полнотекстовый каталог представляет собой логическую концепцию, которая относится к группе полнотекстовых индексов. Полнотекстовый каталог является виртуальным объектом и не входит в какую-либо файловую группу. Однако при присоединении базы данных SQL Server 2005 (9.x), содержащей файлы полнотекстового каталога к более новому экземпляру SQL Server, файлы каталога присоединяются из предыдущего расположения вместе с другими файлами базы данных, так же, как и в SQL Server 2005 (9.x).

Состояние каждого присоединенного полнотекстового каталога в SQL Server совпадает с состоянием, что и при отключении базы данных от SQL Server 2005 (9.x). Если любой полнотекстовый индекс был приостановлен операцией отсоединения, население возобновляется на SQL Server, а полнотекстовый индекс становится доступным для полнотекстового поиска.

Если SQL Server не может найти полнотекстовый файл каталога или если полнотекстовый файл был перемещен во время операции присоединения без указания нового расположения, поведение зависит от выбранного параметра полнотекстового обновления. Если был выбран режим обновления полнотекстового поиска Импорт или Перестроение, то присоединенный полнотекстовый каталог будет перестроен. Если был выбран режим обновления полнотекстового поиска Сброс, то присоединенный полнотекстовый каталог будет сброшен.

Дополнительные сведения об отключении и подключении базы данных см. в статьях "Отсоединение и подключение базы данных" (SQL Server), CREATE DATABASE (SQL Server Transact-SQL),sp_attach_db и sp_detach_db (Transact-SQL)".

См. также

Начало работы с компонентом Full-Text Search
Настройка и управление средством разбиения на слова и парадигматические модули для поиска
Настройка и управление фильтрами для поиска