Поделиться через


Рекомендации по упорядочению контента для поиска в SharePoint Server

ОБЛАСТЬ ПРИМЕНЕНИЯ:yes-img-132013 yes-img-162016 yes-img-192019 yes-img-seSubscription Edition no-img-sopSharePoint в Microsoft 365

Эти рекомендации по упорядочиванию контента SharePoint Server и применению полезных метаданных помогут обеспечить включение в индекс поиска нужного контента и его наличие в результатах поиска.

Хранение самого важного контента в SharePoint

Если это возможно, храните самый важный контент в SharePoint и выполняйте обход и индексирование как можно большего объема важного контента. Если вам не удается выполнить обход контента и индексировать его, рассмотрите возможность федеративного создания результатов из других источников в локальных результатах поиска.

Попробуйте организовать контент с похожим значением и важностью в расположенные рядом структуры сайта. Поисковая система автоматически выведет относительную важность, но вы можете напрямую повлиять на важность сайтов, определив достоверный страницы. Дополнительные сведения см. в разделе Указание достоверных страниц.

Важно знать, какое содержимое следует сканировать и включить в индекс поиска, но также важно знать, какое содержимое не следует выполнять обход. Например, вы не хотите выполнять обход и индексирование общих папок резервного копирования. Вы также должны установить процедуры архивации старого контента, удаления низкокачественного контента и поощрять пользователей добавлять даты истечения срока действия в объявления.

Упорядочивание контента в иерархиях и использование естественного языка

Упорядочив содержимое SharePoint в естественных иерархиях, пользователи не только смогут понять, где они могут найти и отправить содержимое, но и упростить поисковую систему для ранжирования содержимого и возврата результатов поиска, которые лучше соответствуют намерениям пользователя.

Плоская структура Структура с иерархией
http://Europe
http://Asia
http://sales
http://sales/Europe
http://sales/Asia

URL-адреса и другие метаданные файлов, такие как имена файлов, анализируются лингвистически поисковой системы. Если вы используете естественный язык для URL-адресов и метаданных, поисковой системе будет легче понять, какая информация находится на сайте или в файле, и она сможет указать соответствующую оценку в результатах. Поисковой системе (и пользователям) гораздо проще понять URL-адрес и имя файла, чем http://sales/Europe/presentations/phones.ppt разобраться в http://slseur/p_phones.ppt.

Рекомендация для пользователей вводить более полные и согласованные метаданные для сайтов и контента

Метаданные — это данные, которые предоставляют дополнительную информацию об одном или нескольких аспектах сайтов и контента, например создатель сайта, дата создания сайта и цель контента или сайта. Согласованные и полные метаданные улучшают качество самого контента и также упрощают для поисковой системы обнаружение связей между контентом и позволяют ей предоставлять более точные и релевантные результаты поиска.

Вот некоторые из примеров важных метаданных, которые пользователи должны вводить:

  • заголовок документа;

  • описание сайта;

  • авторы документа;

  • дата создания контента.

Для некоторых типов документов, таких как документы PowerPoint и Word, поисковая система извлекает дополнительные метаданные, такие как заголовки и подзаголовки, из контента и использует эту информацию для возврата нужных результатов поиска и предоставления полноценных сводок о документах.

Чтобы предоставить правильные результаты поиска для пользователей, важно также ввести данные личных сайтов и профилей пользователей, чтобы эта информация могла использоваться в качестве метаданных поисковой системой.

Управление многоязычным контентом

Поисковая система обнаруживает язык большинства контента автоматически. Следующие рекомендации позволяют поисковой системе не ошибиться при определении языка.

  • Если возможно, храните контент на разном языке на разных сайтах. Если система поиска не может определить язык определенного элемента контента, предполагается, что он находится на языке сайта, на котором он хранится.

  • Избегайте смешивания языков в контенте и метаданных контента. Используйте в метаданных тот же язык, что и в самом контенте.

  • Избегайте смешивания языков в одном элементе метаданных. В основном, это применимо к URL-адресам.

Указание достоверных страниц

Вы можете использовать функцию достоверных страниц в приложении службы поиска для указания сайтов SharePoint с самой релевантной информацией. Результаты поиска с достоверных страниц приоритетнее других результатов поиска.

Вы можете указать три степени достоверности и также указать недостоверные сайты. При определении сайта как достоверного сайты, подключаемые к достоверной странице через гиперссылке также поднимаются в результатах на основе их близости к достоверной странице. Самая достоверная страница содержит ссылки на наиболее релевантную информацию. URL-адреса, обозначенные как недостоверные, получают меньшую оценку, чем другие сайты.

Рекомендуется указывать только небольшое число (четыре–пять) полномочных страниц. Если указать много авторитетных страниц, трудно предсказать влияние на ранжирование результатов поиска.

Подробнее см. в статье Настройка достоверных страниц в SharePoint Server.