Поделиться через


Планирование гибридного облачного поиска для SharePoint

 

**Последнее изменение раздела:**2017-12-05

Чтобы настроить облачный гибридный поиск для SharePoint, необходимо тщательное планирование. Эта статья поможет вам разработать надежное, защищенное и масштабируемое решение для облачного гибридного поиска.

Какие функции поиска необходимы пользователям?

Когда облачный гибридный поиск будет настроен, а полный обход локального контента будет завершен, в центре поиска Office 365: автоматически появятся гибридные результаты из индекса Office 365:.

Нужны ли пользователям другие типы поиска?

Вертикали поиска ограничивают результаты поиска определенным набором контента, например только видео. Если в настоящее время вы используете вертикаль поиска в центре поиска SharePoint Server, то ее необходимо воссоздать в центре поиска SharePoint Online в Office 365:.

Поиск по сайтусуществующая поисковая система в библиотеках документов SharePoint Server перестает возвращать результаты при перемещении индекса поиска в Office 365:. Поиск выполняется быстрее всего, если пользователя применяют центры поиска, находящиеся в той же среде, что и поисковый индекс, поэтому центр поиска Office 365: обеспечивает наибольшее удобство работы. Если пользователям необходимы результаты из индекса поиска Office 365: на локальных сайтах SharePoint, например существующих сайтах групп в SharePoint Server 2010, то вы можете настроить поиск из SharePoint Server 2013 или SharePoint Server 2016. Запланируйте удаленный источник результатов в SharePoint Server 2013 или SharePoint Server 2016, который получает результаты из индекса поиска Office 365:, и использование федерации запросов. SharePoint Online в Office 365: обрабатывает ваши запросы, поэтому пользователям потребуется использовать синтаксис запросов, поддерживаемый в SharePoint Online. Дополнительные сведения см. в статье Отображение результатов из Office 365 в локальной среде SharePoint с облачным гибридным поиском.

Обнаружение электронных данных можно настроить отдельно для SharePoint Server и SharePoint Online в Office 365:.

Публикация на нескольких сайтах недоступна для облачного гибридного поиска.

Как должны отображаться результаты поиска?

Предварительный просмотр. Когда пользователь наводит указатель мыши на результат поиска из Office 365:, отображаются сведения о его содержимом, а также окно предварительного просмотра. Сведения о содержимом результатов поиска из локальной среды отображаются автоматически, но для этого контента необходимо настроить предварительный просмотр. Запланируйте ферму серверов Office Web Apps и настройте SharePoint Server 2013 на использование сервера Office Web Apps. Сведения о том, как это сделать, см. в статье Отображение результатов из Office 365 в локальной среде SharePoint с облачным гибридным поиском.

Настраиваемая фильтрация по ролям безопасности не поддерживается для SharePoint Online в Office 365:.

Какие функции поиска вам необходимы?

Некоторые функции поиска, знакомые вам по SharePoint Server, могут по-другому работать с облачным гибридным поиском. Запланируйте, когда вы сообщите пользователям об отличиях.

Наиболее подходящие элементы — это функция SharePoint Server 2010. В SharePoint Online в Office 365: используйте правила запросов.

Настраиваемые области поиска — это функция SharePoint Server 2010. В SharePoint Online в Office 365: используйте источники результатов.

Повышение и понижение уровня результатов поиска — это функция SharePoint Server 2010. В SharePoint Online в Office 365: используйте источники результатов.

Удаление локальных результатов поиска. В Центре администрирования SharePoint Server можно выбрать приложение службы поиска и использовать команду "Сброс индекса", чтобы удалить все элементы из индекса поиска. Не используйте эту команду для приложения облачной службы поиска, так как при этом из баз данных обхода будет удален журнал обхода контента, но из индекса Office 365: не будут удалены локальные элементы. Это вызвано тем, что между приложением облачной службы поиска в SharePoint Server и индексом поиска в Office 365: нет прямой связи. Эти локальные элементы становятся потерянными объектами в индексе Office 365:. Если вы хотите удалить все локальные метаданные из индекса поиска Office 365, удалите все локальные источники контента. Все локальные элементы, оставшиеся в индексе поиска Office 365 после завершения процесса, становятся потерянными объектами.

Некоторые функции поиска, знакомые вам по SharePoint Server, недоступны для облачного гибридного поиска. Запланируйте, когда вы сообщите об этом пользователям.

Мультитенантность в ферме SharePoint Server 2013 или SharePoint Server 2016. Ферму SharePoint Server 2013 или SharePoint Server 2016 можно присоединить только к одному клиенту из SharePoint Online в Office 365:, поэтому в SharePoint Online невозможно сохранить изоляцию клиентов мультитенантной фермы SharePoint Server 2013 или SharePoint Server 2016.

Извлечение настраиваемых объектов недоступно для облачного гибридного поиска, так как SharePoint Online в Office 365: не поддерживает эту функцию.

Веб-службу обогащения контента невозможно вызывать при использовании облачного гибридного поиска, так как SharePoint Online в Office 365: не поддерживает извлечение настраиваемых объектов.

Тезаурусы недоступны для облачного гибридного поиска, так как SharePoint Online в Office 365: не поддерживает их.

Планирование архитектуры поиска в SharePoint Server для облачного гибридного поиска

Один из этапов настройки облачного гибридного поиска — создание приложения облачной службы поиска в поисковой ферме SharePoint Server 2013 или SharePoint Server 2016. При создании приложения облачной службы поиска на соответствующем сервере создается поисковая архитектура по умолчанию. В каждой поисковой ферме может быть только одно приложение облачной службы поиска, но вместе с ним можно использовать несколько других приложений службы поиска.

Архитектура облачного гибридного поиска состоит из поисковых компонентов и баз данных, образующих топологию, и серверов, на которых размещается эта топология. При планировании топологии необходимо определить, сколько требуется компонентов обхода контента, на каких серверах будут размещаться поисковые компоненты и базы данных, а также какое оборудование потребуется для каждого сервера.

Прежде чем можно приступить к работе, следует прочитать сведения о топологии поиска для облачных гибридного поиска , чтобы ознакомиться с компонентами поиска в архитектуре поиска для облачных гибридного поиска.

Шаг 1. Сколько локального контента можно индексировать в Office 365:?

На каждый терабайт места в пуле, доступного клиенту в SharePoint Online, в индекс поиска Office 365: можно добавить 1 млн элементов локального контента. Вы можете приобретать дополнительное место, чтобы повышать квоту, пока она не достигнет 20 млн элементов. Если вам нужно индексировать более 20 млн элементов локального контента, обратитесь в службу поддержки Microsoft чтобы повысить этот порог.

Шаг 2. Каким должен быть размер архитектуры облачного поиска?

Для облачного гибридного поиска рекомендуем использовать стандартную поисковую архитектуру, устанавливаемую при создании приложения облачной службы поиска:

Иллюстрация, на которой показана ферма поиска с серверами и компонентами поиска.

Серый компоненты неактивны в облаке гибридного поиска, но они по-прежнему должны быть помещены на серверах, как показано. Ознакомьтесь со сведениями о неактивных компоненты в сведения о топологии поиска для облачных гибридного поиска.

Как и в случае поиска в локальной корпоративной среде, архитектуру поиска можно масштабировать. Основное отличие заключается в том, что для облачного гибридного поиска достаточно масштабировать компонент обхода контента. Если вам нужно настроить обход контента, следуйте инструкциям из статьи Изменение топологии корпоративного поиска для выполнения определенных требований к производительности в SharePoint 2016 (руководство по обходу также применимо к облачному гибридному поиску). Обратите внимание, что в случае быстрого обхода локального контента система может регулировать отправку элементов в индекс поиска Office 365: для защиты клиента Office 365:. Если ваша архитектура поиска содержит не более двух компонентов обхода, этого должно быть достаточно для приемлемой скорости обхода контента.

Шаг 3. Каковы требования к оборудованию для архитектуры облачного поиска?

Выбор между физическими и виртуальными серверами для облачного гибридного поиска

Рекомендуем использовать архитектуру поиска с виртуальными машинами. Однако вы также можете использовать физические компьютеры. Дополнительные сведения см. в статье Выбор между физическими и виртуальными серверами.

Выбор аппаратных ресурсов для серверов узлов облачного гибридного поиска

В этой таблице показан минимальный объем аппаратных ресурсов, необходимых каждому серверу приложений или баз данных.

Сервер На узле Хранилище ОЗУ Processor1

Сервер приложений

A

100 ГБ

16 ГБ

1,8 ГГц, 4 ядра ЦП

Сервер базы данных

B

100 ГБ

16 ГБ

1,8 ГГц, 4 ядра ЦП

1Здесь указано количество ядер, а не потоков ЦП.

Помимо вышеуказанных требований следует учитывать приведенные ниже рекомендации.

  • Убедитесь, что на каждом сервере узла достаточно дискового пространства для базовой установки операционной системы Windows Server и для программных файлов SharePoint Server. На сервере узла также необходимо свободное дисковое пространство для диагностических целей, например для ведения журнала, отладки и создания дампов памяти по ежедневно выполняемым операциям, а также для файла подкачки. Как правило, для операционной системы Windows Server и программных файлов SharePoint Server достаточно 80 ГБ дискового пространства.

  • Увеличьте объем хранилища для пространства журналов SQL каждого сервера базы данных. Если на сервере баз данных не настроено частое резервное копирование баз данных, пространство журналов SQL занимает много места. Дополнительные сведения о планировании баз данных SQL см. в статье Настройка и планирование загрузки SQL Server и хранилища (SharePoint Server).

Планирование производительности хранилища для облачного гибридного поиска

Способ доставки данных от компонентов поиска и операционной системы в рамках хранилища влияет на производительность поиска. Для получения хороших результатов можно сделать следующее.

  • Разделите файлы операционной системы Windows Server, программные файлы SharePoint Server и журналы диагностики по трем отдельным томам или разделам хранилища, обладающим обычной производительностью.

  • Храните данные компонентов поиска в отдельном томе или разделе хранилища, обладающем высокой производительностью.

Совет

Вы можете выбрать настраиваемое расположение для данных компонента поиска при установке SharePoint Server на узле. Любой компонент поиска на узле, которому требуется хранить данные, будет хранить их в указанном расположении. Чтобы изменить его, необходимо переустановить SharePoint Server на этом узле.

Убедитесь, что ваше хранилище работает достаточно быстро для обработки трафика от поисковых компонентов и баз данных. База данных обхода контента — это единственный компонент архитектуры облачного гибридного поиска, на который распространяются требования к количеству операций ввода-вывода в секунду. Для базы данных обхода контента требуется средняя или высокая скорость ввода-вывода. Типичная нагрузка на подсистему ввода-вывода составляет 10 операций на 1 документ в секунду.

Сведения о топологии облачного гибридного поиска

Поисковая топология для приложения облачной службы поиска состоит из таких же поисковых компонентов и баз данных, что и топология стандартного приложения службы поиска в SharePoint Server 2013 или SharePoint Server 2016. Однако существуют некоторые различия.

Неиспользуемые поисковые компоненты и базы данных для облачного гибридного поиска. В случае облачного гибридного поиска Office 365: обрабатывает контент и данные аналитики, а также хранит индекс. Приложение облачной службы поиска не использует собственные компоненты обработки контента, индексирования и обработки аналитических данных, а также базу данных ссылок и базу данных аналитики. Эти компоненты и базы данных бездействуют.

Взаимодействие между поисковыми компонентами и базами данных в топологии приложения облачной службы поиска происходит не так, как в топологии стандартного приложения службы поиска.

Иллюстрация, на которой показаны источники контента, ферма поиска с компонентами поиска и Office 365. Потоки данных, направляющиеся из источников контента через компонент обхода в Office 365.

  1. Компонент обхода получает контент из локальной фермы и отправляет его в индекс поиска Office 365:. Как и обычный компонент обхода, он использует соединители для взаимодействия с источниками контента и базу данных обхода для хранения временных сведений об элементах и ведения журнала обхода.

  2. Как и в случае стандартного приложения службы поиска, компонент администрирования запускает системные процессы, необходимые для поиска.

  3. Рекомендуем всегда выполнять поиск из Office 365:, так как облачный гибридный поиск оптимизирован для этого. Но вы можете настроить поиск по сайтам в SharePoint Server, чтобы получать результаты из индекса поиска в Office 365:. Если поисковая система в локальном семействе веб-сайтов настроена на отправку запросов к индексу Office 365:, то этот компонент обработки запросов будет передавать запросы из поля поиска в индекс Office 365:, а результаты — из индекса Office 365: в поле поиска.

Выбор способа управления обходом локального контента

На производительность обхода и актуальность поиска влияет способ управления обходом контента, например эффективное использование источников контента, планирование обхода и правила обхода контента. Руководство по управлению обходом контента для локального поиска также применимо к облачному гибридному поиску. См. статью Best practices for crawling in SharePoint Server.

Выбор способа синхронизации каталогов Active Directory

При обходе, анализе и шифровании локального контента также выполняется обход списков управления доступом (ACL) для каждого элемента. В индексе поиска Office 365: списки управления доступом хранятся вместе с элементами, поэтому система должна иметь возможность узнать локального пользователя, когда он работает в Office 365:. При настройке синхронизации Active Directory между локальной сетью (Windows Server Active Directory) и клиентом Office 365: (Windows Azure Active Directory) система сопоставляет и переводит списки управления доступом для соответствующих пользователей, которые, в свою очередь, получают из индекса Office 365: результаты поиска, отфильтрованные по ролям безопасности.

Синхронизировать каталоги Active Directory можно двумя способами:

  • синхронизации каталогов с синхронизацией паролей;

  • синхронизации каталогов с единым входом (SSO).

Если вы выберете вариант с использованием единого входа, вы также можете при желании настроить синхронизацию паролей в качестве резервного варианта, но необходимо настроить хотя бы одну из этих функций (синхронизацию паролей или единый вход). Дополнительные сведения и руководство по настройке этих двух методов см. в статье Интеграция Office 365 с локальными средами.

Почему пользователи не могут получать гибридные результаты с помощью облачного гибридного поиска, если они состоят в группе безопасности "Пользователи домена"?

В некоторых организациях для назначения прав доступа к локальному контенту используется одна из стандартных групп безопасности Windows Server Active Directory (AD), например "Пользователи домена".

Средство синхронизации Azure Active Directory Connect по умолчанию исключает некоторые объекты из синхронизации. В частности, исключаются группы безопасности с атрибутом IsCriticalSecurityObject=true. К ним относится группа безопасности "Пользователи домена". Следовательно, права доступа для участников группы "Пользователи домена" недоступны в Azure Active Directory (AAD). Даже если у пользователей есть доступ к локальному контенту, они не получают результаты при поиске такого контента.

Вместо этого вы можете назначать права доступа с помощью группы без атрибута IsCriticalSecurityObject=true, например "Все", "Прошедшие проверку" или настраиваемой группы. Список условий для исключения объектов и дополнительные сведения о непредвиденных результатах синхронизации см. в статье При использовании средства синхронизации Azure Active Directory не синхронизируется один или несколько объектов.

Есть ли в вашей организации конфиденциальный локальный контент?

В некоторых организациях есть локальный контент, который считается конфиденциальным из-за нормативных, правовых или геополитических ограничений. В некоторых случаях запрещается добавлять метаданные конфиденциального локального контента в индекс поиска Office 365:. В других случаях метаданные конфиденциального локального контента можно добавлять в индекс поиска Office 365:, но только некоторым пользователям разрешается открывать результаты поиска для такого контента.

Ниже представлено два примера настройки гибридного поиска с соблюдением этих ограничений.

Если метаданные конфиденциального локального контента разрешается добавлять в индекс Office 365:

Настройте облачный гибридный поиск и тщательно планируйте права доступа к конфиденциальному контенту, чтобы только у нужных пользователей был доступ к конфиденциальному контенту при выборе результата поиска.

Если метаданные конфиденциального локального контента запрещено добавлять в индекс Office 365:

Настройте облачный гибридный поиск в сочетании с гибридным федеративным поиском.

Иллюстрация комбинированной настройки гибридного облачного поиска, гибридного федеративного поиска и корпоративного поиска.

  • Запланируйте источники контента для приложения облачной службы поиска в SharePoint Server, которые предоставляют весь локальный контент, кроме конфиденциального. Метаданные контента, для которого выполнен обход, добавляются в индекс поиска Office 365:.

  • Запланируйте поиск в корпоративной среде в SharePoint Server для обхода конфиденциального локального контента, как описано в статье Планирование поиска в SharePoint Server. Запланируйте для приложения службы поиска источники контента, предоставляющие конфиденциальное содержимое. Метаданные конфиденциального контента, обход которого выполнен, добавляются в индекс поиска SharePoint Server.

  • Если пользователям необходимы результаты из индекса поиска Office 365: на локальных сайтах SharePoint, запланируйте гибридный федеративный поиск из SharePoint Server так, чтобы отображались результаты из индексов поиска SharePoint Server и Office 365:. См. статью Plan hybrid federated search for SharePoint Server.

Планирование проверки облачного гибридного поиска перед его предоставлением пользователям

После создания и настройки приложения облачной службы поиска и завершения полного обхода контента в центре поиска Office 365: будут отображаться результаты как из локальной среды, так и из Интернета. Рекомендуем проверить и настроить новую поисковую среду в отдельном центре поиска, оставив исходную поисковую среду без изменений.

Запланируйте настраиваемый источник результатов, который ограничивает центры поиска в Office 365: так, чтобы в них отображался только контент из Office 365:. На приведенном ниже рисунке показана среда, в которой можно проверить и настроить отображение результатов гибридного поиска.

Illustration showing how content enters the Office 365 index from both a SharePoint Server content farm and from Office 365.

  1. Локальный контент. Во время обхода метаданные этого контента добавляются в индекс поиска Office 365:.

  2. Контент Office 365:. Во время обхода метаданные этого контента добавляются в индекс поиска Office 365:.

  3. Стандартный (или имеющийся) центр поиска Office 365:. Вы создаете для этого центра поиска настраиваемый источник результатов, который ограничивает результаты поиска так, чтобы отображался только контент из Office 365:.

  4. Новый центр поиска Office 365: для проверки и настройки отображения гибридных результатов поиска. Этот центр поиска использует источник результатов по умолчанию и включает в результаты как локальный контент, так и контент из Office 365:. Этот сайт должен быть доступен только тестировщикам и администраторам.

Примечание

При настройке вы можете оставить исходную среду поиска без изменений, но исходную среду Office Delve придется изменить. Когда метаданные локального контента появятся в индексе поиска Office 365:, этот контент появится в Delve.

Статьи по теме

Сведения о гибридном облачном поиске для SharePoint
План настройки облачного гибридного поиска
Гибридный поиск в SharePoint