Microsoft 365에서 SharePoint용 클라우드 하이브리드 검색 계획

적용 대상:예-img-132013 yes-img-162016 yes-img-192019 yes-img-seSubscription Edition yes-img-sopSharePoint in Microsoft 365

Microsoft 365에서 SharePoint에 대한 클라우드 하이브리드 검색 을 설정하려면 신중한 계획이 필요합니다. 이 문서는 매우 안정적이고 안전하며 확장 가능한 클라우드 하이브리드 검색 솔루션을 설계하는 데 도움이 됩니다.

사용자에게 어떤 검색 환경이 필요한가요?

클라우드 하이브리드 검색을 설정했으며 온-프레미스 콘텐츠의 전체 크롤링이 완료되면 Office 365의 검색 센터에서 Microsoft 365 인덱스의 하이브리드 결과를 자동으로 표시합니다.

검색 세로 - 검색 세로는 특정 콘텐츠 집합(예: 비디오만 표시)으로 검색 결과를 좁힐 수 있습니다. 현재 SharePoint Server의 검색 센터에서 검색 세로를 사용하는 경우 Microsoft 365의 SharePoint 검색 센터에서 검색 센터를 다시 만들어야 합니다.

사이트 검색 - 검색 인덱스가 Microsoft 365로 이동하면 SharePoint Server의 문서 라이브러리에서 기존 검색이 결과 반환을 중지합니다. 사용자가 검색 인덱스와 동일한 환경에 있는 검색 센터를 사용하는 경우 검색 속도가 가장 빠르므로 Microsoft 365 Search Center에서 검색하면 더 나은 환경을 제공합니다. SharePoint Server 2010의 기존 팀 사이트와 같이 온-프레미스 SharePoint 사이트의 Microsoft 365 검색 인덱스의 결과가 필요한 경우 SharePoint Server 2013 또는 SharePoint Server 2016에서 검색을 설정할 수 있습니다. Microsoft 365 검색 인덱스의 결과를 가져오고 쿼리 페더레이션 사용을 계획하는 SharePoint Server 2013 또는 SharePoint Server 2016에서 원격 결과 원본을 계획합니다. Microsoft 365의 SharePoint는 쿼리를 처리하므로 사용자는 Microsoft 365의 SharePoint에서 지원하는 쿼리 구문을 사용해야 합니다. 클라우드 하이브리드 검색을 사용하여 온-프레미스 SharePoint에서 Microsoft 365의 결과 표시에서 자세히 알아보세요.

eDiscovery - SharePoint Server와 Microsoft 365의 SharePoint에서 eDiscovery를 별도로 설정해야 할 수 있습니다.

교차 사이트 게시 - 교차 사이트 게시는 클라우드 하이브리드 검색에서 사용할 수 없습니다.

어떤 방식으로 검색 결과를 표시할까요?

미리 보기 - 사용자가 Microsoft 365의 검색 결과를 가리키면 콘텐츠에 대한 정보 및 콘텐츠 미리 보기가 표시됩니다. 온-프레미스에서 제공되는 검색 결과의 콘텐츠에 대한 정보는 자동으로 표시되지만 이 콘텐츠에 대한 미리 보기 표시를 설정해야 합니다. Office Web Apps Server 팜을 계획하고 Office Web Apps Server를 사용하도록 SharePoint Server 2013을 구성합니다. 클라우드 하이브리드 검색을 사용하여 온-프레미스 SharePoint에서 Microsoft 365의 결과 표시에서 방법을 알아봅니다.

사용자 지정 보안 조정 - Microsoft 365의 SharePoint는 사용자 지정 보안 조정을 지원하지 않습니다.

어떤 검색 기능이 필요한가요?

SharePoint Server에서 익숙한 일부 검색 기능은 클라우드 하이브리드 검색과 다르게 작동합니다. 사용자에게 차이점을 알리도록 계획합니다.

최상의 선택 - 최상의 선택은 SharePoint Server 2010 기능입니다. 대신 Microsoft 365의 SharePoint에서 쿼리 규칙을 사용합니다.

사용자 지정 검색 범위 - 사용자 지정 검색 범위는 SharePoint Server 2010 기능입니다. 대신 Microsoft 365의 SharePoint에서 결과 원본을 사용합니다.

검색 결과의 승격/강등 - 검색 결과의 승격/강등은 SharePoint Server 2010 기능입니다. 대신 Microsoft 365의 SharePoint에서 결과 원본을 사용합니다.

온-프레미스 검색 결과 제거 - SharePoint Server의 중앙 관리에서 Search Service 애플리케이션을 선택하고 "인덱스 재설정" 옵션을 사용하여 검색 인덱스에서 모든 항목을 제거할 수 있습니다. 클라우드 Search Service 애플리케이션에 이 옵션을 사용하지 마세요. 이 옵션은 크롤링 데이터베이스에서 크롤링 기록을 삭제하지만 SharePoint Server의 클라우드 Search Service 애플리케이션과 Office 365 검색 인덱스 간에 직접 통신이 없기 때문에 Microsoft 365 인덱스에서 온-프레미스 항목을 제거하지 않습니다. 이러한 온-프레미스 항목은 Microsoft 365 인덱스에서 분리됩니다. Microsoft 365 검색 인덱스에서 모든 온-프레미스 메타데이터를 제거하려면 모든 온-프레미스 콘텐츠 원본을 제거합니다. 프로세스가 완료된 후 Microsoft 365 검색 인덱스에 남아 있는 온-프레미스 항목은 분리된 항목입니다.

SharePoint Server에서 잘 알고 있을 수 있는 검색 기능 중 일부는 클라우드 하이브리드 검색에서 사용할 수 없습니다. 사용자에게 알리도록 계획합니다.

SharePoint Server 2013 또는 SharePointServer 2016 팜의 다중 테넌시 - 하나의 SharePoint Server 2013 또는 SharePoint Server 2016 팜이 Microsoft 365의 SharePoint에 있는 하나의 테넌트에만 연결될 수 있으므로 SharePoint는 다중 테넌트 SharePoint Server 2013 또는 SharePoint Server 2016 팜에서 테넌트 격리를 유지할 수 없습니다.

사용자 지정 항목 추출 - Microsoft 365의 SharePoint는 사용자 지정 항목 추출을 지원하지 않으므로 클라우드 하이브리드 검색에서는 사용자 지정 항목 추출을 사용할 수 없습니다.

콘텐츠 향상 웹 서비스 - Microsoft 365의 SharePoint는 사용자 지정 항목 추출을 지원하지 않으므로 클라우드 하이브리드 검색에서는 콘텐츠 향상 웹 서비스 설명선을 사용할 수 없습니다.

동의어 사전 - Microsoft 365의 SharePoint는 동의어 사전을 지원하지 않으므로 클라우드 하이브리드 검색에서는 동의어 사전을 사용할 수 없습니다.

클라우드 하이브리드 검색을 설정할 때 단계 중 하나는 SharePoint Server 2013 또는 SharePoint Server 2016 검색 팜에 클라우드 Search Service 애플리케이션(클라우드 SSA)을 만드는 것입니다. 이 클라우드 SSA를 만들면 클라우드 SSA를 실행하는 서버에서 기본 검색 아키텍처가 만들어집니다. 각 검색 팜에는 하나의 클라우드 SSA만 있을 수 있지만 클라우드 SSA를 결합하면 여러 SSA를 가질 수 있습니다.

클라우드 하이브리드 검색에 대한 검색 아키텍처는 토폴로지를 구성하는 검색 구성 요소 및 데이터베이스와 해당 토폴로지를 호스트하는 서버로 구성됩니다. 토폴로지의 크롤링 구성 요소 수, 검색 구성 요소 및 데이터베이스를 호스트할 서버 및 각 서버에 필요한 하드웨어를 계획해야 합니다.

계속하기 전에 클라우드 하이브리드 검색에 대한 검색 토폴로지 알아보기를 읽고 클라우드 하이브리드 검색에 대한 검색 아키텍처의 검색 구성 요소에 대해 충분히 이해해야 합니다.

1단계: Microsoft 365에서 인덱싱할 수 있는 온-프레미스 콘텐츠의 양은 얼마나 되나요?

테넌트가 Microsoft 365의 SharePoint에 있는 풀된 스토리지 공간 1TB마다 Office 365 검색 인덱스에서 1백만 개의 온-프레미스 콘텐츠 항목을 인덱싱할 수 있습니다. 할당량이 2천만 개 항목의 임계값에 도달할 때까지 더 많은 공간을 구매하여 할당량을 늘릴 수 있습니다. 2천만 개 이상의 온-프레미스 콘텐츠 항목을 인덱싱해야 하는 경우 Microsoft 지원 문의하여 이 임계값을 높입니다.

2단계: 어떤 크기의 클라우드 검색 아키텍처가 필요한가요?

클라우드 하이브리드 검색의 경우, 클라우드 SSA를 만들 때 얻게 되는 기본 검색 아키텍처를 사용하는 것이 좋습니다.

검색 팜 서버 및 검색 구성 요소를 보여 주는 그림입니다.

회색 구성 요소는 클라우드 하이브리드 검색에서 비활성 상태이지만 표시된 대로 서버에 배치해야 합니다. 클라우드 하이브리드 검색에 대한 검색 토폴로지 알아보기에서 비활성 구성 요소에 대해 알아봅니다.

온-프레미스 전용 엔터프라이즈 검색과 마찬가지로 검색 아키텍처를 확장할 수 있습니다. 기본 차이점은 클라우드 하이브리드 검색의 경우 크롤링 구성 요소의 크기 조정만 관련이 있다는 것입니다. 크롤링을 조정해야 하는 경우 SharePoint 2016의 특정 성능 요구 사항에 대한 엔터프라이즈 검색 토폴로지 다시 디자인의 크롤링 지침을 따릅니다(크롤링에 대한 지침은 클라우드 하이브리드 검색에도 적용됨). 온-프레미스 콘텐츠를 높은 속도로 크롤링하는 경우 시스템에서 Microsoft 365 검색 인덱스에 대한 피드를 제한하여 Microsoft 365 organization 보호할 수 있습니다. 검색 아키텍처에 최대 두 개의 크롤링 구성 요소가 있는 경우 충분한 크롤링 속도가 발생합니다.

3단계: 클라우드 검색 아키텍처에 대해 어떤 하드웨어 요구 사항을 알고 있어야 하나요?

가상 머신을 사용하는 검색 아키텍처를 권장하지만 물리적 컴퓨터를 사용할 수도 있습니다. 서버를 물리적으로 또는 가상으로 실행하도록 선택에서 자세히 알아보세요.

이 표에서는 각 응용 프로그램 서버 또는 데이터베이스 서버에 필요한 최소 하드웨어 리소스 크기가 나와 있습니다.

서버 호스트 저장소 RAM 프로세서1
응용 프로그램 서버
A
100GB
16 GB
1.8GHz CPU 코어 4개
데이터베이스 서버
B
100GB
16 GB
1.8GHz CPU 코어 4개

1CPU 코어 수는 CPU 스레드 수가 아니라 여기에서 지정됩니다.

위 리소스 외에 다음에 유의하세요.

  • 각 호스트 서버에 Windows Server 운영 체제 및 SharePoint Server 프로그램 파일의 기본 설치를 위한 충분한 디스크 공간이 있는지 확인합니다. 또한 호스트 서버에 진단(예: 로깅, 디버깅 및 메모리 덤프 생성), 일상적인 작업 및 페이지 파일에 사용 가능한 하드 디스크 공간도 필요합니다. 일반적으로 80GB의 디스크 공간은 Windows Server 운영 체제 및 SharePoint Server 프로그램 파일에 충분합니다.

  • 각 데이터베이스 서버에 대해 SQL 로그 공간으로 사용될 저장소를 추가합니다. 데이터베이스를 자주 백업하도록 데이터베이스 서버를 설정하지 않은 경우 SQL 로그 공간이 많은 저장소를 사용합니다. SQL 데이터베이스를 계획하는 방법에 대한 자세한 내용은 스토리지 및 SQL Server 용량 계획 및 구성(SharePoint Server)을 참조하세요.

검색 구성 요소 및 운영 체제의 데이터를 저장소에 배포하려는 방법은 검색 성능에 영향을 줍니다. 다음과 같이 하는 것이 좋습니다.

  • 일반 성능을 갖는 세 개의 별도 저장소 볼륨 또는 파티션에 Windows Server 운영 체제 파일, SharePoint Server 프로그램 파일 및 진단 로그를 분할합니다.

  • 검색 구성 요소 데이터를 뛰어난 성능의 저장소 볼륨 또는 파티션에 별도로 저장합니다.

호스트에 SharePoint Server를 설치할 때 검색 구성 요소 데이터에 대한 사용자 지정 위치를 설정할 수 있습니다. 데이터를 저장해야 하는 호스트의 모든 검색 구성 요소는 데이터를 이 위치에 저장합니다. 나중에 이 위치를 변경하려면 해당 호스트에 SharePoint Server를 다시 설치해야 합니다.

사용 중인 저장소가 검색 구성 요소 및 데이터베이스의 트래픽을 처리할 수 있을 정도로 충분히 빠른지 확인하세요. 크롤링 데이터베이스는 IOPS 요구 사항이 있는 클라우드 하이브리드 검색에 대한 검색 아키텍처의 유일한 구성 요소입니다. 크롤링 데이터베이스에는 중간에서 높은 IOPS가 필요하며 I/O 하위 시스템의 일반적인 로드는 DPS(초당 문서 1개) 크롤링 속도당 10 IOPS입니다.

클라우드 SSA의 검색 토폴로지 는 SharePoint Server 2013 또는 SharePoint Server 2016에서 표준 SSA의 검색 토폴로지와 동일한 유형의 검색 구성 요소 및 데이터베이스로 구성됩니다. 그러나 몇 가지 차이점이 있습니다.

클라우드 하이브리드 검색에서 사용되지 않는 검색 구성 요소 및 데이터베이스 - 클라우드 하이브리드 검색에서는 콘텐츠를 처리하고 인덱스를 저장하며 분석을 처리하는 Microsoft 365입니다. 클라우드 SSA는 자체 콘텐츠 처리 구성 요소, 인덱스 구성 요소, 분석 처리 구성 요소, 링크 데이터베이스 또는 분석 데이터베이스를 사용하지 않습니다. 이러한 구성 요소와 데이터베이스는 유휴 상태입니다.

클라우드 하이브리드 검색의 검색 구성 요소와 데이터베이스 간 상호 작용 - 검색 구성 요소와 데이터베이스는 표준 SSA의 검색 토폴로지를 비교할 때 클라우드 SSA의 검색 토폴로지에서 다르게 상호 작용합니다.

콘텐츠 원본, 검색 구성 요소가 있는 검색 팜, Microsoft 365를 보여 주는 그림입니다. 콘텐츠 원본에서 크롤링 구성 요소를 경유하여 Microsoft 365에 이르는 정보 흐름입니다.

  1. 크롤링 구성 요소는 온-프레미스 팜에서 콘텐츠를 가져와 Office 365의 검색 인덱스로 보냅니다. 커넥터를 사용하여 콘텐츠 원본과 상호 작용하고 크롤링 데이터베이스를 사용하여 일반 크롤링 구성 요소처럼 크롤링하는 항목에 대한 임시 및 기록 정보를 모두 저장합니다.

  2. 검색 관리 구성 요소는 표준 SSA의 경우처럼 검색에 반드시 필요한 시스템 프로세스를 실행합니다.

  3. 클라우드 하이브리드 검색이 최적화되어 있으므로 Microsoft 365의 모든 검색을 실행하는 것이 좋습니다. 하지만 SharePoint Server에서 사이트 검색을 설정하여 Office 365 검색 인덱스에서 검색 결과를 가져올 수 있습니다. Microsoft 365 인덱스를 쿼리하기 위해 온-프레미스 사이트 모음에서 검색을 설정한 경우 이 쿼리 처리 구성 요소는 검색 상자에서 Microsoft 365 인덱스로 쿼리를 전달하고 Microsoft 365 인덱스의 결과를 검색 상자에 전달합니다.

온-프레미스 콘텐츠 크롤링 관리 방법 결정

콘텐츠 원본을 효과적으로 사용하고, 크롤링을 예약하고, 크롤링 규칙을 예약하는 등 크롤링을 관리하는 방법에 따라 크롤링 성능 및 검색 새로 고침에 영향을 줄 수 있습니다. 온-프레미스 검색에 대해서만 크롤링을 관리하기 위한 지침은 클라우드 하이브리드 검색에도 적용됩니다. SharePoint Server에서 크롤링에 대한 모범 사례를 참조하세요.

Active Directory 동기화 방법 결정

온-프레미스 콘텐츠가 크롤링, 구문 분석 및 암호화되면 각 항목에 대한 ACL(액세스 제어 목록)도 크롤링됩니다. Microsoft 365 검색 인덱스는 ACL을 항목과 함께 저장하므로 시스템에서 온-프레미스 사용자를 Microsoft 365의 동일한 사용자로 인식할 수 있어야 합니다. 온-프레미스 네트워크(Windows Server Active Directory)와 Microsoft 365 organization(Microsoft Entra ID) 간에 Active Directory 동기화를 설정한 경우 시스템은 ACL을 올바른 사용자에게 매핑하고 변환하며 사용자는 Microsoft 365 인덱스에서 보안이 잘려진 검색 결과를 얻습니다.

Active Directory를 동기화하는 방법에는 다음 두 가지가 있습니다.

  • 암호 동기화를 사용한 디렉터리 동기화

  • SSO(Single Sign-On)를 사용한 디렉터리 동기화

SSO 옵션을 선택하는 경우 SSO에 대한 백업으로 원할 경우 암호 동기화를 구성할 수 있지만 적어도 두 방법 중 하나(예: 암호 동기화 또는 SSO)를 구성해야 합니다. 온 -프레미스 환경과 Microsoft 365 통합에서 두 가지 방법을 구성하는 방법에 대해 자세히 알아봅니다.

사용자가 도메인 사용자 보안 그룹의 구성원일 때 클라우드 하이브리드 검색의 하이브리드 결과를 얻을 수 없는 이유는 무엇인가요?

일부 조직에서는 Windows Server AD(Active Directory)의 기본 보안 그룹 중 하나(예: 도메인 사용자 보안 그룹)를 사용하여 온-프레미스 콘텐츠에 대한 사용자 액세스 권한을 할당합니다.

기본적으로 Microsoft Entra 연결 동기화 도구는 동기화에서 일부 개체를 제외합니다. IsCriticalSecurityObject=true 특성이 있는 보안 그룹은 도구에서 제외하는 개체 집합 중 하나이며 도메인 사용자는 이러한 보안 그룹의 예입니다. 따라서 도메인 사용자의 구성원에 대한 액세스 권한은 Microsoft Entra ID에서 사용할 수 없습니다. 사용자가 온-프레미스 콘텐츠에 액세스할 수 있더라도 해당 콘텐츠를 검색할 때 검색 결과를 얻지 못합니다.

대신 IsCriticalSecurityObject=true가 없는 그룹(예: 모두 그룹, 인증된 사용자 그룹 또는 사용자 지정 그룹)을 사용하여 액세스 권한을 할당합니다. 개체를 제외하기 위한 조건 목록과 예기치 않은 동기화 결과에 대한 자세한 내용은 Azure Active Directory 동기화 도구를 사용할 때 하나 이상의 개체가 동기화되지 않음을 참조하세요.

조직에 중요한 온-프레미스 콘텐츠가 있나요?

일부 조직에는 규제, 법적 또는 지정학적 제약 조건으로 인해 민감한 것으로 간주되는 온-프레미스 콘텐츠가 있습니다. 경우에 따라 중요한 온-프레미스 콘텐츠의 메타데이터를 Microsoft 365 검색 인덱스에 추가하는 것이 금지됩니다. 다른 경우에는 중요한 온-프레미스 콘텐츠의 메타데이터를 Microsoft 365 검색 인덱스에 추가할 수 있지만 제한된 수의 사용자만 중요한 콘텐츠에서 검색 결과를 열 수 있습니다.

다음은 이러한 제약에 맞게 하이브리드 검색을 설정하는 방법의 두 가지 예입니다.

중요한 온-프레미스 콘텐츠의 메타데이터가 Microsoft 365 인덱스에서 허용될 경우

클라우드 하이브리드 검색을 설정하고, 올바른 사용자만 검색 결과를 선택할 때 중요한 콘텐츠에 액세스할 수 있도록 중요한 콘텐츠에 대한 액세스 권한을 신중하게 게획합니다.

중요한 온-프레미스 콘텐츠의 메타데이터가 Microsoft 365 인덱스에서 허용되지 않을 경우

클라우드 하이브리드 검색을 하이브리드 연결된 검색과 함께 설정합니다.

클라우드 하이브리드 검색, 하이브리드 페더레이션 검색 및 엔터프라이즈 검색의 조합을 보여 주는 그림입니다.

  • 중요한 콘텐츠를 제외한 모든 온-프레미스 콘텐츠를 포함하는 SharePoint Server에서 클라우드 Search Service 애플리케이션(클라우드 SSA)에 대한 콘텐츠 원본을 계획합니다. 크롤링된 콘텐츠에 대한 메타데이터는 Office 365 검색 인덱스가 추가됩니다.

  • SharePoint Server에서 엔터프라이즈 검색을 계획하여 중요한 온-프레미스 콘텐츠를 크롤링합니다. SharePoint Server에서 검색 계획을 참조하세요. 중요한 콘텐츠를 다루는 SSA에 대한 콘텐츠 원본을 계획합니다. 크롤링된 중요한 콘텐츠의 메타데이터가 SharePoint Server의 검색 인덱스로 추가됩니다.

  • 사용자가 온-프레미스 SharePoint 사이트에서 Microsoft 365 검색 인덱스의 결과가 필요한 경우 SharePoint Server의 하이브리드 연결된 검색 기능이 SharePoint Server의 검색 인덱스와 Office 365의 검색 인덱스에서 얻은 검색 결과를 표시하도록 계획하세요. SharePoint Server에 대한 하이브리드 연결된 검색 계획을 참조하세요.

사용자에게 표시하기 전에 클라우드 하이브리드 검색의 유효성 검사 계획

클라우드 SSA를 만들고 설정하고 전체 크롤링을 완료한 후 Microsoft 365 검색 센터에 온-프레미스 및 온라인 검색 결과가 모두 표시됩니다. 원래 검색 환경을 변경하지 않고 별도의 검색 센터에서 새 검색 환경의 유효성을 검사하고 조정하는 것이 좋습니다.

Microsoft 365 콘텐츠만 표시하도록 Office 365 검색 센터를 제한하는 사용자 지정 결과 원본을 계획합니다. 다음 그림에서는 하이브리드 검색 결과의 유효성을 검사하고 튜닝할 수 있는 환경을 보여 줍니다.

그림은 SharePoint Server 콘텐츠 팜 및 Microsoft 365 둘 다로부터 Office 365 인덱스 내용을 입력하는 방법을 보여 줍니다.

  1. 온-프레미스 콘텐츠. 크롤링하는 동안 이 콘텐츠의 메타데이터가 Microsoft 365 검색 인덱스로 추가됩니다.

  2. Microsoft 365 콘텐츠. 크롤링하는 동안 이 콘텐츠의 메타데이터가 Microsoft 365 검색 인덱스로 추가됩니다.

  3. 기본(또는 기존) Microsoft 365 검색 센터. 검색 결과가 Microsoft 365 콘텐츠만 표시하도록 제한하는 이 검색 센터에 대한 사용자 지정 결과 원본을 만듭니다. .

  4. 하이브리드 검색 결과가 표시되는 방식의 유효성을 검사하고 조정하는 새로운 Microsoft 365 검색 센터. 이 검색 센터는 기본 결과 원본을 사용하며 온-프레미스 및 Microsoft 365 콘텐츠 모두의 검색 결과를 표시합니다. 테스터와 관리자만 이 사이트에 액세스할 수 있도록 액세스를 설정합니다.

참고

튜닝하는 동안 원래 검색 환경을 변경하지 않고 유지할 수 있지만 원래 Office Delve 환경을 변경하지 않고 유지할 수는 없습니다. 온-프레미스 콘텐츠의 메타데이터가 Office 365 검색 인덱스에 있으면 Delve에서 이 콘텐츠를 표시합니다.

[Microsoft 365에서 SharePoint에 대한 클라우드 하이브리드 검색에 대해 알아보기] (microsoft 365.md SharePoint에 대한 learn-about-cloud-hybrid-search-for-SharePoint)

클라우드 하이브리드 검색 구성 - 로드맵

SharePoint의 하이브리드 검색