Share via


SharePoint Server의 엔터프라이즈 검색 아키텍처 계획

적용 대상:yes-img-132013 yes-img-162016 yes-img-192019 yes-img-seSubscription Edition no-img-sopSharePoint in Microsoft 365

검색 아키텍처에는 검색 구성 요소와 데이터베이스가 포함됩니다. 검색을 사용하려는 위치(엔터프라이즈 또는 인터넷 사이트)에 따라 검색 아키텍처 구성 방법이 달라집니다. 검색 아키텍처를 작성할 때는 고가용성/내결함성, 콘텐츠의 양, 그리고 초당 예상 페이지 보기 및 쿼리 수 등의 요소를 고려해야 합니다.

각 사용 사례의 검색 토폴로지에 대한 자세한 내용은 기술 다이어그램 SharePoint Server 2016의 엔터프라이즈 검색 아키텍처SharePoint Server 2016용 인터넷 사이트 검색 아키텍처를 참조하세요.

검색 구성 요소 및 검색 데이터베이스 개요

다음 표에는 사용 가능한 모든 검색 구성 요소 및 검색 데이터베이스에 대한 간략한 설명이 나와 있습니다. 검색 구성 요소 및 데이터베이스가 상호 작용하는 방법에 대한 자세한 내용은 SharePoint Server 2016 기술 다이어그램에 대한 검색 아키텍처 를 참조하세요.

검색 구성 요소

검색 구성 요소 이름 설명
크롤링 구성 요소 콘텐츠 원본을 크롤링하여 크롤링된 항목에서 크롤링 속성 및 메타데이터를 수집한 다음 해당 정보를 콘텐츠 처리 구성 요소에 보냅니다.
콘텐츠 처리 구성 요소 크롤링된 항목을 변환하여 인덱스 구성 요소로 보냅니다. 또한 크롤링 속성을 관리 속성에 매핑합니다.
분석 처리 구성 요소 검색 분석 및 사용 현황 분석을 수행합니다.
인덱스 구성 요소 콘텐츠 처리 구성 요소에서 처리된 항목을 받아 검색 인덱스에 씁니다. 또한 들어오는 쿼리를 처리하고, 검색 인덱스에서 정보를 검색하여 결과 집합을 쿼리 처리 구성 요소로 다시 보냅니다.
쿼리 처리 구성 요소 들어오는 쿼리를 분석합니다. 이를 통해 정밀도, 회수 기능 및 관련성을 최적화할 수 있습니다. 쿼리는 인덱스 구성 요소로 전송되며, 인덱스 구성 요소는 쿼리에 대한 검색 결과 집합을 반환합니다.
검색 관리 구성 요소 검색을 위한 시스템 프로세스를 실행하고 새 검색 구성 요소 인스턴스를 추가 및 초기화합니다.

검색 데이터베이스

검색 데이터베이스 이름 설명
크롤링 데이터베이스 문서, URL 등 크롤링된 항목에 대한 추적 정보와 기록 정보가 저장됩니다. 마지막 크롤링 시간, 마지막 크롤링 ID 및 마지막 크롤링 중의 업데이트 유형(추가/업데이트/삭제)과 같은 정보도 저장됩니다.
링크 데이터베이스 콘텐츠 처리 구성 요소에서 추출한 처리되지 않은 정보와 검색 클릭 관련 정보가 저장됩니다. 분석 처리 구성 요소가 이 정보를 분석합니다.
분석 보고 데이터베이스 사용 현황 분석 결과를 저장합니다.
검색 관리 데이터베이스 검색 구성 데이터를 저장합니다.

크롤링 구성 요소

크롤링 구성 요소는 콘텐츠 원본을 크롤링합니다. 파일 공유, SharePoint Server 콘텐츠, 기간 업무 애플리케이션 등과 같은 많은 콘텐츠 원본을 크롤링할 수 있습니다. 정보를 검색하기 위해 크롤링 구성 요소는 적절한 인덱싱 커넥터 또는 프로토콜 처리기를 호출하여 콘텐츠 원본에 연결합니다. 콘텐츠를 검색한 후 크롤링 구성 요소는 크롤링된 항목을 콘텐츠 처리 구성 요소에 전달합니다.

콘텐츠 원본 크롤링에 대한 자세한 내용은 SharePoint Server의 크롤링 및 페더레이션 계획을 참조하세요.

콘텐츠 처리 구성 요소

콘텐츠 처리 구성 요소는 크롤링된 항목을 처리하고 이러한 항목을 인덱스 구성 요소로 보냅니다. 콘텐츠 처리 구성 요소는 문서 구문 분석 및 속성 매핑과 같은 작업을 수행합니다. 또한 언어 감지 및 엔터티 추출과 같은 언어 처리도 수행합니다. 구성 요소는 크롤링된 항목을 검색 인덱스에 포함된 아티팩트로 변환합니다. 콘텐츠 처리 구성 요소는 링크 데이터베이스에 대한 링크 및 URL에 대한 정보도 씁니다.

콘텐츠 처리에 대한 자세한 내용은 SharePoint Server의 크롤링 및 페더레이션 계획을 참조하세요.

분석 처리 구성 요소

분석 처리 구성 요소는 검색 분석과 사용 현황 분석의 두 가지 분석 유형을 수행합니다. 이 구성 요소는 이러한 분석 정보를 사용하여 검색 관련성을 향상시키고, 검색 보고서를 만들고, 추천 항목 및 딥 링크를 생성합니다.

  • 검색 분석은 링크 데이터베이스에서 링크, 항목을 클릭한 횟수, 고정 텍스트, 사용자 관련 데이터 및 메타데이터와 같은 정보를 추출합니다. 이 정보는 관련성에 중요한 영향을 줍니다.

  • 사용 현황 분석은 이벤트 저장소를 통해 프런트 엔드에서 수신된 사용 현황 로그 정보를 분석합니다. 사용 현황 분석은 사용 현황 및 통계 보고서를 생성합니다.

분석의 결과는 검색 인덱스의 항목에 추가됩니다. 또한 사용 현황 분석의 결과는 분석 보고 데이터베이스에 저장됩니다.

자세한 내용은 SharePoint Server의 분석 처리 개요를 참조하세요.

인덱스 구성 요소

검색 인덱스는 파티션이라는 고유한 부분으로 구분할 수 있습니다. 검색 인덱스는 모든 인덱스 파티션을 합친 것입니다. 각 인덱스 파티션에는 동일한 정보를 포함하는 인덱스 복제본이 하나 이상 포함됩니다. 내결함성 및 중복성을 얻으려면 각 인덱스 파티션에 대해 추가 인덱스 복제본을 만든 후 여러 서버로 분산합니다.

인덱스 구성 요소는 인덱스 복제본의 논리 표시입니다. 검색 토폴로지에서는 각 인덱스 복제본에 대해 인덱스 구성 요소 하나를 프로비저닝해야 합니다.

인덱스 구성 요소는 다음을 수행합니다.

  • 콘텐츠 처리 구성 요소로부터 처리된 항목을 받아 인덱스 파일에 해당 항목을 씁니다. 인덱스 파일은 인덱스 구성 요소를 호스팅하는 서버의 디스크에 저장됩니다.

  • 쿼리 처리 구성 요소로부터 쿼리를 받아 결과 집합을 반환합니다.

검색 스키마 및 검색 인덱스에 대한 자세한 내용은 SharePoint Server의 검색 스키마 개요를 참조하세요.

쿼리 처리 구성 요소

쿼리 처리 구성 요소는 쿼리와 결과를 분석 및 처리합니다. 또한 단어 분리 및 형태소 분석과 같은 언어 처리를 수행합니다. 이 구성 요소는 검색 프런트 엔드에서 받은 쿼리를 분석 및 처리하여 정밀도, 회수 기능 및 관련성을 최적화합니다. 처리된 쿼리는 인덱스 구성 요소로 전송됩니다. 그러면 인덱스 구성 요소는 처리된 쿼리를 기준으로 하는 결과 집합을 쿼리 처리 구성 요소로 반환하며, 쿼리 처리 구성 요소는 해당 결과 집합을 처리한 후에 검색 프런트 엔드로 반환합니다.

자세한 내용은 SharePoint Server의 쿼리 및 주문 결과 변환 계획을 참조하세요.

검색 관리 구성 요소

검색 관리 구성 요소는 검색을 위한 시스템 프로세스를 실행합니다. 이 구성 요소는 다른 검색 구성 요소의 인스턴스를 추가하고 초기화하는 프로비저닝을 수행합니다.

크롤링 데이터베이스

크롤링 데이터베이스는 크롤링된 항목에 대한 추적 정보와 기록 정보를 저장합니다. 예를 들어 마지막 크롤링 시간, 마지막 크롤링 ID 및 마지막 크롤링 중의 업데이트 유형에 대한 정보가 저장됩니다.

링크 데이터베이스는 콘텐츠 처리 구성 요소에서 추출한 정보를 저장합니다. 또한 검색 클릭에 대한 정보를 저장합니다. 사용자가 검색 결과 페이지에서 검색 결과를 클릭한 횟수입니다. 이 정보는 분석 처리 구성 요소에서 분석할 수 있도록 처리되지 않은 상태로 저장됩니다.

분석 보고 데이터베이스

분석 보고 데이터베이스는 사용 현황 분석의 결과를 저장합니다. 또한 분석의 통계 정보를 저장합니다. SharePoint Server는 이 정보를 사용하여 다른 통계를 표시하는 Excel 보고서를 만듭니다.

검색 관리 데이터베이스

색 관리 데이터베이스는 토폴로지, 크롤링 규칙, 쿼리 규칙 및 크롤링된 속성 및 관리되는 속성 간의 매핑 등의 검색 구성 데이터를 저장합니다. 또한 크롤링 구성 요소에 대한 ACL(액세스 제어 목록)도 저장합니다. 검색 서비스 애플리케이션당 하나의 검색 관리 데이터베이스만 있을 수 있습니다.

참고 항목

SharePoint Server에서 검색 토폴로지 관리