다음을 통해 공유


FAST Search Server 팜 토폴로지 계획(FAST Search Server 2010 for SharePoint)

 

적용 대상: FAST Search Server 2010

마지막으로 수정된 항목: 2012-01-20

이 항목에서는 성능 및 내결함성을 이유로 여러 서버로 확장할 수 있는 다양한 구성 요소를 포함하여 Microsoft FAST Search Server 2010 for SharePoint 팜 토폴로지에 대해 설명합니다.

전체 Microsoft SharePoint Server 2010 팜 토폴로지에 대한 자세한 내용은 검색 토폴로지 계획(FAST Search Server 2010 for SharePoint)을 참조하십시오.

이 문서의 내용:

  • 콘텐츠 흐름

  • FAST Search for SharePoint 팜 내의 구성 요소

콘텐츠 흐름

FAST Search Server 2010 for SharePoint에서는 지원되는 인덱싱 커넥터를 하나 이상 사용하여 인덱싱할 콘텐츠를 검색합니다. FAST Content SSA(Search Service 응용 프로그램)는 기본 인덱싱 커넥터로, SharePoint 콘텐츠 저장소, 웹 서버, Exchange 폴더, 기간 업무(LOB) 데이터 및 파일 서버 같은 다양한 콘텐츠 원본에서 콘텐츠를 검색합니다. 보다 구체적인 검색 시나리오에서는 다른 FAST Search Server 2010 for SharePoint 인덱싱 커넥터를 사용할 수도 있습니다. 인덱싱 커넥터 옵션에 대한 자세한 내용은 크롤링 및 연결 계획(FAST Search Server 2010 for SharePoint)을 참조하십시오.

항목 처리에서는 검색된 문서에서 검색 가능한 콘텐츠를 추출하고 문자 언어를 토대로 항목을 처리합니다.

인덱싱 구성 요소에서는 검색 가능한 콘텐츠를 반전된 인덱스로 변환하고 이러한 인덱스는 다시 쿼리 일치에 사용됩니다.

쿼리 처리에서는 인덱스에 대해 실제 쿼리 일치가 발생하기 전에 동의어 확장 같은 쿼리 변환을 수행하는 방식으로 사용자 쿼리를 처리합니다.

쿼리 일치에서는 검색 인덱스를 사용하여 사용자 쿼리와 일치하는 항목을 반환합니다. 항목은 지정된 쿼리에 대한 관련성에 따라 정렬된 쿼리 적중 횟수 목록에 반환됩니다.

FAST Search Server 2010 for SharePoint에서는 Active Directory 및 클레임 인프라와 상호 작용하여 사용 권한과 그룹 등록을 확인합니다. 그런 다음 콘텐츠 원본의 설정에 따라 현재 사용자가 볼 수 있는 항목만 반환합니다.

FAST Search Server 2010 for SharePoint 팜 내의 구성 요소

FAST Search Server 2010 for SharePoint는 단일 노드에서 실행할 수 있습니다. 또는 하나 이상의 구성 요소를 여러 노드에서 실행하도록 확장할 수도 있습니다. 이 경우 시스템에서는 더 많은 수의 항목을 인덱싱하거나, 더 많은 항목 업데이트를 처리하거나, 인덱싱 대기 시간을 줄이거나, 초당 더 많은 쿼리에 응답할 수 있습니다.

다음 그림에서는 FAST Search Server 2010 for SharePoint의 주요 구성 요소를 보여 줍니다.

FAST Search for SharePoint 팜 토폴로지

FAST Search Server 팜 토폴로지

다음 하위 섹션에서는 각 구성 요소의 기능에 대해 설명합니다.

항목 처리

항목 처리 구성 요소에서는 인덱싱 커넥터로부터 인덱싱할 항목을 받고 지정된 구성에 따라 항목을 처리합니다. 그런 다음 처리된 항목을 인덱싱 서비스로 전송합니다.

항목 처리 서비스의 주요 기능은 다음과 같습니다.

  • 관리 속성에 크롤링 속성 매핑   관리 속성에는 항목과 연결된 메타데이터를 비롯하여 인덱싱될 콘텐츠가 들어 있습니다.

    먼저, 초기 크롤링 항목 집합에 대한 크롤링 속성을 검색합니다. 이를 토대로 매핑을 관리 속성으로 변경할 수 있습니다.

  • Word, Excel 및 PDF와 같은 문서 형식의 구문 분석   여기에는 이러한 형식에서 검색 가능한 텍스트 및 메타데이터를 추출하는 작업도 포함됩니다.

  • 크롤링 콘텐츠에서 속성 추출   속성 추출 기능에서는 이름 및 날짜와 같은 다양한 속성을 찾아서 관리 속성에 매핑합니다. 이 방식으로 이러한 속성을 쿼리하고 속성에 따라 쿼리 구체화를 적용할 수도 있습니다. 추출되는 주요 속성에는 회사 이름, 사람 이름, 위치 및 날짜가 있습니다.

    또한 조직과 관련된 제품 이름 사전 등을 사용하여 사용자 지정 속성 추출기를 만들 수도 있습니다.

  • 항목을 인덱싱하기 전 언어 처리   언어 기능은 검색 시 사용자가 관련 정보를 더욱 쉽게 찾을 수 있도록 언어의 구조 및 변형에 대한 정보를 사용함으로써 정의됩니다. 쿼리에 관한 항목의 관련성은 반드시 쿼리와 문서 모두에 공통되는 단어에 따라 결정된다기보다는 콘텐츠가 정보에 대한 사용자의 요구를 충족하는 정도에 따라 결정됩니다.

    언어 처리에는 특정 언어에 따른 콘텐츠 언어 표준화 및 문자 언어 검색이 포함됩니다. 언어 표준화에는 문자 표준화 및 형태소 변형 표준화 등이 있습니다.

FAST Search Server 2010 for SharePoint에서는 추출할 속성 유형 및 이를 쿼리하는 방법을 지정하는 등의 작업을 통해 항목이 처리되는 방식을 사용자 지정할 수 있습니다.

콘텐츠 배포자는 인덱싱 커넥터와 통신하고 인덱싱 커넥터에서 인덱싱 서비스로 이루어지는 문서 공급을 구성합니다. 내결함성을 위해 주 및 백업 콘텐츠 배포자를 설정할 수 있습니다.

내결함성 및 성능을 위해 여러 항목 처리 노드를 설정할 수 있습니다. 특정 항목 처리 작업은 처리량이 많은 작업이며 공급 속도를 처리하기 위해서는 항목 처리 노드가 두 개 이상 필요합니다.

웹 링크 분석(웹 분석기)

웹 분석기의 주요 기능에는 검색 클릭 방문 로그와 하이퍼링크 구조를 분석하는 두 가지가 있습니다. 이러한 두 가지 분석을 통해 보다 정확한 검색 결과 순위를 얻을 수 있습니다.

검색 클릭 방문 로그에서 많은 클릭 수를 나타내는 항목이 많이 사용되는 항목이므로 이러한 항목에는 표시된 횟수가 적은 항목보다 더 높은 순위 점수가 부여됩니다. 다른 여러 항목에 연결된 항목도 사용자에게 관련성이 보다 높은 것으로 인식되므로 더 높은 순위 점수가 부여됩니다.

웹 분석기에서는 링크 그래프를 분석하고 링크 카디널리티에 따른 쿼리 독립적인 순위 향상 및 앵커 텍스트를 인덱스의 항목에 추가하는 방식으로 검색 관련성을 높입니다. 앵커 텍스트는 해당 앵커 텍스트에서 참조하는 항목을 설명하며 쿼리 용어가 앵커 텍스트와 일치하는 경우 회수율과 관련성을 향상시킵니다. 해당 항목을 가리키는 링크가 많이 포함된 항목에는 순위 점수가 높게 부여됩니다.

웹 분석기는 분석에 필요한 총 시간을 줄이기 위해 여러 노드로 수평 확장할 수 있습니다. 이를 위해 링크 분석 시 전용 조회 데이터베이스와 링크 처리 구성 요소를 추가합니다.

링크 처리 구성 요소는 링크 처리 시 웹 분석기로부터 작업을 받습니다. 대규모 설치 환경에서는 여러 개의 링크 프로세서를 사용합니다.

조회 데이터베이스 구성 요소는 링크 처리를 통해 생성되는 링크 정보를 검색하는 키/값 조회 서버를 나타냅니다. 항목 처리 서비스에서는 URL을 키로 사용하여 항목에 대한 링크 정보를 조회합니다. 대규모 설치 환경에서는 여러 개의 조회 데이터베이스 구성 요소를 사용합니다.

검색 클러스터

검색 클러스터에서는 인덱싱 및 쿼리 일치를 위한 주요 토폴로지를 제공합니다. 이러한 구성 요소를 사용하려면 행/열 구성에서 서버 행렬을 사용하는 고유한 확장 모델이 필요합니다. 다음 그림에서는 검색 클러스터 토폴로지에 사용되는 주요 개념을 보여 줍니다.

FAST Search 클러스터 아키텍처

FAST Search 클러스터 아키텍처

  • 인덱스 열   검색 가능한 전체 인덱스를 단일 서버에 두기에 너무 큰 경우 이를 여러 개의 중첩된 인덱스 열로 분할할 수 있습니다. 쿼리는 검색 클러스터 내의 모든 인덱스 열에 대해 평가되며 각 인덱스 열의 결과는 최종 쿼리 적중 횟수 목록으로 병합됩니다.

  • 검색 행   검색 클러스터 내에서 인덱싱되는 모든 항목이 들어 있는 검색 노드 집합입니다. 검색 행은 검색 클러스터 내의 인덱스 열마다 검색 노드 하나씩으로 구성되어 있습니다. 성능 부하 공유 및 내결함성을 제공하려면 검색 행을 여러 개 사용합니다.

  • 주 및 백업 인덱서   내결함성을 위해 백업 인덱서 노드를 구성할 수 있습니다. 두 개의 인덱서에서 동일한 인덱스 집합을 생성하지만 주 인덱서에서만 쿼리 일치 노드에 인덱스를 배포할 수 있습니다.

중요

주 및 백업 인덱서 노드는 배포 구성 파일(deployment.xml)에서 인덱서 행으로 지정됩니다. 검색 행과 인덱서 행에서는 배포 구성 파일과 동일한 행 번호 지정을 사용합니다.

인덱싱

인덱싱 구성 요소에서는 수신하는 항목을 토대로 반전된 인덱스를 만듭니다. 그런 다음 이러한 반전된 인덱스를 나중에 쿼리 평가 시 사용하도록 쿼리 일치 구성 요소로 보냅니다.

인덱싱 서비스는 인덱싱 발송자 구성 요소와 인덱싱 구성 요소라는 두 구성 요소로 이루어져 있습니다. 인덱싱 서비스가 여러 노드에 배포되면 이러한 구성 요소의 인스턴스도 여러 노드에 배포됩니다.

인덱스 열이 두 개 이상인 경우 인덱스를 조합하여 일관된 검색 결과를 만들어내야 합니다. 이 경우 각 인덱스 열에 대해 인덱싱 노드를 하나씩 배포해야 합니다. 인덱싱 발송자는 처리된 항목이 올바른 열로 라우팅되도록 관리합니다.

인덱싱 서비스는 항목 수에 따라 확장됩니다. 인덱싱 서비스가 단일 노드에서 실행되는 경우 해당 인덱싱 서비스에서 초당 처리할 수 있는 항목 수와 인덱싱 서비스가 인덱스에 포함할 수 있는 총 항목 수 모두에 제한을 받게 됩니다. 인덱싱 서비스를 확장하려면 이를 두 개 이상의 인덱스 열에 배포하면 됩니다. 각 인덱스 열에는 인덱스의 한 부분이 포함되며 조합된 인덱스 집합은 전체 인덱스를 구성하게 됩니다. 이 경우 각 인덱싱 노드에서는 전체 인덱스의 일부만 처리하므로 초당 인덱싱할 수 있는 항목 수와 총 항목 수가 모두 확장됩니다. 또한 백업 인덱싱 노드에서는 내결함성을 제공할 수 있습니다.

내결함성과 성능 모두를 위해 여러 개의 인덱싱 발송자를 사용할 수도 있습니다. 일반적으로 인덱싱 발송자는 주 인덱싱 노드와 동일한 노드에 배포합니다.

쿼리 일치

쿼리 일치 서비스에서는 인덱싱 서비스를 통해 만들어진 반전된 인덱스를 사용하여 쿼리와 일치하는 항목을 검색한 다음 이러한 항목을 쿼리 적중 횟수 목록으로 반환합니다. 쿼리에는 대개 ANDOR 같은 쿼리 연산자와 여러 개의 용어가 결합되어 있습니다. 쿼리 일치 서비스에서는 인덱스의 각 용어를 조회하고 해당 용어가 나타나는 항목의 목록을 검색합니다. 예를 들어 AND 연산자의 경우 쿼리 적중 횟수 목록은 모든 용어가 포함된 용어 집합으로 구성됩니다. 반환되는 용어의 순서는 요청된 정렬 메커니즘을 기반으로 하는데, 이 메커니즘은 대개 다양한 항목 속성으로 계산되는 복잡한 순위이거나 하나 이상의 항목 속성을 토대로 하는 정렬입니다.

쿼리 일치 서비스는 쿼리 적중 횟수 목록에서 각 항목에 대한 방문 횟수가 강조 표시된 요약을 반환할 수도 있습니다. 방문 횟수가 강조 표시된 요약은 일치하는 쿼리 용어가 강조 표시된 원래 항목의 일부로 구성됩니다.

쿼리 일치 서비스에서는 쿼리 결과와 연결된 상세 구체화를 수행합니다. 쿼리 구체화를 통해 쿼리 결과에 대해 계산되었던 집계된 통계 데이터를 사용하여 쿼리 결과를 드릴다운할 수 있습니다. 쿼리 일치 서비스는 대규모 결과 집합에 상세한 구체화를 적용할 수 있도록 집계 데이터 구조를 유지합니다.

쿼리 일치 서비스를 행/열 설정에 배포하여 내결함성을 확보하고 콘텐츠 및 쿼리 볼륨을 확장할 수 있습니다. 인덱스 열에서는 전체 인덱스를 일련의 중첩된 열로 분할하여 콘텐츠 볼륨을 확장할 수 있습니다. 검색 행에서는 동일한 인덱스 파티션을 두 개 이상의 쿼리 일치 노드 간에 복제하여 쿼리 볼륨을 확장할 수 있습니다.

중요

쿼리 일치 서비스의 열 수는 항상 인덱서 서비스의 열 수와 일치합니다. 그 이유는 인덱스 열이 인덱스의 파티션을 나타내며 각 쿼리 일치 노드에서는 이러한 인덱스 파티션을 하나씩만 처리할 수 있기 때문입니다.

검색 행과 인덱서 행은 개별적으로 확장됩니다. 검색 행은 다른 검색 행을 복제하여 쿼리에 대해 확장된 용량과 내결함성을 제공합니다. 인덱서 행은 인덱싱 도중 내결함성을 위한 백업 메커니즘 역할을 수행합니다.

쿼리 처리

쿼리 처리 구성 요소에서는 쿼리의 전처리 작업과 결과의 후처리 작업을 수행합니다. 쿼리 처리에는 쿼리 언어 구문 분석, 언어 처리 및 항목 수준의 보안 처리가 포함됩니다. 결과 처리에는 여러 인덱스 열의 결과 병합, 쿼리 적중 횟수 목록 서식 지정, 쿼리 구체화 데이터 서식 지정 및 중복 항목 제거 등이 포함됩니다.

쿼리 처리 구성 요소에서는 FSA(FAST Search Authorization) 구성 요소와 상호 작용하여 쿼리를 수행하는 사용자에게 볼 수 있는 권한이 있는 결과만 표시되는지 확인합니다. 따라서 쿼리 처리 서비스는 사용자의 권한에 대한 유효성을 검사하고 현재 사용자 및 그룹 등록에 해당하는 액세스 필터를 사용하여 들어오는 쿼리를 다시 작성합니다.

쿼리 처리 서비스는 내결함성 및 초당 더 많은 쿼리를 처리하도록 여러 노드 간에 확장할 수 있습니다. 이 경우 모든 노드를 동일한 방식으로 설정해야 합니다.

시스템 관리

SharePoint Server 2010 중앙 관리 및 사이트 모음 사용자 인터페이스는 FAST Search Server 2010 for SharePoint 배포 환경과 기능을 관리하기 위한 관리 인터페이스를 제공합니다. 일반적인 시스템 관리 서비스에는 UI/cmdlet 기반 시스템 및 기능 구성, 로깅, 인덱스 스키마 관리, 검색 권한 부여가 포함됩니다.

중요

특정 관리 작업은 Windows PowerShell cmdlet이나 명령줄 도구를 통해서만 수행할 수 있습니다.

관리 구성 요소에는 속성 추출 방법 결정, 사용할 동의어 확인, 최상의 선택으로 사용할 항목 결정과 같은 검색 환경을 제어하는 기능이 포함되어 있습니다.

FSA 관리자는 인덱싱된 콘텐츠에 대한 사용자 인증을 관리하는 관리 서비스의 일부입니다. 이를 통해 사용자가 읽을 수 있는 권한이 있는 항목만 쿼리 결과에 나타납니다. FSA 관리자는 클레임 서비스, Active Directory 서비스 또는 다른 LDAP 기반 디렉터리 서비스와 통신하여 인증 프로세스를 관리합니다.

인덱스 스키마 관리

인덱스 스키마 관리는 관리 서비스의 핵심 부분입니다. 인덱스 스키마에는 시스템의 다른 모든 서비스에 대한 인덱스 스키마 관련 구성 파일을 생성하는 데 필요한 모든 구성 엔터티가 포함되어 있습니다.

인덱스 스키마에서는 인덱싱할 항목의 관리 속성, 속성을 인덱싱하는 방법, 쿼리 적중 횟수 목록에 반환되는 속성을 제어합니다.

순위 프로필은 인덱스 스키마의 일부로, 쿼리 적중 횟수 목록이 관련성에 따라 정렬되는 방식을 제어합니다. 관련성 계산은 일련의 순위 프로필 매개 변수를 사용하여 구성할 수 있습니다.

FSA(FAST Search Authorization)

FSA(FAST Search Authorization) 관리자는 인덱싱된 콘텐츠에 대한 사용자 인증을 관리하는 관리 서비스의 일부입니다.

FSA 관리자에서는 콘텐츠 원본 저장소에 대한 사용자의 읽기 권한을 토대로 인덱싱된 항목에 대한 액세스 권한을 사용자에게 부여합니다. 이를 통해 사용자가 읽을 수 있는 권한이 있는 항목만 쿼리 결과에 나타납니다.

FSA 관리자는 Active Directory 서비스 또는 다른 LDAP 기반 디렉터리 서비스와 통신하여 인증 프로세스를 관리합니다.

FAST Search 웹 크롤러

FAST Search 웹 크롤러는 인터넷 사이트와 인트라넷 사이트가 혼합된 복잡한 웹 크롤링 시나리오에 사용할 수 있는 선택적인 인덱싱 커넥터입니다.

웹 사이트를 크롤링할 때 FAST Search Content SSA를 사용하는 경우와 FAST Search 웹 크롤러를 사용하는 경우의 차이에 대한 자세한 내용은 크롤링 및 연결 계획(FAST Search Server 2010 for SharePoint)에서 확인할 수 있습니다.

FAST Search 웹 크롤러에서는 웹 페이지를 읽고 페이지의 링크를 따라 이동하여 항목의 전체 웹을 처리합니다. 그런 다음 검색된 항목을 항목 처리 서비스로 전달합니다.

FAST Search 웹 크롤러에 대한 아키텍처 관련 세부 정보는 FAST Search 웹 크롤러를 사용하여 웹 콘텐츠 크롤링을 참조하십시오.

See Also

Concepts

검색 토폴로지 계획(FAST Search Server 2010 for SharePoint)
Test results: Medium scenario (FAST Search Server 2010 for SharePoint)
크롤링 및 연결 계획(FAST Search Server 2010 for SharePoint)
중복 및 가용성 계획(FAST Search Server 2010 for SharePoint)
성능 및 용량 계획(FAST Search Server 2010 for SharePoint)

Other Resources

OBSOLETE 인덱스 스키마 계획(FAST Search Server 2010 for SharePoint)