다음을 통해 공유


beconfig.xml 참조

 

적용 대상: FAST Search Server 2010

마지막으로 수정된 항목: 2015-03-09

beconfig.xml을 사용하여 Microsoft FAST Search Server 2010 for SharePoint의 Browser Engine 구성 요소에 대한 옵션을 구성합니다. 예를 들어 beconfig.xml을 사용하여 Browser Engine 캐시 크기 또는 시간 초과 설정을 변경합니다.

Browser Engine은 시작할 때 <FASTSearchFolder>\etc에서 beconfig.xml 파일을 읽습니다.

beconfig.xml 사용자 지정

참고

구성 파일을 수정하려면 FAST Search Server 2010 for SharePoint가 설치된 컴퓨터에서 FASTSearchAdministrators 로컬 그룹의 구성원이어야 하는 최소 요구 사항을 만족하는지 확인합니다.

일반 용도의 XML 편집기가 아닌 텍스트 편집기(예: 메모장)를 사용하여 beconfig.xml을 편집합니다.

이 파일을 편집하려면

  1. 설정을 지정하려면 텍스트 편집기에서 beconfig.xml을 편집합니다. <FASTSearchFolder>\etc\에 있는 기존 파일을 시작 지점으로 사용합니다. 파일에서 다른 특성 섹션을 제거하지 마십시오.

  2. nctrl.exe restart browserengine을 실행하여 새 옵션을 사용하여 Browser Engine을 다시 시작합니다.

beconfig.xml 빠른 참조

다음 표에는 beconfig.xml에 있는 요소 목록이 포함되어 있습니다. 이러한 요소는 어떠한 순서로든 표시할 수 있지만 이 표에 지정된 대로 다른 요소 내에 와야 합니다.

요소 설명

<browserengine 요소>

이 파일을 Browser Engine 구성 파일로 식별합니다.

<browser 요소>

가상 웹 브라우저 창에 대한 옵션을 지정합니다. browserengine 요소 내에만 올 수 있습니다.

<proxy 요소>

내부 프록시 서버에 대한 옵션을 지정합니다. browserengine 요소 내에만 올 수 있습니다.

<process 요소>

개별 항목 처리에 영향을 주는 옵션을 지정합니다. browserengine 요소 내에만 올 수 있습니다.

<excludes 요소>

특정 URI가 처리되지 않도록 제외하기 위해 사용되는 일반적인 예외 규칙을 지정하는 하나 이상의 regexp 요소를 포함합니다. browserengine 요소 내에만 올 수 있습니다.

<regexp 요소>

일반적인 제외 규칙을 지정합니다. excludes 특성 내에만 올 수 있습니다.

<pipeline 요소>

처리 파이프라인 옵션을 지정하고 처리할 각 항목에서 수행할 파이프라인 단계를 지정합니다. 하나 이상의 추출기 요소를 포함합니다. browserengine 요소 내에만 올 수 있습니다.

<extractor 요소>

추출기를 지정합니다. typeassembly 요소를 모두 포함해야 하며 parameters 요소를 포함할 수 있습니다. pipeline 요소 내에만 올 수 있습니다.

참고

<FASTSearchFolder>\etc\beconfig.xml에 제공된 추출기 및 하위 요소 목록은 변경하지 않아야 합니다.

beconfig.xml 파일 형식

beconfig.xml의 XML 요소는 <로 시작해서 />로 끝납니다.

기본 요소 형식은 다음과 같습니다.

<요소_이름 [특성_이름=" "] [특성_이름=" "] .../>

예를 들면 다음과 같습니다.

<process maxOperations="1000" maxMemoryMB="1024" timeout="300" />

요소와 특성은 대/소문자를 구분합니다. 특성 값은 따옴표(" ")로 묶어야 하며, 대/소문자를 구분하지 않습니다.

요소 정의는 여러 줄에 입력할 수 있습니다. 요소 정의에서 공백, 캐리지 리턴, 라인 피드 및 탭 문자는 무시됩니다. 예를 들면 다음과 같습니다.

<process
    maxOperations="1000"
    maxMemoryMB="1024"
    timeout="300"
/>

요소 정의가 긴 경우 특성을 여러 줄에 배치하고 들여쓰기를 사용하여 파일을 알아보기 쉽게 만듭니다.

beconfig.xml 파일의 기본 구조는 다음과 같습니다.

<?xml version="1.0"?>
<browserengine>
    <browser ... />
    <proxy ... />
    <process ... />
    <excludes>
        ...
    </excludes>
    <pipeline>
        ...
    </pipeline>
</browserengine>

<!---->로 구분하여 어디에든 주석을 추가할 수 있습니다.

browserengine 요소

최상위 요소입니다.

특성

없음

browser 요소

이 요소는 Browser Engine 내의 포함된 웹 브라우저 구성 요소에 대한 옵션을 지정합니다. 이 요소를 사용하여 웹 페이지 항목의 로드 시간 초과 기간을 조정합니다. 예를 들어 항목 로드 중에 웹 페이지가 자주 시간 초과되면 시간 초과 값을 늘립니다.

특성

특성 설명

width

<pixels>

웹 페이지가 보이지 않는 웹 브라우저 창에서 렌더링됩니다. 이 옵션은 이 창의 너비(픽셀)를 지정합니다.

기본값: 1280

height

<pixels>

보이지 않는 웹 브라우저 창의 높이(픽셀)를 지정합니다.

기본값: 1024

visible

true|false

처리 중 웹 브라우저 창을 보이도록 설정합니다. 디버깅에만 사용합니다.

처리 중 웹 브라우저 창을 보이지 않도록 설정합니다.

기본값: false

images

true|false

Browser Engine이 웹 페이지에 포함된 이미지를 로드하도록 지정합니다. 디버깅에만 사용합니다.

Browser Engine이 웹 페이지에 포함된 이미지를 로드하지 않도록 지정합니다.

기본값: false

timeout

<seconds>

Browser Engine이 처리할 웹 페이지를 로드할 때의 시간 초과 기간(초)을 지정합니다. 웹 페이지를 로드하는 데 시간이 오래 걸리면 무시됩니다.

이 옵션은 로드가 완료된 후 처리 파이프라인을 실행하는 데 걸리는 시간을 고려하지 않습니다.

기본값: 60

예제

<browser width="1280" height="1024" visible="false" images="false" timeout="60"/>

proxy 요소

이 요소는 Browser Engine에서 사용되는 내부 웹 프록시 및 메모리 캐시에 대한 옵션을 지정합니다. 캐시 크기 및 캐시에서 JavaScript의 최대 기간을 조정하려면 이 요소를 사용합니다.

특성

특성 설명

maxsize

<bytes>

웹 또는 웹 크롤러에서 다운로드되는 단일 JavaScript의 최대 크기를 지정합니다. 이 임계값을 초과하는 항목은 무시됩니다.

기본값: 10485760

timeout

<timeout>

웹 또는 웹 크롤러에서 다운로드되는 모든 JavaScript 또는 웹 페이지에 대한 시간 초과 기간(초)을 지정합니다. 다운로드할 때 이 제한 시간을 초과하면 무시됩니다.

기본값: 60

cacheSize

<megabytes>

Browser Engine 내에서 JavaScript 캐시의 최대 크기를 지정합니다. 자주 사용되는 JavaScript를 다시 다운로드하지 않고도 사용할 수 있도록 보존하기 위해 사용됩니다.

기본값: 25

cacheTTL

<seconds>

JavaScript가 삭제되기 전에 캐시에 남아 있는 최대 기간(초)을 지정합니다. 캐시가 꽉 차면 JavaScript가 일찍 삭제될 수 있습니다.

기본값: 3600

예제

<proxy maxsize="10485760" timeout="60" cacheSize="25" cacheTTL="3600"/>

process 요소

이 요소는 Browser Engine에 있는 웹 항목 처리와 관련된 옵션을 지정합니다. 이 요소를 사용하여 최대 메모리 사용 및 파이프라인 시간 초과 기간을 조정합니다.

특성

특성 설명

maxOperations

<operations>

Browser Engine을 자동으로 다시 시작하기 전에 처리할 최대 웹 페이지 수를 지정합니다. 이 특성은 일부 웹 페이지로 인해 발생할 수 있는 가능한 메모리 누수 및 처리 정체를 해결하는 데 유용합니다.

기본값: 1000

maxMemoryMB

<megabytes>

Browser Engine을 자동으로 다시 시작하기 전의 최대 메모리 사용량(MB)을 지정합니다. 이 특성은 웹 페이지로 인해 발생할 수 있는 가능한 메모리 누수 및 처리 정체를 해결하는 데 유용합니다.

기본값: 1024

timeout

<timeout>

특정 웹 페이지에서 하이퍼링크를 추출하는 작업에 대한 시간 초과 기간(초)을 지정합니다. 이 시간 초과 값은 JavaScript로 인해 처리 파이프라인이 웹 페이지 처리를 완료하지 못하는 일부 경우를 해결하기 위해 필요합니다.

기본값: 300

예제

<process maxOperations="1000" maxMemoryMB="1024" timeout="300"/>

excludes 요소

이 요소는 특정 JavaScript 및 CSS 스타일시트 URI를 다운로드하지 못하도록 방지하기 위해 사용되는 하나 이상의 정규식 규칙을 지정합니다. 웹 페이지 처리 속도를 높이고 스크립트가 콘텐츠 인덱스에 표시되지 않도록 방지하기 위해 알려진 광고 스크립트는 이 요소의 일반 사용 범주에서 제외됩니다.

특성

없음

예제

<excludes>
    <regexp value="http://ads\."/>
</excludes>

regexp 요소

이 요소는 단일 정규식 제외 규칙을 지정하며 excludes 요소 내에만 올 수 있습니다. 이 요소는 여러 번 사용할 수 있습니다.

특성

특성 설명

<regexp>

웹 항목을 처리하는 중에 검색된 모든 외부 JavaScript 및 CSS 스타일시트 URI에 대해 일치되는 정규식을 지정합니다. 정규식과 일치하는 URI는 웹 페이지 처리 중에 다운로드되거나 포함되지 않습니다.

기본값: 기본값을 보려면 <FASTSearchFolder>\etc\beconfig.xml을 참조하십시오.

예제

excludes 요소 예제를 참조하십시오.

pipeline 요소

이 요소는 Browser Engine에서 처리하는 동안 각 웹 페이지에서 실행되는 추출기 집합을 지정합니다. 추출기는 특정 종류의 하이퍼링크 또는 HTTP 쿠키 추출, 콘텐츠 인덱싱에 사용되는 체크섬 및 최종 항목 HTML 생성과 같은 일련의 작업을 수행합니다.

특성

특성 설명

name

default

파이프라인의 이름을 지정합니다. 단일 파이프라인만 지원되며 이름은 "default"여야 합니다.

maxFrameLevels

<levels>

처리할 HTML 프레임 수준 수를 지정합니다. 일반적으로 이 옵션은 1로 설정됩니다. 즉, 최상위 프레임과 최상위 프레임의 직속 하위 프레임(프레임셋)만 처리됩니다.

이 숫자를 늘리면 여러 프레임셋이 재귀적으로 처리됩니다.

기본값: 1

timeout

<seconds>

처리 파이프라인이 중지될 때까지 단일 웹 페이지에서 실행될 수 있는 최대 횟수를 지정합니다.

이 값을 늘리면 Browser Engine의 처리량이 줄어들지만 웹 페이지 처리 시간 초과가 발생하는 경우를 줄일 수 있습니다. 이 값을 줄이면 처리량이 늘어나지만 시간 초과가 더 자주 발생합니다.

기본값: 300

iterations

1

각 웹 페이지에서 파이프라인을 실행할 반복 작업의 수를 지정합니다. 반복 작업은 한 번만 지원됩니다.

abortOnFailure

true|false

단일 추출기가 실패할 경우 웹 페이지 처리를 중지하도록 지정합니다.

일부 추출기가 실패하더라도 웹 페이지 처리를 계속하도록 지정합니다. 이렇게 하면 링크 추출 성능이 향상되지만 최악의 경우 콘텐츠 인덱스에 부분 항목이 전송될 수도 있습니다.

default

true

이 파이프라인을 기본 파이프라인으로 지정합니다. 파이프라인은 하나만 지원되므로 이 값은 항상 "default"로 설정되어야 합니다.

예제

<pipeline name="default" maxFrameLevels="1" timeout="180" iterations="1" abortOnFailure="true" default="true">
..
</pipeline>

extractor 요소

이 요소는 파이프라인에서 단일 추출기를 지정합니다. <FASTSearchFolder>\etc\beconfig.xml에 제공된 추출기 목록은 변경하지 않아야 합니다.