다음을 통해 공유


postprocess.exe 참조

 

적용 대상: FAST Search Server 2010

마지막으로 수정된 항목: 2015-03-09

postprocess 도구를 사용하여 하나 이상의 크롤링 모음에 대한 콘텐츠 인덱싱에 항목을 수동으로 다시 공급할 수 있습니다. 중복 검색 기능이 해제되어 있지 않은 경우 전송 전에 각 항목의 고유한 체크섬 지문을 중복 데이터베이스와 대조하여 확인합니다.

기본적으로 구성의 구성 요소에 등록된 모든 항목 프로세서 서버의 로그가 집계됩니다.

참고

다양한 항목 프로세서 서버에서 식별자를 처리할 수 있으며, 이전 실행의 로그가 여전히 시스템에 있을 수 있습니다. 각 식별자의 최근 로그 항목을 보려면 -a 명령 옵션을 사용합니다.

참고

명령줄 도구를 사용하려면 FAST Search Server 2010 for SharePoint가 설치된 컴퓨터에서 FASTSearchAdministrators 로컬 그룹의 구성원이어야 하는 최소 요구 사항을 만족하는지 확인합니다.

Syntax

<FASTSearchFolder>\bin\postprocess [options]

Parameters

매개 변수 설명

<FASTSearchFolder>

FAST Search Server 2010 for SharePoint를 설치한 폴더의 경로(예: C:\FASTSearch)입니다.

옵션이 필요하지 않으며 모든 항목이 선택 사항입니다.

postprocess 일반 옵션

옵션 설명

-h

도움말 정보를 표시합니다.

-v

버전 정보를 표시합니다.

-l

<로그 수준>

다음과 같은 기록할 정보의 유형을 지정합니다.

  • debug

  • verbose

  • info

  • warning

  • error

-I

<노드 식별자>

postprocess에 사용하려는 노드를 지정합니다.

node_id.dat 파일을 삭제하지 않았으며 올바른 식별자를 전달하는지 확신할 수 없으면 지정하지 마십시오.

-d

<경로>

데이터 저장소 디렉터리를 지정합니다.

이 옵션을 사용하면 크롤링 데이터, 런타임 구성 및 로그를 지정된 디렉터리 내의 하위 디렉터리에 저장할 수 있습니다.

기본값: <FASTSearchFolder>\data\crawler

-R

<크롤링_모음>

모음을 다시 공급합니다. 항목이 이전에 추가되었더라도 모든 항목을 콘텐츠 인덱싱에 다시 공급합니다.

<크롤링_모음>을 단일 모음이나 쉼표로 구분된 모음 목록(공백 없음)으로 지정합니다.

모든 모음을 다시 공급하려면 '*'를 지정합니다. 이때 별표를 따옴표로 묶어야 합니다.

-P

[<주소>:]<포트 번호>

postprocess 포트를 지정합니다.

<포트 번호>를 사용하여 postprocess에 사용되는 포트 번호 범위의 시작 번호를 지정합니다. 기본값: 크롤러 기본 포트 + 6

또는 호스트 이름이나 값 형태로 IP 주소를 지정할 수도 있습니다.

기본값: 13000

-U

<구성 파일>

크롤러 전역 기본 구성 파일을 사용합니다.

이 옵션은 먼저 현재 디렉터리에서 CrawlerGlobalDefaults.xml 을 찾습니다. 찾을 수 없으면 <FASTSearchFolder>\etc\에서 찾습니다.

명령줄에 지정한 옵션이 충돌하면 구성 파일의 값이 재정의됩니다.

-D

직접 I/O를 사용하도록 설정합니다.

운영 체제에서 지원되는 경우에만 사용도록 설정합니다.

기본값: off

postprocess 다시 공급(-R) 모드 옵션

옵션 설명

-r

<크롤링_사이트>

지정된 크롤링 사이트 이후에 계속 다시 공급됩니다. 이 옵션을 -s와 함께 사용하지 마십시오.

참고

<크롤링_사이트>에 특수 키워드 @auto를 사용하면 postprocess가 마지막 다시 공급이 중단되었던 위치에서 크롤링을 자동으로 재개합니다.

-s

<크롤링_사이트>

지정된 사이트 이름(호스트 이름)만 처리합니다.

이 옵션을 -r과 함께 사용하지 마십시오.

-i

<파일>

지정된 파일에 나열된 URI 및 사이트를 처리합니다.

-r, -s-i 옵션은 서로 함께 사용할 수 없습니다.

<파일>은 URI나 크롤링 사이트(또는 둘 다)를 포함하는 줄 바꿈으로 구분된 파일입니다.

-x

허용된 모든 URI를 처리합니다. 여기에는 현재 모음 포함/제외 규칙과 일치하는 모든 URI가 포함되며 일치하지 않는 URI는 무시됩니다.

-u 옵션과 함께 사용하면 업데이트된 모음 사양 XML 파일을 지정할 수 있습니다.

-X

제외된 URI를 삭제합니다. 모음 사양 포함/제외 규칙과 일치하지 않는 URL를 삭제합니다.

-x와 함께 사용하여 허용된 모든 URI를 처리하는 경우가 아니면 다른 모든 URI가 무시됩니다.

이 옵션은 -u와 함께 사용하면 유용합니다.

-b

프로그램에서 포함/제외된 항목을 확인할 때 robots.txt 규칙을 적용합니다. robots.txt 규칙은 -x-X 옵션에도 적용됩니다.

-u

<XML 구성 파일>

구성 데이터베이스에서 로드된 포함/제외 정규식을 <XML 구성 파일>의 규칙으로 업데이트합니다. 이 업데이트는 postprocess 다시 공급 도중에만 적용됩니다.

-b

콘텐츠 인덱싱 큐에서 콘텐츠가 다시 공급됩니다.

크롤러가 콘텐츠 인덱싱보다 빠른 속도로 처리 중인 경우 postprocess는 항목을 디스크 큐에 대기시키고 이러한 큐를 처리합니다. 이 옵션은 기존 큐를 처리합니다(비웁니다).

-k

<콘텐츠_모음>|<공급_대상>

크롤링 공급 대상으로 지정된 콘텐츠 모음을 재정의합니다.

또는 모음 구성에 정의된 대로 공급 대상의 기호 이름을 지정할 수도 있습니다.

기본값: <콘텐츠_모음>

postprocess 내부 옵션

이러한 옵션은 테스트 및 디버깅 전용으로 사용하거나 크롤러에서 postprocess를 시작할 때 내부에서 사용합니다.

옵션 설명

-p

<포트>

<포트>에서 노드 스케줄러 프로세스에 연결합니다.

-S

<포트>

<포트>에서 수신합니다. 내부에서만 사용됩니다.

-o

FAST Search 출력 모드를 사용하도록 설정합니다.

-F

<파일 서버 포트>

지정된 포트에서 외부 파일 서버를 사용하도록 postprocess에 지시합니다.

-T

프로파일링을 사용하도록 설정합니다.

profile_methods.py 도구를 사용하여 프로필을 검토합니다.

-t

hotshot 모듈을 사용하여 프로파일링을 사용도록 설정합니다.

profile_lines.py 도구를 사용하여 프로필을 검토합니다.

-n

널 피더(\dev\null에 해당)를 사용합니다. 항목이 공급되지 않습니다.

테스트용으로 사용합니다.

이 예에서는 크롤링 모음인 MyCollection을 콘텐츠 인덱싱으로 다시 공급합니다.

<FASTSearchFolder>\bin\postprocess -R MyCollection

다음 예에서는 모든 크롤링 모음을 콘텐츠 인덱싱으로 다시 공급합니다.

<FASTSearchFolder>\bin\postprocess -R '*'

다음 예에서는 크롤링 모음인 MyCollection의 크롤링 사이트 www.contoso.com을 콘텐츠 인덱싱으로 다시 공급합니다.

<FASTSearchFolder>\bin\postprocess -R MyCollection -s www.contoso.com

크롤링 모음 포함/제외 규칙과 더 이상 일치하지 않는 항목을 제거하면서 모음인 MyCollection을 콘텐츠 인덱싱으로 다시 공급하려면 이 예에서처럼 수행합니다.

<FASTSearchFolder>\bin\postprocess -R MyCollection -x -X

이 예에서는 크롤링 모음인 MyCollection을 사용자 지정 포함/제외 규칙으로 업데이트하고 규칙과 일치하는 항목을 다시 공급합니다.

<FASTSearchFolder>\bin\postprocess -R MyCollection -x -u MyCustomConfig.xml

MyCustomConfig.xml 에는 일반적으로 다시 처리하려는 항목에 대해 -s와 같은 옵션이 제공하는 세분성보다 높은 세분성으로 포함하거나 제외할 수 있습니다.

참고

크롤러는 postprocess를 사용하여 중복 검색 및 콘텐츠 인덱싱으로의 항목 전송을 수행합니다. 사이트 관리자 프로세스와 마찬가지로, postprocess는 크롤러와 함께 자동으로 시작됩니다. 또한 크롤러가 실행되고 있지 않을 때도 직접 postprocess를 시작하여 하나 이상의 크롤링 모음의 항목을 수동으로 다시 공급할 수 있습니다.

크롤러에 새 항목이나 수정 또는 삭제된 항목이 발생하면 postprocess에서는 이러한 항목을 전송합니다. 중복 검색을 해제한 경우가 아니면 전송 전에 각 항목을 중복 데이터베이스와 대조하여 확인합니다.