다음을 통해 공유


crawler.exe 참조

 

적용 대상: FAST Search Server 2010

마지막으로 수정된 항목: 2015-03-09

크롤러 바이너리를 사용하여 FAST Search 웹 크롤러를 시작할 수 있습니다. 크롤러를 독립 실행형 노드 크롤러로 시작하거나 분산된 다중 노드 크롤러의 일부(다중 노드 스케줄러 또는 노드 스케줄러)로 시작하는 옵션을 지정할 수 있습니다.

참고

명령줄 도구를 사용하려면 FAST Search Server 2010 for SharePoint가 설치된 컴퓨터에서 FASTSearchAdministrators 로컬 그룹의 구성원이어야 하는 최소 요구 사항을 충족하는지 확인합니다.

Syntax

<FASTSearchFolder>\bin\crawler [options]

Parameters

매개 변수 설명

<FASTSearchFolder>

FAST Search Server 2010 for SharePoint를 설치한 폴더의 경로(예: C:\FASTSearch)입니다.

옵션이 필요하지 않으며 모든 항목이 선택 사항입니다.

크롤러 기본 옵션

옵션 설명

-h

도움말 정보를 표시합니다.

-v

버전 정보를 표시합니다.

-P

[<호스트 이름>:]<크롤러 기본 포트>

크롤러 기본 포트(XML-RPC 인터페이스)를 지정합니다.

동일한 노드에서 크롤러의 여러 인스턴스를 실행할 때 사용합니다.

  • <호스트 이름>은 XML-RPC 인터페이스용 바인딩 주소입니다(선택 사항). 호스트 이름이나 IP 주소일 수 있으며 일부 호스트에는 IP 주소가 두 개 이상 지정되기도 합니다.

  • <크롤러 기본 포트>는 크롤러에 사용할 수 있는 포트 번호 범위의 시작 포트를 설정합니다.

기본값: 13000

-d

<경로>

데이터 저장소 디렉터리를 지정합니다.

이 옵션을 사용하면 크롤링 데이터, 런타임 구성 및 로그를 지정된 디렉터리의 하위 디렉터리에 저장할 수 있습니다.

기본값: <FASTSearchFolder> 환경 변수가 설정된 경우 기본 경로는 <FASTSearchFolder>\data\crawler입니다. 그렇지 않을 경우 기본 경로는 data입니다.

-f

<XML 구성 파일>

크롤링 모음 구성을 지정합니다.

이 옵션을 사용하여 크롤링 모음을 하나 이상 포함하는 XML 파일의 위치를 지정합니다.

크롤러는 이 파일의 콘텐츠에 대한 구문을 분석하고 지정된 크롤링 모음을 추가 또는 업데이트한 후 크롤링을 시작합니다.

-c

<개수>

시작할 사이트 관리자 프로세스 수를 크롤링 모음 사양에 정의된 클러스터 수보다 작거나 같게 지정합니다.

크롤링 양이 많은 경우에는 프로세스 수를 CPU 수보다 많거나 같게 지정합니다.

최대 8개의 프로세스가 지원됩니다.

기본값: 2

크롤러 고급 옵션

옵션 설명

-D

<개수>

초당 최대 DNS 요청 수를 지정합니다.

FAST Search 웹 크롤러에는 하나 이상의 DNS 서버와 통신하여 DNS 조회를 수행할 수 있는 DNS 조회 기능이 기본 제공됩니다. 이 옵션을 사용하면 크롤러에서 DNS 서버로 보내는 초당 DNS 요청 수를 제한할 수 있습니다.

DNS 확인자는 DNS 서버에서 현재 조회 속도를 처리할 수 없다고 판단되면 조회 속도를 자동으로 낮춥니다. 실제 속도는 모음 통계 출력에 보고됩니다.

기본값: 100개 요청

-F

<파일>

크롤러 전역 구성 파일을 지정합니다.

이 옵션을 사용하여 크롤러의 전역 구성이 들어 있는 XML 파일의 위치를 지정할 수 있으며, 전역 구성에는 모든 명령줄 옵션에 대한 기본값이 포함되어 있을 수도 있습니다.

많은 옵션을 XML 구성 파일과 크롤러 명령줄 도구 모두에서 지정할 수 있습니다. 명령줄 도구에 지정된 옵션이 우선적으로 적용됩니다.

시작 시 크롤러는 기본 CrawlerGlobalDefaults.xml 구성 파일(현재 디렉터리 또는 <FASTSearchFolder>\etc 폴더에 있음)을 찾습니다.

-n

유휴 상태 크롤러를 종료합니다.

크롤링 모음의 새로 고침 설정은 전체 모음을 크롤링하는 데 드는 시간보다 길어야 합니다.

기본값: disabled

-T

프로파일링을 사용하도록 설정합니다.

디버깅에만 사용합니다.

-t

hotshot 모듈을 사용하여 프로파일링을 사용하도록 설정합니다.

디버깅에만 사용합니다.

크롤러 로깅 옵션

옵션 설명

-L

<경로>

로그 저장소 디렉터리를 지정합니다.

이 옵션을 사용하여 지정된 디렉터리의 하위 디렉터리에 크롤러 특정 로그를 저장합니다.

기본값: %FASTSEARCH% 환경 변수가 설정된 경우 기본 경로는 %FASTSEARCH%\var\log\crawler입니다. 그렇지 않을 경우 기본 경로는 data\log입니다.

-q

자세한 정보 로깅을 사용하지 않습니다.

이 옵션은 CRITICAL, ERROR 및 WARNING 로그 메시지를 기록할 때만 사용합니다.

-l

<로그 수준>

다음과 같은 기록할 정보의 유형을 지정합니다.

  • debug

  • verbose

  • info

  • warning

  • error

크롤러 통합 옵션

옵션 설명

-o

FAST Search Server 2010 for SharePoint 모드를 사용하도록 설정합니다.

FAST Search Server 2010 for SharePoint 설정에서 크롤러를 실행할 때 이 옵션을 사용합니다.

-i

구성 서버를 무시합니다. 구성 서버에 연결할 수 없는 경우에도 크롤러가 계속 실행됩니다.

크롤러 다중 노드 옵션

옵션 설명

-U

FAST Search 웹 크롤러를 다중 노드 설정 시 다중 노드 스케줄러로 실행합니다.

-S 옵션을 사용하여 노드 스케줄러를 XML-RPC 포트에 연결합니다.

-S

<다중 노드 스케줄러 호스트>:<다중 노드 스케줄러 포트>

크롤러를 다중 노드 스케줄러의 노드 스케줄러로 시작합니다.

다중 노드 스케줄러의 호스트 이름 및 포트 번호를 지정합니다.

: crawler1.contoso.com:13000

-s

분산 설정 시 서바이벌 모드를 사용하므로 연결이 성공적으로 설정될 때까지 다중 노드 스케줄러에 계속 다시 연결하고 노드 스케줄러의 연결을 유지합니다.

이 옵션은 노드 스케줄러에만 적용됩니다.

-I

<노드 식별자>

크롤러 노드의 기호 이름을 지정합니다.

이 옵션은 거의 사용되지 않습니다. 다중 노드 크롤러 설정 시 크롤러 노드마다 크롤링 모음 구성에서 크롤링에 포함된 크롤러 노드를 지정하는 데 사용되는 고유한 기호 이름을 지정해야 합니다.

이 옵션은 노드 스케줄러에만 적용됩니다. 기본값이 자동으로 생성되어 구성 데이터베이스에 저장됩니다. 이 옵션을 사용하는 경우 대체 값을 한 번만 지정하면 됩니다. 즉, 크롤러가 처음 시작될 때 지정합니다.

포트 13000에서 독립 실행형 단일 노드 크롤러를 시작하려면 다음 예를 따릅니다.

<FASTSearchFolder>\bin\crawler -o -P 13000

이 예에서는 포트 13000에서 다중 노드 설정 시 다중 노드 스케줄러를 시작합니다.

<FASTSearchFolder>\bin\crawler -o -P 13000 -U

다음 예에서는 다중 노드 스케줄러에 연결하는 다른 노드에서 다중 노드 설정 시 노드 스케줄러를 시작합니다.

<FASTSearchFolder>\bin\crawler -o -P 13000 -S crawler1.contoso.com:13000

See Also

Concepts

crawlerglobaldefaults.xml 참조