다음을 통해 공유


crawleradmin.exe 참조

 

적용 대상: FAST Search Server 2010

마지막으로 수정된 항목: 2015-03-09

crawleradmin 도구를 사용하여 크롤링 모음을 구성하고 제어하고 모니터링할 수 있습니다. 예를 들어 crawleradmin을 사용하여 크롤링 모음을 추가, 업데이트 또는 삭제하거나 콘텐츠 공급을 일시 중단 또는 다시 시작하거나 진행 중인 크롤링(FAST Search 웹 크롤러 사용)을 모니터링할 수 있습니다. 크롤링 모음은 동일한 크롤링 구성을 사용하여 크롤링되는 웹 사이트 집합입니다.

참고

명령줄 도구를 사용하려면 FAST Search Server 2010 for SharePoint가 설치된 컴퓨터에서 FASTSearchAdministrators 로컬 그룹의 구성원이어야 하는 최소 요구 사항을 만족하는지 확인합니다.

Syntax

<FASTSearchFolder>\bin\crawleradmin [options]

Parameters

매개 변수 설명

<FASTSearchFolder>

FAST Search Server 2010 for SharePoint를 설치한 폴더의 경로(예: C:\FASTSearch)입니다.

crawleradmin 일반 옵션

옵션 및 약식 이름 필수 여부 설명

--crawlernode(-C)

<호스트 이름>[:<포트>]

아니요

지정한 호스트 이름과 포트(선택적)의 FAST Search 웹 크롤러를 관리합니다.

기본값: localhost:13000

--offline(-o)

<구성_디렉터리>

아니요

크롤러 실행으로 인해 잠긴 데이터베이스에 액세스하여 crawleradmin이 크롤러 관리 API를 통하지 않고 해당 데이터베이스에서 직접 작업을 수행할 수 있도록 합니다(오프라인 모드).

이 명령을 실행하기 전에 크롤러를 중지해야 합니다.

크롤러의 구성_디렉터리를 지정하지 않으면 명령에서 다음 기본 구성 디렉터리를 사용합니다. FASTSEARCH\data\crawler\config

또는 FASTSEARCH 환경 변수를 설정하지 않으면 다음 디렉터리가 사용됩니다. data\config

이 옵션과 함께 사용할 수 있는 값은 다음과 같습니다.

  • -a

  • -d

  • -c

  • -q

  • -G

  • -f

  • -d

  • --getdata

  • --verifyuri

-l

<로그-수준>

아니요

다음과 같은 기록할 정보의 유형을 지정합니다.

  • debug

  • verbose

  • info

  • warning

  • error

-h

아니요

도움말 정보를 표시합니다.

-v

아니요

버전 정보를 표시합니다.

크롤러 구성 옵션

옵션 및 약식 이름 필수 여부 설명

--addconfig (-f)

<XML_파일의_경로>

아니요

지정한 XML 파일에서 크롤링 모음 구성을 추가하거나 업데이트합니다.

--getcollection (-G)

<크롤링_모음>

아니요

지정한 크롤링 모음 이름(크롤러 XML 구성 파일에 정의됨)에 대한 XML 구성을 stdout에 출력하고 stdout을 파일에 저장합니다.

--delcollection (-d)

<크롤링_모음>

아니요

크롤링 모음과 크롤링 모음의 저장된 콘텐츠를 크롤러에서 삭제합니다.

--encrypt(-e)

<캐시 크기>

아니요

크롤링 모음 구성 파일에서 보안을 위해 암호를 암호화합니다.

크롤러 제어 옵션

옵션 및 약식 이름 필수 여부 설명

--suspendcollection(-s)

<크롤링_모음>

아니요

지정한 크롤링 모음에 대한 크롤링을 일시 중단합니다. 공급 큐에 있는 항목의 공급은 계속됩니다.

--resumecollection(-r)

<크롤링_모음>

아니요

지정한 크롤링 모음에 대한 크롤링을 다시 시작합니다.

--suspendfeed

<크롤링_모음>

아니요

크롤링 모음의 콘텐츠 공급을 일시 중단합니다.

필요한 경우 쉼표로 구분된 공급 대상(크롤링 모음 구성의 기호화된 이름) 목록을 지정합니다.

--resumefeed

<크롤링_모음>

아니요

크롤링 모음의 콘텐츠 공급을 다시 시작합니다.

필요한 경우 쉼표로 구분된 공급 대상(크롤링 모음 구성의 기호화된 이름) 목록을 지정합니다.

--enable-refreshing-crawlmode

<크롤링_모음>

아니요

크롤링 모음에 대해 refresh 크롤링 모드를 설정합니다.

이 모드를 설정하면 크롤러가 이전에 크롤링된 URI만 크롤링하고 새로 고칩니다.

--disable-refreshing-crawlmode

<크롤링_모음>

아니요

크롤링 모음에 대해 refresh 크롤링 모드를 해제하고 일반 크롤링 모드를 다시 시작합니다.

URI 전송, 다시 반입 및 다시 공급 옵션

옵션 및 약식 이름 필수 여부 설명

--adduri(-u)

<크롤링_모음>

아니요

지정한 URI를 크롤링 모음 작업 큐에 추가합니다.

URI를 추가하여 즉시 크롤링하려면 --force 플래그를 함께 사용합니다.

--addurifile

<크롤링_모음>

아니요

지정한 파일의 모든 URI를 크롤링 모음 작업 큐에 추가합니다.

URI를 추가하여 즉시 크롤링하려면 --force 플래그를 함께 사용합니다.

--refetch(-F)

<크롤링_모음>

아니요

크롤링 모음을 강제로 다시 가져옵니다.

크롤러가 기존 작업 큐를 모두 삭제하고 모든 캐시를 정리하며 새 크롤링 주기를 시작하고 알려진 모든 시작 URI를 작업 큐에 놓습니다. 고아 항목 검색에 사용되는 카운터(dbswitch)는 늘리지 마십시오.

--refetchuri(-F)

<크롤링_모음>

아니요

지정한 크롤링 모음에 있는 URI를 강제로 다시 가져옵니다.

이전에 크롤링된 URI일 필요는 없지만 크롤링 모음에 대한 포함/제외 규칙의 범위 내에 있어야 합니다.

또한 URI가 속해 있는 사이트에 대한 크롤링도 트리거합니다(이 새로 고침 기간에 사이트가 아직 크롤링되지 않은 경우).

--refetchsite

<크롤링_모음>:<URI>

아니요

지정한 크롤링 모음에 있는 URI에서 크롤링 사이트를 강제로 다시 가져옵니다.

--force

아니요

다음 옵션과 함께 사용하는 경우 URI가 즉시 크롤링되도록 합니다(활성 사이트의 크롤링이 취소될 수 있음).

  • --adduri

  • --addurifile

  • --refetchuri

  • --refetchsite

--feed

아니요

다음 옵션과 함께 사용하는 경우 항목 변경 상태에 관계없이 콘텐츠 인덱싱 프로세스에 URI를 다시 공급합니다.

  • --refetchuri

  • --refetchsite

--refeedsite

<크롤링_모음>:<크롤링_사이트>

아니요

크롤링 저장소의 모든 항목을 크롤링 사이트의 콘텐츠 인덱싱 프로세스에 다시 공급합니다.

<크롤링_사이트>는 호스트 이름(정규화된 호스트 이름)과 포트를 결합한 것으로, 웹 서버를 호스팅하는 서버를 고유하게 식별합니다.

단일 사이트에서 명령줄 도구 및 매개 변수 postprocess -R을 실행하는 것과 동일한 결과를 가져오지만 크롤러를 중지할 필요가 없습니다. 런타임에 동시 재공급 수를 제한하여 크롤러에 과부하가 발생하지 않도록 해야 합니다.

다시 공급된 URI는 우선 순위가 높은 큐에 놓입니다. 공급은 우선 순위가 높은 큐와 보통인 큐에서 모두 동시에 발생합니다. 항목을 검색할 수 있게 될 때까지 약간의 지연이 발생할 수도 있습니다.

--refeeduri

<크롤링_모음>:<URI>

아니요

지정한 URI를 크롤링 저장소에서 인덱스 프로세스에 다시 공급합니다.

자세한 내용은 --refeedsite를 참조하십시오.

--refeedprefix

<접두사>

아니요

다시 공급하기 위해 URI와 일치해야 할 URI 접두사(스키마 포함)를 지정합니다.

--refeedsite와 함께 사용합니다.

--refeedtarget

<대상>:<크롤링_모음>

아니요

--refeed 옵션에 대한 공급 대상과 콘텐츠 모음을 지정합니다.

취소, 격리 및 삭제 옵션

옵션 및 약식 이름 필수 여부 설명

--preemptsite(-p)

<크롤링_모음>:<크롤링_사이트>

아니요

지정한 크롤링 모음에 대해 사이트 크롤링을 취소합니다.

--quarantine

<크롤링_모음>:<크롤링_사이트>:<시간>

아니요

지정한 시간(초) 동안 사이트가 크롤링되지 않도록 차단합니다.

--unquarantine

<크롤링_모음>:<크롤링_사이트>

아니요

지정한 크롤링 모음에 대해 크롤링 사이트를 격리에서 제외합니다.

--deletesite

<크롤링_모음>:<크롤링_사이트>

아니요

지정한 크롤링 모음에 대해 크롤링 사이트를 크롤러에서 삭제합니다.

--deluri

<크롤링_모음>:<URI>

아니요

크롤링 모음에서 URI를 삭제합니다.

--delurifile

<크롤링_모음>:<파일>

아니요

크롤링 모음에서 URI를 삭제합니다. <파일>은 크롤링 모음에서 제거할, 줄 바꿈으로 구분된 URI 파일입니다.

통계 옵션

옵션 및 약식 이름 필수 여부 설명

--collstats(-q)

<크롤링_모음>

아니요

크롤링 모음에 대한 크롤링 통계를 표시합니다.

--collstatsquiet(-Q)

<크롤링_모음>

아니요

크롤링 모음에 대한 크롤링 통계 요약을 표시합니다.

--statistics(-c)

아니요

모든 크롤링 모음에 대한 크롤링 통계를 표시합니다.

--sitestats

<크롤링_모음>:<크롤링_사이트>

아니요

크롤링 모음의 지정한 크롤링 사이트에 대한 크롤링 통계를 표시합니다.

--cycle

1에서 n까지의 숫자 또는 "all"

아니요

다음 옵션과 함께 사용하는 경우 지정한 크롤링 새로 고침 주기의 통계를 표시합니다.

  • --collstats

  • --collstatsquiet

  • --statistics

  • --sitestats

모든 새로 고침 주기의 통계를 병합하려면 "all"을 지정합니다.

기본값: 현재 주기

모니터링 옵션

옵션 및 약식 이름 필수 여부 설명

--status

아니요

다음을 포함하여 모든 크롤링 모음의 상태를 표시합니다.

  • 크롤링 모음 이름

  • 상태(예: 유휴)

  • 공급 상태(예: 공급 중)

  • 활성 사이트 수

  • 저장된 항목 수

  • 항목 비율

--nodestatus

아니요

모든 크롤링 모음의 상태(노드별)를 표시합니다. 보고되는 정보는 --status 옵션의 항목과 비슷합니다.

--active(-a)

아니요

모든 활성 크롤링 모음 이름을 표시합니다.

--nummanagers(-n)

아니요

현재 크롤링 중인 크롤링 사이트의 수를 표시합니다.

--sitemanagerstatus(-S)

<ID>

아니요

지정한 사이트 관리자 <ID>의 상태를 표시합니다.

상태에는 지정한 사이트 관리자에서 현재 크롤링 중인 사이트의 목록과 작업 큐 크기, 보류 중인 URI 및 전역 캐시 특성과 같은 추가 정보가 포함됩니다.

--numworkers(-N)

<ID>

아니요

사이트 관리자에 대한 활성 사이트 수를 표시합니다.

--sites(-t)

<ID>

아니요

사이트 관리자가 현재 크롤링 중인 사이트를 나열합니다.

--starturistat

아니요

시작 URI 파일의 공급 상태를 표시합니다.

디버깅 옵션(고급 사용자용)

옵션 및 약식 이름 필수 여부 설명

--getlogin

<양식 URI>

아니요

<양식 URI>를 다운로드하고, 양식에서 로그온 정보를 추출하고, 양식 문서에서 XML 구성을 생성합니다.

--extractlinks

<URI>

아니요

URI를 다운로드하고 URI에서 전달 링크를 추출합니다.

--addheader

<HTTP 헤더 문자열>

아니요

다음 옵션과 함께 사용하는 경우 HTTP 요청에 추가 HTTP 헤더를 추가합니다.

  • --getlogin

  • --extractlinks

--verifyuri

<크롤링_모음>:<URI>

아니요

크롤링 모음 구성의 포함 및 제외 규칙을 기반으로 크롤링 모음에서 URI를 크롤링할 수 있는지 여부를 확인합니다.

--getdata

<크롤링_모음>:<URI>

아니요

크롤링 저장소에서 한 크롤링 모음의 URI에 대해 다운로드된 콘텐츠를 검색합니다.

--idn

<URI>

아니요

IDNA로 인코딩된 URI 버전을 가져옵니다.

모음 구성을 사용하여 크롤러를 추가하거나 업데이트하려면

<FASTSearchFolder>\bin\crawleradmin -f MyCrawlCollectionConfig.xml

크롤러에서 모음을 제거하려면

<FASTSearchFolder>\bin\crawleradmin -d MyCollection

모음의 크롤링을 일시 중단하려면

<FASTSearchFolder>\bin\crawleradmin --suspendcollection MyCollection

크롤링할 URI를 모음에 추가하려면

<FASTSearchFolder>\bin\crawleradmin --adduri MyCollection:https://www.contoso.com/

크롤링 모음의 통계를 표시하려면

<FASTSearchFolder>\bin\crawleradmin -q MyCollection

크롤링 모음의 특정 사이트에 대한 통계를 표시하려면

<FASTSearchFolder>\bin\crawleradmin --sitestats MyCollection:www.contoso.com

1시간 동안 www.contoso.com 사이트가 크롤링되지 않도록 일시적으로 차단하려면(사이트가 현재 크롤링되고 있는 경우도 포함)

<FASTSearchFolder>\bin\crawleradmin --quarantine MyCollection:www.contoso.com:3600

크롤러의 모든 모음에 대한 통계를 표시하려면

<FASTSearchFolder>\bin\crawleradmin --status