次の方法で共有


crawleradmin.exe リファレンス

 

適用先: FAST Search Server 2010

トピックの最終更新日: 2015-03-09

crawleradmin ツールを使用して、クロール コレクションの構成、制御、および監視を行います。たとえば、crawleradmin を使用して、クロール コレクションの追加、更新、または削除を行ったり、コンテンツのフィードを中止または再開したり、(FAST Search Web クローラーを使用している) 進行中のクロールを監視したりします。クロール コレクションは、同じクロール構成を使用してクロールされる Web サイトの集合です。

注意

コマンドライン ツールを使用するには、使用者が以下の最小要件を満たしていることを確認します。FAST Search Server 2010 for SharePoint がインストールされているコンピューター上の FASTSearchAdministrators ローカル グループのメンバーであること。

Syntax

<FASTSearchFolder>\bin\crawleradmin [options]

Parameters

パラメーター 説明

<FASTSearchFolder>

C:\FASTSearch など、FAST Search Server 2010 for SharePoint をインストールしたフォルダーのパスです。

crawleradmin の全般的なオプション

オプション (および略称) 必須か 説明

--crawlernode (-C)

<ホスト名>[:<ポート>]

省略可能

指定されたホスト名およびポート (省略可能) で FAST Search Web クローラーを管理します。

既定値: localhost:13000

--offline (-o)

<構成ディレクトリ>

省略可能

crawleradmin がクローラー管理 API を介してではなく、直接データベースを操作できるように、実行中のクローラーによってロックされているデータベースにアクセスします (オフライン モード)。

このコマンドを発行する前にクローラーを停止する必要があります。

クローラーの構成ディレクトリを指定しない場合、このコマンドでは、次の既定の構成ディレクトリを使用します。 FASTSEARCH\data\crawler\config

または、 FASTSEARCH 環境変数が設定されていない場合、次のディレクトリを使用します。 data\config

このオプションは以下のオプションと組み合わせて使用できます。

  • -a

  • -d

  • -c

  • -q

  • -G

  • -f

  • -d

  • --getdata

  • --verifyuri

-l

<ログ レベル>

省略可能

ログに対して情報の種類を指定します。

  • debug

  • verbose

  • info

  • warning

  • error

-h

省略可能

ヘルプ情報を表示します。

-v

省略可能

バージョン情報を表示します。

クローラー構成オプション

オプション (および略称) 必須か 説明

--addconfig (-f)

<XML ファイルへのパス>

省略可能

指定された XML ファイルでクロール コレクションの構成を追加または更新します。

--getcollection (-G)

<クロール コレクション>

省略可能

指定されたクロール コレクション名の XML 構成 (クローラー XML 構成ファイルで定義) を stdout に出力し、stdout をファイルに保存します。

--delcollection (-d)

<クロール コレクション>

省略可能

クロール コレクションおよび保存されているそのクロール コレクションのコンテンツをクローラーから削除します。

--encrypt (-e)

<キャッシュ サイズ>

省略可能

クロール コレクション構成ファイル内のセキュリティ用のパスワードを暗号化します。

クローラー制御オプション

オプション (および略称) 必須か 説明

--suspendcollection (-s)

<クロール コレクション>

省略可能

指定されたクロール コレクションのクロールを中止します。フィード キュー内のアイテムのフィードは続行します。

--resumecollection (-r)

<クロール コレクション>

省略可能

指定されたクロール コレクションのクロールを再開します。

--suspendfeed

<クロール コレクション>[: ターゲット]

省略可能

クロール コレクションのコンテンツのフィードを中止します。

オプションで、フィードのターゲット (クロール コレクション構成内のシンボル名) のカンマ区切りのリストを指定します。

--resumefeed

<クロール コレクション>[: ターゲット]

省略可能

クロール コレクションのコンテンツのフィードを再開します。

オプションで、フィードのターゲット (クロール コレクション構成内のシンボル名) のカンマ区切りのリストを指定します。

--enable-refreshing-crawlmode

<クロール コレクション>

省略可能

クロール コレクションの refresh クロール モードを有効にします。

有効にすると、クローラーは前にクロールされた URI のみをクロールまたは最新の情報に更新します。

--disable-refreshing-crawlmode

<クロール コレクション>

省略可能

クロール コレクションの refresh クロールモードを無効にし、通常のクロール モードを再開します。

URI の送信、再取得、再フィード オプション

オプション (および略称) 必須か 説明

--adduri (-u)

<クロール コレクション>:<URI>

省略可能

指定された URI をクロール コレクションのワーク キューの末尾に追加します。

URI をキューの先頭に追加して直ちにクロールするには、--force フラグと組み合わせて指定します。

--addurifile

<クロール コレクション>:<ファイル>

省略可能

指定されたファイルに保存されているすべての URI をクロール コレクションのワーク キューの末尾に追加します。

URI をキューの先頭に追加して直ちにクロールするには、--force フラグと組み合わせて指定します。

--refetch (-F)

<クロール コレクション>

省略可能

クロール コレクションを強制的に再取得します。

クローラーは、すべての既存のワーク キューを削除し、すべてのキャッシュを消去し、新しいクロール周期を開始し、すべての既知の開始 URI をワーク キューに格納します。孤立データの検出に使用されるカウンターは増やしません (dbswitch)。

--refetchuri (-F)

<クロール コレクション>:<URI>

省略可能

指定されたクロール コレクション内の URI を強制的に再取得します。

再取得する URI が以前にクロールされている必要はありません。ただし、クロール コレクションの対象ルール/除外ルールの範囲に収まっている必要があります。

この処理を実行することによって、(この更新期間内にサイトが既にクロールされていない限り) URI が属するサイトのクロールも開始されます。

--refetchsite

<クロール コレクション>:<URI>

省略可能

指定されたクロール コレクション内の URI からクロール サイトを強制的に再取得します。

--force

省略可能

以下のオプションと組み合わせて使用したときに、URI が直ちにクロールされるようにします (アクティブなサイトを横取りする可能性があります)。

  • --adduri

  • --addurifile

  • --refetchuri

  • --refetchsite

--feed

省略可能

以下のオプションと組み合わせて使用したときに、(アイテムの変更状態にかかわらず) コンテンツのインデックス作成プロセスに URI を再フィードします。

  • --refetchuri

  • --refetchsite

--refeedsite

<クロール コレクション>:<クロール サイト>

省略可能

クローラー ストア内のすべてのアイテムをクロール サイトのコンテンツのインデックス作成プロセスに再フィードします。

<クロール サイト> はホスト名 (完全修飾パスを使用できます) とポートの組み合わせです。それら 2 項目の組み合わせによって Web サーバーをホストできるサーバーを一意に識別します。

これは単一サイトでコマンドライン ツールとパラメーター postprocess -R を実行するのと同じですが、クローラーを停止する必要はありません。クローラーの過負荷を防止するために、実行時には同時再フィードの数を制限する必要があります。

再フィードされた URI は優先度の高いキューに格納されます。フィードは優先度の高いキューと優先度が通常のキューの両方から同時に行われます。アイテムが検索可能になるまでの遅延を感じることがあります。

--refeeduri

<クロール コレクション>:<URI>

省略可能

指定された URI をクロール ストアからインデックス作成プロセスへ再フィードします。

詳細については、--refeedsite を参照してください。

--refeedprefix

<プレフィックス>

省略可能

URI を再フィードする条件として一致する必要がある URI プレフィックス (スキームを含む) を指定します。

--refeedsite と組み合わせて使用します。

--refeedtarget

<フィード先>:<クロール コレクション>

省略可能

--refeed オプションのフィード先とコンテンツ コレクションを指定します。

横取り、検疫、および削除オプション

オプション (および略称) 必須か 説明

--preemptsite (-p)

<クロール コレクション>:<クロール サイト>

省略可能

指定されたクロール コレクションのサイトのクロールを横取りします。

--quarantine

<クロール コレクション>:<クロール サイト>:<時間>

省略可能

指定された秒数の間、サイトのクロールをブロックします。

--unquarantine

<クロール コレクション>:<クロール サイト>

省略可能

指定されたクロール コレクションの検疫対象からクロール サイトを除外します。

--deletesite

<クロール コレクション>:<クロール サイト>

省略可能

指定されたクロール コレクションのクローラーからクロール サイトを削除します。

--deluri

<クロール コレクション>:<URI>

省略可能

クロール コレクションから URI を削除します。

--delurifile

<クロール コレクション>:<ファイル>

省略可能

クロール コレクションから URI を削除します。<ファイル> はクロール コレクションから削除する、改行記号で区切られた URI のファイルです。

統計オプション

オプション (および略称) 必須か 説明

--collstats (-q)

<クロール コレクション>

省略可能

クロール コレクションのクロール統計情報を表示します。

--collstatsquiet (-Q)

<クロール コレクション>

省略可能

クロール コレクションのクロール統計情報の要約を表示します。

--statistics (-c)

省略可能

すべてのコレクションのクロール統計情報を表示します。

--sitestats

<クロール コレクション>:<クロール サイト>

省略可能

クロール コレクション内の指定されたクロール サイトのクロール統計情報を表示します。

--cycle

1 から n までの数字または "all"

省略可能

以下のオプションと組み合わせて使用するときに、指定されたクロール更新周期中の統計情報を表示します。

  • --collstats

  • --collstatsquiet

  • --statistics

  • --sitestats

すべての更新周期の統計情報を結合するには、"all" を指定します。

既定値: 現在の周期

監視オプション

オプション (および略称) 必須か 説明

--status

省略可能

以下を含むすべてのクロール コレクションの状態を表示します。

  • クロール コレクション名

  • 状態 (たとえば idle)

  • フィード状態 (たとえば Feeding)

  • アクティブなサイトの数

  • 格納されたアイテムの数

  • アイテム速度

--nodestatus

省略可能

すべてのクロール コレクションの状態を (ノードごとに) 表示します (報告される情報は --status オプションのアイテムと同様です)。

--active (-a)

省略可能

すべてのアクティブなクロール コレクション名を表示します。

--nummanagers (-n)

省略可能

現在クロール中のクロール サイトの数を表示します。

--sitemanagerstatus (-S)

<ID>

省略可能

指定されたサイト マネージャー <ID> の状態を表示します。

状態には、指定されたサイト マネージャーで現在クロール中のサイトのリスト、およびワーク キューのサイズ、保留中の URI、およびグローバル キャッシュの統計情報などの追加情報が含まれます。

--numworkers (-N)

<ID>

省略可能

サイト マネージャーに対応するアクティブなサイトの数を表示します。

--sites (-t)

<ID>

省略可能

サイト マネージャーによって現在クロールされているサイトの一覧を表示します。

--starturistat

省略可能

開始 URI ファイルのフィード状態を表示します。

デバッグ オプション (上級ユーザー向け)

オプション (および略称) 必須か 説明

--getlogin

<フォームの URI>

省略可能

フォームの URI をダウンロードし、フォームからログオン情報を抽出し、フォーム ドキュメントから XML 構成を生成します。

--extractlinks

<URI>

省略可能

URI をダウンロードし、その URI から前方リンクを抽出します。

--addheader

<HTTP ヘッダー文字列>

省略可能

以下のオプションと組み合わせて使用するときに、HTTP 要求に HTTP ヘッダーを追加します。

  • --getlogin

  • --extractlinks

--verifyuri

<クロール コレクション>:<URI>

省略可能

クロール コレクションの URI を (クロール コレクション構成の対象ルールおよび除外ルールに基づいて) クロールできるかどうか確認します。

--getdata

<クロール コレクション>:<URI>

省略可能

クローラー ストアからダウンロードされた、1 つのクロール コレクション内の URI のコンテンツを取得します。

--idn

<URI>

省略可能

URI の IDNA エンコードされたバージョンを取得します。

コレクション構成のクローラーを追加または更新する例

<FASTSearchFolder>\bin\crawleradmin -f MyCrawlCollectionConfig.xml

クローラーからコレクションを削除する例

<FASTSearchFolder>\bin\crawleradmin -d MyCollection

コレクションのクロールを中止する例

<FASTSearchFolder>\bin\crawleradmin --suspendcollection MyCollection

クロールの対象として URI をコレクションに追加する例

<FASTSearchFolder>\bin\crawleradmin --adduri MyCollection:https://www.contoso.com/

クロール コレクションの統計情報を表示する例

<FASTSearchFolder>\bin\crawleradmin -q MyCollection

クロール コレクション内の特定のサイトの統計情報を表示する例

<FASTSearchFolder>\bin\crawleradmin --sitestats MyCollection:www.contoso.com

サイトが現在クロールされているかどうかに関係なく、1 時間にわたって www.contoso.com サイトのクロールを一時的にブロックする例

<FASTSearchFolder>\bin\crawleradmin --quarantine MyCollection:www.contoso.com:3600

クローラー内のすべてのコレクションの状態を表示する例

<FASTSearchFolder>\bin\crawleradmin --status