crawleradmin.exe リファレンス
適用先: FAST Search Server 2010
トピックの最終更新日: 2015-03-09
crawleradmin ツールを使用して、クロール コレクションの構成、制御、および監視を行います。たとえば、crawleradmin を使用して、クロール コレクションの追加、更新、または削除を行ったり、コンテンツのフィードを中止または再開したり、(FAST Search Web クローラーを使用している) 進行中のクロールを監視したりします。クロール コレクションは、同じクロール構成を使用してクロールされる Web サイトの集合です。
注意
コマンドライン ツールを使用するには、使用者が以下の最小要件を満たしていることを確認します。FAST Search Server 2010 for SharePoint がインストールされているコンピューター上の FASTSearchAdministrators ローカル グループのメンバーであること。
Syntax
<FASTSearchFolder>\bin\crawleradmin [options]
Parameters
パラメーター | 説明 |
---|---|
<FASTSearchFolder> |
C:\FASTSearch など、FAST Search Server 2010 for SharePoint をインストールしたフォルダーのパスです。 |
crawleradmin の全般的なオプション
オプション (および略称) | 値 | 必須か | 説明 |
---|---|---|---|
--crawlernode (-C) |
<ホスト名>[:<ポート>] |
省略可能 |
指定されたホスト名およびポート (省略可能) で FAST Search Web クローラーを管理します。 既定値: localhost:13000 |
--offline (-o) |
<構成ディレクトリ> |
省略可能 |
crawleradmin がクローラー管理 API を介してではなく、直接データベースを操作できるように、実行中のクローラーによってロックされているデータベースにアクセスします (オフライン モード)。 このコマンドを発行する前にクローラーを停止する必要があります。 クローラーの構成ディレクトリを指定しない場合、このコマンドでは、次の既定の構成ディレクトリを使用します。 FASTSEARCH\data\crawler\config または、 FASTSEARCH 環境変数が設定されていない場合、次のディレクトリを使用します。 data\config このオプションは以下のオプションと組み合わせて使用できます。
|
-l |
<ログ レベル> |
省略可能 |
ログに対して情報の種類を指定します。
|
-h |
省略可能 |
ヘルプ情報を表示します。 |
|
-v |
省略可能 |
バージョン情報を表示します。 |
クローラー構成オプション
オプション (および略称) | 値 | 必須か | 説明 |
---|---|---|---|
--addconfig (-f) |
<XML ファイルへのパス> |
省略可能 |
指定された XML ファイルでクロール コレクションの構成を追加または更新します。 |
--getcollection (-G) |
<クロール コレクション> |
省略可能 |
指定されたクロール コレクション名の XML 構成 (クローラー XML 構成ファイルで定義) を stdout に出力し、stdout をファイルに保存します。 |
--delcollection (-d) |
<クロール コレクション> |
省略可能 |
クロール コレクションおよび保存されているそのクロール コレクションのコンテンツをクローラーから削除します。 |
--encrypt (-e) |
<キャッシュ サイズ> |
省略可能 |
クロール コレクション構成ファイル内のセキュリティ用のパスワードを暗号化します。 |
クローラー制御オプション
オプション (および略称) | 値 | 必須か | 説明 |
---|---|---|---|
--suspendcollection (-s) |
<クロール コレクション> |
省略可能 |
指定されたクロール コレクションのクロールを中止します。フィード キュー内のアイテムのフィードは続行します。 |
--resumecollection (-r) |
<クロール コレクション> |
省略可能 |
指定されたクロール コレクションのクロールを再開します。 |
--suspendfeed |
<クロール コレクション>[: ターゲット] |
省略可能 |
クロール コレクションのコンテンツのフィードを中止します。 オプションで、フィードのターゲット (クロール コレクション構成内のシンボル名) のカンマ区切りのリストを指定します。 |
--resumefeed |
<クロール コレクション>[: ターゲット] |
省略可能 |
クロール コレクションのコンテンツのフィードを再開します。 オプションで、フィードのターゲット (クロール コレクション構成内のシンボル名) のカンマ区切りのリストを指定します。 |
--enable-refreshing-crawlmode |
<クロール コレクション> |
省略可能 |
クロール コレクションの refresh クロール モードを有効にします。 有効にすると、クローラーは前にクロールされた URI のみをクロールまたは最新の情報に更新します。 |
--disable-refreshing-crawlmode |
<クロール コレクション> |
省略可能 |
クロール コレクションの refresh クロールモードを無効にし、通常のクロール モードを再開します。 |
URI の送信、再取得、再フィード オプション
オプション (および略称) | 値 | 必須か | 説明 |
---|---|---|---|
--adduri (-u) |
<クロール コレクション>:<URI> |
省略可能 |
指定された URI をクロール コレクションのワーク キューの末尾に追加します。 URI をキューの先頭に追加して直ちにクロールするには、--force フラグと組み合わせて指定します。 |
--addurifile |
<クロール コレクション>:<ファイル> |
省略可能 |
指定されたファイルに保存されているすべての URI をクロール コレクションのワーク キューの末尾に追加します。 URI をキューの先頭に追加して直ちにクロールするには、--force フラグと組み合わせて指定します。 |
--refetch (-F) |
<クロール コレクション> |
省略可能 |
クロール コレクションを強制的に再取得します。 クローラーは、すべての既存のワーク キューを削除し、すべてのキャッシュを消去し、新しいクロール周期を開始し、すべての既知の開始 URI をワーク キューに格納します。孤立データの検出に使用されるカウンターは増やしません (dbswitch)。 |
--refetchuri (-F) |
<クロール コレクション>:<URI> |
省略可能 |
指定されたクロール コレクション内の URI を強制的に再取得します。 再取得する URI が以前にクロールされている必要はありません。ただし、クロール コレクションの対象ルール/除外ルールの範囲に収まっている必要があります。 この処理を実行することによって、(この更新期間内にサイトが既にクロールされていない限り) URI が属するサイトのクロールも開始されます。 |
--refetchsite |
<クロール コレクション>:<URI> |
省略可能 |
指定されたクロール コレクション内の URI からクロール サイトを強制的に再取得します。 |
--force |
省略可能 |
以下のオプションと組み合わせて使用したときに、URI が直ちにクロールされるようにします (アクティブなサイトを横取りする可能性があります)。
|
|
--feed |
省略可能 |
以下のオプションと組み合わせて使用したときに、(アイテムの変更状態にかかわらず) コンテンツのインデックス作成プロセスに URI を再フィードします。
|
|
--refeedsite |
<クロール コレクション>:<クロール サイト> |
省略可能 |
クローラー ストア内のすべてのアイテムをクロール サイトのコンテンツのインデックス作成プロセスに再フィードします。 <クロール サイト> はホスト名 (完全修飾パスを使用できます) とポートの組み合わせです。それら 2 項目の組み合わせによって Web サーバーをホストできるサーバーを一意に識別します。 これは単一サイトでコマンドライン ツールとパラメーター postprocess -R を実行するのと同じですが、クローラーを停止する必要はありません。クローラーの過負荷を防止するために、実行時には同時再フィードの数を制限する必要があります。 再フィードされた URI は優先度の高いキューに格納されます。フィードは優先度の高いキューと優先度が通常のキューの両方から同時に行われます。アイテムが検索可能になるまでの遅延を感じることがあります。 |
--refeeduri |
<クロール コレクション>:<URI> |
省略可能 |
指定された URI をクロール ストアからインデックス作成プロセスへ再フィードします。 詳細については、--refeedsite を参照してください。 |
--refeedprefix |
<プレフィックス> |
省略可能 |
URI を再フィードする条件として一致する必要がある URI プレフィックス (スキームを含む) を指定します。 --refeedsite と組み合わせて使用します。 |
--refeedtarget |
<フィード先>:<クロール コレクション> |
省略可能 |
--refeed オプションのフィード先とコンテンツ コレクションを指定します。 |
横取り、検疫、および削除オプション
オプション (および略称) | 値 | 必須か | 説明 |
---|---|---|---|
--preemptsite (-p) |
<クロール コレクション>:<クロール サイト> |
省略可能 |
指定されたクロール コレクションのサイトのクロールを横取りします。 |
--quarantine |
<クロール コレクション>:<クロール サイト>:<時間> |
省略可能 |
指定された秒数の間、サイトのクロールをブロックします。 |
--unquarantine |
<クロール コレクション>:<クロール サイト> |
省略可能 |
指定されたクロール コレクションの検疫対象からクロール サイトを除外します。 |
--deletesite |
<クロール コレクション>:<クロール サイト> |
省略可能 |
指定されたクロール コレクションのクローラーからクロール サイトを削除します。 |
--deluri |
<クロール コレクション>:<URI> |
省略可能 |
クロール コレクションから URI を削除します。 |
--delurifile |
<クロール コレクション>:<ファイル> |
省略可能 |
クロール コレクションから URI を削除します。<ファイル> はクロール コレクションから削除する、改行記号で区切られた URI のファイルです。 |
統計オプション
オプション (および略称) | 値 | 必須か | 説明 |
---|---|---|---|
--collstats (-q) |
<クロール コレクション> |
省略可能 |
クロール コレクションのクロール統計情報を表示します。 |
--collstatsquiet (-Q) |
<クロール コレクション> |
省略可能 |
クロール コレクションのクロール統計情報の要約を表示します。 |
--statistics (-c) |
省略可能 |
すべてのコレクションのクロール統計情報を表示します。 |
|
--sitestats |
<クロール コレクション>:<クロール サイト> |
省略可能 |
クロール コレクション内の指定されたクロール サイトのクロール統計情報を表示します。 |
--cycle |
1 から n までの数字または "all" |
省略可能 |
以下のオプションと組み合わせて使用するときに、指定されたクロール更新周期中の統計情報を表示します。
すべての更新周期の統計情報を結合するには、"all" を指定します。 既定値: 現在の周期 |
監視オプション
オプション (および略称) | 値 | 必須か | 説明 |
---|---|---|---|
--status |
省略可能 |
以下を含むすべてのクロール コレクションの状態を表示します。
|
|
--nodestatus |
省略可能 |
すべてのクロール コレクションの状態を (ノードごとに) 表示します (報告される情報は --status オプションのアイテムと同様です)。 |
|
--active (-a) |
省略可能 |
すべてのアクティブなクロール コレクション名を表示します。 |
|
--nummanagers (-n) |
省略可能 |
現在クロール中のクロール サイトの数を表示します。 |
|
--sitemanagerstatus (-S) |
<ID> |
省略可能 |
指定されたサイト マネージャー <ID> の状態を表示します。 状態には、指定されたサイト マネージャーで現在クロール中のサイトのリスト、およびワーク キューのサイズ、保留中の URI、およびグローバル キャッシュの統計情報などの追加情報が含まれます。 |
--numworkers (-N) |
<ID> |
省略可能 |
サイト マネージャーに対応するアクティブなサイトの数を表示します。 |
--sites (-t) |
<ID> |
省略可能 |
サイト マネージャーによって現在クロールされているサイトの一覧を表示します。 |
--starturistat |
省略可能 |
開始 URI ファイルのフィード状態を表示します。 |
デバッグ オプション (上級ユーザー向け)
オプション (および略称) | 値 | 必須か | 説明 |
---|---|---|---|
--getlogin |
<フォームの URI> |
省略可能 |
フォームの URI をダウンロードし、フォームからログオン情報を抽出し、フォーム ドキュメントから XML 構成を生成します。 |
--extractlinks |
<URI> |
省略可能 |
URI をダウンロードし、その URI から前方リンクを抽出します。 |
--addheader |
<HTTP ヘッダー文字列> |
省略可能 |
以下のオプションと組み合わせて使用するときに、HTTP 要求に HTTP ヘッダーを追加します。
|
--verifyuri |
<クロール コレクション>:<URI> |
省略可能 |
クロール コレクションの URI を (クロール コレクション構成の対象ルールおよび除外ルールに基づいて) クロールできるかどうか確認します。 |
--getdata |
<クロール コレクション>:<URI> |
省略可能 |
クローラー ストアからダウンロードされた、1 つのクロール コレクション内の URI のコンテンツを取得します。 |
--idn |
<URI> |
省略可能 |
URI の IDNA エンコードされたバージョンを取得します。 |
例
コレクション構成のクローラーを追加または更新する例
<FASTSearchFolder>\bin\crawleradmin -f MyCrawlCollectionConfig.xml
クローラーからコレクションを削除する例
<FASTSearchFolder>\bin\crawleradmin -d MyCollection
コレクションのクロールを中止する例
<FASTSearchFolder>\bin\crawleradmin --suspendcollection MyCollection
クロールの対象として URI をコレクションに追加する例
<FASTSearchFolder>\bin\crawleradmin --adduri MyCollection:https://www.contoso.com/
クロール コレクションの統計情報を表示する例
<FASTSearchFolder>\bin\crawleradmin -q MyCollection
クロール コレクション内の特定のサイトの統計情報を表示する例
<FASTSearchFolder>\bin\crawleradmin --sitestats MyCollection:www.contoso.com
サイトが現在クロールされているかどうかに関係なく、1 時間にわたって www.contoso.com サイトのクロールを一時的にブロックする例
<FASTSearchFolder>\bin\crawleradmin --quarantine MyCollection:www.contoso.com:3600
クローラー内のすべてのコレクションの状態を表示する例
<FASTSearchFolder>\bin\crawleradmin --status