SharePoint Server でクロール ルールを管理する

適用対象:yes-img-13 2013yes-img-162016 yes-img-192019 yes-img-seSubscription Edition no-img-sopSharePoint in Microsoft 365

クロール ルールを追加することで、コンテンツをクロールするときに特定のパスを含めたり、除外したりできます。 パスを含める場合は、クロール用の代替アカウント資格情報を指定できます。 クロール ルールの作成や編集のほかに、既存のクロール ルールをテスト、編集、削除したり、並べ替えたりすることができます。

クロール ルールを使用して、以下のことを行います。

  • サイト上のコンテンツがクロールされないようにします。 たとえば、クロールするコンテンツ ソースを作成したが、検索システムがサブディレクトリhttp://www.contoso.com/downloads'http://www.contoso.com' からコンテンツをクロールしないようにする場合は、そのサブディレクトリからコンテンツを除外するクロール ルールを作成します。

  • それ以外の場合は除外されるサイトのコンテンツをクロールします。 たとえば、 コンテンツを 'http://www.contoso.com/downloads' からクロールから除外したが、サブディレクトリ 'http://www.contoso.com/downloads/content' のコンテンツをクロールする場合は、そのサブディレクトリのコンテンツを含めるクロール ルールを作成します。

  • 認証資格情報を指定する。 クロール対象のサイトで、既定のコンテンツ アクセス アカウントの資格情報とは異なる資格情報を必要とする場合は、認証用の資格情報を指定するクロール ルールを作成します。

クロール ルールでは、アスタリスク (*) をワイルドカード文字として使用できます。 たとえば、'' のクロールから JPEG ファイルを除外するには、'http://www.contoso.com*.jpg' をhttp://www.contoso.com/除外するクロール ルールを作成します。

クロール ルールの順序は重要です。これは、特定のコンテンツ セットと一致する最初のルールが適用されるからです。

クロール ルールを作成または編集するには

  1. この手順を実行しているユーザー アカウントが Search Service アプリケーションの管理者であることを確認します。

  2. サーバーの全体管理の [ アプリケーション構成の管理] セクションで、[ サービス アプリケーションの管理] をクリックします。

  3. [サービス アプリケーションの管理] ページのサービス アプリケーションの一覧で、[Search service アプリケーション] をクリックします。

  4. [検索管理] ページの [ クロール] セクションで、[ クロール ルール] をクリックします。 [クロール ルールの管理] ページが表示されます。

  5. 新しいクロール ルールを作成するには、[新しいクロール ルール] をクリックします。 既存のクロール ルールを編集するには、クロール ルールの一覧で、編集するクロール ルールの名前をポイントし、表示される矢印をクリックして、[ 編集] をクリックします。

  6. [クロール ルールの追加] ページの [ パス] セクションで、次の操作を行います。

  • [ パス] ボックスに、クロール ルールを適用するパスを入力します。 このパスでは、標準のワイルドカード文字を使用できます。

  • ワイルドカード文字ではなく正規表現を使用するには、[ このルールのマッチングに正規表現構文を使用する] を選択します。

  1. [ クロールの構成] セクションで、次のいずれかのオプションを選択します。
  • [このパスにあるアイテムをすべて除外する]。 指定したパスにあるすべてのアイテムをクロールから除外する場合は、このオプションを選択します。 このオプションを選択した場合は、[ 除外する複雑な URL (疑問符を含む URL (?)] を選択して、疑問符 (?) 表記を使用するパラメーターを含む URL を除外することで除外を絞り込むことができます。

  • [このパスにあるアイテムをすべて含める]。 パスにあるすべてのアイテムをクロールする場合は、このオプションを選択します。 このオプションを選択した場合は、次のオプションの任意の組み合わせを選択することで、包含をさらに絞り込むことができます。

    [URL 自体をクロールしないで URL のリンクをたどる]。 開始 URL 自体をクロールせずに、URL に含まれるリンクをクロールする場合は、このオプションを選択します。

    [複合 URL (疑問符 (?) が含まれる URL) をクロールする]。 疑問符 (?) の表記を使用するパラメータが含まれている URL をクロールする場合は、このオプションを選択します。

    SharePoint Server コンテンツを http ページとしてクロールします。 通常、SharePoint Server サイトは特別なプロトコルを使用してクロールされます。 代わりに SharePoint Server サイトを HTTP ページとしてクロールする場合は、このオプションを選択します。 HTTP プロトコルを使用してコンテンツをクロールすると、アイテムの権限は保存されません。

  1. [ 認証の指定] セクションで、以下のいずれかの操作を行います。

    注:

    このオプションは、[ クロールの構成] セクションで [ このパスにあるアイテムをすべて含める] オプションを選択した場合にのみ使用できます。

  • 既定のコンテンツ アクセス アカウントを使用するには、[ 既定のコンテンツ アクセス アカウントを使用] を選択します。

  • 別のアカウントを使用する場合は、[ 別のコンテンツ アクセス アカウントを指定 する] を選択し、[ アカウント ] ボックスに、このクロール ルールで定義されているパスにアクセスできるユーザー アカウント名を入力します。 次に、[ パスワード ] ボックスと [ パスワードの確認 ] ボックスに、このユーザー アカウントのパスワードを入力します。 基本認証の使用を回避するには、[ 基本認証を許可しない] チェック ボックスをオンにします。 サーバーは、NTLM 認証の使用を試みます。 NTLM 認証に失敗した場合、[ 基本認証を使用しない] チェック ボックスがオンでない限り、サーバーは基本認証の使用を試みます。

  • 認証にクライアント証明書を使用する場合は、[ クライアント証明書を指定する] を選択し、[ 証明書] メニューを展開してから証明書を選択します。

  • フォーム資格情報を認証に使用するには、[ フォーム資格情報を指定する] を選択し、[ フォームの URL] ボックスに、フォームの URL (資格情報を受け取るページの場所) を入力してから [ 資格情報の入力] をクリックします。 リモート サーバーのログオン プロンプトが新しいウィンドウに表示されたら、ログオンに使用するフォーム資格情報を入力します。 ログオンに成功した場合、プロンプトが表示されます。 ログオンに成功すると、認証に必要な資格情報がリモート サイトに保存されます。

  • Cookie を使用するには、[ クロールに Cookie を使用する] を選択し、[ URL から Cookie を取得 する] を選択して、Web サイトまたはサーバーから Cookie を取得します。 または、[ クロール用の Cookie の指定] を選択して、ローカル ファイル システムまたはファイル共有から Cookie をインポートします。 必要に応じて、エラー ページを [ エラー ページ (セミコロン区切り)] ボックスに指定することもできます。

  • 匿名アクセスを許可するには、[ 匿名アクセス] を選択します。

  1. [OK] をクリックします。

クロール ルールを URL に対してテストするには

  1. この手順を実行しているユーザー アカウントが Search Service アプリケーションの管理者であることを確認します。

  2. サーバーの全体管理の [ アプリケーション構成の管理] セクションで、[ サービス アプリケーションの管理] をクリックします。

  3. [サービス アプリケーションの管理] ページのサービス アプリケーションの一覧で、[Search service アプリケーション] をクリックします。

  4. [検索管理] ページの [ クロール] セクションで、[ クロール ルール] をクリックします。

  5. [クロール ルールの管理] ページで、[ URL を入力してテストをクリックし、ルールに一致するかどうかを確認します] ボックスに、テストする URL を入力します。

  6. [ テスト] をクリックします。 テストの結果は、[URL を入力してテストをクリックし、ルールに一致するかどうかを確認します] ボックスの下に表示されます。

クロール ルールを削除するには

  1. この手順を実行しているユーザー アカウントが Search Service アプリケーションの管理者であることを確認します。

  2. サーバーの全体管理の [ アプリケーション構成の管理] セクションで、[ サービス アプリケーションの管理] をクリックします。

  3. [サービス アプリケーションの管理] ページのサービス アプリケーションの一覧で、[Search service アプリケーション] をクリックします。

  4. [検索管理] ページの [ クロール] セクションで、[ クロール ルール] をクリックします。

  5. [クロール ルールの管理] ページで、削除するクロール ルールの名前をクロール ルール リストでポイントし、表示された矢印をクリックします。次に、[ 削除] をクリックします。

  6. [OK] をクリックして、このクロール ルールの削除を確認します。

クロール ルールを並べ替えるには

  1. この手順を実行しているユーザー アカウントが Search Service アプリケーションの管理者であることを確認します。

  2. サーバーの全体管理の [ アプリケーション構成の管理] セクションで、[ サービス アプリケーションの管理] をクリックします。

  3. [サービス アプリケーションの管理] ページのサービス アプリケーションの一覧で、[Search service アプリケーション] をクリックします。

  4. [検索管理] ページの [ クロール] セクションで、[ クロール ルール] をクリックします。

  5. [クロール ルールの管理] ページにあるクロール ルール リストの [ 順序] 列で、クロール ルールを適用する位置を指定します。 その他の値は順に 1 つずつずれます。