SharePoint Server에서 연속 크롤링 관리
적용 대상:2013 2016 2019 Subscription Edition SharePoint in Microsoft 365
연속 크롤링 사용 은 증분 크롤링 대신 크롤링 일정 옵션입니다. 이 옵션은 SharePoint Server의 새로운 옵션이며 SharePoint 사이트 유형의 콘텐츠 원본에만 적용됩니다.
연속 크롤링은 검색 결과를 최신 상태로 유지하는 데 도움이 되도록 SharePoint Server 사이트를 자주 크롤링합니다. 증분 크롤링과 마찬가지로 연속 크롤링은 마지막 크롤링 이후 추가, 변경 또는 삭제된 콘텐츠를 크롤링합니다. 특정 시간에 시작되고 지정된 시간에 정기적으로 반복되는 증분 크롤링과 달리 연속 크롤링은 미리 정의된 시간 간격으로 자동으로 시작됩니다. 연속 크롤링의 기본 간격은 15분마다입니다. 연속 크롤링은 SharePoint Server 콘텐츠가 너무 자주 크롤링될 때 검색 인덱스를 최신 상태로 유지하므로 검색 결과의 새로 고침을 보장하는 데 도움이 됩니다. 따라서 연속 크롤링은 빠르게 변화하는 SharePoint Server 콘텐츠를 크롤링하는 데 특히 유용합니다.
단일 연속 크롤링에는 연속 크롤링이 사용하도록 설정된 Search Service 응용 프로그램의 모든 콘텐츠 원본이 포함됩니다. 이와 마찬가지로 연속 크롤링 간격은 연속 크롤링이 사용하도록 설정된 Search Service 응용 프로그램의 모든 콘텐츠 원본에 적용됩니다.
동일한 콘텐츠 원본에 대해 여러 개의 전체 크롤링 또는 여러 증분 크롤링을 동시에 실행할 수 없습니다. 그러나 여러 연속 크롤링을 동시에 실행할 수 있습니다. 따라서 하나의 연속 크롤링이 큰 콘텐츠 업데이트를 처리하는 경우에도 다른 연속 크롤링은 미리 정의된 시간 간격으로 시작하고 다른 업데이트를 크롤링할 수 있습니다. 동일한 리포지토리에 대해 전체 또는 증분 크롤링이 진행되는 동안 특정 콘텐츠 리포지토리의 연속 크롤링도 발생할 수 있습니다.
연속 크롤링은 오류를 반복적으로 반환하는 항목을 처리하거나 다시 시도하지 않습니다. 이러한 오류는 연속 크롤링을 사용하도록 설정된 콘텐츠 원본에 대해 4시간마다 자동으로 실행되는 "정리" 증분 크롤링 중에 다시 시도됩니다. 증분 크롤링 중에 오류를 계속 반환하는 항목은 향후 증분 크롤링 중에 다시 시도되지만 오류가 해결될 때까지 연속 크롤링에서 선택되지 않습니다.
Search_Service_Application_Name: 콘텐츠 원본 추가/편집 페이지에서 증분 크롤링 시간을 설정할 수 있지만 Microsoft PowerShell을 사용하여 연속 크롤링에 대한 빈도 간격을 변경할 수 있습니다.
기존 콘텐츠 원본에 대해 연속 크롤링을 사용하도록 설정하려면
이 절차를 수행할 사용자 계정이 Search Service 응용 프로그램의 관리자인지 확인합니다.
중앙 관리의 응용 프로그램 관리 섹션에서 서비스 응용 프로그램 관리를 클릭합니다.
Search Service 응용 프로그램을 클릭합니다.
Search_Service_Application_Name: 검색 관리 페이지의 빠른 실행의 크롤링에서 콘텐츠 원본을 클릭합니다.
Search_Service_Application_Name: 콘텐츠 원본 관리 페이지에서 연속 크롤링을 사용하도록 설정할 SharePoint 콘텐츠 원본을 클릭합니다.
크롤링 일정 섹션에서 연속 크롤링 사용을 선택합니다.
확인을 클릭합니다.
확인:Search_Service_Application_Name: 콘텐츠 원본 관리 페이지에서 상태 열에 크롤링 연속 상태가 있는지 확인합니다.
새 콘텐츠 원본에 대해 연속 크롤링을 사용하도록 설정하려면
이 절차를 수행할 사용자 계정이 Search Service 응용 프로그램의 관리자인지 확인합니다.
중앙 관리의 응용 프로그램 관리 섹션에서 서비스 응용 프로그램 관리를 클릭합니다.
Search Service 응용 프로그램을 클릭합니다.
Search_Service_Application_Name: 검색 관리 페이지의 빠른 실행의 크롤링에서 콘텐츠 원본을 클릭합니다.
Search_Service_Application_Name: 콘텐츠 원본 관리 페이지에서 새 콘텐츠 원본을 클릭합니다.
SharePoint 사이트 형식의 콘텐츠 원본을 만듭니다.
이름 섹션의 이름필드에 이름을 입력합니다.
콘텐츠 원본 형식 섹션에서 SharePoint 사이트를 선택합니다.
시작 주소 섹션에서 시작 주소 또는 주소를 입력합니다.
크롤링 설정 섹션에서 모든 시작 주소에 대한 크롤링 동작을 선택합니다.
크롤링 일정 섹션에서 연속 크롤링 사용을 선택합니다.
확인을 클릭합니다.
확인:Search_Service_Application_Name: 콘텐츠 원본 관리 페이지에서 새로 추가된 콘텐츠 원본이 표시되고 상태 열에 크롤링 연속 상태가 있는지 확인합니다.
하나의 콘텐츠 원본에 대해 연속 크롤링을 사용하지 않도록 설정하려면
이 절차를 수행할 사용자 계정이 Search Service 응용 프로그램의 관리자인지 확인합니다.
중앙 관리의 응용 프로그램 관리 섹션에서 서비스 응용 프로그램 관리를 클릭합니다.
Search Service 응용 프로그램을 클릭합니다.
Search_Service_Application_Name: 검색 관리 페이지의 빠른 실행의 크롤링에서 콘텐츠 원본을 클릭합니다.
Search_Service_Application_Name: 콘텐츠 원본 관리 페이지에서 연속 크롤링을 사용하지 않도록 설정할 SharePoint 콘텐츠 원본을 클릭합니다.
크롤링 일정 섹션에서 증분 크롤링 사용의 지우기를 선택합니다. 이렇게 하면 연속 크롤링이 비활성화됩니다.
연속 크롤링을 사용하지 않도록 설정하려면 확인을 클릭합니다.
선택 사항: 일정 편집 을 클릭하여 증분 크롤링 일정을 변경한 다음 확인을 클릭합니다.
Search_Service_Application_Name: 콘텐츠 원본 편집 페이지에서 확인을 클릭합니다.
확인:Search_Service_Application_Name: 콘텐츠 원본 관리 페이지에서 상태 열이 유휴 상태로 변경되었는지 확인합니다. 연속 크롤링을 사용하지 않도록 설정한 후에도 크롤링 큐에 남아 있는 모든 URL이 계속 크롤링되기 때문에 이 작업은 다소 시간이 걸릴 수 있습니다.
모든 콘텐츠 원본에 대해 연속 크롤링을 사용하지 않도록 설정하려면
이 절차를 수행할 사용자 계정이 Search Service 응용 프로그램의 관리자인지 확인합니다.
팜의 서버에서 SharePoint 관리 셸을 시작합니다.
Microsoft PowerShell 명령 프롬프트에 다음 명령을 입력합니다.
$SSA = Get-SPEnterpriseSearchServiceApplication $SPContentSources = $SSA | Get-SPEnterpriseSearchCrawlContentSource | WHERE {$_.Type -eq "SharePoint"} foreach ($cs in $SPContentSources) { $cs.EnableContinuousCrawls = $false $cs.Update() }
확인:Search_Service_Application_Name: 콘텐츠 원본 관리 페이지에서 상태 열이 모든 콘텐츠 원본에 대해 유휴 상태로 변경되었는지 확인합니다. 연속 크롤링을 사용하지 않도록 설정한 후에도 크롤링 큐에 남아 있는 모든 URL이 계속 크롤링되기 때문에 이 작업은 다소 시간이 걸릴 수 있습니다.
연속 크롤링 간격을 변경하려면
이 절차를 수행하는 사용자 계정이 Farm Administrators 그룹의 구성원인지 확인합니다.
SharePoint 관리 셸을 시작합니다.
Microsoft PowerShell 명령 프롬프트에 다음 명령을 입력합니다.
$ssa = Get-SPEnterpriseSearchServiceApplication $ssa.SetProperty("ContinuousCrawlInterval",n)
여기서,
- n 은 연속 크롤링을 시작하려는 시간(분)의 일반 간격입니다. 기본 간격은 15분마다입니다. 설정할 수 있는 가장 짧은 간격은 1분입니다.
참고
간격을 줄이면 SharePoint Server 및 크롤러의 부하가 증가합니다. 이에 따라 리소스 소비가 증가할 수 있도록 계획하고 스케일 아웃해야 합니다.