SharePoint Server에서 사용자 지정 엔터티 추출기 만들기 및 배포

적용 대상:yes-img-132013 yes-img-162016 yes-img-192019 yes-img-seSubscription Edition no-img-sopSharePoint in Microsoft 365

SharePoint Server 외부 시스템에서 사용자 지정 엔터티 추출기 파일을 만들고 유지 관리할 수 있으며, SharePoint Server으로 해당 파일을 가져와 검색 시스템에서 사용자 지정 엔터티 추출기를 사용하도록 할 수 있습니다.

클래식 검색에서 사용자 지정 엔터티를 구체화로 사용하려면 먼저 사용자 지정 엔터티 추출 사전을 만들고 배포합니다. 그런 다음 관리 속성이 사용자 지정 엔터티 추출기를 사용하도록 구성하고 전체 크롤링을 실행합니다. 그리고 나면 사용자 지정 엔터티를 구체화로 사용하도록 검색 결과 페이지에서 구체화 웹 파트를 구성할 수 있습니다.

시작하기 전에

이 작업을 시작하기 전에 다음이 있어야 합니다.

  • Search Service 응용 프로그램

  • 완전히 크롤링된 하나 이상의 콘텐츠 원본

  • 검색 결과 페이지

사용자 지정 엔터티 추출 사전 만들기

사용자 지정 엔터티 추출 사전을 만들려면

  1. 만들 사용자 지정 엔터티 추출 사전의 유형을 단어, 단어 부분, 일치하는 단어 또는 일치하는 단어 부분 중에서 결정합니다. 자세한 내용은 사용자 지정 엔터티 추출기 유형 개요를 참조하세요.

  2. 양식 표시 열을 포함하는 .csv 파일을 만듭니다. 이때 열 구분 기호로 쉼표를 사용해야 합니다. 분음 부호와 같은 ASCII 문자가 아닌 문자가 파일에 포함된 경우 UTF-8로 인코딩해야 합니다. Microsoft PowerShell cmdlet을 실행하여 사용자 지정 엔터티 추출 사전을 배포할 서버에서 액세스할 수 있는 위치에 파일을 저장합니다.

    • 열에 사용자 지정 엔터티로 포함할 용어(단어 하나 또는 여러 개)를 입력합니다. 키당 여러 줄을 사용할 수 있습니다. 용어 앞뒤에 공백이 있으면 안 됩니다.

    • 원하는 경우 양식 표시 열에 구체화 이름을 입력합니다. 이 열을 비워 두면 콘텐츠에서 추출되는 용어가 콘텐츠에서와 동일한 대/소문자를 사용하여 구체화로 표시됩니다. 구체화가 표시되는 방식을 제어 및 표준화하려면 Display Form 열을 사용합니다.

예를 들어 Contoso 조직에는 Contoso Beginner, Contoso Professional 및 Contoso Expert라는 세 가지 수준의 인증 시스템이 있습니다. Contoso는 이러한 엔터티를 추출하여 모두 구체화할 수 있기를 원합니다. "Contoso", "beginner", "professional" 또는 "expert" 단어가 기록된 경우에 관계없이 구체화를 Contoso Beginner, Contoso ProfessionalContoso Expert로 표시하려고 합니다. 이 예제에서 사용자 지정 엔터티 추출 사전 파일 입력은 다음과 같이 표시될 수 있습니다.

Key,Display form
Contoso Beginner,Contoso Beginner
Contoso B1,Contoso Beginner
Contoso Professional,Contoso Professional
Contoso prof,Contoso Professional
Contoso Expert,Contoso Expert

사용자 지정 엔터티 추출 사전 배포

사용자 지정 엔터티 추출 사전을 배포하려면 SharePoint Server으로 사전을 가져와야 합니다.

사용자 지정 엔터티 추출 사전을 가져오려면

  1. 사용자 지정 엔터티 추출기 사전을 가져올 사용자 계정이 Search Service 응용 프로그램의 관리자인지 확인합니다.

  2. SharePoint 관리 셸을 시작합니다.

  3. Windows PowerShell 명령 프롬프트에 다음 명령을 입력합니다.

    $searchApp = Get-SPEnterpriseSearchServiceApplication
    Import-SPEnterpriseSearchCustomExtractionDictionary -SearchApplication $searchApp -Filename <Path> -DictionaryName <Dictionary name> 
    
    

    여기서 각 부분이 나타내는 의미는 다음과 같습니다.

    • <Path>는 가져올 .csv 파일(사용자 지정 추출 사전)의 전체 UNC 경로를 지정합니다.

    • <Dictionary name>은 사용자 지정 추출 사전의 유형 이름입니다.

    가져올 사전의 유형에 따라 다음 중 하나를 입력합니다.

    • Microsoft.UserDictionaries.EntityExtraction.Custom.Word. n [여기서 n = 1,2,3,4,5]

    • Microsoft.UserDictionaries.EntityExtraction.Custom.ExactWord.1

    • Microsoft.UserDictionaries.EntityExtraction.Custom.WordPart. n [여기서 n = 1,2,3,4,5]

    • Microsoft.UserDictionaries.EntityExtraction.Custom.ExactWordPart.1

사용자 지정 엔터티 추출용으로 관리 속성 구성

다음 절차에서는 사용자 지정 엔터티를 추출할 기존 관리 속성과 사용자 지정 엔터티 추출 사전을 연결하는 방법을 설명합니다. 이 속성은 일반적으로 Title 또는 Body 관리 속성과 같이 이러한 엔터티를 포함할 것으로 예상되는 관리 속성입니다. 사용자 지정 엔터티는 해당 콘텐츠의 섹션에 인덱>스가 없는 태그<가 지정되어 있더라도 연결된 관리 속성의 전체 콘텐츠에서 추출됩니다.

사용자 지정 엔터티를 추출할 기존 관리 속성을 지정하려면 기존 관리 속성을 편집합니다. 크롤링 및 관리 속성 관리에 대한 자세한 내용은 SharePoint Server에서 검색 스키마 관리를 참조하세요.

사용자 지정 엔터티 추출을 위해 관리 속성을 편집하려면

  1. 사용자 계정이 Search Service 응용 프로그램의 관리자인지 확인합니다.

  2. 중앙 관리의 응용 프로그램 관리 섹션에서 서비스 응용 프로그램 관리를 클릭합니다.

  3. Search Service 응용 프로그램을 클릭합니다.

  4. 검색 관리 페이지의 빠른 실행에 있는 쿼리 및 결과에서 검색 스키마를 클릭합니다.

  5. 관리 속성 페이지에서 한 단어나 여러 단어(또는 단어 부분)가 포함되어 있고 사용자 지정 엔터티 추출 사전과 연결할 관리 속성을 찾습니다. 필터 상자에 관리 속성의 이름을 입력해도 됩니다.

  6. 관리 속성을 가리키고 화살표를 클릭한 후 속성 편집/매핑을 클릭합니다.

  7. 관리 속성 편집 페이지에서 사용자 지정 엔터티 추출에서 설정을 편집합니다. 가져온 사용자 지정 엔터티 추출 사전을 선택한 다음 확인을 클릭합니다.

다음 전체 크롤링이 완료되면 사용자 지정 엔터티 추출기가 사용하도록 설정됩니다. 원래 관리 속성 콘텐츠는 검색 인덱스에서 변경되지 않고 저장됩니다. 또한 사용하도록 설정한 사용자 지정 엔터티 추출기의 유형에 따라 추출된 엔터티는 다음 관리 속성 중 하나 이상에 복사됩니다.

  • WordCustomRefiner1
  • WordCustomRefiner2
  • WordCustomRefiner3
  • WordCustomRefiner4
  • WordCustomRefiner5
  • WordExactCustomRefiner
  • WordPartCustomRefiner1
  • WordPartCustomRefiner2
  • WordPartCustomRefiner3
  • WordPartCustomRefiner4
  • WordPartCustomRefiner5
  • WordPartExactCustomRefiner

이러한 관리 속성은 검색 가능하고, 쿼리 가능하고, 검색 가능하고, 정렬 가능하고, 구체화되도록 자동으로 구성됩니다.

웹 파트에서 구체화 구성

추출된 사용자 지정 엔터티를 검색 결과 페이지에서 구체화로 사용할 수 있습니다. 사용자 지정 엔터티 기반 구체화는 구체화 웹 파트에서 사용 가능합니다.

사용자 지정 엔터티 추출기를 기반으로 구체화를 추가하려면

  1. 이 절차를 수행하는 사용자 계정이 엔터프라이즈 검색 센터 사이트에서 Designers SharePoint 그룹의 구성원인지 확인합니다.

  2. 구성할 구체화 웹 파트가 포함된 페이지로 이동한 다음 설정 메뉴, 페이지 편집을 차례로 클릭합니다.

  3. 구체화 웹 파트를 편집합니다. 구체화 패널 웹 파트 메뉴 화살표를 클릭한 다음 웹 파트 편집을 클릭합니다.

    • 웹 파트 도구 창의 검색 구체화에 대한 속성 섹션에서 이 웹 파트의 구체화 선택이 선택되어 있는지 확인합니다.

    • 구체화 선택을 클릭합니다.

    • 구체화 구성 페이지의 사용 가능한 구체화 섹션에 있는 단추를 사용하여 목록에서 구체화로 표시할, 추출된 엔터티가 포함된 관리 속성을 하나 이상 선택하고 추가를 클릭합니다. 예를 들어 단어 추출 사전을 배포한 경우 WordCustomRefiner1을 선택합니다.

    • 구성 대상 섹션에서 각 구체화를 표시할 방법을 구성합니다.

  4. 확인을 클릭합니다.

사용자 지정 엔터티 추출기 유형 개요

다음 표에서는 만들 수 있는 사용자 지정 추출 사전의 유형과 사전 항목이 검색 인덱스의 콘텐츠와 어떻게 일치하는지, 사전을 배포할 때 사용해야 하는 사전 이름 및 추출된 엔터티를 포함할 관리 속성에 대해 설명합니다.


사용자 지정 엔터티 추출기/사용자 지정 엔터티 추출기 사전 설명 예제 Windows PowerShell에서 사용할 사전 이름 추출한 엔터티가 포함될 관리 속성
단어 추출 토큰화된 콘텐츠와 일치하는 대/소문자 미구분 사전 항목(최대 5개 사전) "anchor" 항목은 "anchor" 및 "Anchor"와 일치하고 "anchorage"와는 일치하지 않습니다. Microsoft.UserDictionaries.EntityExtraction.Custom.Word.n [where n = 1,2,3,4 또는 5] WordCustomRefiner1 WordCustomRefiner2 WordCustomRefiner3 WordCustomRefiner4 WordCustomRefiner5
단어 부분 추출 토큰화되지 않은 콘텐츠와 일치하는 대/소문자 미구분 사전 항목(최대 5개 사전) "anchor" 항목은 "anchor", "Anchor", "anchorage"와 일치합니다. Microsoft.UserDictionaries.EntityExtraction.Custom.WordPart.n [where n = 1,2,3,4 또는 5] WordPartCustomRefiner1 WordPartCustomRefiner2 WordPartCustomRefiner3 WordPartCustomRefiner4 WordPartCustomRefiner5
일치하는 단어 추출 토큰화된 콘텐츠와 일치하는 대/소문자 구분 사전 항목(최대 1개 사전) "anchor" 항목은 "anchor"와 일치하며 "Anchor" 또는 "anchorage"와는 일치하지 않습니다. Microsoft.UserDictionaries.EntityExtraction.Custom.ExactWord.1 WordExactCustomRefiner
일치하는 단어 부분 추출 토큰화되지 않은 콘텐츠와 일치하는 대/소문자 구분 사전 항목(최대 1개 사전) "anchor" 항목은 "anchor" 및 "anchorage"와 일치하고 "Anchor"와는 일치하지 않습니다. Microsoft.UserDictionaries.EntityExtraction.Custom.ExactWordPart.1 WordPartExactCustomRefiner

참고 항목

Import-SPEnterpriseSearchCustomExtractionDictionary