CustomAnalyzer interface
텍스트를 인덱싱 가능/검색 가능한 토큰으로 변환하는 프로세스를 제어할 수 있습니다. 미리 정의된 단일 토큰라이저와 하나 이상의 필터로 구성된 사용자 정의 구성입니다. tokenizer는 텍스트를 토큰으로 분리하고 토큰 변환기에서 내보낸 토큰을 수정하기 위한 필터를 담당합니다.
속성
char |
토큰라이저에서 처리하기 전에 입력 텍스트를 준비하는 데 사용되는 문자 필터 목록입니다. 예를 들어, 특정 문자 또는 기호를 대신할 수 있습니다. 필터는 나열된 순서대로 실행됩니다. |
name | 분석기의 이름입니다. 문자, 숫자, 공백, 대시 또는 밑줄만 사용해야 하며 영숫자 문자로만 시작하고 끝낼 수 있습니다. 길이는 128자로 제한됩니다. |
odatatype | 다형 판별자 |
token |
토큰화기에서 생성된 토큰을 필터링하거나 수정하는 데 사용되는 토큰 필터 목록입니다. 예를 들어, 모든 문자를 소문자로 변환하는 소문자 필터를 지정할 수 있습니다. 필터는 나열된 순서대로 실행됩니다. |
tokenizer |
연속 텍스트를 단어로 구분하는 등의 일련의 토큰으로 나누는 데 사용할 토큰라이저의 이름입니다. KnownTokenizerNames 는 기본 제공 토큰라이저 이름을 포함하는 열거형입니다. |
속성 세부 정보
charFilters
토큰라이저에서 처리하기 전에 입력 텍스트를 준비하는 데 사용되는 문자 필터 목록입니다. 예를 들어, 특정 문자 또는 기호를 대신할 수 있습니다. 필터는 나열된 순서대로 실행됩니다.
charFilters?: string[]
속성 값
string[]
name
분석기의 이름입니다. 문자, 숫자, 공백, 대시 또는 밑줄만 사용해야 하며 영숫자 문자로만 시작하고 끝낼 수 있습니다. 길이는 128자로 제한됩니다.
name: string
속성 값
string
odatatype
다형 판별자
odatatype: "#Microsoft.Azure.Search.CustomAnalyzer"
속성 값
"#Microsoft.Azure.Search.CustomAnalyzer"
tokenFilters
토큰화기에서 생성된 토큰을 필터링하거나 수정하는 데 사용되는 토큰 필터 목록입니다. 예를 들어, 모든 문자를 소문자로 변환하는 소문자 필터를 지정할 수 있습니다. 필터는 나열된 순서대로 실행됩니다.
tokenFilters?: string[]
속성 값
string[]
tokenizerName
연속 텍스트를 단어로 구분하는 등의 일련의 토큰으로 나누는 데 사용할 토큰라이저의 이름입니다. KnownTokenizerNames 는 기본 제공 토큰라이저 이름을 포함하는 열거형입니다.
tokenizerName: string
속성 값
string