다음을 통해 공유


EdgeNGramTokenizer interface

에지의 입력을 지정된 크기의 n-그램으로 토큰화합니다. 이 토크나이저는 Apache Lucene을 사용하여 구현됩니다.

Extends

속성

maxGram

최대 n그램 길이입니다. 기본값은 2입니다. 최대값은 300입니다.

minGram

최소 n그램 길이입니다. 기본값은 1입니다. 최대값은 300입니다. maxGram 값보다 작아야 합니다.

odatatype

이 개체가 될 수 있는 다양한 형식을 지정하는 다형 판별자

tokenChars

토큰에 유지할 문자 클래스입니다.

상속된 속성

name

토큰라이저의 이름입니다. 문자, 숫자, 공백, 대시 또는 밑줄만 사용해야 하며 영숫자 문자로만 시작하고 끝낼 수 있습니다. 길이는 128자로 제한됩니다.

속성 세부 정보

maxGram

최대 n그램 길이입니다. 기본값은 2입니다. 최대값은 300입니다.

maxGram?: number

속성 값

number

minGram

최소 n그램 길이입니다. 기본값은 1입니다. 최대값은 300입니다. maxGram 값보다 작아야 합니다.

minGram?: number

속성 값

number

odatatype

이 개체가 될 수 있는 다양한 형식을 지정하는 다형 판별자

odatatype: "#Microsoft.Azure.Search.EdgeNGramTokenizer"

속성 값

"#Microsoft.Azure.Search.EdgeNGramTokenizer"

tokenChars

토큰에 유지할 문자 클래스입니다.

tokenChars?: TokenCharacterKind[]

속성 값

상속된 속성 세부 정보

name

토큰라이저의 이름입니다. 문자, 숫자, 공백, 대시 또는 밑줄만 사용해야 하며 영숫자 문자로만 시작하고 끝낼 수 있습니다. 길이는 128자로 제한됩니다.

name: string

속성 값

string

BaseLexicalTokenizer.name 상속됨