다음을 통해 공유


ClassicTokenizer interface

대부분의 유럽 언어 문서를 처리하는 데 적합한 문법 기반 토큰라이저입니다. 이 토크나이저는 Apache Lucene을 사용하여 구현됩니다.

Extends

속성

maxTokenLength

최대 토큰 길이입니다. 기본값은 255입니다. 최대 길이보다 긴 토큰은 분할됩니다. 사용할 수 있는 최대 토큰 길이는 300자입니다.

odatatype

이 개체가 될 수 있는 다양한 형식을 지정하는 다형 판별자

상속된 속성

name

토큰라이저의 이름입니다. 문자, 숫자, 공백, 대시 또는 밑줄만 사용해야 하며 영숫자 문자로만 시작하고 끝낼 수 있습니다. 길이는 128자로 제한됩니다.

속성 세부 정보

maxTokenLength

최대 토큰 길이입니다. 기본값은 255입니다. 최대 길이보다 긴 토큰은 분할됩니다. 사용할 수 있는 최대 토큰 길이는 300자입니다.

maxTokenLength?: number

속성 값

number

odatatype

이 개체가 될 수 있는 다양한 형식을 지정하는 다형 판별자

odatatype: "#Microsoft.Azure.Search.ClassicTokenizer"

속성 값

"#Microsoft.Azure.Search.ClassicTokenizer"

상속된 속성 세부 정보

name

토큰라이저의 이름입니다. 문자, 숫자, 공백, 대시 또는 밑줄만 사용해야 하며 영숫자 문자로만 시작하고 끝낼 수 있습니다. 길이는 128자로 제한됩니다.

name: string

속성 값

string

BaseLexicalTokenizer.name 상속됨