Aracılığıyla paylaş


NGramTokenizer interface

Girişi verilen boyutların n gramını belirteci haline getirmektedir. Bu belirteç oluşturucu Apache Lucene kullanılarak uygulanır.

Extends

Özellikler

maxGram

En fazla n-gram uzunluk. Varsayılan değer 2'dir. Maksimum değer 300'dür.

minGram

En düşük n-gram uzunluğu. Varsayılan değer 1'dir. Maksimum değer 300'dür. maxGram değerinden küçük olmalıdır.

odatatype

Bu nesnenin olabileceği farklı türleri belirten polimorfik ayrımcı

tokenChars

Belirteçlerde tutulacak karakter sınıfları.

Devralınan Özellikler

name

Belirteç oluşturucunun adı. Yalnızca harf, rakam, boşluk, tire veya alt çizgi içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır.

Özellik Ayrıntıları

maxGram

En fazla n-gram uzunluk. Varsayılan değer 2'dir. Maksimum değer 300'dür.

maxGram?: number

Özellik Değeri

number

minGram

En düşük n-gram uzunluğu. Varsayılan değer 1'dir. Maksimum değer 300'dür. maxGram değerinden küçük olmalıdır.

minGram?: number

Özellik Değeri

number

odatatype

Bu nesnenin olabileceği farklı türleri belirten polimorfik ayrımcı

odatatype: "#Microsoft.Azure.Search.NGramTokenizer"

Özellik Değeri

"#Microsoft.Azure.Search.NGramTokenizer"

tokenChars

Belirteçlerde tutulacak karakter sınıfları.

tokenChars?: TokenCharacterKind[]

Özellik Değeri

Devralınan Özellik Detayları

name

Belirteç oluşturucunun adı. Yalnızca harf, rakam, boşluk, tire veya alt çizgi içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır.

name: string

Özellik Değeri

string

BaseLexicalTokenizer.name Devralındı