Aracılığıyla paylaş


MicrosoftLanguageStemmingTokenizer interface

Dile özgü kuralları kullanarak metni böler ve sözcükleri temel formlarına küçültür.

Extends

Özellikler

isSearchTokenizer

Belirteç oluşturucunun nasıl kullanıldığını gösteren bir değer. Arama belirteci olarak kullanılırsa true olarak, dizin belirteç oluşturucu olarak kullanılırsa false olarak ayarlayın. Varsayılan değer false’tur.

language

Kullanılacak dil. Varsayılan değer İngilizce'dir.

maxTokenLength

En fazla belirteç uzunluğu. Uzunluk üst sınırından daha uzun olan belirteçler bölünür. Kullanılabilecek en fazla belirteç uzunluğu 300 karakterdir. 300 karakterden uzun belirteçler önce 300 uzunluğundaki belirteçlere bölünür ve ardından bu belirteçlerin her biri ayarlanan maksimum belirteç uzunluğuna göre bölünür. Varsayılan değer 255'tir.

odatatype

Bu nesnenin olabileceği farklı türleri belirten polimorfik ayrımcı

Devralınan Özellikler

name

Belirteç oluşturucunun adı. Yalnızca harf, rakam, boşluk, kısa çizgi veya alt çizgi içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır.

Özellik Ayrıntıları

isSearchTokenizer

Belirteç oluşturucunun nasıl kullanıldığını gösteren bir değer. Arama belirteci olarak kullanılırsa true olarak, dizin belirteç oluşturucu olarak kullanılırsa false olarak ayarlayın. Varsayılan değer false’tur.

isSearchTokenizer?: boolean

Özellik Değeri

boolean

language

Kullanılacak dil. Varsayılan değer İngilizce'dir.

language?: MicrosoftStemmingTokenizerLanguage

Özellik Değeri

maxTokenLength

En fazla belirteç uzunluğu. Uzunluk üst sınırından daha uzun olan belirteçler bölünür. Kullanılabilecek en fazla belirteç uzunluğu 300 karakterdir. 300 karakterden uzun belirteçler önce 300 uzunluğundaki belirteçlere bölünür ve ardından bu belirteçlerin her biri ayarlanan maksimum belirteç uzunluğuna göre bölünür. Varsayılan değer 255'tir.

maxTokenLength?: number

Özellik Değeri

number

odatatype

Bu nesnenin olabileceği farklı türleri belirten polimorfik ayrımcı

odatatype: "#Microsoft.Azure.Search.MicrosoftLanguageStemmingTokenizer"

Özellik Değeri

"#Microsoft.Azure.Search.MicrosoftLanguageStemmingTokenizer"

Devralınan Özellik Detayları

name

Belirteç oluşturucunun adı. Yalnızca harf, rakam, boşluk, kısa çizgi veya alt çizgi içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır.

name: string

Özellik Değeri

string

BaseLexicalTokenizer.name Devralındı