Aracılığıyla paylaş


ClassicTokenizer interface

Çoğu Avrupa dili belgesini işlemek için uygun olan dil bilgisi tabanlı belirteç oluşturucu. Bu belirteç oluşturucu Apache Lucene kullanılarak uygulanır.

Extends

Özellikler

maxTokenLength

En fazla belirteç uzunluğu. Varsayılan değer 255'tir. Uzunluk üst sınırından daha uzun olan belirteçler bölünür. Kullanılabilecek en fazla belirteç uzunluğu 300 karakterdir.

odatatype

Bu nesnenin olabileceği farklı türleri belirten polimorfik ayrımcı

Devralınan Özellikler

name

Belirteç oluşturucunun adı. Yalnızca harf, rakam, boşluk, tire veya alt çizgi içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır.

Özellik Ayrıntıları

maxTokenLength

En fazla belirteç uzunluğu. Varsayılan değer 255'tir. Uzunluk üst sınırından daha uzun olan belirteçler bölünür. Kullanılabilecek en fazla belirteç uzunluğu 300 karakterdir.

maxTokenLength?: number

Özellik Değeri

number

odatatype

Bu nesnenin olabileceği farklı türleri belirten polimorfik ayrımcı

odatatype: "#Microsoft.Azure.Search.ClassicTokenizer"

Özellik Değeri

"#Microsoft.Azure.Search.ClassicTokenizer"

Devralınan Özellik Detayları

name

Belirteç oluşturucunun adı. Yalnızca harf, rakam, boşluk, tire veya alt çizgi içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır.

name: string

Özellik Değeri

string

BaseLexicalTokenizer.name Devralındı