Indexes - Analyze

Başvuru

Hizmet:: Search Service

API Sürümü:: 2024-03-01-Preview

Çözümleyicinin metni belirteçlere nasıl böler olduğunu gösterir.

POST {endpoint}/indexes('{indexName}')/search.analyze?api-version=2024-03-01-Preview

URI Parametreleri

Name	İçinde	Gerekli	Tür	Description
endpoint	path	True	string	Arama hizmetinin uç nokta URL'si.
indexName	path	True	string	Çözümleyicinin testine yönelik dizinin adı.
api-version	query	True	string	İstemci Api Sürümü.

İstek Başlığı

Name	Gerekli	Tür	Description
x-ms-client-request-id		string uuid	Hata ayıklamaya yardımcı olmak için istekle birlikte gönderilen izleme kimliği.

İstek Gövdesi

Name	Gerekli	Tür	Description
text	True	string	Belirteçlere bölünecek metin.
analyzer		LexicalAnalyzerName	Verilen metni kesmek için kullanılacak çözümleyicinin adı.
charFilters		CharFilterName[]	Verilen metni kırarken kullanılacak isteğe bağlı karakter filtreleri listesi.
normalizer		LexicalNormalizerName	Verilen metni normalleştirmek için kullanılacak normalleştiricinin adı.
tokenFilters		TokenFilterName[]	Verilen metni kırarken kullanılacak isteğe bağlı belirteç filtreleri listesi.
tokenizer		LexicalTokenizerName	Verilen metni kesmek için kullanılacak belirteç oluşturucunun adı.

Yanıtlar

Name	Tür	Description
200 OK	AnalyzeResult
Other Status Codes	ErrorResponse	Hata yanıtı.

Örnekler

SearchServiceIndexAnalyze

Örnek isteği

HTTP

POST https://myservice.search.windows.net/indexes('hotels')/search.analyze?api-version=2024-03-01-Preview

{
  "text": "Text to analyze",
  "analyzer": "standard.lucene"
}

Örnek yanıt

Durum kodu:: 200

{
  "tokens": [
    {
      "token": "text",
      "startOffset": 0,
      "endOffset": 4,
      "position": 0
    },
    {
      "token": "to",
      "startOffset": 5,
      "endOffset": 7,
      "position": 1
    },
    {
      "token": "analyze",
      "startOffset": 8,
      "endOffset": 15,
      "position": 2
    }
  ]
}

Tanımlar

Name	Description
AnalyzedTokenInfo	Çözümleyici tarafından döndürülen belirteç hakkında bilgi.
AnalyzeRequest	Bu metni belirteçlere bölmek için kullanılan bazı metin ve çözümleme bileşenlerini belirtir.
AnalyzeResult	Bir çözümleyicinin metin üzerinde test edilmesi sonucu.
CharFilterName	Arama altyapısı tarafından desteklenen tüm karakter filtrelerinin adlarını tanımlar.
ErrorAdditionalInfo	Kaynak yönetimi hatası ek bilgileri.
ErrorDetail	Hata ayrıntısı.
ErrorResponse	Hata yanıtı
LexicalAnalyzerName	Arama altyapısı tarafından desteklenen tüm metin çözümleyicilerinin adlarını tanımlar.
LexicalNormalizerName	Arama altyapısı tarafından desteklenen tüm metin normalleştiricilerinin adlarını tanımlar.
LexicalTokenizerName	Arama altyapısı tarafından desteklenen tüm belirteç oluşturucuların adlarını tanımlar.
TokenFilterName	Arama altyapısı tarafından desteklenen tüm belirteç filtrelerinin adlarını tanımlar.

AnalyzedTokenInfo

Çözümleyici tarafından döndürülen belirteç hakkında bilgi.

Name	Tür	Description
endOffset	integer	Giriş metnindeki belirtecin son karakterinin dizini.
position	integer	Giriş metnindeki belirtecin diğer belirteçlere göre konumu. Giriş metnindeki ilk belirtecin konumu 0, sonrakinin konumu 1 vb. olur. Kullanılan çözümleyiciye bağlı olarak, bazı belirteçler birbirinin eş anlamlısı olması gibi aynı konuma sahip olabilir.
startOffset	integer	Giriş metnindeki belirtecin ilk karakterinin dizini.
token	string	Çözümleyici tarafından döndürülen belirteç.

AnalyzeRequest

Bu metni belirteçlere bölmek için kullanılan bazı metin ve çözümleme bileşenlerini belirtir.

Name	Tür	Description
analyzer	LexicalAnalyzerName	Verilen metni kesmek için kullanılacak çözümleyicinin adı.
charFilters	CharFilterName[]	Verilen metni kırarken kullanılacak isteğe bağlı karakter filtreleri listesi.
normalizer	LexicalNormalizerName	Verilen metni normalleştirmek için kullanılacak normalleştiricinin adı.
text	string	Belirteçlere bölünecek metin.
tokenFilters	TokenFilterName[]	Verilen metni kırarken kullanılacak isteğe bağlı belirteç filtreleri listesi.
tokenizer	LexicalTokenizerName	Verilen metni kesmek için kullanılacak belirteç oluşturucunun adı.

AnalyzeResult

Bir çözümleyicinin metin üzerinde test edilmesi sonucu.

Name	Tür	Description
tokens	AnalyzedTokenInfo[]	İstekte belirtilen çözümleyici tarafından döndürülen belirteçlerin listesi.

CharFilterName

Arama altyapısı tarafından desteklenen tüm karakter filtrelerinin adlarını tanımlar.

Name	Tür	Description
html_strip	string	HTML yapılarını ayırmaya çalışan bir karakter filtresi. Bkz. https://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/charfilter/HTMLStripCharFilter.html

ErrorAdditionalInfo

Kaynak yönetimi hatası ek bilgileri.

Name	Tür	Description
info	object	Ek bilgiler.
type	string	Ek bilgi türü.

ErrorDetail

Hata ayrıntısı.

Name	Tür	Description
additionalInfo	ErrorAdditionalInfo[]	Hata ek bilgileri.
code	string	Hata kodu.
details	ErrorDetail[]	Hata ayrıntıları.
message	string	Hata iletisi.
target	string	Hata hedefi.

ErrorResponse

Hata yanıtı

Name	Tür	Description
error	ErrorDetail	Hata nesnesi.

LexicalAnalyzerName

Arama altyapısı tarafından desteklenen tüm metin çözümleyicilerinin adlarını tanımlar.

Name	Tür	Description
ar.lucene	string	Arapça için Lucene çözümleyicisi.
ar.microsoft	string	Arapça için Microsoft çözümleyicisi.
bg.lucene	string	Bulgarca için Lucene çözümleyicisi.
bg.microsoft	string	Bulgarca için Microsoft çözümleyicisi.
bn.microsoft	string	Bangla için Microsoft çözümleyicisi.
ca.lucene	string	Catalan için Lucene çözümleyicisi.
ca.microsoft	string	Katalan için Microsoft çözümleyicisi.
cs.lucene	string	Çekçe için Lucene analizörü.
cs.microsoft	string	Çekçe için Microsoft çözümleyicisi.
da.lucene	string	Danca için Lucene çözümleyicisi.
da.microsoft	string	Danca için Microsoft çözümleyicisi.
de.lucene	string	Almanca için Lucene çözümleyicisi.
de.microsoft	string	Almanca için Microsoft çözümleyicisi.
el.lucene	string	Yunanca için Lucene çözümleyicisi.
el.microsoft	string	Yunanca için Microsoft çözümleyicisi.
en.lucene	string	İngilizce için Lucene çözümleyicisi.
en.microsoft	string	İngilizce için Microsoft çözümleyicisi.
es.lucene	string	İspanyolca için Lucene çözümleyicisi.
es.microsoft	string	İspanyolca için Microsoft çözümleyicisi.
et.microsoft	string	Estonca için Microsoft çözümleyicisi.
eu.lucene	string	Bask dili için Lucene çözümleyicisi.
fa.lucene	string	Farsça için Lucene analizörü.
fi.lucene	string	Fince için Lucene çözümleyicisi.
fi.microsoft	string	Fince için Microsoft çözümleyicisi.
fr.lucene	string	Fransızca için Lucene çözümleyicisi.
fr.microsoft	string	Fransızca için Microsoft çözümleyicisi.
ga.lucene	string	lucene çözümleyicisi İrlandalı.
gl.lucene	string	Galiçyalı için Lucene analizörü.
gu.microsoft	string	Gujarati için Microsoft Çözümleyicisi.
he.microsoft	string	İbranice için Microsoft çözümleyicisi.
hi.lucene	string	Hintçe için Lucene çözümleyicisi.
hi.microsoft	string	Hintçe için Microsoft çözümleyicisi.
hr.microsoft	string	Hırvat dili için Microsoft çözümleyicisi.
hu.lucene	string	Macarca için Lucene çözümleyicisi.
hu.microsoft	string	Macarca için Microsoft çözümleyicisi.
hy.lucene	string	Ermeniler için Lucene analizörü.
id.lucene	string	Endonezya dili için Lucene çözümleyicisi.
id.microsoft	string	Endonezya dili (Bahasa) için Microsoft çözümleyicisi.
is.microsoft	string	İzlanda dili için Microsoft çözümleyicisi.
it.lucene	string	İtalyanca için Lucene çözümleyicisi.
it.microsoft	string	İtalyanca için Microsoft çözümleyicisi.
ja.lucene	string	Japonca için Lucene çözümleyicisi.
ja.microsoft	string	Japonca için Microsoft çözümleyicisi.
keyword	string	Bir alanın içeriğinin tamamını tek bir belirteç olarak ele alır. Bu, posta kodları, kimlikler ve bazı ürün adları gibi veriler için kullanışlıdır. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/KeywordAnalyzer.html
kn.microsoft	string	Kannada için Microsoft çözümleyicisi.
ko.lucene	string	Korece için Lucene çözümleyicisi.
ko.microsoft	string	Korece için Microsoft çözümleyicisi.
lt.microsoft	string	Litvanca için Microsoft çözümleyicisi.
lv.lucene	string	Letonca için Lucene çözümleyicisi.
lv.microsoft	string	Letonca için Microsoft çözümleyicisi.
ml.microsoft	string	Malayalam için Microsoft çözümleyicisi.
mr.microsoft	string	Marathi için Microsoft çözümleyicisi.
ms.microsoft	string	Malay dili (Latin) için Microsoft çözümleyicisi.
nb.microsoft	string	Norveççe (Bokmål) için Microsoft analyzer.
nl.lucene	string	Felemenkçe için Lucene çözümleyicisi.
nl.microsoft	string	Felemenkçe için Microsoft çözümleyicisi.
no.lucene	string	Norveçli lucene çözümleyicisi.
pa.microsoft	string	Punjabi için Microsoft çözümleyicisi.
pattern	string	Normal ifade deseni aracılığıyla metni terimlere esnek bir şekilde ayırır. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/PatternAnalyzer.html
pl.lucene	string	Lehçe için Lucene çözümleyicisi.
pl.microsoft	string	Lehçe için Microsoft çözümleyicisi.
pt-BR.lucene	string	Portekizce (Brezilya) için Lucene çözümleyicisi.
pt-BR.microsoft	string	Portekizce (Brezilya) için Microsoft çözümleyicisi.
pt-PT.lucene	string	Portekizce (Portekiz) için Lucene çözümleyicisi.
pt-PT.microsoft	string	Portekizce (Portekiz) için Microsoft çözümleyicisi.
ro.lucene	string	Rumence için Lucene analizörü.
ro.microsoft	string	Rumence için Microsoft çözümleyicisi.
ru.lucene	string	Rus için Lucene analizörü.
ru.microsoft	string	Rusça için Microsoft çözümleyicisi.
simple	string	Metni harf olmayana böler ve küçük harfe dönüştürür. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/SimpleAnalyzer.html
sk.microsoft	string	Slovakça için Microsoft çözümleyicisi.
sl.microsoft	string	Slovence için Microsoft çözümleyicisi.
sr-cyrillic.microsoft	string	Sırp (Kiril) için Microsoft analyzer.
sr-latin.microsoft	string	Sırp dili (Latin) için Microsoft çözümleyicisi.
standard.lucene	string	Standart Lucene çözümleyicisi.
standardasciifolding.lucene	string	Standart ASCII Katlama Lucene çözümleyicisi. Bkz. https://docs.microsoft.com/rest/api/searchservice/Custom-analyzers-in-Azure-Search#Analyzers
stop	string	Metni harf olmayana böler; Küçük harf ve stopword belirteç filtrelerini uygular. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/StopAnalyzer.html
sv.lucene	string	İsveççe için Lucene çözümleyicisi.
sv.microsoft	string	İsveççe için Microsoft çözümleyicisi.
ta.microsoft	string	Tamil için Microsoft Çözümleyicisi.
te.microsoft	string	Telugu için Microsoft çözümleyicisi.
th.lucene	string	Tay dili için Lucene çözümleyicisi.
th.microsoft	string	Tay dili için Microsoft çözümleyicisi.
tr.lucene	string	Türkçe için Lucene çözümleyicisi.
tr.microsoft	string	Türkçe için Microsoft çözümleyicisi.
uk.microsoft	string	Ukrayna dili için Microsoft çözümleyicisi.
ur.microsoft	string	Urduca için Microsoft çözümleyicisi.
vi.microsoft	string	Vietnam dili için Microsoft çözümleyicisi.
whitespace	string	Boşluk belirteci kullanan bir çözümleyici. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/WhitespaceAnalyzer.html
zh-Hans.lucene	string	Çince (Basitleştirilmiş) için Lucene çözümleyicisi.
zh-Hans.microsoft	string	Çince (Basitleştirilmiş) için Microsoft çözümleyicisi.
zh-Hant.lucene	string	Çince (Geleneksel) için Lucene çözümleyicisi.
zh-Hant.microsoft	string	Çince (Geleneksel) için Microsoft çözümleyicisi.

LexicalNormalizerName

Arama altyapısı tarafından desteklenen tüm metin normalleştiricilerinin adlarını tanımlar.

Name	Tür	Description
asciifolding	string	İlk 127 ASCII karakterde ("Temel Latin" Unicode bloğu) bulunmayan alfabetik, sayısal ve sembolik Unicode karakterleri, bu eşdeğerler varsa ASCII eşdeğerlerine dönüştürür. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/ASCIIFoldingFilter.html
elision	string	İknaları kaldırır. Örneğin, "l'avion" (düzlem) "avion" (düzlem) olarak dönüştürülür. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/util/ElisionFilter.html
lowercase	string	Belirteç metnini küçük harfle normalleştirir. Bkz. https://lucene.apache.org/core/6_6_1/analyzers-common/org/apache/lucene/analysis/core/LowerCaseFilter.html
standard	string	Küçük harf ve asciifoldlamadan oluşan standart normalleştirici. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/reverse/ReverseStringFilter.html
uppercase	string	Belirteç metnini büyük harfle normalleştirir. Bkz. https://lucene.apache.org/core/6_6_1/analyzers-common/org/apache/lucene/analysis/core/UpperCaseFilter.html

LexicalTokenizerName

Arama altyapısı tarafından desteklenen tüm belirteç oluşturucuların adlarını tanımlar.

Name	Tür	Description
classic	string	Çoğu Avrupa dili belgesini işlemek için uygun olan dil bilgisi tabanlı belirteç oluşturucu. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/standard/ClassicTokenizer.html
edgeNGram	string	Bir kenardan gelen girişi verilen boyutların n gramı olarak belirteci oluşturur. Bkz. https://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/ngram/EdgeNGramTokenizer.html
keyword_v2	string	Girişin tamamını tek bir belirteç olarak yayar. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/KeywordTokenizer.html
letter	string	Metni harf olmayanlara böler. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/LetterTokenizer.html
lowercase	string	Metni harf olmayanlara böler ve küçük harfe dönüştürür. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/LowerCaseTokenizer.html
microsoft_language_stemming_tokenizer	string	Dile özgü kuralları kullanarak metni böler ve sözcükleri temel formlarına küçültür.
microsoft_language_tokenizer	string	Dile özgü kuralları kullanarak metni böler.
nGram	string	Girişi verilen boyutların n gramı olarak belirteci haline getirmektedir. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/ngram/NGramTokenizer.html
path_hierarchy_v2	string	Yol benzeri hiyerarşiler için belirteç oluşturucu. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/path/PathHierarchyTokenizer.html
pattern	string	Farklı belirteçler oluşturmak için regex desen eşleştirmesi kullanan belirteç oluşturucu. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/pattern/PatternTokenizer.html
standard_v2	string	Standart Lucene çözümleyicisi; Standart belirteç oluşturucu, küçük harfli filtre ve durdurma filtresinden oluşur. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/standard/StandardTokenizer.html
uax_url_email	string	Url'leri ve e-postaları tek bir belirteç olarak belirteç haline döndürür. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/standard/UAX29URLEmailTokenizer.html
whitespace	string	Metni boşlukta böler. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/WhitespaceTokenizer.html

TokenFilterName

Arama altyapısı tarafından desteklenen tüm belirteç filtrelerinin adlarını tanımlar.

Name	Tür	Description
apostrophe	string	Kesme işaretinden sonraki tüm karakterleri (kesme işareti de dahil) çıkarır. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/tr/ApostropheFilter.html
arabic_normalization	string	Ortografiyi normalleştirmek için Arapça normalleştiriciyi uygulayan bir belirteç filtresi. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/ar/ArabicNormalizationFilter.html
asciifolding	string	İlk 127 ASCII karakterinde ("Temel Latin" Unicode bloğu) bulunmayan alfabetik, sayısal ve sembolik Unicode karakterlerini, böyle eşdeğerler varsa ASCII eşdeğerlerine dönüştürür. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/ASCIIFoldingFilter.html
cjk_bigram	string	standart belirteç oluşturucudan oluşturulan CJK terimlerinin büyük Forms. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/cjk/CJKBigramFilter.html
cjk_width	string	CJK genişlik farklarını normalleştirir. Tam ASCII çeşitlemelerini eşdeğer temel Latinceye ve yarım genişlikte Katakana değişkenlerini eşdeğer Kana'ya katlar. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/cjk/CJKWidthFilter.html
classic	string	İngilizce sahipliklerini ve kısaltmalardan noktaları kaldırır. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/standard/ClassicFilter.html
common_grams	string	Dizin oluştururken sık karşılaşılan terimler için bigrams oluşturun. Tek terimler de dizine eklenir ve bigram'lar yer paylaşımlı olur. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/commongrams/CommonGramsFilter.html
edgeNGram_v2	string	Giriş belirtecinin önünden veya arkasından başlayarak verilen boyutların n gramını oluşturur. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/ngram/EdgeNGramTokenFilter.html
elision	string	elisyonu kaldırır. Örneğin, "l'avion" (düzlem) "avion" (düzlem) olarak dönüştürülür. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/util/ElisionFilter.html
german_normalization	string	Alman karakterlerini German2 kartopu algoritmasının buluşsal yöntemlerine göre normalleştirir. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/de/GermanNormalizationFilter.html
hindi_normalization	string	Yazım varyasyonlarındaki bazı farklılıkları kaldırmak için Hintçedeki metni normalleştirir. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/hi/HindiNormalizationFilter.html
indic_normalization	string	Hint dillerindeki metnin Unicode gösterimini normalleştirir. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/in/IndicNormalizationFilter.html
keyword_repeat	string	Gelen her belirteci bir kez anahtar sözcük, bir kez de anahtar sözcük olmayan belirteç olarak iki kez yayar. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/KeywordRepeatFilter.html
kstem	string	İngilizce için yüksek performanslı bir kstem filtresi. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/en/KStemFilter.html
length	string	Çok uzun veya çok kısa sözcükleri kaldırır. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/LengthFilter.html
limit	string	Dizin oluşturma sırasında belirteç sayısını sınırlar. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/LimitTokenCountFilter.html
lowercase	string	Belirteç metnini küçük harfe normalleştirir. Bkz. https://lucene.apache.org/core/6_6_1/analyzers-common/org/apache/lucene/analysis/core/LowerCaseFilter.html
nGram_v2	string	Verilen boyutların n gramını oluşturur. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/ngram/NGramTokenFilter.html
persian_normalization	string	Farsça için normalleştirme uygular. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/fa/PersianNormalizationFilter.html
phonetic	string	Fonetik eşleşmeler için belirteçler oluşturun. Bkz. https://lucene.apache.org/core/4_10_3/analyzers-phonetic/org/apache/lucene/analysis/phonetic/package-tree.html
porter_stem	string	Belirteç akışını dönüştürmek için Porter kök oluşturma algoritmasını kullanır. Bkz. http://tartarus.org/~martin/PorterStemmer
reverse	string	Belirteç dizesini tersine çevirir. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/reverse/ReverseStringFilter.html
scandinavian_folding	string	İskandinav karakterlerini katlar åÅäæÄÆ-a> ve öÖøØ-o>. Ayrıca aa, ae, ao, oe ve oo çift sesli harf kullanımına karşı ayrımcılığa neden olur ve yalnızca ilkini bırakır. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/ScandinavianFoldingFilter.html
scandinavian_normalization	string	Değiştirilebilir İskandinav karakterlerinin kullanımını normalleştirir. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/ScandinavianNormalizationFilter.html
shingle	string	Belirteç birleşimlerini tek bir belirteç olarak oluşturur. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/shingle/ShingleFilter.html
snowball	string	Snowball tarafından oluşturulan bir kök ayırıcı kullanarak sözcükleri saplayan bir filtre. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/snowball/SnowballFilter.html
sorani_normalization	string	Sorani metninin Unicode gösterimini normalleştirir. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/ckb/SoraniNormalizationFilter.html
stemmer	string	Dile özgü köklendirme filtresi. Bkz. https://docs.microsoft.com/rest/api/searchservice/Custom-analyzers-in-Azure-Search#TokenFilters
stopwords	string	Belirteç akışından durdurma sözcüklerini kaldırır. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/StopFilter.html
trim	string	Belirteçlerden baştaki ve sondaki boşluğu keser. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/TrimFilter.html
truncate	string	Terimleri belirli bir uzunlukta kısaltılır. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/TruncateTokenFilter.html
unique	string	Önceki belirteçle aynı metindeki belirteçleri filtreler. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/RemoveDuplicatesTokenFilter.html
uppercase	string	Belirteç metnini büyük harfe göre normalleştirir. Bkz. https://lucene.apache.org/core/6_6_1/analyzers-common/org/apache/lucene/analysis/core/UpperCaseFilter.html
word_delimiter	string	Sözcükleri alt sözcüklere böler ve alt sözcük gruplarında isteğe bağlı dönüştürmeler gerçekleştirir.

Aracılığıyla paylaş