Indexes - Analyze
Çözümleyicinin metni belirteçlere nasıl böler olduğunu gösterir.
POST {endpoint}/indexes('{indexName}')/search.analyze?api-version=2024-03-01-Preview
URI Parametreleri
Name | İçinde | Gerekli | Tür | Description |
---|---|---|---|---|
endpoint
|
path | True |
string |
Arama hizmetinin uç nokta URL'si. |
index
|
path | True |
string |
Çözümleyicinin testine yönelik dizinin adı. |
api-version
|
query | True |
string |
İstemci Api Sürümü. |
İstek Başlığı
Name | Gerekli | Tür | Description |
---|---|---|---|
x-ms-client-request-id |
string uuid |
Hata ayıklamaya yardımcı olmak için istekle birlikte gönderilen izleme kimliği. |
İstek Gövdesi
Name | Gerekli | Tür | Description |
---|---|---|---|
text | True |
string |
Belirteçlere bölünecek metin. |
analyzer |
Verilen metni kesmek için kullanılacak çözümleyicinin adı. |
||
charFilters |
Verilen metni kırarken kullanılacak isteğe bağlı karakter filtreleri listesi. |
||
normalizer |
Verilen metni normalleştirmek için kullanılacak normalleştiricinin adı. |
||
tokenFilters |
Verilen metni kırarken kullanılacak isteğe bağlı belirteç filtreleri listesi. |
||
tokenizer |
Verilen metni kesmek için kullanılacak belirteç oluşturucunun adı. |
Yanıtlar
Name | Tür | Description |
---|---|---|
200 OK | ||
Other Status Codes |
Hata yanıtı. |
Örnekler
SearchServiceIndexAnalyze
Örnek isteği
POST https://myservice.search.windows.net/indexes('hotels')/search.analyze?api-version=2024-03-01-Preview
{
"text": "Text to analyze",
"analyzer": "standard.lucene"
}
Örnek yanıt
{
"tokens": [
{
"token": "text",
"startOffset": 0,
"endOffset": 4,
"position": 0
},
{
"token": "to",
"startOffset": 5,
"endOffset": 7,
"position": 1
},
{
"token": "analyze",
"startOffset": 8,
"endOffset": 15,
"position": 2
}
]
}
Tanımlar
Name | Description |
---|---|
Analyzed |
Çözümleyici tarafından döndürülen belirteç hakkında bilgi. |
Analyze |
Bu metni belirteçlere bölmek için kullanılan bazı metin ve çözümleme bileşenlerini belirtir. |
Analyze |
Bir çözümleyicinin metin üzerinde test edilmesi sonucu. |
Char |
Arama altyapısı tarafından desteklenen tüm karakter filtrelerinin adlarını tanımlar. |
Error |
Kaynak yönetimi hatası ek bilgileri. |
Error |
Hata ayrıntısı. |
Error |
Hata yanıtı |
Lexical |
Arama altyapısı tarafından desteklenen tüm metin çözümleyicilerinin adlarını tanımlar. |
Lexical |
Arama altyapısı tarafından desteklenen tüm metin normalleştiricilerinin adlarını tanımlar. |
Lexical |
Arama altyapısı tarafından desteklenen tüm belirteç oluşturucuların adlarını tanımlar. |
Token |
Arama altyapısı tarafından desteklenen tüm belirteç filtrelerinin adlarını tanımlar. |
AnalyzedTokenInfo
Çözümleyici tarafından döndürülen belirteç hakkında bilgi.
Name | Tür | Description |
---|---|---|
endOffset |
integer |
Giriş metnindeki belirtecin son karakterinin dizini. |
position |
integer |
Giriş metnindeki belirtecin diğer belirteçlere göre konumu. Giriş metnindeki ilk belirtecin konumu 0, sonrakinin konumu 1 vb. olur. Kullanılan çözümleyiciye bağlı olarak, bazı belirteçler birbirinin eş anlamlısı olması gibi aynı konuma sahip olabilir. |
startOffset |
integer |
Giriş metnindeki belirtecin ilk karakterinin dizini. |
token |
string |
Çözümleyici tarafından döndürülen belirteç. |
AnalyzeRequest
Bu metni belirteçlere bölmek için kullanılan bazı metin ve çözümleme bileşenlerini belirtir.
Name | Tür | Description |
---|---|---|
analyzer |
Verilen metni kesmek için kullanılacak çözümleyicinin adı. |
|
charFilters |
Verilen metni kırarken kullanılacak isteğe bağlı karakter filtreleri listesi. |
|
normalizer |
Verilen metni normalleştirmek için kullanılacak normalleştiricinin adı. |
|
text |
string |
Belirteçlere bölünecek metin. |
tokenFilters |
Verilen metni kırarken kullanılacak isteğe bağlı belirteç filtreleri listesi. |
|
tokenizer |
Verilen metni kesmek için kullanılacak belirteç oluşturucunun adı. |
AnalyzeResult
Bir çözümleyicinin metin üzerinde test edilmesi sonucu.
Name | Tür | Description |
---|---|---|
tokens |
İstekte belirtilen çözümleyici tarafından döndürülen belirteçlerin listesi. |
CharFilterName
Arama altyapısı tarafından desteklenen tüm karakter filtrelerinin adlarını tanımlar.
Name | Tür | Description |
---|---|---|
html_strip |
string |
HTML yapılarını ayırmaya çalışan bir karakter filtresi. Bkz. https://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/charfilter/HTMLStripCharFilter.html |
ErrorAdditionalInfo
Kaynak yönetimi hatası ek bilgileri.
Name | Tür | Description |
---|---|---|
info |
object |
Ek bilgiler. |
type |
string |
Ek bilgi türü. |
ErrorDetail
Hata ayrıntısı.
Name | Tür | Description |
---|---|---|
additionalInfo |
Hata ek bilgileri. |
|
code |
string |
Hata kodu. |
details |
Hata ayrıntıları. |
|
message |
string |
Hata iletisi. |
target |
string |
Hata hedefi. |
ErrorResponse
Hata yanıtı
Name | Tür | Description |
---|---|---|
error |
Hata nesnesi. |
LexicalAnalyzerName
Arama altyapısı tarafından desteklenen tüm metin çözümleyicilerinin adlarını tanımlar.
Name | Tür | Description |
---|---|---|
ar.lucene |
string |
Arapça için Lucene çözümleyicisi. |
ar.microsoft |
string |
Arapça için Microsoft çözümleyicisi. |
bg.lucene |
string |
Bulgarca için Lucene çözümleyicisi. |
bg.microsoft |
string |
Bulgarca için Microsoft çözümleyicisi. |
bn.microsoft |
string |
Bangla için Microsoft çözümleyicisi. |
ca.lucene |
string |
Catalan için Lucene çözümleyicisi. |
ca.microsoft |
string |
Katalan için Microsoft çözümleyicisi. |
cs.lucene |
string |
Çekçe için Lucene analizörü. |
cs.microsoft |
string |
Çekçe için Microsoft çözümleyicisi. |
da.lucene |
string |
Danca için Lucene çözümleyicisi. |
da.microsoft |
string |
Danca için Microsoft çözümleyicisi. |
de.lucene |
string |
Almanca için Lucene çözümleyicisi. |
de.microsoft |
string |
Almanca için Microsoft çözümleyicisi. |
el.lucene |
string |
Yunanca için Lucene çözümleyicisi. |
el.microsoft |
string |
Yunanca için Microsoft çözümleyicisi. |
en.lucene |
string |
İngilizce için Lucene çözümleyicisi. |
en.microsoft |
string |
İngilizce için Microsoft çözümleyicisi. |
es.lucene |
string |
İspanyolca için Lucene çözümleyicisi. |
es.microsoft |
string |
İspanyolca için Microsoft çözümleyicisi. |
et.microsoft |
string |
Estonca için Microsoft çözümleyicisi. |
eu.lucene |
string |
Bask dili için Lucene çözümleyicisi. |
fa.lucene |
string |
Farsça için Lucene analizörü. |
fi.lucene |
string |
Fince için Lucene çözümleyicisi. |
fi.microsoft |
string |
Fince için Microsoft çözümleyicisi. |
fr.lucene |
string |
Fransızca için Lucene çözümleyicisi. |
fr.microsoft |
string |
Fransızca için Microsoft çözümleyicisi. |
ga.lucene |
string |
lucene çözümleyicisi İrlandalı. |
gl.lucene |
string |
Galiçyalı için Lucene analizörü. |
gu.microsoft |
string |
Gujarati için Microsoft Çözümleyicisi. |
he.microsoft |
string |
İbranice için Microsoft çözümleyicisi. |
hi.lucene |
string |
Hintçe için Lucene çözümleyicisi. |
hi.microsoft |
string |
Hintçe için Microsoft çözümleyicisi. |
hr.microsoft |
string |
Hırvat dili için Microsoft çözümleyicisi. |
hu.lucene |
string |
Macarca için Lucene çözümleyicisi. |
hu.microsoft |
string |
Macarca için Microsoft çözümleyicisi. |
hy.lucene |
string |
Ermeniler için Lucene analizörü. |
id.lucene |
string |
Endonezya dili için Lucene çözümleyicisi. |
id.microsoft |
string |
Endonezya dili (Bahasa) için Microsoft çözümleyicisi. |
is.microsoft |
string |
İzlanda dili için Microsoft çözümleyicisi. |
it.lucene |
string |
İtalyanca için Lucene çözümleyicisi. |
it.microsoft |
string |
İtalyanca için Microsoft çözümleyicisi. |
ja.lucene |
string |
Japonca için Lucene çözümleyicisi. |
ja.microsoft |
string |
Japonca için Microsoft çözümleyicisi. |
keyword |
string |
Bir alanın içeriğinin tamamını tek bir belirteç olarak ele alır. Bu, posta kodları, kimlikler ve bazı ürün adları gibi veriler için kullanışlıdır. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/KeywordAnalyzer.html |
kn.microsoft |
string |
Kannada için Microsoft çözümleyicisi. |
ko.lucene |
string |
Korece için Lucene çözümleyicisi. |
ko.microsoft |
string |
Korece için Microsoft çözümleyicisi. |
lt.microsoft |
string |
Litvanca için Microsoft çözümleyicisi. |
lv.lucene |
string |
Letonca için Lucene çözümleyicisi. |
lv.microsoft |
string |
Letonca için Microsoft çözümleyicisi. |
ml.microsoft |
string |
Malayalam için Microsoft çözümleyicisi. |
mr.microsoft |
string |
Marathi için Microsoft çözümleyicisi. |
ms.microsoft |
string |
Malay dili (Latin) için Microsoft çözümleyicisi. |
nb.microsoft |
string |
Norveççe (Bokmål) için Microsoft analyzer. |
nl.lucene |
string |
Felemenkçe için Lucene çözümleyicisi. |
nl.microsoft |
string |
Felemenkçe için Microsoft çözümleyicisi. |
no.lucene |
string |
Norveçli lucene çözümleyicisi. |
pa.microsoft |
string |
Punjabi için Microsoft çözümleyicisi. |
pattern |
string |
Normal ifade deseni aracılığıyla metni terimlere esnek bir şekilde ayırır. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/PatternAnalyzer.html |
pl.lucene |
string |
Lehçe için Lucene çözümleyicisi. |
pl.microsoft |
string |
Lehçe için Microsoft çözümleyicisi. |
pt-BR.lucene |
string |
Portekizce (Brezilya) için Lucene çözümleyicisi. |
pt-BR.microsoft |
string |
Portekizce (Brezilya) için Microsoft çözümleyicisi. |
pt-PT.lucene |
string |
Portekizce (Portekiz) için Lucene çözümleyicisi. |
pt-PT.microsoft |
string |
Portekizce (Portekiz) için Microsoft çözümleyicisi. |
ro.lucene |
string |
Rumence için Lucene analizörü. |
ro.microsoft |
string |
Rumence için Microsoft çözümleyicisi. |
ru.lucene |
string |
Rus için Lucene analizörü. |
ru.microsoft |
string |
Rusça için Microsoft çözümleyicisi. |
simple |
string |
Metni harf olmayana böler ve küçük harfe dönüştürür. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/SimpleAnalyzer.html |
sk.microsoft |
string |
Slovakça için Microsoft çözümleyicisi. |
sl.microsoft |
string |
Slovence için Microsoft çözümleyicisi. |
sr-cyrillic.microsoft |
string |
Sırp (Kiril) için Microsoft analyzer. |
sr-latin.microsoft |
string |
Sırp dili (Latin) için Microsoft çözümleyicisi. |
standard.lucene |
string |
Standart Lucene çözümleyicisi. |
standardasciifolding.lucene |
string |
Standart ASCII Katlama Lucene çözümleyicisi. Bkz. https://docs.microsoft.com/rest/api/searchservice/Custom-analyzers-in-Azure-Search#Analyzers |
stop |
string |
Metni harf olmayana böler; Küçük harf ve stopword belirteç filtrelerini uygular. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/StopAnalyzer.html |
sv.lucene |
string |
İsveççe için Lucene çözümleyicisi. |
sv.microsoft |
string |
İsveççe için Microsoft çözümleyicisi. |
ta.microsoft |
string |
Tamil için Microsoft Çözümleyicisi. |
te.microsoft |
string |
Telugu için Microsoft çözümleyicisi. |
th.lucene |
string |
Tay dili için Lucene çözümleyicisi. |
th.microsoft |
string |
Tay dili için Microsoft çözümleyicisi. |
tr.lucene |
string |
Türkçe için Lucene çözümleyicisi. |
tr.microsoft |
string |
Türkçe için Microsoft çözümleyicisi. |
uk.microsoft |
string |
Ukrayna dili için Microsoft çözümleyicisi. |
ur.microsoft |
string |
Urduca için Microsoft çözümleyicisi. |
vi.microsoft |
string |
Vietnam dili için Microsoft çözümleyicisi. |
whitespace |
string |
Boşluk belirteci kullanan bir çözümleyici. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/WhitespaceAnalyzer.html |
zh-Hans.lucene |
string |
Çince (Basitleştirilmiş) için Lucene çözümleyicisi. |
zh-Hans.microsoft |
string |
Çince (Basitleştirilmiş) için Microsoft çözümleyicisi. |
zh-Hant.lucene |
string |
Çince (Geleneksel) için Lucene çözümleyicisi. |
zh-Hant.microsoft |
string |
Çince (Geleneksel) için Microsoft çözümleyicisi. |
LexicalNormalizerName
Arama altyapısı tarafından desteklenen tüm metin normalleştiricilerinin adlarını tanımlar.
Name | Tür | Description |
---|---|---|
asciifolding |
string |
İlk 127 ASCII karakterde ("Temel Latin" Unicode bloğu) bulunmayan alfabetik, sayısal ve sembolik Unicode karakterleri, bu eşdeğerler varsa ASCII eşdeğerlerine dönüştürür. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/ASCIIFoldingFilter.html |
elision |
string |
İknaları kaldırır. Örneğin, "l'avion" (düzlem) "avion" (düzlem) olarak dönüştürülür. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/util/ElisionFilter.html |
lowercase |
string |
Belirteç metnini küçük harfle normalleştirir. Bkz. https://lucene.apache.org/core/6_6_1/analyzers-common/org/apache/lucene/analysis/core/LowerCaseFilter.html |
standard |
string |
Küçük harf ve asciifoldlamadan oluşan standart normalleştirici. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/reverse/ReverseStringFilter.html |
uppercase |
string |
Belirteç metnini büyük harfle normalleştirir. Bkz. https://lucene.apache.org/core/6_6_1/analyzers-common/org/apache/lucene/analysis/core/UpperCaseFilter.html |
LexicalTokenizerName
Arama altyapısı tarafından desteklenen tüm belirteç oluşturucuların adlarını tanımlar.
Name | Tür | Description |
---|---|---|
classic |
string |
Çoğu Avrupa dili belgesini işlemek için uygun olan dil bilgisi tabanlı belirteç oluşturucu. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/standard/ClassicTokenizer.html |
edgeNGram |
string |
Bir kenardan gelen girişi verilen boyutların n gramı olarak belirteci oluşturur. Bkz. https://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/ngram/EdgeNGramTokenizer.html |
keyword_v2 |
string |
Girişin tamamını tek bir belirteç olarak yayar. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/KeywordTokenizer.html |
letter |
string |
Metni harf olmayanlara böler. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/LetterTokenizer.html |
lowercase |
string |
Metni harf olmayanlara böler ve küçük harfe dönüştürür. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/LowerCaseTokenizer.html |
microsoft_language_stemming_tokenizer |
string |
Dile özgü kuralları kullanarak metni böler ve sözcükleri temel formlarına küçültür. |
microsoft_language_tokenizer |
string |
Dile özgü kuralları kullanarak metni böler. |
nGram |
string |
Girişi verilen boyutların n gramı olarak belirteci haline getirmektedir. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/ngram/NGramTokenizer.html |
path_hierarchy_v2 |
string |
Yol benzeri hiyerarşiler için belirteç oluşturucu. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/path/PathHierarchyTokenizer.html |
pattern |
string |
Farklı belirteçler oluşturmak için regex desen eşleştirmesi kullanan belirteç oluşturucu. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/pattern/PatternTokenizer.html |
standard_v2 |
string |
Standart Lucene çözümleyicisi; Standart belirteç oluşturucu, küçük harfli filtre ve durdurma filtresinden oluşur. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/standard/StandardTokenizer.html |
uax_url_email |
string |
Url'leri ve e-postaları tek bir belirteç olarak belirteç haline döndürür. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/standard/UAX29URLEmailTokenizer.html |
whitespace |
string |
Metni boşlukta böler. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/WhitespaceTokenizer.html |
TokenFilterName
Arama altyapısı tarafından desteklenen tüm belirteç filtrelerinin adlarını tanımlar.