Indexes - Create
Yeni bir arama dizini oluşturur.
POST {endpoint}/indexes?api-version=2025-09-01
URI Parametreleri
| Name | İçinde | Gerekli | Tür | Description |
|---|---|---|---|---|
|
endpoint
|
path | True |
string |
Arama hizmetinin uç nokta URL'si. |
|
api-version
|
query | True |
string |
İstemci Api Sürümü. |
İstek Başlığı
| Name | Gerekli | Tür | Description |
|---|---|---|---|
| x-ms-client-request-id |
string (uuid) |
Hata ayıklamaya yardımcı olmak için istekle birlikte gönderilen izleme kimliği. |
İstek Gövdesi
| Name | Gerekli | Tür | Description |
|---|---|---|---|
| fields | True |
Dizinin alanları. |
|
| name | True |
string |
Dizinin adı. |
| @odata.etag |
string |
Dizinin ETag'i. |
|
| analyzers | LexicalAnalyzer[]: |
Dizin için çözümleyiciler. |
|
| charFilters | CharFilter[]: |
Dizin için karakter filtreleri. |
|
| corsOptions |
Dizin için Çıkış Noktaları Arası Kaynak Paylaşımı'nı (CORS) denetleme seçenekleri. |
||
| defaultScoringProfile |
string |
Sorguda hiçbiri belirtilmemişse kullanılacak puanlama profilinin adı. Bu özellik ayarlanmamışsa ve sorguda puanlama profili belirtilmemişse, varsayılan puanlama (tf-idf) kullanılır. |
|
| description |
string |
Dizinin açıklaması. |
|
| encryptionKey |
Azure Key Vault'ta oluşturduğunuz bir şifreleme anahtarının açıklaması. Bu anahtar, hiç kimsenin, hatta Microsoft'un bile verilerinizin şifresini çözemeyeceğinden tam olarak emin olmak istediğinizde, verileriniz için ek bir bekleyen şifreleme düzeyi sağlamak için kullanılır. Verilerinizi bir kez şifreledikten sonra, her zaman şifreli kalacaktır. Arama hizmeti, bu özelliği null olarak ayarlama girişimlerini yoksayar. Şifreleme anahtarınızı döndürmek istiyorsanız bu özelliği gerektiği gibi değiştirebilirsiniz; Verileriniz etkilenmeyecektir. Müşteri tarafından yönetilen anahtarlarla şifreleme, ücretsiz arama hizmetleri için kullanılamaz ve yalnızca 1 Ocak 2019'da veya sonrasında oluşturulan ücretli hizmetler için kullanılabilir. |
||
| normalizers | LexicalNormalizer[]: |
Dizin için normalleştiriciler. |
|
| scoringProfiles |
Dizin için puanlama profilleri. |
||
| semantic |
Anlamsal yetenekleri etkileyen bir arama dizini için parametreleri tanımlar. |
||
| similarity | Similarity: |
Bir arama sorgusuyla eşleşen belgeleri puanlarken ve sıralarken kullanılacak benzerlik algoritmasının türü. Benzerlik algoritması yalnızca dizin oluşturma sırasında tanımlanabilir ve mevcut dizinlerde değiştirilemez. Null ise, ClassicSimilarity algoritması kullanılır. |
|
| suggesters |
Dizin için önerilerde bulunanlar. |
||
| tokenFilters |
TokenFilter[]:
|
Belirteç, dizin için filtre uygular. |
|
| tokenizers | LexicalTokenizer[]: |
Dizin için belirteçleştiriciler. |
|
| vectorSearch |
Vektör arama ile ilgili yapılandırma seçeneklerini içerir. |
Yanıtlar
| Name | Tür | Description |
|---|---|---|
| 201 Created | ||
| Other Status Codes |
Hata yanıtı. |
Örnekler
SearchServiceCreateIndex
Örnek isteği
POST https://stableexampleservice.search.windows.net/indexes?api-version=2025-09-01
{
"name": "temp-stable-test",
"description": "description",
"fields": [
{
"name": "id",
"type": "Edm.String",
"key": true,
"sortable": true
},
{
"name": "vector1",
"type": "Collection(Edm.Single)",
"retrievable": true,
"searchable": true,
"dimensions": 20,
"vectorSearchProfile": "config1"
},
{
"name": "vector1b",
"type": "Collection(Edm.Single)",
"retrievable": true,
"searchable": true,
"dimensions": 10,
"vectorSearchProfile": "config2"
},
{
"name": "vector2",
"type": "Collection(Edm.Single)",
"retrievable": true,
"searchable": true,
"dimensions": 5,
"vectorSearchProfile": "config3"
},
{
"name": "vector3",
"type": "Collection(Edm.Single)",
"retrievable": true,
"searchable": true,
"dimensions": 5,
"vectorSearchProfile": "config3"
},
{
"name": "vector22",
"type": "Collection(Edm.Single)",
"retrievable": true,
"searchable": true,
"dimensions": 10,
"vectorSearchProfile": "config2"
},
{
"name": "name",
"type": "Edm.String",
"retrievable": true,
"searchable": true,
"filterable": true,
"sortable": true,
"facetable": true,
"analyzer": "en.lucene"
},
{
"name": "description",
"type": "Edm.String",
"retrievable": true,
"searchable": true,
"filterable": true,
"sortable": true,
"facetable": true,
"analyzer": "standard.lucene"
},
{
"name": "category",
"type": "Edm.String",
"retrievable": true,
"searchable": true,
"filterable": true,
"sortable": true,
"facetable": true,
"analyzer": "en.lucene",
"normalizer": "standard"
},
{
"name": "ownerId",
"type": "Edm.String",
"retrievable": true,
"searchable": true,
"filterable": true,
"sortable": true,
"facetable": true,
"analyzer": "en.lucene"
}
],
"scoringProfiles": [
{
"name": "stringFieldBoost",
"text": {
"weights": {
"name": 3,
"description": 1,
"category": 2,
"ownerId": 1
}
},
"functions": [
{
"tag": {
"tagsParameter": "categoryTag"
},
"type": "tag",
"fieldName": "category",
"boost": 2
}
]
}
],
"defaultScoringProfile": "stringFieldBoost",
"corsOptions": {
"allowedOrigins": [
"https://www.example.com/foo"
],
"maxAgeInSeconds": 10
},
"suggesters": [
{
"name": "sg",
"searchMode": "analyzingInfixMatching",
"sourceFields": [
"category",
"ownerId"
]
}
],
"analyzers": [
{
"tokenizer": "standard_v2",
"tokenFilters": [
"common_grams"
],
"charFilters": [
"html_strip"
],
"@odata.type": "#Microsoft.Azure.Search.CustomAnalyzer",
"name": "tagsAnalyzer"
}
],
"tokenizers": [
{
"maxTokenLength": 100,
"@odata.type": "#Microsoft.Azure.Search.StandardTokenizerV2",
"name": "my_tokenizer"
}
],
"tokenFilters": [
{
"preserveOriginal": false,
"@odata.type": "#Microsoft.Azure.Search.AsciiFoldingTokenFilter",
"name": "my_tokenFilter"
}
],
"charFilters": [
{
"mappings": [
".=>,",
"_=>-"
],
"@odata.type": "#Microsoft.Azure.Search.MappingCharFilter",
"name": "my_mapping"
}
],
"normalizers": [
{
"tokenFilters": [
"asciifolding"
],
"charFilters": [
"my_mapping"
],
"@odata.type": "#Microsoft.Azure.Search.CustomNormalizer",
"name": "tagsNormalizer"
}
],
"similarity": {
"k1": 10,
"b": 0.1,
"@odata.type": "#Microsoft.Azure.Search.BM25Similarity"
},
"semantic": {
"defaultConfiguration": "testconfig",
"configurations": [
{
"name": "testconfig",
"prioritizedFields": {
"titleField": {
"fieldName": "category"
},
"prioritizedContentFields": [
{
"fieldName": "description"
}
],
"prioritizedKeywordsFields": [
{
"fieldName": "ownerId"
}
]
},
"rankingOrder": "BoostedRerankerScore"
}
]
},
"vectorSearch": {
"profiles": [
{
"name": "config1",
"algorithm": "cosine",
"vectorizer": "openai",
"compression": "mySQ8"
},
{
"name": "config2",
"algorithm": "euclidean",
"vectorizer": "custom-web-api",
"compression": "mySQ8"
},
{
"name": "config3",
"algorithm": "dotProduct",
"vectorizer": "custom-web-api",
"compression": "myBQC"
}
],
"algorithms": [
{
"hnswParameters": {
"metric": "cosine"
},
"name": "cosine",
"kind": "hnsw"
},
{
"hnswParameters": {
"metric": "euclidean"
},
"name": "euclidean",
"kind": "hnsw"
},
{
"hnswParameters": {
"metric": "dotProduct"
},
"name": "dotProduct",
"kind": "hnsw"
}
],
"vectorizers": [
{
"azureOpenAIParameters": {
"resourceUri": "https://test-sample.openai.azure.com/",
"deploymentId": "model",
"apiKey": "api-key",
"modelName": "text-embedding-3-large"
},
"name": "openai",
"kind": "azureOpenAI"
},
{
"customWebApiParameters": {
"uri": "https://my-custom-endpoint.org/",
"httpHeaders": {
"header1": "value1",
"header2": "value2"
},
"httpMethod": "POST",
"timeout": "PT1M",
"authResourceId": "api://f89d1c93-58a7-4b07-9a5b-5f89048b927b",
"authIdentity": {
"@odata.type": "#Microsoft.Azure.Search.DataNoneIdentity"
}
},
"name": "custom-web-api",
"kind": "customWebApi"
}
],
"compressions": [
{
"scalarQuantizationParameters": {
"quantizedDataType": "int8"
},
"name": "mySQ8",
"kind": "scalarQuantization",
"truncationDimension": 2
},
{
"name": "myBQC",
"kind": "binaryQuantization",
"truncationDimension": 2
}
]
},
"@odata.etag": "0x1234568AE7E58A1"
}
Örnek yanıt
{
"@odata.etag": "0x1234568AE7E58A1",
"name": "temp-stable-test",
"description": "description",
"defaultScoringProfile": "stringFieldBoost",
"fields": [
{
"name": "id",
"type": "Edm.String",
"searchable": true,
"filterable": true,
"retrievable": true,
"stored": true,
"sortable": true,
"facetable": true,
"key": true,
"synonymMaps": []
},
{
"name": "vector1",
"type": "Collection(Edm.Single)",
"searchable": true,
"filterable": false,
"retrievable": true,
"stored": true,
"sortable": false,
"facetable": false,
"key": false,
"dimensions": 20,
"vectorSearchProfile": "config1",
"synonymMaps": []
},
{
"name": "vector1b",
"type": "Collection(Edm.Single)",
"searchable": true,
"filterable": false,
"retrievable": true,
"stored": true,
"sortable": false,
"facetable": false,
"key": false,
"dimensions": 10,
"vectorSearchProfile": "config2",
"synonymMaps": []
},
{
"name": "vector2",
"type": "Collection(Edm.Single)",
"searchable": true,
"filterable": false,
"retrievable": true,
"stored": true,
"sortable": false,
"facetable": false,
"key": false,
"dimensions": 5,
"vectorSearchProfile": "config3",
"synonymMaps": []
},
{
"name": "vector3",
"type": "Collection(Edm.Single)",
"searchable": true,
"filterable": false,
"retrievable": true,
"stored": true,
"sortable": false,
"facetable": false,
"key": false,
"dimensions": 5,
"vectorSearchProfile": "config3",
"synonymMaps": []
},
{
"name": "vector22",
"type": "Collection(Edm.Single)",
"searchable": true,
"filterable": false,
"retrievable": true,
"stored": true,
"sortable": false,
"facetable": false,
"key": false,
"dimensions": 10,
"vectorSearchProfile": "config2",
"synonymMaps": []
},
{
"name": "name",
"type": "Edm.String",
"searchable": true,
"filterable": true,
"retrievable": true,
"stored": true,
"sortable": true,
"facetable": true,
"key": false,
"analyzer": "en.lucene",
"synonymMaps": []
},
{
"name": "description",
"type": "Edm.String",
"searchable": true,
"filterable": true,
"retrievable": true,
"stored": true,
"sortable": true,
"facetable": true,
"key": false,
"analyzer": "standard.lucene",
"synonymMaps": []
},
{
"name": "category",
"type": "Edm.String",
"searchable": true,
"filterable": true,
"retrievable": true,
"stored": true,
"sortable": true,
"facetable": true,
"key": false,
"analyzer": "en.lucene",
"normalizer": "standard",
"synonymMaps": []
},
{
"name": "ownerId",
"type": "Edm.String",
"searchable": true,
"filterable": true,
"retrievable": true,
"stored": true,
"sortable": true,
"facetable": true,
"key": false,
"analyzer": "en.lucene",
"synonymMaps": []
}
],
"scoringProfiles": [
{
"name": "stringFieldBoost",
"functionAggregation": "sum",
"text": {
"weights": {
"name": 3,
"description": 1,
"category": 2,
"ownerId": 1
}
},
"functions": [
{
"fieldName": "category",
"interpolation": "linear",
"type": "tag",
"boost": 2,
"tag": {
"tagsParameter": "categoryTag"
}
}
]
}
],
"corsOptions": {
"allowedOrigins": [
"https://www.example.com/foo"
],
"maxAgeInSeconds": 10
},
"suggesters": [
{
"name": "sg",
"searchMode": "analyzingInfixMatching",
"sourceFields": [
"category",
"ownerId"
]
}
],
"analyzers": [
{
"@odata.type": "#Microsoft.Azure.Search.CustomAnalyzer",
"name": "tagsAnalyzer",
"tokenizer": "standard_v2",
"tokenFilters": [
"common_grams"
],
"charFilters": [
"html_strip"
]
}
],
"normalizers": [
{
"@odata.type": "#Microsoft.Azure.Search.CustomNormalizer",
"name": "tagsNormalizer",
"tokenFilters": [
"asciifolding"
],
"charFilters": [
"my_mapping"
]
}
],
"tokenizers": [
{
"@odata.type": "#Microsoft.Azure.Search.StandardTokenizerV2",
"name": "my_tokenizer",
"maxTokenLength": 100
}
],
"tokenFilters": [
{
"@odata.type": "#Microsoft.Azure.Search.AsciiFoldingTokenFilter",
"name": "my_tokenFilter",
"preserveOriginal": false
}
],
"charFilters": [
{
"@odata.type": "#Microsoft.Azure.Search.MappingCharFilter",
"name": "my_mapping",
"mappings": [
".=>,",
"_=>-"
]
}
],
"similarity": {
"@odata.type": "#Microsoft.Azure.Search.BM25Similarity",
"k1": 10,
"b": 0.1
},
"semantic": {
"defaultConfiguration": "testconfig",
"configurations": [
{
"name": "testconfig",
"rankingOrder": "BoostedRerankerScore",
"prioritizedFields": {
"titleField": {
"fieldName": "category"
},
"prioritizedContentFields": [
{
"fieldName": "description"
}
],
"prioritizedKeywordsFields": [
{
"fieldName": "ownerId"
}
]
}
}
]
},
"vectorSearch": {
"algorithms": [
{
"name": "cosine",
"kind": "hnsw",
"hnswParameters": {
"metric": "cosine",
"m": 4,
"efConstruction": 400,
"efSearch": 500
}
},
{
"name": "euclidean",
"kind": "hnsw",
"hnswParameters": {
"metric": "euclidean",
"m": 4,
"efConstruction": 400,
"efSearch": 500
}
},
{
"name": "dotProduct",
"kind": "hnsw",
"hnswParameters": {
"metric": "dotProduct",
"m": 4,
"efConstruction": 400,
"efSearch": 500
}
}
],
"profiles": [
{
"name": "config1",
"algorithm": "cosine",
"vectorizer": "openai",
"compression": "mySQ8"
},
{
"name": "config2",
"algorithm": "euclidean",
"vectorizer": "custom-web-api",
"compression": "mySQ8"
},
{
"name": "config3",
"algorithm": "dotProduct",
"vectorizer": "custom-web-api",
"compression": "myBQC"
}
],
"vectorizers": [
{
"name": "openai",
"kind": "azureOpenAI",
"azureOpenAIParameters": {
"resourceUri": "https://test-sample.openai.azure.com",
"deploymentId": "model",
"apiKey": "api-key",
"modelName": "text-embedding-3-large"
}
},
{
"name": "custom-web-api",
"kind": "customWebApi",
"customWebApiParameters": {
"httpMethod": "POST",
"uri": "https://my-custom-endpoint.org/",
"timeout": "PT1M",
"authResourceId": "api://f89d1c93-58a7-4b07-9a5b-5f89048b927b",
"httpHeaders": {
"header1": "value1",
"header2": "value2"
},
"authIdentity": {
"@odata.type": "#Microsoft.Azure.Search.DataNoneIdentity"
}
}
}
],
"compressions": [
{
"name": "mySQ8",
"kind": "scalarQuantization",
"truncationDimension": 2,
"scalarQuantizationParameters": {
"quantizedDataType": "int8"
},
"rescoringOptions": {
"enableRescoring": true,
"defaultOversampling": 4,
"rescoreStorageMethod": "preserveOriginals"
}
},
{
"name": "myBQC",
"kind": "binaryQuantization",
"truncationDimension": 2,
"rescoringOptions": {
"enableRescoring": true,
"defaultOversampling": 4,
"rescoreStorageMethod": "preserveOriginals"
}
}
]
}
}
Tanımlar
| Name | Description |
|---|---|
|
Ascii |
İlk 127 ASCII karakterde ("Temel Latince" Unicode bloğu) yer almayan alfabetik, sayısal ve sembolik Unicode karakterleri, bu tür eşdeğerler varsa ASCII eşdeğerlerine dönüştürür. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır. |
|
Azure |
Arama hizmetiniz için oluşturulan ve Azure Key Vault'ta depolanan şifreleme anahtarlarına kimliği doğrulanmış erişim için kullanılan kayıtlı bir uygulamanın kimlik bilgileri. |
|
Azure |
Azure OpenAI kaynağını kullanarak belirli bir metin girişi için bir vektör eklemesi oluşturmanıza olanak tanır. |
|
Azure |
Çağrılacak Azure Open AI model adı. |
|
Azure |
Azure OpenAI kaynağına bağlanmak için parametreleri belirtir. |
|
Azure |
Bir sorgu dizesini vektörleştirmek için kullanılan Azure OpenAI kaynağını belirtir. |
|
Binary |
İndeksleme ve sorgulama sırasında kullanılan ikili niceleme sıkıştırma yöntemine özgü yapılandırma seçeneklerini içerir. |
| BM25Similarity |
Okapi BM25 benzerlik algoritmasına dayalı sıralama fonksiyonu. BM25, uzunluk normalleştirmesini ('b' parametresi tarafından kontrol edilir) ve terim frekansı doygunluğunu ('k1' parametresi tarafından kontrol edilir) içeren TF-IDF benzeri bir algoritmadır. |
|
Char |
Arama motoru tarafından desteklenen tüm karakter filtrelerinin adlarını tanımlar. |
|
Cjk |
Standart belirteçleyiciden oluşturulan CJK terimlerinin bigramlarını oluşturur. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır. |
|
Cjk |
CjkBigramTokenFilter tarafından yoksayılabilen betikler. |
|
Classic |
TF-IDF'nin Lucene TFIDFSimilarity uygulamasını kullanan eski benzerlik algoritması. Bu TF-IDF varyasyonu, statik belge uzunluğu normalleştirmesinin yanı sıra, aranan sorgularla yalnızca kısmen eşleşen belgeleri cezalandıran koordinasyon faktörlerini de beraberinde getirir. |
|
Classic |
Çoğu Avrupa dilindeki belgeyi işlemek için uygun olan dilbilgisi tabanlı belirteçleyici. Bu belirteç oluşturucu Apache Lucene kullanılarak uygulanır. |
|
Common |
İndeksleme sırasında sık karşılaşılan terimler için bigramlar oluşturun. Tek terimler de indekslenmeye devam ediyor ve bigramlar üst üste bindiriliyor. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır. |
|
Cors |
Bir dizin için Çıkış Noktaları Arası Kaynak Paylaşımı'nı (CORS) denetleme seçeneklerini tanımlar. |
|
Custom |
Metni dizine eklenebilir/aranabilir belirteçlere dönüştürme işlemi üzerinde kontrol sahibi olmanızı sağlar. Önceden tanımlanmış tek bir belirteç oluşturucu ve bir veya daha fazla filtreden oluşan kullanıcı tanımlı bir yapılandırmadır. Belirteçleştirici, metni belirteçlere bölmekten ve belirteç oluşturucu tarafından yayılan belirteçleri değiştirmek için filtrelerden sorumludur. |
|
Custom |
Varsayılan olarak katı eşleştirmeyle çalışan filtrelenebilir, sıralanabilir ve facetable alanlar için normalleştirmeyi yapılandırmanıza olanak tanır. Bu, depolanan belirteci değiştiren en az bir veya daha fazla filtreden oluşan kullanıcı tanımlı bir yapılandırmadır. |
|
Dictionary |
Birçok Cermen dilinde bulunan bileşik sözcükleri ayrıştırır. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır. |
|
Distance |
Coğrafi bir konuma olan mesafeye bağlı olarak puanları artıran bir işlev tanımlar. |
|
Distance |
Mesafe puanlama işlevine parametre değerleri sağlar. |
|
Edge |
Bir giriş belirtecinin önünden veya arkasından başlayarak verilen boyut(lar)ın n-gramını oluşturur. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır. |
|
Edge |
Bir n-gramın girişin hangi tarafından oluşturulması gerektiğini belirtir. |
|
Edge |
Bir giriş belirtecinin önünden veya arkasından başlayarak verilen boyut(lar)ın n-gramını oluşturur. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır. |
|
Edge |
Bir kenardan gelen girdiyi, verilen boyut(lar)ın n-gramına tokenize eder. Bu belirteç oluşturucu Apache Lucene kullanılarak uygulanır. |
|
Elision |
Elizyonları kaldırır. Örneğin, "l'avion" (uçak) "avion" (uçak) olarak dönüştürülecektir. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır. |
|
Error |
Kaynak yönetimi hatası ek bilgileri. |
|
Error |
Hata ayrıntısı. |
|
Error |
Hata yanıtı |
|
Exhaustive |
Kapsamlı KNN algoritmasına özgü parametreleri içerir. |
|
Exhaustive |
Sorgulama sırasında kullanılan ve tüm vektör dizini boyunca deneme yanılma araması gerçekleştirecek olan kapsamlı KNN algoritmasına özgü yapılandırma seçeneklerini içerir. |
|
Freshness |
Tarih-saat alanının değerine bağlı olarak puanları artıran bir işlev tanımlar. |
|
Freshness |
Tazelik puanlama işlevine parametre değerleri sağlar. |
|
Hnsw |
HNSW algoritmasına özgü parametreleri içerir. |
|
Hnsw |
Dizin oluşturma ve sorgulama sırasında kullanılan HNSW yaklaşık en yakın komşular algoritmasına özgü yapılandırma seçeneklerini içerir. HNSW algoritması, arama hızı ve doğruluğu arasında ayarlanabilir bir denge sunar. |
|
Input |
Bir beceri için giriş alanı eşlemesi. |
|
Keep |
Yalnızca belirli bir sözcük listesinde yer alan metne sahip belirteçleri tutan bir belirteç filtresi. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır. |
|
Keyword |
Terimleri anahtar sözcük olarak işaretler. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır. |
|
Keyword |
Tüm girişi tek bir belirteç olarak yayar. Bu belirteç oluşturucu Apache Lucene kullanılarak uygulanır. |
|
Keyword |
Tüm girişi tek bir belirteç olarak yayar. Bu belirteç oluşturucu Apache Lucene kullanılarak uygulanır. |
|
Length |
Çok uzun veya çok kısa sözcükleri kaldırır. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır. |
|
Lexical |
Arama motoru tarafından desteklenen tüm metin çözümleyicilerinin adlarını tanımlar. |
|
Lexical |
Arama motoru tarafından desteklenen tüm metin normalleştiricilerinin adlarını tanımlar. |
|
Lexical |
Arama motoru tarafından desteklenen tüm tokenizer'ların adlarını tanımlar. |
|
Limit |
İndeksleme sırasında belirteç sayısını sınırlar. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır. |
|
Lucene |
Standart Apache Lucene analizörü; Standart belirteçleyici, küçük harf filtresi ve durdurma filtresinden oluşur. |
|
Lucene |
Unicode Metin Bölütleme kurallarına uygun olarak metni keser. Bu belirteç oluşturucu Apache Lucene kullanılarak uygulanır. |
|
Lucene |
Unicode Metin Bölütleme kurallarına uygun olarak metni keser. Bu belirteç oluşturucu Apache Lucene kullanılarak uygulanır. |
|
Magnitude |
Sayısal bir alanın büyüklüğüne bağlı olarak puanları artıran bir işlev tanımlar. |
|
Magnitude |
Büyüklük puanlama işlevine parametre değerleri sağlar. |
|
Mapping |
Eşlemeler seçeneğiyle tanımlanan eşlemeleri uygulayan bir karakter filtresi. Eşleştirme açgözlüdür (belirli bir noktada en uzun desen eşleşmesi kazanır). Değiştirmenin boş dize olmasına izin verilir. Bu karakter filtresi Apache Lucene kullanılarak uygulanır. |
|
Microsoft |
Dile özgü kuralları kullanarak metni böler ve sözcükleri temel biçimlerine indirger. |
|
Microsoft |
Dile özgü kuralları kullanarak metni böler. |
|
Microsoft |
Microsoft dil köklendirme belirteç oluşturucusu tarafından desteklenen dilleri listeler. |
|
Microsoft |
Microsoft dil belirteci tarafından desteklenen dilleri listeler. |
|
NGram |
Verilen boyut(lar)dan n-gram üretir. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır. |
|
NGram |
Verilen boyut(lar)dan n-gram üretir. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır. |
|
NGram |
Girdiyi, verilen boyut(lar)ın n-gramına tokenize eder. Bu belirteç oluşturucu Apache Lucene kullanılarak uygulanır. |
|
Output |
Bir beceri için çıktı alanı eşlemesi. |
|
Path |
Yol benzeri hiyerarşiler için belirteçleştirici. Bu belirteç oluşturucu Apache Lucene kullanılarak uygulanır. |
|
Pattern |
Metni düzenli bir ifade deseni aracılığıyla esnek bir şekilde terimlere ayırır. Bu çözümleyici Apache Lucene kullanılarak uygulanır. |
|
Pattern |
Bir veya daha fazla desende her yakalama grubu için bir tane olmak üzere birden çok belirteç yaymak için Java normal ifadelerini kullanır. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır. |
|
Pattern |
Giriş dizesindeki karakterlerin yerini alan bir karakter filtresi. Korunacak karakter dizilerini tanımlamak için normal bir ifade ve değiştirilecek karakterleri tanımlamak için bir değiştirme deseni kullanır. Örneğin, "aa bb aa bb" giriş metni, "(aa)\s+(bb)" deseni ve "$1#$2" yerine geçtiğinde, sonuç "aa#bb aa#bb" olacaktır. Bu karakter filtresi Apache Lucene kullanılarak uygulanır. |
|
Pattern |
Giriş dizesindeki karakterlerin yerini alan bir karakter filtresi. Korunacak karakter dizilerini tanımlamak için normal bir ifade ve değiştirilecek karakterleri tanımlamak için bir değiştirme deseni kullanır. Örneğin, "aa bb aa bb" giriş metni, "(aa)\s+(bb)" deseni ve "$1#$2" yerine geçtiğinde, sonuç "aa#bb aa#bb" olacaktır. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır. |
|
Pattern |
Farklı belirteçler oluşturmak için normal ifade deseni eşleştirmesini kullanan belirteçleyici. Bu belirteç oluşturucu Apache Lucene kullanılarak uygulanır. |
|
Phonetic |
PhoneticTokenFilter ile kullanılacak fonetik kodlayıcı türünü tanımlar. |
|
Phonetic |
Fonetik eşleşmeler için belirteçler oluşturun. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır. |
|
Prioritized |
Anlamsal sıralama, resim yazıları, vurgular ve yanıtlar için kullanılacak başlık, içerik ve anahtar sözcük alanlarını açıklar. |
|
Ranking |
Belgelerin sıralama düzeni için kullanılacak puanı temsil eder. |
|
Regex |
Desen çözümleyicisinde ve desen belirteçleyicisinde normal ifadelerin nasıl kullanıldığını denetlemek için birleştirilebilecek bayrakları tanımlar. |
|
Rescoring |
Yeniden puanlama seçeneklerini içerir. |
|
Scalar |
Skaler Kuantizasyona özgü parametreleri içerir. |
|
Scalar |
İndeksleme ve sorgulama sırasında kullanılan skaler niceleme sıkıştırma yöntemine özgü yapılandırma seçeneklerini içerir. |
|
Scoring |
Bir puanlama profilindeki tüm puanlama işlevlerinin sonuçlarını birleştirmek için kullanılan toplama işlevini tanımlar. |
|
Scoring |
Bir dizi belgede puan artırmayı enterpolasyon yapmak için kullanılan işlevi tanımlar. |
|
Scoring |
Arama sorgularında puanlamayı etkileyen bir arama dizini için parametreleri tanımlar. |
|
Search |
Bir alanın adını, veri türünü ve arama davranışını açıklayan bir dizin tanımındaki bir alanı temsil eder. |
|
Search |
Arama dizinindeki bir alanın veri türünü tanımlar. |
|
Search |
Bir dizinin alanlarını ve arama davranışını açıklayan bir arama dizini tanımını temsil eder. |
|
Search |
Bir veri kaynağının kimlik özelliğini temizler. |
|
Search |
Kullanılacak veri kaynağının kimliğini belirtir. |
|
Search |
Azure Key Vault'ta müşteri tarafından yönetilen bir şifreleme anahtarı. Oluşturduğunuz ve yönettiğiniz anahtarlar, dizinler ve eş anlamlı eşlemeler gibi bekleyen verileri şifrelemek veya şifresini çözmek için kullanılabilir. |
|
Semantic |
Anlamsal yetenekler bağlamında kullanılacak belirli bir yapılandırmayı tanımlar. |
|
Semantic |
Anlamsal yapılandırmanın bir parçası olarak kullanılan bir alan. |
|
Semantic |
Anlamsal yetenekleri etkileyen bir arama dizini için parametreleri tanımlar. |
|
Shingle |
Tek bir belirteç olarak belirteç kombinasyonları oluşturur. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır. |
|
Snowball |
Snowball tarafından oluşturulan bir kök kullanarak sözcükleri köklendiren bir filtre. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır. |
|
Snowball |
Snowball belirteç filtresi için kullanılacak dil. |
|
Stemmer |
Özel sözlük tabanlı kök oluşturma ile diğer kök filtrelerini geçersiz kılma olanağı sağlar. Sözlük tabanlı herhangi bir terim, anahtar kelime olarak işaretlenir, böylece zincirin aşağısındaki köklerle köklenmezler. Herhangi bir sap filtresinden önce yerleştirilmelidir. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır. |
|
Stemmer |
Dile özel kök filtresi. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır. |
|
Stemmer |
Stemmer belirteç filtresi için kullanılacak dil. |
|
Stop |
Metni harf olmayanlara böler; Küçük harf ve stopword belirteç filtrelerini uygular. Bu çözümleyici Apache Lucene kullanılarak uygulanır. |
|
Stopwords |
Dile özgü durdurma sözcüklerinin önceden tanımlanmış bir listesini tanımlar. |
|
Stopwords |
Belirteç akışından durdurma sözcüklerini kaldırır. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır. |
| Suggester |
Suggest API'nin dizindeki bir alan grubuna nasıl uygulanması gerektiğini tanımlar. |
|
Suggester |
Önerenin yeteneklerini gösteren bir değer. |
|
Synonym |
Bir belirteç akışındaki tek veya çok sözcüklü eş anlamlılarla eşleşir. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır. |
|
Tag |
Belirli bir etiket listesiyle eşleşen dize değerlerine sahip belgelerin puanlarını artıran bir işlev tanımlar. |
|
Tag |
Etiket puanlama işlevine parametre değerleri sağlar. |
|
Text |
Eşleşmelerin arama sorgularında puanlamayı artırması gereken dizin alanlarındaki ağırlıkları tanımlar. |
|
Token |
Belirteç filtresinin üzerinde çalışabileceği karakter sınıflarını temsil eder. |
|
Token |
Arama motoru tarafından desteklenen tüm belirteç filtrelerinin adlarını tanımlar. |
|
Truncate |
Terimleri belirli bir uzunlukta keser. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır. |
|
Uax |
URL'leri ve e-postaları tek bir belirteç olarak belirteçleştirir. Bu belirteç oluşturucu Apache Lucene kullanılarak uygulanır. |
|
Unique |
Önceki belirteçle aynı metne sahip belirteçleri filtreler. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır. |
|
Vector |
Vektör alanı içeriklerini yorumlamak için kodlama biçimi. |
|
Vector |
Vektör arama ile ilgili yapılandırma seçeneklerini içerir. |
|
Vector |
Dizin oluşturma ve sorgulama için kullanılan algoritma. |
|
Vector |
Vektör karşılaştırmaları için kullanılacak benzerlik metriği. Ekleme modelinin eğitildiği benzerlik metriğinin seçilmesi önerilir. |
|
Vector |
Dizin oluşturma ve sorgulama için kullanılan sıkıştırma yöntemi. |
|
Vector |
Yeniden puanlama ve dahili dizin işlemleri için kullanılan orijinal tam duyarlıklı vektörler için depolama yöntemi. |
|
Vector |
Sıkıştırılmış vektör değerlerinin nicelleştirilmiş veri türü. |
|
Vector |
Vektör aramasıyla kullanılacak konfigürasyonların bir kombinasyonunu tanımlar. |
|
Vector |
Sorgu sırasında kullanılacak vektörleştirme yöntemi. |
|
Web |
Kullanıcı tanımlı bir vektörleştiriciye bağlanmak için özellikleri belirtir. |
|
Web |
Bir sorgu dizesinin vektör katıştırmasını oluşturmak için kullanıcı tanımlı bir vektörleştirici belirtir. Harici bir vektörleştiricinin entegrasyonu, bir beceri kümesinin özel Web API arabirimi kullanılarak gerçekleştirilir. |
|
Word |
Sözcükleri alt sözcüklere böler ve alt sözcük gruplarında isteğe bağlı dönüştürmeler gerçekleştirir. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır. |
AsciiFoldingTokenFilter
İlk 127 ASCII karakterde ("Temel Latince" Unicode bloğu) yer almayan alfabetik, sayısal ve sembolik Unicode karakterleri, bu tür eşdeğerler varsa ASCII eşdeğerlerine dönüştürür. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır.
| Name | Tür | Default value | Description |
|---|---|---|---|
| @odata.type |
string:
#Microsoft. |
Belirteç filtresinin türünü belirten bir URI parçası. |
|
| name |
string |
Belirteç filtresinin adı. Yalnızca harfler, rakamlar, boşluklar, kısa çizgiler veya alt çizgiler içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır. |
|
| preserveOriginal |
boolean |
False |
Orijinal belirtecin tutulup tutulmayacağını gösteren bir değer. Varsayılan değer false'tur. |
AzureActiveDirectoryApplicationCredentials
Arama hizmetiniz için oluşturulan ve Azure Key Vault'ta depolanan şifreleme anahtarlarına kimliği doğrulanmış erişim için kullanılan kayıtlı bir uygulamanın kimlik bilgileri.
| Name | Tür | Description |
|---|---|---|
| applicationId |
string |
Bekleyen verilerinizi şifrelerken kullanılacak Azure Key Vault için gerekli erişim izinleri verilmiş bir AAD Uygulama Kimliği. Uygulama Kimliği, AAD Uygulamanızın Nesne Kimliği ile karıştırılmamalıdır. |
| applicationSecret |
string |
Belirtilen AAD uygulamasının kimlik doğrulama anahtarı. |
AzureOpenAIEmbeddingSkill
Azure OpenAI kaynağını kullanarak belirli bir metin girişi için bir vektör eklemesi oluşturmanıza olanak tanır.
| Name | Tür | Description |
|---|---|---|
| @odata.type |
string:
#Microsoft. |
Beceri türünü belirten bir URI parçası. |
| apiKey |
string |
Belirlenen Azure OpenAI kaynağının API anahtarı. |
| authIdentity | SearchIndexerDataIdentity: |
Giden bağlantılar için kullanılan, kullanıcı tarafından atanan yönetilen kimlik. |
| context |
string |
Belge kökü veya belge içeriği (örneğin, /document veya /document/content) gibi işlemlerin gerçekleştiği düzeyi temsil eder. Varsayılan değer /document'dir. |
| deploymentId |
string |
Belirlenen kaynakta Azure OpenAI modeli dağıtımının kimliği. |
| description |
string |
Becerinin girdilerini, çıktılarını ve kullanımını açıklayan becerinin açıklaması. |
| dimensions |
integer (int32) |
Sonuçta elde edilen çıktı eklemelerinin sahip olması gereken boyut sayısı. Yalnızca text-embedding-3 ve sonraki modellerde desteklenir. |
| inputs |
Becerilerin girişleri, kaynak veri kümesindeki bir sütun veya yukarı akış becerisinin çıktısı olabilir. |
|
| modelName |
Sağlanan deploymentId yolunda dağıtılan katıştırma modelinin adı. |
|
| name |
string |
Becerinin, onu beceri kümesi içinde benzersiz bir şekilde tanımlayan adı. Adı tanımlanmamış bir beceriye, beceriler dizisindeki 1 tabanlı dizininin varsayılan adı verilir ve önüne '#' karakteri eklenir. |
| outputs |
Bir becerinin çıktısı, arama dizinindeki bir alan veya başka bir beceri tarafından girdi olarak kullanılabilecek bir değerdir. |
|
| resourceUri |
string (uri) |
Azure OpenAI kaynağının kaynak URI'si. |
AzureOpenAIModelName
Çağrılacak Azure Open AI model adı.
| Değer | Description |
|---|---|
| text-embedding-ada-002 | |
| text-embedding-3-large | |
| text-embedding-3-small |
AzureOpenAIParameters
Azure OpenAI kaynağına bağlanmak için parametreleri belirtir.
| Name | Tür | Description |
|---|---|---|
| apiKey |
string |
Belirlenen Azure OpenAI kaynağının API anahtarı. |
| authIdentity | SearchIndexerDataIdentity: |
Giden bağlantılar için kullanılan, kullanıcı tarafından atanan yönetilen kimlik. |
| deploymentId |
string |
Belirlenen kaynakta Azure OpenAI modeli dağıtımının kimliği. |
| modelName |
Sağlanan deploymentId yolunda dağıtılan katıştırma modelinin adı. |
|
| resourceUri |
string (uri) |
Azure OpenAI kaynağının kaynak URI'si. |
AzureOpenAIVectorizer
Bir sorgu dizesini vektörleştirmek için kullanılan Azure OpenAI kaynağını belirtir.
| Name | Tür | Description |
|---|---|---|
| azureOpenAIParameters | AzureOpenAIParameters: |
Azure OpenAI katıştırma vektörleştirmesine özgü parametreleri içerir. |
| kind |
string:
azure |
Vektör aramasıyla kullanılmak üzere yapılandırılan vektörleştirme yönteminin adı. |
| name |
string |
Bu özel vektörleştirme yöntemiyle ilişkilendirilecek ad. |
BinaryQuantizationVectorSearchCompressionConfiguration
İndeksleme ve sorgulama sırasında kullanılan ikili niceleme sıkıştırma yöntemine özgü yapılandırma seçeneklerini içerir.
| Name | Tür | Description |
|---|---|---|
| kind |
string:
binary |
Vektör aramasıyla kullanılmak üzere yapılandırılan sıkıştırma yönteminin adı. |
| name |
string |
Bu özel yapılandırmayla ilişkilendirilecek ad. |
| rescoringOptions |
Yeniden puanlama seçeneklerini içerir. |
|
| truncationDimension |
integer (int32) |
Vektörlerin kesileceği boyut sayısı. Vektörlerin kesilmesi, vektörlerin boyutunu ve arama sırasında aktarılması gereken veri miktarını azaltır. Bu, depolama maliyetinden tasarruf sağlayabilir ve geri çağırma pahasına arama performansını iyileştirebilir. Yalnızca OpenAI text-embedding-3-large (small) gibi Matryoshka Representation Learning (MRL) ile eğitilen yerleştirmeler için kullanılmalıdır. Varsayılan değer null'dur, bu da kesme olmadığı anlamına gelir. |
BM25Similarity
Okapi BM25 benzerlik algoritmasına dayalı sıralama fonksiyonu. BM25, uzunluk normalleştirmesini ('b' parametresi tarafından kontrol edilir) ve terim frekansı doygunluğunu ('k1' parametresi tarafından kontrol edilir) içeren TF-IDF benzeri bir algoritmadır.
| Name | Tür | Description |
|---|---|---|
| @odata.type |
string:
#Microsoft. |
|
| b |
number (double) |
Bu özellik, bir belgenin uzunluğunun alaka düzeyi puanını nasıl etkilediğini denetler. Varsayılan olarak, 0,75 değeri kullanılır. 0,0 değeri, uzunluk normalleştirmesinin uygulanmadığı anlamına gelirken, 1,0 değeri, puanın belgenin uzunluğuna göre tamamen normalleştirildiği anlamına gelir. |
| k1 |
number (double) |
Bu özellik, eşleşen her terimin terim sıklığı ile bir belge-sorgu çiftinin son alaka düzeyi puanı arasındaki ölçeklendirme işlevini denetler. Varsayılan olarak, 1,2 değeri kullanılır. 0,0 değeri, skorun terim sıklığındaki bir artışla ölçeklenmediği anlamına gelir. |
CharFilterName
Arama motoru tarafından desteklenen tüm karakter filtrelerinin adlarını tanımlar.
| Değer | Description |
|---|---|
| html_strip |
HTML yapılarını çıkarmaya çalışan bir karakter filtresi. Bkz. https://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/charfilter/HTMLStripCharFilter.html |
CjkBigramTokenFilter
Standart belirteçleyiciden oluşturulan CJK terimlerinin bigramlarını oluşturur. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır.
| Name | Tür | Default value | Description |
|---|---|---|---|
| @odata.type |
string:
#Microsoft. |
Belirteç filtresinin türünü belirten bir URI parçası. |
|
| ignoreScripts |
Görmezden gelinecek senaryolar. |
||
| name |
string |
Belirteç filtresinin adı. Yalnızca harfler, rakamlar, boşluklar, kısa çizgiler veya alt çizgiler içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır. |
|
| outputUnigrams |
boolean |
False |
Hem unigramların hem de bigramların (doğruysa) veya yalnızca bigramların (yanlışsa) çıktısının alınıp alınmayacağını gösteren bir değer. Varsayılan değer false'tur. |
CjkBigramTokenFilterScripts
CjkBigramTokenFilter tarafından yoksayılabilen betikler.
| Değer | Description |
|---|---|
| han |
CJK terimlerinin bigramlarını oluştururken Han betiğini yoksayın. |
| hiragana |
CJK terimlerinin bigramlarını oluştururken Hiragana komut dosyasını dikkate almayın. |
| katakana |
CJK terimlerinin bigramlarını oluştururken Katakana komut dosyasını dikkate almayın. |
| hangul |
CJK terimlerinin bigramlarını oluştururken Hangul komut dosyasını göz ardı edin. |
ClassicSimilarity
TF-IDF'nin Lucene TFIDFSimilarity uygulamasını kullanan eski benzerlik algoritması. Bu TF-IDF varyasyonu, statik belge uzunluğu normalleştirmesinin yanı sıra, aranan sorgularla yalnızca kısmen eşleşen belgeleri cezalandıran koordinasyon faktörlerini de beraberinde getirir.
| Name | Tür | Description |
|---|---|---|
| @odata.type |
string:
#Microsoft. |
ClassicTokenizer
Çoğu Avrupa dilindeki belgeyi işlemek için uygun olan dilbilgisi tabanlı belirteçleyici. Bu belirteç oluşturucu Apache Lucene kullanılarak uygulanır.
| Name | Tür | Default value | Description |
|---|---|---|---|
| @odata.type |
string:
#Microsoft. |
Belirteç oluşturucu türünü belirten bir URI parçası. |
|
| maxTokenLength |
integer (int32) maximum: 300 |
255 |
Maksimum belirteç uzunluğu. Varsayılan değer 255'tir. Maksimum uzunluktan daha uzun olan jetonlar bölünür. Kullanılabilecek maksimum belirteç uzunluğu 300 karakterdir. |
| name |
string |
Tokenizer'ın adı. Yalnızca harfler, rakamlar, boşluklar, kısa çizgiler veya alt çizgiler içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır. |
CommonGramTokenFilter
İndeksleme sırasında sık karşılaşılan terimler için bigramlar oluşturun. Tek terimler de indekslenmeye devam ediyor ve bigramlar üst üste bindiriliyor. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır.
| Name | Tür | Default value | Description |
|---|---|---|---|
| @odata.type |
string:
#Microsoft. |
Belirteç filtresinin türünü belirten bir URI parçası. |
|
| commonWords |
string[] |
Ortak kelimeler kümesi. |
|
| ignoreCase |
boolean |
False |
Sık kullanılan sözcüklerle eşleşen sözcüklerin büyük/küçük harfe duyarlı olup olmayacağını gösteren bir değer. Varsayılan değer false'tur. |
| name |
string |
Belirteç filtresinin adı. Yalnızca harfler, rakamlar, boşluklar, kısa çizgiler veya alt çizgiler içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır. |
|
| queryMode |
boolean |
False |
Belirteç filtresinin sorgu modunda olup olmadığını gösteren bir değer. Sorgu modundayken, belirteç filtresi bigramlar oluşturur ve ardından ortak sözcükleri ve tek terimleri ve ardından ortak bir sözcüğü kaldırır. Varsayılan değer false'tur. |
CorsOptions
Bir dizin için Çıkış Noktaları Arası Kaynak Paylaşımı'nı (CORS) denetleme seçeneklerini tanımlar.
| Name | Tür | Description |
|---|---|---|
| allowedOrigins |
string[] |
JavaScript koduna dizininize erişim izni verilecek kaynakların listesi. {protocol}://{fully-qualified-domain-name}[:{port#}] biçimindeki ana bilgisayarların bir listesini veya tüm çıkış noktalarına izin vermek için tek bir '*' içerebilir (önerilmez). |
| maxAgeInSeconds |
integer (int64) |
Tarayıcıların CORS ön kontrol yanıtlarını önbelleğe alması gereken süre. Varsayılan olarak 5 dakikadır. |
CustomAnalyzer
Metni dizine eklenebilir/aranabilir belirteçlere dönüştürme işlemi üzerinde kontrol sahibi olmanızı sağlar. Önceden tanımlanmış tek bir belirteç oluşturucu ve bir veya daha fazla filtreden oluşan kullanıcı tanımlı bir yapılandırmadır. Belirteçleştirici, metni belirteçlere bölmekten ve belirteç oluşturucu tarafından yayılan belirteçleri değiştirmek için filtrelerden sorumludur.
| Name | Tür | Description |
|---|---|---|
| @odata.type |
string:
#Microsoft. |
Çözümleyici türünü belirten bir URI parçası. |
| charFilters |
Giriş metnini belirteç oluşturucu tarafından işlenmeden önce hazırlamak için kullanılan karakter filtrelerinin listesi. Örneğin, belirli karakterleri veya sembolleri değiştirebilirler. Filtreler listelenme sırasına göre çalıştırılır. |
|
| name |
string |
Çözümleyicinin adı. Yalnızca harfler, rakamlar, boşluklar, kısa çizgiler veya alt çizgiler içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır. |
| tokenFilters |
Bir belirteç oluşturucu tarafından oluşturulan belirteçleri filtrelemek veya değiştirmek için kullanılan belirteç filtrelerinin listesi. Örneğin, tüm karakterleri küçük harfe dönüştüren bir küçük harf filtresi belirtebilirsiniz. Filtreler listelenme sırasına göre çalıştırılır. |
|
| tokenizer |
Sürekli metni, bir cümleyi sözcüklere bölme gibi bir belirteç dizisine bölmek için kullanılacak belirteç oluşturucunun adı. |
CustomNormalizer
Varsayılan olarak katı eşleştirmeyle çalışan filtrelenebilir, sıralanabilir ve facetable alanlar için normalleştirmeyi yapılandırmanıza olanak tanır. Bu, depolanan belirteci değiştiren en az bir veya daha fazla filtreden oluşan kullanıcı tanımlı bir yapılandırmadır.
| Name | Tür | Description |
|---|---|---|
| @odata.type |
string:
#Microsoft. |
Normalleştirici türünü belirten bir URI parçası. |
| charFilters |
Giriş metnini işlenmeden önce hazırlamak için kullanılan karakter filtrelerinin listesi. Örneğin, belirli karakterleri veya sembolleri değiştirebilirler. Filtreler listelenme sırasına göre çalıştırılır. |
|
| name |
string |
Normalleştiricinin adı. Yalnızca harfler, rakamlar, boşluklar, kısa çizgiler veya alt çizgiler içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır. '.microsoft' veya '.lucene' ile bitemez ve 'asciifolding', 'standart', 'küçük harf', 'büyük harf' veya 'elision' olarak adlandırılamaz. |
| tokenFilters |
Giriş belirtecini filtrelemek veya değiştirmek için kullanılan belirteç filtrelerinin listesi. Örneğin, tüm karakterleri küçük harfe dönüştüren bir küçük harf filtresi belirtebilirsiniz. Filtreler listelenme sırasına göre çalıştırılır. |
DictionaryDecompounderTokenFilter
Birçok Cermen dilinde bulunan bileşik sözcükleri ayrıştırır. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır.
| Name | Tür | Default value | Description |
|---|---|---|---|
| @odata.type |
string:
#Microsoft. |
Belirteç filtresinin türünü belirten bir URI parçası. |
|
| maxSubwordSize |
integer (int32) maximum: 300 |
15 |
En büyük alt sözcük boyutu. Yalnızca bundan daha kısa alt kelimelerin çıktısı alınır. Varsayılan değer 15'tir. Maksimum 300'dür. |
| minSubwordSize |
integer (int32) maximum: 300 |
2 |
Minimum alt sözcük boyutu. Yalnızca bundan daha uzun alt sözcüklerin çıktısı alınır. Varsayılan değer 2'dir. Maksimum 300'dür. |
| minWordSize |
integer (int32) maximum: 300 |
5 |
Minimum sözcük boyutu. Yalnızca bundan daha uzun kelimeler işlenir. Varsayılan değer 5'tir. Maksimum 300'dür. |
| name |
string |
Belirteç filtresinin adı. Yalnızca harfler, rakamlar, boşluklar, kısa çizgiler veya alt çizgiler içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır. |
|
| onlyLongestMatch |
boolean |
False |
Çıktıya yalnızca en uzun eşleşen alt sözcüğün eklenip eklenmeyeceğini belirten bir değer. Varsayılan değer false'tur. |
| wordList |
string[] |
Eşleştirilecek kelimelerin listesi. |
DistanceScoringFunction
Coğrafi bir konuma olan mesafeye bağlı olarak puanları artıran bir işlev tanımlar.
| Name | Tür | Description |
|---|---|---|
| boost |
number (double) |
Ham puan için bir çarpan. 1.0'a eşit olmayan pozitif bir sayı olmalıdır. |
| distance |
Mesafe puanlama fonksiyonu için parametre değerleri. |
|
| fieldName |
string |
Puanlama işlevine giriş olarak kullanılan alanın adı. |
| interpolation |
Yükseltmenin belge puanları arasında nasıl enterpolasyon yapılacağını gösteren bir değer; varsayılan olarak "Doğrusal" olarak ayarlanır. |
|
| type |
string:
distance |
Kullanılacak işlevin türünü belirtir. Geçerli değerler büyüklük, tazelik, uzaklık ve etiketi içerir. İşlev türü küçük harf olmalıdır. |
DistanceScoringParameters
Mesafe puanlama işlevine parametre değerleri sağlar.
| Name | Tür | Description |
|---|---|---|
| boostingDistance |
number (double) |
Takviye aralığının sona erdiği referans konumundan kilometre cinsinden mesafe. |
| referencePointParameter |
string |
Başvuru konumunu belirtmek için arama sorgularında geçirilen parametrenin adı. |
EdgeNGramTokenFilter
Bir giriş belirtecinin önünden veya arkasından başlayarak verilen boyut(lar)ın n-gramını oluşturur. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır.
| Name | Tür | Default value | Description |
|---|---|---|---|
| @odata.type |
string:
#Microsoft. |
Belirteç filtresinin türünü belirten bir URI parçası. |
|
| maxGram |
integer (int32) |
2 |
Maksimum n-gram uzunluk. Varsayılan değer 2'dir. |
| minGram |
integer (int32) |
1 |
Minimum n-gram uzunluk. Varsayılan değer 1'dir. maxGram değerinden küçük olmalıdır. |
| name |
string |
Belirteç filtresinin adı. Yalnızca harfler, rakamlar, boşluklar, kısa çizgiler veya alt çizgiler içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır. |
|
| side | front |
N-gramın girişin hangi tarafından oluşturulması gerektiğini belirtir. Varsayılan değer "ön"dür. |
EdgeNGramTokenFilterSide
Bir n-gramın girişin hangi tarafından oluşturulması gerektiğini belirtir.
| Değer | Description |
|---|---|
| front |
n-gramın girişin önünden oluşturulması gerektiğini belirtir. |
| back |
n-gramın girişin arkasından oluşturulması gerektiğini belirtir. |
EdgeNGramTokenFilterV2
Bir giriş belirtecinin önünden veya arkasından başlayarak verilen boyut(lar)ın n-gramını oluşturur. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır.
| Name | Tür | Default value | Description |
|---|---|---|---|
| @odata.type |
string:
#Microsoft. |
Belirteç filtresinin türünü belirten bir URI parçası. |
|
| maxGram |
integer (int32) maximum: 300 |
2 |
Maksimum n-gram uzunluk. Varsayılan değer 2'dir. Maksimum 300'dür. |
| minGram |
integer (int32) maximum: 300 |
1 |
Minimum n-gram uzunluk. Varsayılan değer 1'dir. Maksimum 300'dür. maxGram değerinden küçük olmalıdır. |
| name |
string |
Belirteç filtresinin adı. Yalnızca harfler, rakamlar, boşluklar, kısa çizgiler veya alt çizgiler içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır. |
|
| side | front |
N-gramın girişin hangi tarafından oluşturulması gerektiğini belirtir. Varsayılan değer "ön"dür. |
EdgeNGramTokenizer
Bir kenardan gelen girdiyi, verilen boyut(lar)ın n-gramına tokenize eder. Bu belirteç oluşturucu Apache Lucene kullanılarak uygulanır.
| Name | Tür | Default value | Description |
|---|---|---|---|
| @odata.type |
string:
#Microsoft. |
Belirteç oluşturucu türünü belirten bir URI parçası. |
|
| maxGram |
integer (int32) maximum: 300 |
2 |
Maksimum n-gram uzunluk. Varsayılan değer 2'dir. Maksimum 300'dür. |
| minGram |
integer (int32) maximum: 300 |
1 |
Minimum n-gram uzunluk. Varsayılan değer 1'dir. Maksimum 300'dür. maxGram değerinden küçük olmalıdır. |
| name |
string |
Tokenizer'ın adı. Yalnızca harfler, rakamlar, boşluklar, kısa çizgiler veya alt çizgiler içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır. |
|
| tokenChars |
Belirteçlerde tutulacak karakter sınıfları. |
ElisionTokenFilter
Elizyonları kaldırır. Örneğin, "l'avion" (uçak) "avion" (uçak) olarak dönüştürülecektir. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır.
| Name | Tür | Description |
|---|---|---|
| @odata.type |
string:
#Microsoft. |
Belirteç filtresinin türünü belirten bir URI parçası. |
| articles |
string[] |
Kaldırılacak makaleler kümesi. |
| name |
string |
Belirteç filtresinin adı. Yalnızca harfler, rakamlar, boşluklar, kısa çizgiler veya alt çizgiler içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır. |
ErrorAdditionalInfo
Kaynak yönetimi hatası ek bilgileri.
| Name | Tür | Description |
|---|---|---|
| info |
object |
Ek bilgiler. |
| type |
string |
Ek bilgi türü. |
ErrorDetail
Hata ayrıntısı.
| Name | Tür | Description |
|---|---|---|
| additionalInfo |
Hata ek bilgileri. |
|
| code |
string |
Hata kodu. |
| details |
Hata ayrıntıları. |
|
| message |
string |
Hata iletisi. |
| target |
string |
Hata hedefi. |
ErrorResponse
Hata yanıtı
| Name | Tür | Description |
|---|---|---|
| error |
Hata nesnesi. |
ExhaustiveKnnParameters
Kapsamlı KNN algoritmasına özgü parametreleri içerir.
| Name | Tür | Description |
|---|---|---|
| metric |
Vektör karşılaştırmaları için kullanılacak benzerlik metriği. |
ExhaustiveKnnVectorSearchAlgorithmConfiguration
Sorgulama sırasında kullanılan ve tüm vektör dizini boyunca deneme yanılma araması gerçekleştirecek olan kapsamlı KNN algoritmasına özgü yapılandırma seçeneklerini içerir.
| Name | Tür | Description |
|---|---|---|
| exhaustiveKnnParameters |
Kapsamlı KNN algoritmasına özgü parametreleri içerir. |
|
| kind |
string:
exhaustive |
Vektör aramasıyla kullanılmak üzere yapılandırılan algoritma türünün adı. |
| name |
string |
Bu özel yapılandırmayla ilişkilendirilecek ad. |
FreshnessScoringFunction
Tarih-saat alanının değerine bağlı olarak puanları artıran bir işlev tanımlar.
| Name | Tür | Description |
|---|---|---|
| boost |
number (double) |
Ham puan için bir çarpan. 1.0'a eşit olmayan pozitif bir sayı olmalıdır. |
| fieldName |
string |
Puanlama işlevine giriş olarak kullanılan alanın adı. |
| freshness |
Tazelik puanlama işlevi için parametre değerleri. |
|
| interpolation |
Yükseltmenin belge puanları arasında nasıl enterpolasyon yapılacağını gösteren bir değer; varsayılan olarak "Doğrusal" olarak ayarlanır. |
|
| type |
string:
freshness |
Kullanılacak işlevin türünü belirtir. Geçerli değerler büyüklük, tazelik, uzaklık ve etiketi içerir. İşlev türü küçük harf olmalıdır. |
FreshnessScoringParameters
Tazelik puanlama işlevine parametre değerleri sağlar.
| Name | Tür | Description |
|---|---|---|
| boostingDuration |
string (duration) |
Belirli bir belge için yükseltmenin durdurulacağı sona erme süresi. |
HnswParameters
HNSW algoritmasına özgü parametreleri içerir.
| Name | Tür | Default value | Description |
|---|---|---|---|
| efConstruction |
integer (int32) minimum: 100maximum: 1000 |
400 |
Dizin süresi boyunca kullanılan en yakın komşuları içeren dinamik listenin boyutu. Bu parametrenin artırılması, dizin oluşturma süresinin artması pahasına dizin kalitesini iyileştirebilir. Belli bir noktada, bu parametrenin arttırılması azalan getirilere yol açar. |
| efSearch |
integer (int32) minimum: 100maximum: 1000 |
500 |
Arama sırasında kullanılan en yakın komşuları içeren dinamik listenin boyutu. Bu parametreyi artırmak, daha yavaş arama pahasına arama sonuçlarını iyileştirebilir. Belli bir noktada, bu parametrenin arttırılması azalan getirilere yol açar. |
| m |
integer (int32) minimum: 4maximum: 10 |
4 |
İnşaat sırasında her yeni eleman için oluşturulan çift yönlü bağlantıların sayısı. Bu parametre değerinin artırılması, artan bellek tüketimi ve daha uzun dizin oluşturma süresi pahasına yüksek iç boyutluluğa sahip veri kümeleri için geri çağırmayı iyileştirebilir ve alma sürelerini azaltabilir. |
| metric |
Vektör karşılaştırmaları için kullanılacak benzerlik metriği. |
HnswVectorSearchAlgorithmConfiguration
Dizin oluşturma ve sorgulama sırasında kullanılan HNSW yaklaşık en yakın komşular algoritmasına özgü yapılandırma seçeneklerini içerir. HNSW algoritması, arama hızı ve doğruluğu arasında ayarlanabilir bir denge sunar.
| Name | Tür | Description |
|---|---|---|
| hnswParameters |
HNSW algoritmasına özgü parametreleri içerir. |
|
| kind |
string:
hnsw |
Vektör aramasıyla kullanılmak üzere yapılandırılan algoritma türünün adı. |
| name |
string |
Bu özel yapılandırmayla ilişkilendirilecek ad. |
InputFieldMappingEntry
Bir beceri için giriş alanı eşlemesi.
| Name | Tür | Description |
|---|---|---|
| inputs |
Karmaşık bir tür oluştururken kullanılan özyinelemeli girişler. |
|
| name |
string |
Girişin adı. |
| source |
string |
Girişin kaynağı. |
| sourceContext |
string |
Özyinelemeli girişleri seçmek için kullanılan kaynak bağlamı. |
KeepTokenFilter
Yalnızca belirli bir sözcük listesinde yer alan metne sahip belirteçleri tutan bir belirteç filtresi. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır.
| Name | Tür | Default value | Description |
|---|---|---|---|
| @odata.type |
string:
#Microsoft. |
Belirteç filtresinin türünü belirten bir URI parçası. |
|
| keepWords |
string[] |
Saklanacak kelimelerin listesi. |
|
| keepWordsCase |
boolean |
False |
Önce tüm sözcüklerin küçük harfle yazılıp yazılmayacağını gösteren bir değer. Varsayılan değer false'tur. |
| name |
string |
Belirteç filtresinin adı. Yalnızca harfler, rakamlar, boşluklar, kısa çizgiler veya alt çizgiler içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır. |
KeywordMarkerTokenFilter
Terimleri anahtar sözcük olarak işaretler. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır.
| Name | Tür | Default value | Description |
|---|---|---|---|
| @odata.type |
string:
#Microsoft. |
Belirteç filtresinin türünü belirten bir URI parçası. |
|
| ignoreCase |
boolean |
False |
Büyük/küçük harfin yok sayılıp sayılmayacağını belirten bir değer. Doğruysa, önce tüm sözcükler küçük harfe dönüştürülür. Varsayılan değer false'tur. |
| keywords |
string[] |
Anahtar sözcük olarak işaretlenecek sözcüklerin listesi. |
|
| name |
string |
Belirteç filtresinin adı. Yalnızca harfler, rakamlar, boşluklar, kısa çizgiler veya alt çizgiler içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır. |
KeywordTokenizer
Tüm girişi tek bir belirteç olarak yayar. Bu belirteç oluşturucu Apache Lucene kullanılarak uygulanır.
| Name | Tür | Default value | Description |
|---|---|---|---|
| @odata.type |
string:
#Microsoft. |
Belirteç oluşturucu türünü belirten bir URI parçası. |
|
| bufferSize |
integer (int32) |
256 |
Bayt cinsinden okuma arabelleği boyutu. Varsayılan değer 256'dır. |
| name |
string |
Tokenizer'ın adı. Yalnızca harfler, rakamlar, boşluklar, kısa çizgiler veya alt çizgiler içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır. |
KeywordTokenizerV2
Tüm girişi tek bir belirteç olarak yayar. Bu belirteç oluşturucu Apache Lucene kullanılarak uygulanır.
| Name | Tür | Default value | Description |
|---|---|---|---|
| @odata.type |
string:
#Microsoft. |
Belirteç oluşturucu türünü belirten bir URI parçası. |
|
| maxTokenLength |
integer (int32) maximum: 300 |
256 |
Maksimum belirteç uzunluğu. Varsayılan değer 256'dır. Maksimum uzunluktan daha uzun olan jetonlar bölünür. Kullanılabilecek maksimum belirteç uzunluğu 300 karakterdir. |
| name |
string |
Tokenizer'ın adı. Yalnızca harfler, rakamlar, boşluklar, kısa çizgiler veya alt çizgiler içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır. |
LengthTokenFilter
Çok uzun veya çok kısa sözcükleri kaldırır. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır.
| Name | Tür | Default value | Description |
|---|---|---|---|
| @odata.type |
string:
#Microsoft. |
Belirteç filtresinin türünü belirten bir URI parçası. |
|
| max |
integer (int32) maximum: 300 |
300 |
Karakter cinsinden maksimum uzunluk. Varsayılan ve maksimum 300'dür. |
| min |
integer (int32) maximum: 300 |
0 |
Karakter cinsinden minimum uzunluk. Varsayılan değer 0'dır. Maksimum 300'dür. Max değerinden küçük olmalıdır. |
| name |
string |
Belirteç filtresinin adı. Yalnızca harfler, rakamlar, boşluklar, kısa çizgiler veya alt çizgiler içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır. |
LexicalAnalyzerName
Arama motoru tarafından desteklenen tüm metin çözümleyicilerinin adlarını tanımlar.
| Değer | Description |
|---|---|
| ar.microsoft |
Arapça için Microsoft çözümleyicisi. |
| ar.lucene |
Arapça için Lucene analizörü. |
| hy.lucene |
Ermenice için Lucene analizörü. |
| bn.microsoft |
Bangla için Microsoft çözümleyicisi. |
| eu.lucene |
Bask için Lucene analizörü. |
| bg.microsoft |
Bulgarca için Microsoft çözümleyicisi. |
| bg.lucene |
Bulgarca için Lucene analizörü. |
| ca.microsoft |
Katalanca için Microsoft çözümleyicisi. |
| ca.lucene |
Katalanca için Lucene analizörü. |
| zh-Hans.microsoft |
Çince (Basitleştirilmiş) için Microsoft çözümleyicisi. |
| zh-Hans.lucene |
Çince için Lucene analizörü (Basitleştirilmiş). |
| zh-Hant.microsoft |
Çince (Geleneksel) için Microsoft çözümleyicisi. |
| zh-Hant.lucene |
Çince (Geleneksel) için Lucene analizörü. |
| hr.microsoft |
Hırvatça için Microsoft çözümleyicisi. |
| cs.microsoft |
Çekçe için Microsoft çözümleyicisi. |
| cs.lucene |
Çekçe için Lucene analizörü. |
| da.microsoft |
Danca için Microsoft çözümleyicisi. |
| da.lucene |
Danca için Lucene analizörü. |
| nl.microsoft |
Hollandaca için Microsoft çözümleyicisi. |
| nl.lucene |
Hollandaca için Lucene analizörü. |
| en.microsoft |
İngilizce için Microsoft çözümleyicisi. |
| en.lucene |
İngilizce için Lucene analizörü. |
| et.microsoft |
Estonca için Microsoft çözümleyicisi. |
| fi.microsoft |
Fince için Microsoft çözümleyicisi. |
| fi.lucene |
Fince için Lucene analizörü. |
| fr.microsoft |
Fransızca için Microsoft çözümleyicisi. |
| fr.lucene |
Fransızca için Lucene analizörü. |
| gl.lucene |
Galiçyaca için Lucene analizörü. |
| de.microsoft |
Almanca için Microsoft çözümleyicisi. |
| de.lucene |
Almanca için Lucene analizörü. |
| el.microsoft |
Yunanca için Microsoft çözümleyicisi. |
| el.lucene |
Yunanca için Lucene analizörü. |
| gu.microsoft |
Gujarati için Microsoft çözümleyicisi. |
| he.microsoft |
İbranice için Microsoft çözümleyicisi. |
| hi.microsoft |
Hintçe için Microsoft çözümleyicisi. |
| hi.lucene |
Hintçe için Lucene analizörü. |
| hu.microsoft |
Macarca için Microsoft çözümleyicisi. |
| hu.lucene |
Macarca için Lucene analizörü. |
| is.microsoft |
İzlandaca için Microsoft çözümleyicisi. |
| id.microsoft |
Endonezce (Bahasa) için Microsoft çözümleyicisi. |
| id.lucene |
Endonezya için Lucene analizörü. |
| ga.lucene |
İrlandalılar için Lucene analizörü. |
| it.microsoft |
İtalyanca için Microsoft çözümleyicisi. |
| it.lucene |
İtalyanca için Lucene analizörü. |
| ja.microsoft |
Japonca için Microsoft çözümleyicisi. |
| ja.lucene |
Japonca için Lucene analizörü. |
| kn.microsoft |
Kannada için Microsoft çözümleyicisi. |
| ko.microsoft |
Korece için Microsoft çözümleyicisi. |
| ko.lucene |
Korece için Lucene analizörü. |
| lv.microsoft |
Letonca için Microsoft çözümleyicisi. |
| lv.lucene |
Letonca için Lucene analizörü. |
| lt.microsoft |
Litvanca için Microsoft çözümleyicisi. |
| ml.microsoft |
Malayalam için Microsoft çözümleyicisi. |
| ms.microsoft |
Malayca (Latince) için Microsoft çözümleyicisi. |
| mr.microsoft |
Marathi için Microsoft çözümleyicisi. |
| nb.microsoft |
Microsoft analyzer for Norwegian (Bokmål). |
| no.lucene |
Norveççe için Lucene analizörü. |
| fa.lucene |
Farsça için Lucene analizörü. |
| pl.microsoft |
Lehçe için Microsoft çözümleyicisi. |
| pl.lucene |
Lehçe için Lucene analizörü. |
| pt-BR.microsoft |
Portekizce (Brezilya) için Microsoft çözümleyicisi. |
| pt-BR.lucene |
Portekizce (Brezilya) için Lucene analizörü. |
| pt-PT.microsoft |
Portekizce (Portekiz) için Microsoft çözümleyicisi. |
| pt-PT.lucene |
Portekizce (Portekiz) için Lucene analizörü. |
| pa.microsoft |
Punjabi için Microsoft çözümleyicisi. |
| ro.microsoft |
Romence için Microsoft çözümleyicisi. |
| ro.lucene |
Romence için Lucene analizörü. |
| ru.microsoft |
Rusça için Microsoft analizörü. |
| ru.lucene |
Rusça için Lucene analizörü. |
| sr-cyrillic.microsoft |
Sırpça (Kiril) için Microsoft çözümleyicisi. |
| sr-latin.microsoft |
Sırpça (Latin) için Microsoft çözümleyicisi. |
| sk.microsoft |
Slovakça için Microsoft çözümleyicisi. |
| sl.microsoft |
Slovence için Microsoft çözümleyicisi. |
| es.microsoft |
İspanyolca için Microsoft çözümleyicisi. |
| es.lucene |
İspanyolca için Lucene analizörü. |
| sv.microsoft |
İsveççe için Microsoft çözümleyicisi. |
| sv.lucene |
İsveççe için Lucene analizörü. |
| ta.microsoft |
Tamil için Microsoft çözümleyicisi. |
| te.microsoft |
Telugu için Microsoft çözümleyicisi. |
| th.microsoft |
Tay dili için Microsoft çözümleyicisi. |
| th.lucene |
Tay dili için Lucene analizörü. |
| tr.microsoft |
Türkçe için Microsoft çözümleyicisi. |
| tr.lucene |
Türkçe için Lucene analizörü. |
| uk.microsoft |
Ukraynaca için Microsoft çözümleyicisi. |
| ur.microsoft |
Urduca için Microsoft çözümleyicisi. |
| vi.microsoft |
Vietnamca için Microsoft çözümleyicisi. |
| standard.lucene |
Standart Lucene analizörü. |
| standardasciifolding.lucene |
Standart ASCII Katlanır Lucene analizörü. Bkz. https://learn.microsoft.com/rest/api/searchservice/Custom-analyzers-in-Azure-Search#Analyzers |
| keyword |
Bir alanın tüm içeriğini tek bir belirteç olarak değerlendirir. Bu, posta kodları, kimlikler ve bazı ürün adları gibi veriler için kullanışlıdır. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/KeywordAnalyzer.html |
| pattern |
Metni düzenli bir ifade deseni aracılığıyla esnek bir şekilde terimlere ayırır. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/PatternAnalyzer.html |
| simple |
Metni harf olmayan harflere böler ve küçük harfe dönüştürür. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/SimpleAnalyzer.html |
| stop |
Metni harf olmayanlara böler; Küçük harf ve stopword belirteç filtrelerini uygular. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/StopAnalyzer.html |
| whitespace |
Beyaz boşluk belirteç oluşturucusunu kullanan bir çözümleyici. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/WhitespaceAnalyzer.html |
LexicalNormalizerName
Arama motoru tarafından desteklenen tüm metin normalleştiricilerinin adlarını tanımlar.
LexicalTokenizerName
Arama motoru tarafından desteklenen tüm tokenizer'ların adlarını tanımlar.
LimitTokenFilter
İndeksleme sırasında belirteç sayısını sınırlar. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır.
| Name | Tür | Default value | Description |
|---|---|---|---|
| @odata.type |
string:
#Microsoft. |
Belirteç filtresinin türünü belirten bir URI parçası. |
|
| consumeAllTokens |
boolean |
False |
maxTokenCount'a ulaşılsa bile girişteki tüm belirteçlerin tüketilmesi gerekip gerekmediğini belirten bir değer. Varsayılan değer false'tur. |
| maxTokenCount |
integer (int32) |
1 |
Üretilecek maksimum jeton sayısı. Varsayılan değer 1'dir. |
| name |
string |
Belirteç filtresinin adı. Yalnızca harfler, rakamlar, boşluklar, kısa çizgiler veya alt çizgiler içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır. |
LuceneStandardAnalyzer
Standart Apache Lucene analizörü; Standart belirteçleyici, küçük harf filtresi ve durdurma filtresinden oluşur.
| Name | Tür | Default value | Description |
|---|---|---|---|
| @odata.type |
string:
#Microsoft. |
Çözümleyici türünü belirten bir URI parçası. |
|
| maxTokenLength |
integer (int32) maximum: 300 |
255 |
Maksimum belirteç uzunluğu. Varsayılan değer 255'tir. Maksimum uzunluktan daha uzun olan jetonlar bölünür. Kullanılabilecek maksimum belirteç uzunluğu 300 karakterdir. |
| name |
string |
Çözümleyicinin adı. Yalnızca harfler, rakamlar, boşluklar, kısa çizgiler veya alt çizgiler içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır. |
|
| stopwords |
string[] |
Durdurma sözcüklerinin bir listesi. |
LuceneStandardTokenizer
Unicode Metin Bölütleme kurallarına uygun olarak metni keser. Bu belirteç oluşturucu Apache Lucene kullanılarak uygulanır.
| Name | Tür | Default value | Description |
|---|---|---|---|
| @odata.type |
string:
#Microsoft. |
Belirteç oluşturucu türünü belirten bir URI parçası. |
|
| maxTokenLength |
integer (int32) |
255 |
Maksimum belirteç uzunluğu. Varsayılan değer 255'tir. Maksimum uzunluktan daha uzun olan jetonlar bölünür. |
| name |
string |
Tokenizer'ın adı. Yalnızca harfler, rakamlar, boşluklar, kısa çizgiler veya alt çizgiler içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır. |
LuceneStandardTokenizerV2
Unicode Metin Bölütleme kurallarına uygun olarak metni keser. Bu belirteç oluşturucu Apache Lucene kullanılarak uygulanır.
| Name | Tür | Default value | Description |
|---|---|---|---|
| @odata.type |
string:
#Microsoft. |
Belirteç oluşturucu türünü belirten bir URI parçası. |
|
| maxTokenLength |
integer (int32) maximum: 300 |
255 |
Maksimum belirteç uzunluğu. Varsayılan değer 255'tir. Maksimum uzunluktan daha uzun olan jetonlar bölünür. Kullanılabilecek maksimum belirteç uzunluğu 300 karakterdir. |
| name |
string |
Tokenizer'ın adı. Yalnızca harfler, rakamlar, boşluklar, kısa çizgiler veya alt çizgiler içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır. |
MagnitudeScoringFunction
Sayısal bir alanın büyüklüğüne bağlı olarak puanları artıran bir işlev tanımlar.
| Name | Tür | Description |
|---|---|---|
| boost |
number (double) |
Ham puan için bir çarpan. 1.0'a eşit olmayan pozitif bir sayı olmalıdır. |
| fieldName |
string |
Puanlama işlevine giriş olarak kullanılan alanın adı. |
| interpolation |
Yükseltmenin belge puanları arasında nasıl enterpolasyon yapılacağını gösteren bir değer; varsayılan olarak "Doğrusal" olarak ayarlanır. |
|
| magnitude |
Büyüklük puanlama fonksiyonu için parametre değerleri. |
|
| type |
string:
magnitude |
Kullanılacak işlevin türünü belirtir. Geçerli değerler büyüklük, tazelik, uzaklık ve etiketi içerir. İşlev türü küçük harf olmalıdır. |
MagnitudeScoringParameters
Büyüklük puanlama işlevine parametre değerleri sağlar.
| Name | Tür | Description |
|---|---|---|
| boostingRangeEnd |
number (double) |
Yükseltmenin sona erdiği alan değeri. |
| boostingRangeStart |
number (double) |
Yükseltmenin başladığı alan değeri. |
| constantBoostBeyondRange |
boolean |
Aralık bitiş değerinin ötesindeki alan değerleri için sabit bir artırma uygulanıp uygulanmayacağını gösteren bir değer; Varsayılan değer false'tur. |
MappingCharFilter
Eşlemeler seçeneğiyle tanımlanan eşlemeleri uygulayan bir karakter filtresi. Eşleştirme açgözlüdür (belirli bir noktada en uzun desen eşleşmesi kazanır). Değiştirmenin boş dize olmasına izin verilir. Bu karakter filtresi Apache Lucene kullanılarak uygulanır.
| Name | Tür | Description |
|---|---|---|
| @odata.type |
string:
#Microsoft. |
Karakter filtresinin türünü belirten bir URI parçası. |
| mappings |
string[] |
Aşağıdaki biçimdeki eşlemelerin listesi: "a=>b" ("a" karakterinin tüm yinelemeleri "b" karakteriyle değiştirilir). |
| name |
string |
Char filtresinin adı. Yalnızca harfler, rakamlar, boşluklar, kısa çizgiler veya alt çizgiler içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır. |
MicrosoftLanguageStemmingTokenizer
Dile özgü kuralları kullanarak metni böler ve sözcükleri temel biçimlerine indirger.
| Name | Tür | Default value | Description |
|---|---|---|---|
| @odata.type |
string:
#Microsoft. |
Belirteç oluşturucu türünü belirten bir URI parçası. |
|
| isSearchTokenizer |
boolean |
False |
Tokenizer'ın nasıl kullanıldığını gösteren bir değer. Arama belirteci olarak kullanılıyorsa true olarak ayarlayın, dizin oluşturma belirteci olarak kullanılıyorsa false olarak ayarlayın. Varsayılan değer false'tur. |
| language |
Kullanılacak dil. Varsayılan değer İngilizce'dir. |
||
| maxTokenLength |
integer (int32) maximum: 300 |
255 |
Maksimum belirteç uzunluğu. Maksimum uzunluktan daha uzun olan jetonlar bölünür. Kullanılabilecek maksimum belirteç uzunluğu 300 karakterdir. 300 karakterden daha uzun jetonlar önce 300 uzunluğundaki jetonlara bölünür ve ardından bu jetonların her biri belirlenen maksimum jeton uzunluğuna göre bölünür. Varsayılan değer 255'tir. |
| name |
string |
Tokenizer'ın adı. Yalnızca harfler, rakamlar, boşluklar, kısa çizgiler veya alt çizgiler içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır. |
MicrosoftLanguageTokenizer
Dile özgü kuralları kullanarak metni böler.
| Name | Tür | Default value | Description |
|---|---|---|---|
| @odata.type |
string:
#Microsoft. |
Belirteç oluşturucu türünü belirten bir URI parçası. |
|
| isSearchTokenizer |
boolean |
False |
Tokenizer'ın nasıl kullanıldığını gösteren bir değer. Arama belirteci olarak kullanılıyorsa true olarak ayarlayın, dizin oluşturma belirteci olarak kullanılıyorsa false olarak ayarlayın. Varsayılan değer false'tur. |
| language |
Kullanılacak dil. Varsayılan değer İngilizce'dir. |
||
| maxTokenLength |
integer (int32) maximum: 300 |
255 |
Maksimum belirteç uzunluğu. Maksimum uzunluktan daha uzun olan jetonlar bölünür. Kullanılabilecek maksimum belirteç uzunluğu 300 karakterdir. 300 karakterden daha uzun jetonlar önce 300 uzunluğundaki jetonlara bölünür ve ardından bu jetonların her biri belirlenen maksimum jeton uzunluğuna göre bölünür. Varsayılan değer 255'tir. |
| name |
string |
Tokenizer'ın adı. Yalnızca harfler, rakamlar, boşluklar, kısa çizgiler veya alt çizgiler içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır. |
MicrosoftStemmingTokenizerLanguage
Microsoft dil köklendirme belirteç oluşturucusu tarafından desteklenen dilleri listeler.
| Değer | Description |
|---|---|
| arabic |
Arapça için Microsoft kök tokenizer'ı seçer. |
| bangla |
Bangla için Microsoft kök tokenizer'ı seçer. |
| bulgarian |
Bulgarca için Microsoft kök tokenizer'ı seçer. |
| catalan |
Katalanca için Microsoft kök tokenizer'ı seçer. |
| croatian |
Hırvatça için Microsoft kök tokenizer'ı seçer. |
| czech |
Çekçe için Microsoft kök tokenizer'ı seçer. |
| danish |
Danca için Microsoft kök tokenizer'ı seçer. |
| dutch |
Felemenkçe için Microsoft kök tokenizer'ı seçer. |
| english |
İngilizce için Microsoft kök tokenizer'ı seçer. |
| estonian |
Estonca için Microsoft kök tokenizer'ı seçer. |
| finnish |
Fince için Microsoft kök tokenizer'ı seçer. |
| french |
Fransızca için Microsoft kök tokenizer'ı seçer. |
| german |
Almanca için Microsoft kök oluşturma belirteç oluşturucusunu seçer. |
| greek |
Yunanca için Microsoft kök tokenizer'ı seçer. |
| gujarati |
Gujarati için Microsoft kök belirtecini seçer. |
| hebrew |
İbranice için Microsoft kök oluşturma belirteç oluşturucusunu seçer. |
| hindi |
Hintçe için Microsoft kök tokenizer'ı seçer. |
| hungarian |
Macarca için Microsoft kök tokenizer'ını seçer. |
| icelandic |
İzlandaca için Microsoft kök tokenizer'ı seçer. |
| indonesian |
Endonezce için Microsoft kök tokenizer'ı seçer. |
| italian |
İtalyanca için Microsoft kök tokenizer'ı seçer. |
| kannada |
Kannada için Microsoft kök tokenizer'ı seçer. |
| latvian |
Letonca için Microsoft kök tokenizer'ı seçer. |
| lithuanian |
Litvanca için Microsoft kök belirtecini seçer. |
| malay |
Malay dili için Microsoft kök tokenizer'ı seçer. |
| malayalam |
Malayalam için Microsoft kök tokenizer'ı seçer. |
| marathi |
Marathi için Microsoft kök tokenizer'ı seçer. |
| norwegianBokmaal |
Norveççe (Bokmål) için Microsoft kök tokenizer'ı seçer. |
| polish |
Lehçe için Microsoft kök tokenizer'ı seçer. |
| portuguese |
Portekizce için Microsoft kök tokenizer'ı seçer. |
| portugueseBrazilian |
Portekizce (Brezilya) için Microsoft kök tokenizer'ı seçer. |
| punjabi |
Punjabi için Microsoft kök belirteç oluşturucusunu seçer. |
| romanian |
Romence için Microsoft kök tokenizer'ı seçer. |
| russian |
Rusça için Microsoft kök tokenizer'ı seçer. |
| serbianCyrillic |
Sırpça (Kiril) için Microsoft kök belirtecini seçer. |
| serbianLatin |
Sırpça (Latince) için Microsoft kök tokenizer'ı seçer. |
| slovak |
Slovakça için Microsoft kök tokenizer'ı seçer. |
| slovenian |
Slovence için Microsoft kök tokenizer'ı seçer. |
| spanish |
İspanyolca için Microsoft kök tokenizer'ı seçer. |
| swedish |
İsveççe için Microsoft kök tokenizer'ı seçer. |
| tamil |
Tamilce için Microsoft kök oluşturma belirteç oluşturucusunu seçer. |
| telugu |
Telugu için Microsoft kök oluşturma belirteç oluşturucusunu seçer. |
| turkish |
Türkçe için Microsoft stemming tokenizer'ı seçer. |
| ukrainian |
Ukraynaca için Microsoft kök tokenizer'ı seçer. |
| urdu |
Urduca için Microsoft kök belirteç oluşturucusunu seçer. |
MicrosoftTokenizerLanguage
Microsoft dil belirteci tarafından desteklenen dilleri listeler.
| Değer | Description |
|---|---|
| bangla |
Bangla için Microsoft tokenizer'ı seçer. |
| bulgarian |
Bulgarca için Microsoft tokenizer'ı seçer. |
| catalan |
Katalanca için Microsoft tokenizer'ı seçer. |
| chineseSimplified |
Çince (Basitleştirilmiş) için Microsoft tokenizer'ı seçer. |
| chineseTraditional |
Çince (Geleneksel) için Microsoft tokenizer'ı seçer. |
| croatian |
Hırvatça için Microsoft tokenizer'ı seçer. |
| czech |
Çekçe için Microsoft tokenizer'ı seçer. |
| danish |
Danca için Microsoft tokenizer'ı seçer. |
| dutch |
Felemenkçe için Microsoft tokenizer'ı seçer. |
| english |
İngilizce için Microsoft belirteç oluşturucuyu seçer. |
| french |
Fransızca için Microsoft tokenizer'ı seçer. |
| german |
Almanca için Microsoft tokenizer'ı seçer. |
| greek |
Yunanca için Microsoft tokenizer'ı seçer. |
| gujarati |
Gujarati için Microsoft tokenizer'ı seçer. |
| hindi |
Hintçe için Microsoft tokenizer'ı seçer. |
| icelandic |
İzlandaca için Microsoft tokenizer'ı seçer. |
| indonesian |
Endonezce için Microsoft tokenizer'ı seçer. |
| italian |
İtalyanca için Microsoft tokenizer'ı seçer. |
| japanese |
Japonca için Microsoft tokenizer'ı seçer. |
| kannada |
Kannada için Microsoft tokenizer'ı seçer. |
| korean |
Korece için Microsoft tokenizer'ı seçer. |
| malay |
Malay dili için Microsoft tokenizer'ı seçer. |
| malayalam |
Malayalam için Microsoft tokenizer'ı seçer. |
| marathi |
Marathi için Microsoft belirteç oluşturucuyu seçer. |
| norwegianBokmaal |
Norveççe (Bokmål) için Microsoft tokenizer'ı seçer. |
| polish |
Lehçe için Microsoft tokenizer'ı seçer. |
| portuguese |
Portekizce için Microsoft tokenizer'ı seçer. |
| portugueseBrazilian |
Portekizce (Brezilya) için Microsoft tokenizer'ı seçer. |
| punjabi |
Punjabi için Microsoft tokenizer'ı seçer. |
| romanian |
Romence için Microsoft tokenizer'ı seçer. |
| russian |
Rusça için Microsoft tokenizer'ı seçer. |
| serbianCyrillic |
Sırpça (Kiril) için Microsoft tokenizer'ı seçer. |
| serbianLatin |
Sırpça (Latin) için Microsoft tokenizer'ı seçer. |
| slovenian |
Slovence için Microsoft tokenizer'ı seçer. |
| spanish |
İspanyolca için Microsoft tokenizer'ı seçer. |
| swedish |
İsveççe için Microsoft tokenizer'ı seçer. |
| tamil |
Tamil için Microsoft belirteç oluşturucuyu seçer. |
| telugu |
Telugu için Microsoft tokenizer'ı seçer. |
| thai |
Tay dili için Microsoft tokenizer'ı seçer. |
| ukrainian |
Ukraynaca için Microsoft tokenizer'ı seçer. |
| urdu |
Urduca için Microsoft tokenizer'ı seçer. |
| vietnamese |
Vietnamca için Microsoft tokenizer'ı seçer. |
NGramTokenFilter
Verilen boyut(lar)dan n-gram üretir. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır.
| Name | Tür | Default value | Description |
|---|---|---|---|
| @odata.type |
string:
#Microsoft. |
Belirteç filtresinin türünü belirten bir URI parçası. |
|
| maxGram |
integer (int32) |
2 |
Maksimum n-gram uzunluk. Varsayılan değer 2'dir. |
| minGram |
integer (int32) |
1 |
Minimum n-gram uzunluk. Varsayılan değer 1'dir. maxGram değerinden küçük olmalıdır. |
| name |
string |
Belirteç filtresinin adı. Yalnızca harfler, rakamlar, boşluklar, kısa çizgiler veya alt çizgiler içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır. |
NGramTokenFilterV2
Verilen boyut(lar)dan n-gram üretir. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır.
| Name | Tür | Default value | Description |
|---|---|---|---|
| @odata.type |
string:
#Microsoft. |
Belirteç filtresinin türünü belirten bir URI parçası. |
|
| maxGram |
integer (int32) maximum: 300 |
2 |
Maksimum n-gram uzunluk. Varsayılan değer 2'dir. Maksimum 300'dür. |
| minGram |
integer (int32) maximum: 300 |
1 |
Minimum n-gram uzunluk. Varsayılan değer 1'dir. Maksimum 300'dür. maxGram değerinden küçük olmalıdır. |
| name |
string |
Belirteç filtresinin adı. Yalnızca harfler, rakamlar, boşluklar, kısa çizgiler veya alt çizgiler içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır. |
NGramTokenizer
Girdiyi, verilen boyut(lar)ın n-gramına tokenize eder. Bu belirteç oluşturucu Apache Lucene kullanılarak uygulanır.
| Name | Tür | Default value | Description |
|---|---|---|---|
| @odata.type |
string:
#Microsoft. |
Belirteç oluşturucu türünü belirten bir URI parçası. |
|
| maxGram |
integer (int32) maximum: 300 |
2 |
Maksimum n-gram uzunluk. Varsayılan değer 2'dir. Maksimum 300'dür. |
| minGram |
integer (int32) maximum: 300 |
1 |
Minimum n-gram uzunluk. Varsayılan değer 1'dir. Maksimum 300'dür. maxGram değerinden küçük olmalıdır. |
| name |
string |
Tokenizer'ın adı. Yalnızca harfler, rakamlar, boşluklar, kısa çizgiler veya alt çizgiler içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır. |
|
| tokenChars |
Belirteçlerde tutulacak karakter sınıfları. |
OutputFieldMappingEntry
Bir beceri için çıktı alanı eşlemesi.
| Name | Tür | Description |
|---|---|---|
| name |
string |
Beceri tarafından tanımlanan çıktının adı. |
| targetName |
string |
Çıktının hedef adı. İsteğe bağlıdır ve varsayılan olarak adlandırılır. |
PathHierarchyTokenizerV2
Yol benzeri hiyerarşiler için belirteçleştirici. Bu belirteç oluşturucu Apache Lucene kullanılarak uygulanır.
| Name | Tür | Default value | Description |
|---|---|---|---|
| @odata.type |
string:
#Microsoft. |
Belirteç oluşturucu türünü belirten bir URI parçası. |
|
| delimiter |
string (char) |
/ |
Kullanılacak sınırlayıcı karakter. Varsayılan değer "/" dir. |
| maxTokenLength |
integer (int32) maximum: 300 |
300 |
Maksimum belirteç uzunluğu. Varsayılan ve maksimum 300'dür. |
| name |
string |
Tokenizer'ın adı. Yalnızca harfler, rakamlar, boşluklar, kısa çizgiler veya alt çizgiler içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır. |
|
| replacement |
string (char) |
/ |
Ayarlanırsa, sınırlayıcı karakterin yerini alan bir değer. Varsayılan değer "/" dir. |
| reverse |
boolean |
False |
Belirteçlerin ters sırada oluşturulup oluşturulmayacağını gösteren bir değer. Varsayılan değer false'tur. |
| skip |
integer (int32) |
0 |
Atlanacak ilk jeton sayısı. Varsayılan değer 0'dır. |
PatternAnalyzer
Metni düzenli bir ifade deseni aracılığıyla esnek bir şekilde terimlere ayırır. Bu çözümleyici Apache Lucene kullanılarak uygulanır.
| Name | Tür | Default value | Description |
|---|---|---|---|
| @odata.type |
string:
#Microsoft. |
Çözümleyici türünü belirten bir URI parçası. |
|
| flags |
Normal ifade bayrakları. |
||
| lowercase |
boolean |
True |
Terimlerin küçük harfle yazılıp yazılmayacağını belirten bir değer. Varsayılan değer doğrudur |
| name |
string |
Çözümleyicinin adı. Yalnızca harfler, rakamlar, boşluklar, kısa çizgiler veya alt çizgiler içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır. |
|
| pattern |
string |
\W+ |
Belirteç ayırıcılarıyla eşleşmesi için bir normal ifade deseni. Varsayılan, sözcük olmayan bir veya daha fazla karakterle eşleşen bir ifadedir. |
| stopwords |
string[] |
Durdurma sözcüklerinin bir listesi. |
PatternCaptureTokenFilter
Bir veya daha fazla desende her yakalama grubu için bir tane olmak üzere birden çok belirteç yaymak için Java normal ifadelerini kullanır. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır.
| Name | Tür | Default value | Description |
|---|---|---|---|
| @odata.type |
string:
#Microsoft. |
Belirteç filtresinin türünü belirten bir URI parçası. |
|
| name |
string |
Belirteç filtresinin adı. Yalnızca harfler, rakamlar, boşluklar, kısa çizgiler veya alt çizgiler içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır. |
|
| patterns |
string[] |
Her bir belirteçle eşleştirilecek desenlerin listesi. |
|
| preserveOriginal |
boolean |
True |
Desenlerden biri eşleşse bile orijinal belirtecin döndürülüp döndürülmeyeceğini gösteren bir değer. Varsayılan değer doğrudur |
PatternReplaceCharFilter
Giriş dizesindeki karakterlerin yerini alan bir karakter filtresi. Korunacak karakter dizilerini tanımlamak için normal bir ifade ve değiştirilecek karakterleri tanımlamak için bir değiştirme deseni kullanır. Örneğin, "aa bb aa bb" giriş metni, "(aa)\s+(bb)" deseni ve "$1#$2" yerine geçtiğinde, sonuç "aa#bb aa#bb" olacaktır. Bu karakter filtresi Apache Lucene kullanılarak uygulanır.
| Name | Tür | Description |
|---|---|---|
| @odata.type |
string:
#Microsoft. |
Karakter filtresinin türünü belirten bir URI parçası. |
| name |
string |
Char filtresinin adı. Yalnızca harfler, rakamlar, boşluklar, kısa çizgiler veya alt çizgiler içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır. |
| pattern |
string |
Normal ifade deseni. |
| replacement |
string |
Değiştirilen metin. |
PatternReplaceTokenFilter
Giriş dizesindeki karakterlerin yerini alan bir karakter filtresi. Korunacak karakter dizilerini tanımlamak için normal bir ifade ve değiştirilecek karakterleri tanımlamak için bir değiştirme deseni kullanır. Örneğin, "aa bb aa bb" giriş metni, "(aa)\s+(bb)" deseni ve "$1#$2" yerine geçtiğinde, sonuç "aa#bb aa#bb" olacaktır. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır.
| Name | Tür | Description |
|---|---|---|
| @odata.type |
string:
#Microsoft. |
Belirteç filtresinin türünü belirten bir URI parçası. |
| name |
string |
Belirteç filtresinin adı. Yalnızca harfler, rakamlar, boşluklar, kısa çizgiler veya alt çizgiler içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır. |
| pattern |
string |
Normal ifade deseni. |
| replacement |
string |
Değiştirilen metin. |
PatternTokenizer
Farklı belirteçler oluşturmak için normal ifade deseni eşleştirmesini kullanan belirteçleyici. Bu belirteç oluşturucu Apache Lucene kullanılarak uygulanır.
| Name | Tür | Default value | Description |
|---|---|---|---|
| @odata.type |
string:
#Microsoft. |
Belirteç oluşturucu türünü belirten bir URI parçası. |
|
| flags |
Normal ifade bayrakları. |
||
| group |
integer (int32) |
-1 |
Belirteçlere ayıklamak için normal ifade desenindeki eşleşen grubun sıfır tabanlı sırası. Eşleşen gruplardan bağımsız olarak girdiyi belirteçlere bölmek için tüm deseni kullanmak istiyorsanız -1 kullanın. Varsayılan değer -1'dir. |
| name |
string |
Tokenizer'ın adı. Yalnızca harfler, rakamlar, boşluklar, kısa çizgiler veya alt çizgiler içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır. |
|
| pattern |
string |
\W+ |
Belirteç ayırıcılarıyla eşleşmesi için bir normal ifade deseni. Varsayılan, sözcük olmayan bir veya daha fazla karakterle eşleşen bir ifadedir. |
PhoneticEncoder
PhoneticTokenFilter ile kullanılacak fonetik kodlayıcı türünü tanımlar.
| Değer | Description |
|---|---|
| metaphone |
Bir belirteci Metafon değerine kodlar. |
| doubleMetaphone |
Bir belirteci çift metafon değerine kodlar. |
| soundex |
Bir belirteci Soundex değerine kodlar. |
| refinedSoundex |
Bir belirteci Rafine Soundex değerine kodlar. |
| caverphone1 |
Bir belirteci Caverphone 1.0 değerine kodlar. |
| caverphone2 |
Bir belirteci Caverphone 2.0 değerine kodlar. |
| cologne |
Bir belirteci Köln Fonetik değerine kodlar. |
| nysiis |
Bir belirteci bir NYSIIS değerine kodlar. |
| koelnerPhonetik |
Kölner Phonetik algoritmasını kullanarak bir belirteci kodlar. |
| haasePhonetik |
Kölner Phonetik algoritmasının Haase iyileştirmesini kullanarak bir belirteci kodlar. |
| beiderMorse |
Belirteci Beider-Morse bir değere kodlar. |
PhoneticTokenFilter
Fonetik eşleşmeler için belirteçler oluşturun. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır.
| Name | Tür | Default value | Description |
|---|---|---|---|
| @odata.type |
string:
#Microsoft. |
Belirteç filtresinin türünü belirten bir URI parçası. |
|
| encoder | metaphone |
Kullanılacak fonetik kodlayıcı. Varsayılan değer "metafon"dur. |
|
| name |
string |
Belirteç filtresinin adı. Yalnızca harfler, rakamlar, boşluklar, kısa çizgiler veya alt çizgiler içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır. |
|
| replace |
boolean |
True |
Kodlanmış belirteçlerin orijinal belirteçlerin yerini alması gerekip gerekmediğini belirten bir değer. false ise, kodlanmış belirteçler eş anlamlı olarak eklenir. Varsayılan değer doğrudur |
PrioritizedFields
Anlamsal sıralama, resim yazıları, vurgular ve yanıtlar için kullanılacak başlık, içerik ve anahtar sözcük alanlarını açıklar.
| Name | Tür | Description |
|---|---|---|
| prioritizedContentFields |
Anlamsal sıralama, başlıklar, vurgular ve yanıtlar için kullanılacak içerik alanlarını tanımlar. En iyi sonucu elde etmek için, seçilen alanların doğal dil biçiminde metin içermesi gerekir. Dizideki alanların sırası, önceliklerini temsil eder. İçerik uzunsa daha düşük önceliğe sahip alanlar kesilebilir. |
|
| prioritizedKeywordsFields |
Anlamsal sıralama, başlıklar, vurgular ve yanıtlar için kullanılacak anahtar kelime alanlarını tanımlar. En iyi sonucu elde etmek için, seçilen alanlar bir anahtar kelime listesi içermelidir. Dizideki alanların sırası, önceliklerini temsil eder. İçerik uzunsa daha düşük önceliğe sahip alanlar kesilebilir. |
|
| titleField |
Anlamsal sıralama, başlıklar, vurgular ve yanıtlar için kullanılacak başlık alanını tanımlar. Dizininizde bir başlık alanınız yoksa, bu alanı boş bırakın. |
RankingOrder
Belgelerin sıralama düzeni için kullanılacak puanı temsil eder.
| Değer | Description |
|---|---|
| BoostedRerankerScore |
Sıralama düzenini BoostedRerankerScore olarak ayarlar |
| RerankerScore |
Sıralama düzenini ReRankerScore olarak ayarlar |
RegexFlags
Desen çözümleyicisinde ve desen belirteçleyicisinde normal ifadelerin nasıl kullanıldığını denetlemek için birleştirilebilecek bayrakları tanımlar.
| Değer | Description |
|---|---|
| CANON_EQ |
Kanonik eşdeğerliği etkinleştirir. |
| CASE_INSENSITIVE |
Büyük/küçük harfe duyarlı olmayan eşleştirmeyi etkinleştirir. |
| COMMENTS |
Desendeki boşluklara ve yorumlara izin verir. |
| DOTALL |
Dotall modunu etkinleştirir. |
| LITERAL |
Desenin harfi harfine ayrıştırılmasını sağlar. |
| MULTILINE |
Çok satırlı modu etkinleştirir. |
| UNICODE_CASE |
Unicode uyumlu büyük/küçük harf katlamayı etkinleştirir. |
| UNIX_LINES |
Unix hatları modunu etkinleştirir. |
RescoringOptions
Yeniden puanlama seçeneklerini içerir.
| Name | Tür | Default value | Description |
|---|---|---|---|
| defaultOversampling |
number (double) |
Varsayılan aşırı örnekleme faktörü. Yüksek hızda örnekleme, nicelemeden kaynaklanan çözünürlük kaybını dengelemek için daha büyük bir potansiyel belge kümesini alır. Bu, tam duyarlıklı vektörlerde yeniden puanlanacak sonuç kümesini artırır. Minimum değer 1'dir, yani fazla örnekleme yoktur (1x). Bu parametre yalnızca 'enableRescoring' true olduğunda ayarlanabilir. Daha yüksek değerler, gecikme pahasına geri çağırmayı iyileştirir. |
|
| enableRescoring |
boolean |
True |
Doğru olarak ayarlanırsa, sıkıştırılmış vektörler üzerinde yapılan ilk aramadan sonra, benzerlik puanları tam duyarlıklı vektörler kullanılarak yeniden hesaplanır. Bu, gecikme pahasına geri çağırmayı iyileştirecektir. |
| rescoreStorageMethod | preserveOriginals |
Orijinal vektörler için depolama yöntemini kontrol eder. Bu ayar sabittir. |
ScalarQuantizationParameters
Skaler Kuantizasyona özgü parametreleri içerir.
| Name | Tür | Description |
|---|---|---|
| quantizedDataType |
Sıkıştırılmış vektör değerlerinin nicelleştirilmiş veri türü. |
ScalarQuantizationVectorSearchCompressionConfiguration
İndeksleme ve sorgulama sırasında kullanılan skaler niceleme sıkıştırma yöntemine özgü yapılandırma seçeneklerini içerir.
| Name | Tür | Description |
|---|---|---|
| kind |
string:
scalar |
Vektör aramasıyla kullanılmak üzere yapılandırılan sıkıştırma yönteminin adı. |
| name |
string |
Bu özel yapılandırmayla ilişkilendirilecek ad. |
| rescoringOptions |
Yeniden puanlama seçeneklerini içerir. |
|
| scalarQuantizationParameters |
Skaler Kuantizasyona özgü parametreleri içerir. |
|
| truncationDimension |
integer (int32) |
Vektörlerin kesileceği boyut sayısı. Vektörlerin kesilmesi, vektörlerin boyutunu ve arama sırasında aktarılması gereken veri miktarını azaltır. Bu, depolama maliyetinden tasarruf sağlayabilir ve geri çağırma pahasına arama performansını iyileştirebilir. Yalnızca OpenAI text-embedding-3-large (small) gibi Matryoshka Representation Learning (MRL) ile eğitilen yerleştirmeler için kullanılmalıdır. Varsayılan değer null'dur, bu da kesme olmadığı anlamına gelir. |
ScoringFunctionAggregation
Bir puanlama profilindeki tüm puanlama işlevlerinin sonuçlarını birleştirmek için kullanılan toplama işlevini tanımlar.
| Değer | Description |
|---|---|
| sum |
Puanları, tüm puanlama işlevi sonuçlarının toplamına göre artırın. |
| average |
Puanları, tüm puanlama işlevi sonuçlarının ortalaması kadar artırın. |
| minimum |
Puanları, tüm puanlama işlevi sonuçlarının minimumu kadar artırın. |
| maximum |
Puanları, tüm puanlama işlevi sonuçlarının maksimumu kadar artırın. |
| firstMatching |
Puanlama profilinde ilk geçerli puanlama işlevini kullanarak puanları artırın. |
ScoringFunctionInterpolation
Bir dizi belgede puan artırmayı enterpolasyon yapmak için kullanılan işlevi tanımlar.
| Değer | Description |
|---|---|
| linear |
Puanları doğrusal olarak azalan bir miktarda artırır. Bu, puanlama işlevleri için varsayılan enterpolasyondur. |
| constant |
Puanları sabit bir faktörle artırır. |
| quadratic |
Puanları ikinci dereceden azalan bir miktarda artırır. Takviyeler, daha yüksek puanlar için yavaş ve puanlar azaldıkça daha hızlı azalır. Bu enterpolasyon seçeneğine, etiket puanlama işlevlerinde izin verilmez. |
| logarithmic |
Puanları logaritmik olarak azalan bir miktarda artırır. Artışlar, daha yüksek puanlar için hızlı bir şekilde azalır ve puanlar azaldıkça daha yavaş azalır. Bu enterpolasyon seçeneğine, etiket puanlama işlevlerinde izin verilmez. |
ScoringProfile
Arama sorgularında puanlamayı etkileyen bir arama dizini için parametreleri tanımlar.
| Name | Tür | Description |
|---|---|---|
| functionAggregation |
Tek tek puanlama işlevlerinin sonuçlarının nasıl birleştirilmesi gerektiğini gösteren bir değer. Varsayılan olarak "Toplam" kullanılır. Puanlama işlevi yoksa yoksayılır. |
|
| functions | ScoringFunction[]: |
Belgelerin puanlanmasını etkileyen işlevlerin toplamı. |
| name |
string |
Puanlama profilinin adı. |
| text |
Belirli dizin alanlarındaki metin eşleşmelerine dayalı olarak puanlamayı artıran parametreler. |
SearchField
Bir alanın adını, veri türünü ve arama davranışını açıklayan bir dizin tanımındaki bir alanı temsil eder.
| Name | Tür | Description |
|---|---|---|
| analyzer |
Alan için kullanılacak çözümleyicinin adı. Bu seçenek yalnızca aranabilir alanlarla kullanılabilir ve searchAnalyzer veya indexAnalyzer ile birlikte ayarlanamaz. Analizör seçildikten sonra alan için değiştirilemez. Karmaşık alanlar için null olmalıdır. |
|
| dimensions |
integer (int32) minimum: 2maximum: 4096 |
Vektör alanının boyutluluğu. |
| facetable |
boolean |
Faset sorgularında alana başvurulacak alanın etkinleştirilip etkinleştirilmeyeceğini belirten bir değer. Genellikle kategoriye göre isabet sayısını içeren arama sonuçlarının bir sunumunda kullanılır (örneğin, dijital kameraları arayın ve markaya göre, megapiksellere, fiyata vb. göre isabetleri görün). Bu özellik karmaşık alanlar için null olmalıdır. Edm.GeographyPoint veya Collection(Edm.GeographyPoint) türündeki alanlar facetable olamaz. Varsayılan değer, diğer tüm basit alanlar için geçerlidir. |
| fields |
Bu Edm.ComplexType veya Collection(Edm.ComplexType) türünde bir alansa, alt alanların listesi. Basit alanlar için null veya boş olmalıdır. |
|
| filterable |
boolean |
Alanın $filter sorgularda başvurulup başvurulmayacağının etkinleştirilip etkinleştirilmeyeceğini belirten bir değer. Filterable, dizelerin nasıl işlendiği konusunda aranabilir olandan farklıdır. Filtrelenebilir Edm.String veya Collection(Edm.String) türündeki alanlar sözcük bölünmesine uğramaz, bu nedenle karşılaştırmalar yalnızca tam eşleşmeler içindir. Örneğin, böyle bir f alanını "güneşli gün" olarak ayarlarsanız, $filter=f eq 'güneşli' eşleşme bulamaz, ancak $filter=f eq 'güneşli gün' bulur. Bu özellik karmaşık alanlar için null olmalıdır. Varsayılan değer basit alanlar için doğru, karmaşık alanlar için null değeridir. |
| indexAnalyzer |
Alan için indeksleme zamanında kullanılan çözümleyicinin adı. Bu seçenek yalnızca aranabilir alanlarla kullanılabilir. searchAnalyzer ile birlikte ayarlanmalıdır ve analyzer seçeneğiyle birlikte ayarlanamaz. Bu özellik bir dil çözümleyicisinin adına ayarlanamaz; Dil çözümleyicisine ihtiyacınız varsa bunun yerine Analyzer özelliğini kullanın. Analizör seçildikten sonra alan için değiştirilemez. Karmaşık alanlar için null olmalıdır. |
|
| key |
boolean |
Alanın, dizindeki belgeleri benzersiz bir şekilde tanımlayıp tanımlamadığını gösteren bir değer. Her dizinde tam olarak bir üst düzey alan anahtar alan olarak seçilmelidir ve bu alan Edm.String türünde olmalıdır. Önemli alanlar, belgeleri doğrudan aramak ve belirli belgeleri güncelleştirmek veya silmek için kullanılabilir. Varsayılan değer, basit alanlar için false ve karmaşık alanlar için null değeridir. |
| name |
string |
Dizin veya üst alanın fields koleksiyonu içinde benzersiz olması gereken alanın adı. |
| normalizer |
Alan için kullanılacak normalleştiricinin adı. Bu seçenek yalnızca filtrelenebilir, sıralanabilir veya facetable özelliği etkinleştirilmiş alanlarla kullanılabilir. Normalleştirici seçildikten sonra, alan için değiştirilemez. Karmaşık alanlar için null olmalıdır. |
|
| retrievable |
boolean |
Alanın bir arama sonucunda döndürülüp döndürülemeyeceğini belirten bir değer. Bir alanı (örneğin, kenar boşluğu) filtre, sıralama veya puanlama mekanizması olarak kullanmak istiyor ancak alanın son kullanıcı tarafından görülebilmesini istemiyorsanız bu seçeneği devre dışı bırakabilirsiniz. Bu özellik anahtar alanlar için true olmalı ve karmaşık alanlar için null olmalıdır. Bu özellik mevcut alanlarda değiştirilebilir. Bu özelliğin etkinleştirilmesi, dizin depolama gereksinimlerinde herhangi bir artışa neden olmaz. Varsayılan değer basit alanlar için true, vektör alanları için false ve karmaşık alanlar için null değeridir. |
| searchAnalyzer |
Alan için arama zamanında kullanılan çözümleyicinin adı. Bu seçenek yalnızca aranabilir alanlarla kullanılabilir. indexAnalyzer ile birlikte ayarlanmalıdır ve çözümleyici seçeneğiyle birlikte ayarlanamaz. Bu özellik bir dil çözümleyicisinin adına ayarlanamaz; Dil çözümleyicisine ihtiyacınız varsa bunun yerine Analyzer özelliğini kullanın. Bu çözümleyici mevcut bir alanda güncellenebilir. Karmaşık alanlar için null olmalıdır. |
|
| searchable |
boolean |
Alanın tam metin aranabilir olup olmadığını belirten bir değer. Bu, indeksleme sırasında kelime kırma gibi analizlere tabi tutulacağı anlamına gelir. Aranabilir bir alanı "güneşli gün" gibi bir değere ayarlarsanız, dahili olarak "güneşli" ve "gün" belirteçlerine bölünür. Bu, bu terimler için tam metin aramaları sağlar. Edm.String veya Collection(Edm.String) türündeki alanlar varsayılan olarak aranabilir. Bu özellik, diğer dize olmayan veri türlerinin basit alanları için false olmalı ve karmaşık alanlar için null olmalıdır. Not: Aranabilir alanlar, tam metin aramaları için alan değerinin ek belirteçleştirilmiş sürümlerini barındırmak için dizininizde fazladan alan kullanır. Dizininizde yer kazanmak istiyorsanız ve aramalara dahil edilecek bir alana ihtiyacınız yoksa, aranabilir değerini false olarak ayarlayın. |
| sortable |
boolean |
Alanın $orderby ifadelerde başvurulmasının etkinleştirilip etkinleştirilmeyeceğini belirten bir değer. Varsayılan olarak, arama motoru sonuçları puana göre sıralar, ancak birçok deneyimde kullanıcılar belgelerdeki alanlara göre sıralamak isteyecektir. Basit bir alan yalnızca tek değerliyse (ana belge kapsamında tek bir değere sahipse) sıralanabilir olabilir. Basit toplama alanları, çok değerli oldukları için sıralanabilir olamaz. Karmaşık koleksiyonların basit alt alanları da çok değerlidir ve bu nedenle sıralanabilir olamaz. Bu, ister anlık bir üst alan ister bir üst alan olsun, karmaşık koleksiyondur. Karmaşık alanlar sıralanabilir olamaz ve bu tür alanlar için sıralanabilir özelliğin null olması gerekir. Sıralanabilir için varsayılan değer, tek değerli basit alanlar için doğru, çok değerli basit alanlar için false ve karmaşık alanlar için null değeridir. |
| stored |
boolean |
Alanın, bir arama sonucunda döndürülmek üzere diskte ayrı olarak kalıcı olup olmayacağını belirten sabit bir değer. Depolama yükünden tasarruf etmek için alan içeriğini bir arama yanıtında döndürmeyi planlamıyorsanız, bu seçeneği devre dışı bırakabilirsiniz. Bu, yalnızca dizin oluşturma sırasında ve yalnızca vektör alanları için ayarlanabilir. Bu özellik mevcut alanlar için değiştirilemez veya yeni alanlar için false olarak ayarlanamaz. Bu özellik false olarak ayarlanırsa, 'retrievable' özelliği de false olarak ayarlanmalıdır. Bu özellik, anahtar alanlar, yeni alanlar ve vektör olmayan alanlar için doğru veya ayarlanmamış olmalıdır ve karmaşık alanlar için null olmalıdır. Bu özelliğin devre dışı bırakılması dizin depolama gereksinimlerini azaltır. Vektör alanları için varsayılan değer doğrudur. |
| synonymMaps |
string[] |
Bu alanla ilişkilendirilecek eş anlamlı eşlemelerinin adlarının listesi. Bu seçenek yalnızca aranabilir alanlarla kullanılabilir. Şu anda alan başına yalnızca bir eş anlamlı eşleme desteklenir. Bir alana eş anlamlı eşlem atamak, bu alanı hedefleyen sorgu terimlerinin eş anlamlı eşlemedeki kurallar kullanılarak sorgu zamanında genişletilmesini sağlar. Bu öznitelik mevcut alanlarda değiştirilebilir. Karmaşık alanlar için null veya boş bir koleksiyon olmalıdır. |
| type |
Alanın veri türü. |
|
| vectorEncoding |
Alan içeriğini yorumlamak için kodlama biçimi. |
|
| vectorSearchProfile |
string |
Vektör alanında arama yaparken kullanılacak algoritmayı ve vektörleştiriciyi belirten vektör arama profilinin adı. |
SearchFieldDataType
Arama dizinindeki bir alanın veri türünü tanımlar.
| Değer | Description |
|---|---|
| Edm.String |
Bir alanın bir dize içerdiğini gösterir. |
| Edm.Int32 |
Bir alanın 32 bit işaretli bir tamsayı içerdiğini gösterir. |
| Edm.Int64 |
Bir alanın 64 bit işaretli bir tamsayı içerdiğini gösterir. |
| Edm.Double |
Bir alanın IEEE çift duyarlıklı kayan nokta numarası içerdiğini gösterir. |
| Edm.Boolean |
Bir alanın bir Boole değeri (doğru veya yanlış) içerdiğini gösterir. |
| Edm.DateTimeOffset |
Bir alanın, saat dilimi bilgileri de dahil olmak üzere bir tarih/saat değeri içerdiğini gösterir. |
| Edm.GeographyPoint |
Bir alanın boylam ve enlem cinsinden bir coğrafi konum içerdiğini gösterir. |
| Edm.ComplexType |
Bir alanın, diğer türlerin alt alanlarına sahip olan bir veya daha fazla karmaşık nesne içerdiğini gösterir. |
| Edm.Single |
Bir alanın tek duyarlıklı kayan nokta sayısı içerdiğini gösterir. Bu yalnızca Collection(Edm.Single) ile kullanıldığında geçerlidir. |
| Edm.Half |
Bir alanın yarı duyarlıklı kayan nokta sayısı içerdiğini gösterir. Bu yalnızca Collection(Edm.Half) ile kullanıldığında geçerlidir. |
| Edm.Int16 |
Bir alanın 16 bit işaretli bir tamsayı içerdiğini gösterir. Bu yalnızca Collection(Edm.Int16) ile kullanıldığında geçerlidir. |
| Edm.SByte |
Bir alanın 8 bitlik işaretli bir tamsayı içerdiğini gösterir. Bu yalnızca Collection(Edm.SByte) ile kullanıldığında geçerlidir. |
| Edm.Byte |
Bir alanın 8 bitlik işaretsiz bir tamsayı içerdiğini gösterir. Bu yalnızca Collection(Edm.Byte) ile kullanıldığında geçerlidir. |
SearchIndex
Bir dizinin alanlarını ve arama davranışını açıklayan bir arama dizini tanımını temsil eder.
| Name | Tür | Description |
|---|---|---|
| @odata.etag |
string |
Dizinin ETag'i. |
| analyzers | LexicalAnalyzer[]: |
Dizin için çözümleyiciler. |
| charFilters | CharFilter[]: |
Dizin için karakter filtreleri. |
| corsOptions |
Dizin için Çıkış Noktaları Arası Kaynak Paylaşımı'nı (CORS) denetleme seçenekleri. |
|
| defaultScoringProfile |
string |
Sorguda hiçbiri belirtilmemişse kullanılacak puanlama profilinin adı. Bu özellik ayarlanmamışsa ve sorguda puanlama profili belirtilmemişse, varsayılan puanlama (tf-idf) kullanılır. |
| description |
string |
Dizinin açıklaması. |
| encryptionKey |
Azure Key Vault'ta oluşturduğunuz bir şifreleme anahtarının açıklaması. Bu anahtar, hiç kimsenin, hatta Microsoft'un bile verilerinizin şifresini çözemeyeceğinden tam olarak emin olmak istediğinizde, verileriniz için ek bir bekleyen şifreleme düzeyi sağlamak için kullanılır. Verilerinizi bir kez şifreledikten sonra, her zaman şifreli kalacaktır. Arama hizmeti, bu özelliği null olarak ayarlama girişimlerini yoksayar. Şifreleme anahtarınızı döndürmek istiyorsanız bu özelliği gerektiği gibi değiştirebilirsiniz; Verileriniz etkilenmeyecektir. Müşteri tarafından yönetilen anahtarlarla şifreleme, ücretsiz arama hizmetleri için kullanılamaz ve yalnızca 1 Ocak 2019'da veya sonrasında oluşturulan ücretli hizmetler için kullanılabilir. |
|
| fields |
Dizinin alanları. |
|
| name |
string |
Dizinin adı. |
| normalizers | LexicalNormalizer[]: |
Dizin için normalleştiriciler. |
| scoringProfiles |
Dizin için puanlama profilleri. |
|
| semantic |
Anlamsal yetenekleri etkileyen bir arama dizini için parametreleri tanımlar. |
|
| similarity | Similarity: |
Bir arama sorgusuyla eşleşen belgeleri puanlarken ve sıralarken kullanılacak benzerlik algoritmasının türü. Benzerlik algoritması yalnızca dizin oluşturma sırasında tanımlanabilir ve mevcut dizinlerde değiştirilemez. Null ise, ClassicSimilarity algoritması kullanılır. |
| suggesters |
Dizin için önerilerde bulunanlar. |
|
| tokenFilters |
TokenFilter[]:
|
Belirteç, dizin için filtre uygular. |
| tokenizers | LexicalTokenizer[]: |
Dizin için belirteçleştiriciler. |
| vectorSearch |
Vektör arama ile ilgili yapılandırma seçeneklerini içerir. |
SearchIndexerDataNoneIdentity
Bir veri kaynağının kimlik özelliğini temizler.
| Name | Tür | Description |
|---|---|---|
| @odata.type |
string:
#Microsoft. |
Kimlik türünü belirten bir URI parçası. |
SearchIndexerDataUserAssignedIdentity
Kullanılacak veri kaynağının kimliğini belirtir.
| Name | Tür | Description |
|---|---|---|
| @odata.type |
string:
#Microsoft. |
Kimlik türünü belirten bir URI parçası. |
| userAssignedIdentity |
string |
Genellikle "/subscriptions/12345678-1234-1234-1234-1234567890ab/resourceGroups/rg/providers/Microsoft.ManagedIdentity/userAssignedIdentities/myId" biçiminde yönetilen kimlik atanan bir kullanıcının tam Azure kaynak kimliği. |
SearchResourceEncryptionKey
Azure Key Vault'ta müşteri tarafından yönetilen bir şifreleme anahtarı. Oluşturduğunuz ve yönettiğiniz anahtarlar, dizinler ve eş anlamlı eşlemeler gibi bekleyen verileri şifrelemek veya şifresini çözmek için kullanılabilir.
| Name | Tür | Description |
|---|---|---|
| accessCredentials |
Azure Key Vault erişmek için kullanılan isteğe bağlı Azure Active Directory kimlik bilgileri. Bunun yerine yönetilen kimlik kullanılıyorsa gerekli değildir. |
|
| keyVaultKeyName |
string |
Bekleyen verilerinizi şifrelemek için kullanılacak Azure Key Vault anahtarınızın adı. |
| keyVaultKeyVersion |
string |
Bekleyen verilerinizi şifrelemek için kullanılacak Azure Key Vault anahtarınızın sürümü. |
| keyVaultUri |
string |
DNS adı olarak da adlandırılan Azure Key Vault URI'si, bekleyen verilerinizi şifrelemek için kullanılacak anahtarı içerir. Örnek bir URI olabilir |
SemanticConfiguration
Anlamsal yetenekler bağlamında kullanılacak belirli bir yapılandırmayı tanımlar.
| Name | Tür | Description |
|---|---|---|
| name |
string |
Anlamsal yapılandırmanın adı. |
| prioritizedFields |
Anlamsal sıralama, başlıklar, vurgular ve yanıtlar için kullanılacak başlık, içerik ve anahtar sözcük alanlarını açıklar. Üç alt özellikten (titleField, prioritizedKeywordsFields ve prioritizedContentFields) en az birinin ayarlanması gerekir. |
|
| rankingOrder |
Arama sonuçlarının sıralama düzeni için kullanılacak puan türünü belirtir. |
SemanticField
Anlamsal yapılandırmanın bir parçası olarak kullanılan bir alan.
| Name | Tür | Description |
|---|---|---|
| fieldName |
string |
SemanticSettings
Anlamsal yetenekleri etkileyen bir arama dizini için parametreleri tanımlar.
| Name | Tür | Description |
|---|---|---|
| configurations |
Dizin için anlamsal yapılandırmalar. |
|
| defaultConfiguration |
string |
Dizininizde varsayılan bir anlamsal yapılandırmanın adını ayarlamanıza olanak tanır ve her seferinde sorgu parametresi olarak geçirmeyi isteğe bağlı hale getirir. |
ShingleTokenFilter
Tek bir belirteç olarak belirteç kombinasyonları oluşturur. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır.
| Name | Tür | Default value | Description |
|---|---|---|---|
| @odata.type |
string:
#Microsoft. |
Belirteç filtresinin türünü belirten bir URI parçası. |
|
| filterToken |
string |
_ |
Belirteç olmayan her konum için eklenecek dize. Varsayılan değer bir alt çizgidir ("_"). |
| maxShingleSize |
integer (int32) minimum: 2 |
2 |
Maksimum kiremit boyutu. Varsayılan ve minimum değer 2'dir. |
| minShingleSize |
integer (int32) minimum: 2 |
2 |
Minimum shingle boyutu. Varsayılan ve minimum değer 2'dir. maxShingleSize değerinden küçük olmalıdır. |
| name |
string |
Belirteç filtresinin adı. Yalnızca harfler, rakamlar, boşluklar, kısa çizgiler veya alt çizgiler içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır. |
|
| outputUnigrams |
boolean |
True |
Çıkış akışının giriş belirteçlerini (unigramlar) ve zonaları içerip içermeyeceğini gösteren bir değer. Varsayılan değer doğrudur |
| outputUnigramsIfNoShingles |
boolean |
False |
Zona bulunmadığı zamanlar için unigram çıktısı alınıp alınmayacağını gösteren bir değer. outputUnigrams false olarak ayarlandığında bu özellik önceliklidir. Varsayılan değer false'tur. |
| tokenSeparator |
string |
Bir kiremit oluşturmak için bitişik belirteçleri birleştirirken kullanılacak dize. Varsayılan değer tek bir boşluktur (" "). |
SnowballTokenFilter
Snowball tarafından oluşturulan bir kök kullanarak sözcükleri köklendiren bir filtre. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır.
| Name | Tür | Description |
|---|---|---|
| @odata.type |
string:
#Microsoft. |
Belirteç filtresinin türünü belirten bir URI parçası. |
| language |
Kullanılacak dil. |
|
| name |
string |
Belirteç filtresinin adı. Yalnızca harfler, rakamlar, boşluklar, kısa çizgiler veya alt çizgiler içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır. |
SnowballTokenFilterLanguage
Snowball belirteç filtresi için kullanılacak dil.
| Değer | Description |
|---|---|
| armenian |
Ermenice için Lucene Snowball köklendirme tokenizer'ını seçer. |
| basque |
Bask için Lucene Snowball köklendirme tokenizer'ını seçer. |
| catalan |
Katalanca için Lucene Snowball köklendirme tokenizer'ını seçer. |
| danish |
Danca için Lucene Snowball köklendirme tokenizer'ını seçer. |
| dutch |
Felemenkçe için Lucene Snowball köklendirme tokenizer'ını seçer. |
| english |
İngilizce için Lucene Snowball köklendirme belirteç oluşturucusunu seçer. |
| finnish |
Fince için Lucene Snowball köklendirme tokenizer'ını seçer. |
| french |
Fransızca için Lucene Snowball köklendirme tokenizer'ını seçer. |
| german |
Almanca için Lucene Snowball köklendirme tokenizer'ını seçer. |
| german2 |
Alman varyant algoritmasını kullanan Lucene Snowball kök belirteç oluşturucusunu seçer. |
| hungarian |
Macarca için Lucene Snowball köklendirme tokenizer'ını seçer. |
| italian |
İtalyanca için Lucene Snowball köklendirme tokenizer'ını seçer. |
| kp |
Hollandaca için Kraaij-Pohlmann köklendirme algoritmasını kullanan Lucene Snowball köklendirme belirteçleyicisini seçer. |
| lovins |
Lovins köklendirme algoritmasını kullanan İngilizce için Lucene Snowball köklendirme belirteçleyicisini seçer. |
| norwegian |
Norveççe için Lucene Snowball köklendirme tokenizer'ını seçer. |
| porter |
Porter köklendirme algoritmasını kullanan İngilizce için Lucene Snowball köklendirme belirteçleyicisini seçer. |
| portuguese |
Portekizce için Lucene Snowball köklendirme belirteç oluşturucusunu seçer. |
| romanian |
Romence için Lucene Snowball köklendirme tokenizer'ını seçer. |
| russian |
Rusça için Lucene Snowball köklendirme tokenizer'ını seçer. |
| spanish |
İspanyolca için Lucene Snowball köklendirme tokenizer'ını seçer. |
| swedish |
İsveççe için Lucene Snowball köklendirme tokenizer'ını seçer. |
| turkish |
Türkçe için Lucene Snowball köklendirme tokenizer'ını seçer. |
StemmerOverrideTokenFilter
Özel sözlük tabanlı kök oluşturma ile diğer kök filtrelerini geçersiz kılma olanağı sağlar. Sözlük tabanlı herhangi bir terim, anahtar kelime olarak işaretlenir, böylece zincirin aşağısındaki köklerle köklenmezler. Herhangi bir sap filtresinden önce yerleştirilmelidir. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır.
| Name | Tür | Description |
|---|---|---|
| @odata.type |
string:
#Microsoft. |
Belirteç filtresinin türünü belirten bir URI parçası. |
| name |
string |
Belirteç filtresinin adı. Yalnızca harfler, rakamlar, boşluklar, kısa çizgiler veya alt çizgiler içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır. |
| rules |
string[] |
Aşağıdaki biçimde köklendirme kurallarının listesi: "word => stem", örneğin: "ran => run". |
StemmerTokenFilter
Dile özel kök filtresi. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır.
| Name | Tür | Description |
|---|---|---|
| @odata.type |
string:
#Microsoft. |
Belirteç filtresinin türünü belirten bir URI parçası. |
| language |
Kullanılacak dil. |
|
| name |
string |
Belirteç filtresinin adı. Yalnızca harfler, rakamlar, boşluklar, kısa çizgiler veya alt çizgiler içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır. |
StemmerTokenFilterLanguage
Stemmer belirteç filtresi için kullanılacak dil.
| Değer | Description |
|---|---|
| arabic |
Arapça için Lucene köklendirme belirteç oluşturucusunu seçer. |
| armenian |
Ermenice için Lucene kök tokenizer'ı seçer. |
| basque |
Bask için Lucene köklendirme tokenizer'ını seçer. |
| brazilian |
Portekizce (Brezilya) için Lucene köklendirme tokenizer'ını seçer. |
| bulgarian |
Bulgarca için Lucene köklendirme tokenizer'ını seçer. |
| catalan |
Katalanca için Lucene köklendirme tokenizer'ını seçer. |
| czech |
Çekçe için Lucene köklendirme tokenizer'ını seçer. |
| danish |
Danca için Lucene köklendirme tokenizer'ını seçer. |
| dutch |
Felemenkçe için Lucene köklendirme tokenizer'ını seçer. |
| dutchKp |
Hollandaca için Kraaij-Pohlmann köklendirme algoritmasını kullanan Lucene köklendirme belirteçleyicisini seçer. |
| english |
İngilizce için Lucene köklendirme tokenizer'ını seçer. |
| lightEnglish |
İngilizce için hafif köklendirme yapan Lucene köklendirme belirteçleyicisini seçer. |
| minimalEnglish |
Minimum köklendirme yapan İngilizce için Lucene köklendirme belirteçleyicisini seçer. |
| possessiveEnglish |
Sözcüklerden sondaki iyelik eklerini kaldıran İngilizce için Lucene köklendirme belirteçleyicisini seçer. |
| porter2 |
Porter2 köklendirme algoritmasını kullanan İngilizce için Lucene köklendirme belirteçleyicisini seçer. |
| lovins |
Lovins köklendirme algoritmasını kullanan İngilizce için Lucene köklendirme belirteçleyicisini seçer. |
| finnish |
Fince için Lucene köklendirme tokenizer'ını seçer. |
| lightFinnish |
Fince için hafif köklendirme yapan Lucene köklendirme belirteçleyicisini seçer. |
| french |
Fransızca için Lucene köklendirme tokenizer'ını seçer. |
| lightFrench |
Fransızca için hafif köklendirme yapan Lucene köklendirme belirteçleyicisini seçer. |
| minimalFrench |
Fransızca için minimum köklendirme yapan Lucene köklendirme belirteçleyicisini seçer. |
| galician |
Galiçya dili için Lucene kök tokenizer'ı seçer. |
| minimalGalician |
Galiçya dili için minimum köklendirme yapan Lucene köklendirme belirteçleyicisini seçer. |
| german |
Almanca için Lucene köklendirme tokenizer'ını seçer. |
| german2 |
Alman varyant algoritmasını kullanan Lucene kök tokenizer'ı seçer. |
| lightGerman |
Almanca için hafif köklendirme yapan Lucene köklendirme belirteçleyicisini seçer. |
| minimalGerman |
Almanca için minimum köklendirme yapan Lucene köklendirme belirteçleyicisini seçer. |
| greek |
Yunanca için Lucene köklendirme tokenizer'ını seçer. |
| hindi |
Hintçe için Lucene köklendirme belirteç oluşturucusunu seçer. |
| hungarian |
Macarca için Lucene köklendirme tokenizer'ını seçer. |
| lightHungarian |
Macarca için hafif köklendirme yapan Lucene köklendirme belirteçleyicisini seçer. |
| indonesian |
Endonezce için Lucene köklendirme tokenizer'ını seçer. |
| irish |
İrlandaca için Lucene köklendirme tokenizer'ını seçer. |
| italian |
İtalyanca için Lucene köklendirme tokenizer'ını seçer. |
| lightItalian |
İtalyanca için hafif köklendirme yapan Lucene köklendirme belirteçleyicisini seçer. |
| sorani |
Sorani için Lucene köklendirme tokenizer'ını seçer. |
| latvian |
Letonca için Lucene köklendirme tokenizer'ını seçer. |
| norwegian |
Norveççe (Bokmål) için Lucene köklendirme tokenizer'ını seçer. |
| lightNorwegian |
Norveççe (Bokmål) için hafif köklendirme yapan Lucene köklendirme tokenizer'ını seçer. |
| minimalNorwegian |
Minimum köklendirme yapan Norveççe (Bokmål) için Lucene köklendirme belirteçleyicisini seçer. |
| lightNynorsk |
Hafif köklendirme yapan Norveççe (Nynorsk) için Lucene köklendirme belirteçleyicisini seçer. |
| minimalNynorsk |
Minimum köklendirme yapan Norveççe (Nynorsk) için Lucene köklendirme tokenizer'ını seçer. |
| portuguese |
Portekizce için Lucene köklendirme tokenizer'ını seçer. |
| lightPortuguese |
Portekizce için hafif köklendirme yapan Lucene köklendirme belirteçleyicisini seçer. |
| minimalPortuguese |
Portekizce için minimum köklendirme yapan Lucene köklendirme belirteçleyicisini seçer. |
| portugueseRslp |
RSLP köklendirme algoritmasını kullanan Portekizce için Lucene köklendirme belirteçleyicisini seçer. |
| romanian |
Romence için Lucene köklendirme tokenizer'ını seçer. |
| russian |
Rusça için Lucene köklendirme tokenizer'ını seçer. |
| lightRussian |
Rusça için hafif köklendirme yapan Lucene köklendirme belirteçleyicisini seçer. |
| spanish |
İspanyolca için Lucene köklendirme tokenizer'ını seçer. |
| lightSpanish |
İspanyolca için hafif köklendirme yapan Lucene köklendirme belirteçleyicisini seçer. |
| swedish |
İsveççe için Lucene köklendirme tokenizer'ını seçer. |
| lightSwedish |
İsveççe için hafif köklendirme yapan Lucene köklendirme belirteçleyicisini seçer. |
| turkish |
Türkçe için Lucene köklendirme tokenizer'ını seçer. |
StopAnalyzer
Metni harf olmayanlara böler; Küçük harf ve stopword belirteç filtrelerini uygular. Bu çözümleyici Apache Lucene kullanılarak uygulanır.
| Name | Tür | Description |
|---|---|---|
| @odata.type |
string:
#Microsoft. |
Çözümleyici türünü belirten bir URI parçası. |
| name |
string |
Çözümleyicinin adı. Yalnızca harfler, rakamlar, boşluklar, kısa çizgiler veya alt çizgiler içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır. |
| stopwords |
string[] |
Durdurma sözcüklerinin bir listesi. |
StopwordsList
Dile özgü durdurma sözcüklerinin önceden tanımlanmış bir listesini tanımlar.
| Değer | Description |
|---|---|
| arabic |
Arapça için durdurma sözcüğü listesini seçer. |
| armenian |
Ermenice için durdurma sözcüğü listesini seçer. |
| basque |
Bask için durdurma sözcüğü listesini seçer. |
| brazilian |
Portekizce (Brezilya) için stopword listesini seçer. |
| bulgarian |
Bulgarca için durdurma sözcüğü listesini seçer. |
| catalan |
Katalanca için durdurma sözcüğü listesini seçer. |
| czech |
Çekçe için durdurma sözcüğü listesini seçer. |
| danish |
Danca için durdurma sözcüğü listesini seçer. |
| dutch |
Felemenkçe için durdurma sözcüğü listesini seçer. |
| english |
İngilizce için durdurma sözcüğü listesini seçer. |
| finnish |
Fince için durdurma sözcüğü listesini seçer. |
| french |
Fransızca için durdurma sözcüğü listesini seçer. |
| galician |
Galiçyaca için durdurma sözcüğü listesini seçer. |
| german |
Almanca için durdurma sözcüğü listesini seçer. |
| greek |
Yunanca için durdurma sözcüğü listesini seçer. |
| hindi |
Hintçe için durdurma sözcüğü listesini seçer. |
| hungarian |
Macarca için durdurma sözcüğü listesini seçer. |
| indonesian |
Endonezce için durdurma sözcüğü listesini seçer. |
| irish |
İrlandaca için durdurma sözcüğü listesini seçer. |
| italian |
İtalyanca için durdurma sözcüğü listesini seçer. |
| latvian |
Letonca için durdurma sözcüğü listesini seçer. |
| norwegian |
Norveççe için durdurma sözcüğü listesini seçer. |
| persian |
Farsça için durdurma sözcüğü listesini seçer. |
| portuguese |
Portekizce için durdurma sözcüğü listesini seçer. |
| romanian |
Romence için durdurma sözcüğü listesini seçer. |
| russian |
Rusça için durdurma sözcüğü listesini seçer. |
| sorani |
Sorani için durdurma sözcüğü listesini seçer. |
| spanish |
İspanyolca için durdurma sözcüğü listesini seçer. |
| swedish |
İsveççe için durdurma sözcüğü listesini seçer. |
| thai |
Tay dili için durdurma sözcüğü listesini seçer. |
| turkish |
Türkçe için durdurma sözcüğü listesini seçer. |
StopwordsTokenFilter
Belirteç akışından durdurma sözcüklerini kaldırır. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır.
| Name | Tür | Default value | Description |
|---|---|---|---|
| @odata.type |
string:
#Microsoft. |
Belirteç filtresinin türünü belirten bir URI parçası. |
|
| ignoreCase |
boolean |
False |
Büyük/küçük harfin yok sayılıp sayılmayacağını belirten bir değer. Doğruysa, önce tüm sözcükler küçük harfe dönüştürülür. Varsayılan değer false'tur. |
| name |
string |
Belirteç filtresinin adı. Yalnızca harfler, rakamlar, boşluklar, kısa çizgiler veya alt çizgiler içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır. |
|
| removeTrailing |
boolean |
True |
Durdurma sözcüğü olması durumunda son arama teriminin yok sayılıp sayılmayacağını belirten bir değer. Varsayılan değer doğrudur |
| stopwords |
string[] |
Durdurma sözcüklerinin listesi. Bu özellik ve stopwords list özelliğinin her ikisi de ayarlanamaz. |
|
| stopwordsList | english |
Kullanılacak önceden tanımlanmış bir durdurma sözcükleri listesi. Bu özellik ve stopwords özelliğinin her ikisi de ayarlanamaz. Varsayılan değer İngilizce'dir. |
Suggester
Suggest API'nin dizindeki bir alan grubuna nasıl uygulanması gerektiğini tanımlar.
| Name | Tür | Description |
|---|---|---|
| name |
string |
Önerenin adı. |
| searchMode |
Önerenin yeteneklerini gösteren bir değer. |
|
| sourceFields |
string[] |
Önerinin uygulandığı alan adlarının listesi. Her alan aranabilir olmalıdır. |
SuggesterSearchMode
Önerenin yeteneklerini gösteren bir değer.
| Değer | Description |
|---|---|
| analyzingInfixMatching |
Bir alandaki ardışık tam terimleri ve önekleri eşleştirir. Örneğin, 'En hızlı kahverengi tilki' alanı için 'hızlı' ve 'en hızlı kaş' sorgularının her ikisi de eşleşir. |
SynonymTokenFilter
Bir belirteç akışındaki tek veya çok sözcüklü eş anlamlılarla eşleşir. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır.
| Name | Tür | Default value | Description |
|---|---|---|---|
| @odata.type |
string:
#Microsoft. |
Belirteç filtresinin türünü belirten bir URI parçası. |
|
| expand |
boolean |
True |
Eş anlamlılar listesindeki tüm sözcüklerin (if => gösterimi kullanılmıyorsa) birbiriyle eşlenip eşlenmeyeceğini gösteren bir değer. Doğruysa, eşanlamlılar listesindeki tüm kelimeler (= gösterimi kullanılmazsa> ) birbiriyle eşlenir. Aşağıdaki liste: inanılmaz, inanılmaz, muhteşem, şaşırtıcı: inanılmaz, inanılmaz, muhteşem, şaşırtıcı => inanılmaz, inanılmaz, muhteşem, şaşırtıcı. Yanlışsa, aşağıdaki liste: inanılmaz, inanılmaz, muhteşem, şaşırtıcı şuna eşdeğer olacaktır: inanılmaz, inanılmaz, muhteşem, şaşırtıcı => inanılmaz. Varsayılan değer doğrudur |
| ignoreCase |
boolean |
False |
Eşleştirme için büyük/küçük harf katlamalı girişin yapılıp yapılmayacağını gösteren bir değer. Varsayılan değer false'tur. |
| name |
string |
Belirteç filtresinin adı. Yalnızca harfler, rakamlar, boşluklar, kısa çizgiler veya alt çizgiler içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır. |
|
| synonyms |
string[] |
Aşağıdaki iki biçimdeki eş anlamlıların listesi: 1. inanılmaz, inanılmaz, muhteşem => şaşırtıcı - => sembolünün sol tarafındaki tüm terimler, sağ tarafındaki tüm terimlerle değiştirilecektir; 2. İnanılmaz, inanılmaz, muhteşem, şaşırtıcı - eşdeğer kelimelerin virgülle ayrılmış listesi. Bu listenin yorumlanma şeklini değiştirmek için genişletme seçeneğini ayarlayın. |
TagScoringFunction
Belirli bir etiket listesiyle eşleşen dize değerlerine sahip belgelerin puanlarını artıran bir işlev tanımlar.
| Name | Tür | Description |
|---|---|---|
| boost |
number (double) |
Ham puan için bir çarpan. 1.0'a eşit olmayan pozitif bir sayı olmalıdır. |
| fieldName |
string |
Puanlama işlevine giriş olarak kullanılan alanın adı. |
| interpolation |
Yükseltmenin belge puanları arasında nasıl enterpolasyon yapılacağını gösteren bir değer; varsayılan olarak "Doğrusal" olarak ayarlanır. |
|
| tag |
Etiket puanlama işlevi için parametre değerleri. |
|
| type |
string:
tag |
Kullanılacak işlevin türünü belirtir. Geçerli değerler büyüklük, tazelik, uzaklık ve etiketi içerir. İşlev türü küçük harf olmalıdır. |
TagScoringParameters
Etiket puanlama işlevine parametre değerleri sağlar.
| Name | Tür | Description |
|---|---|---|
| tagsParameter |
string |
Hedef alanla karşılaştırılacak etiketlerin listesini belirtmek için arama sorgularında geçirilen parametrenin adı. |
TextWeights
Eşleşmelerin arama sorgularında puanlamayı artırması gereken dizin alanlarındaki ağırlıkları tanımlar.
| Name | Tür | Description |
|---|---|---|
| weights |
object |
Belge puanlamasını artırmak için alan başına ağırlıklar sözlüğü. Anahtarlar alan adlarıdır ve değerler her alanın ağırlıklarıdır. |
TokenCharacterKind
Belirteç filtresinin üzerinde çalışabileceği karakter sınıflarını temsil eder.
| Değer | Description |
|---|---|
| letter |
Harfleri jeton halinde tutar. |
| digit |
Rakamları jetonlarda tutar. |
| whitespace |
Boşlukları belirteçlerde tutar. |
| punctuation |
Noktalama işaretlerini belirteçlerde tutar. |
| symbol |
Sembolleri jetonlarda tutar. |
TokenFilterName
Arama motoru tarafından desteklenen tüm belirteç filtrelerinin adlarını tanımlar.
TruncateTokenFilter
Terimleri belirli bir uzunlukta keser. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır.
| Name | Tür | Default value | Description |
|---|---|---|---|
| @odata.type |
string:
#Microsoft. |
Belirteç filtresinin türünü belirten bir URI parçası. |
|
| length |
integer (int32) maximum: 300 |
300 |
Terimlerin kısaltılacağı uzunluk. Varsayılan ve maksimum 300'dür. |
| name |
string |
Belirteç filtresinin adı. Yalnızca harfler, rakamlar, boşluklar, kısa çizgiler veya alt çizgiler içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır. |
UaxUrlEmailTokenizer
URL'leri ve e-postaları tek bir belirteç olarak belirteçleştirir. Bu belirteç oluşturucu Apache Lucene kullanılarak uygulanır.
| Name | Tür | Default value | Description |
|---|---|---|---|
| @odata.type |
string:
#Microsoft. |
Belirteç oluşturucu türünü belirten bir URI parçası. |
|
| maxTokenLength |
integer (int32) maximum: 300 |
255 |
Maksimum belirteç uzunluğu. Varsayılan değer 255'tir. Maksimum uzunluktan daha uzun olan jetonlar bölünür. Kullanılabilecek maksimum belirteç uzunluğu 300 karakterdir. |
| name |
string |
Tokenizer'ın adı. Yalnızca harfler, rakamlar, boşluklar, kısa çizgiler veya alt çizgiler içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır. |
UniqueTokenFilter
Önceki belirteçle aynı metne sahip belirteçleri filtreler. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır.
| Name | Tür | Default value | Description |
|---|---|---|---|
| @odata.type |
string:
#Microsoft. |
Belirteç filtresinin türünü belirten bir URI parçası. |
|
| name |
string |
Belirteç filtresinin adı. Yalnızca harfler, rakamlar, boşluklar, kısa çizgiler veya alt çizgiler içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır. |
|
| onlyOnSamePosition |
boolean |
False |
Yalnızca aynı konumdaki kopyaların kaldırılıp kaldırılmayacağını belirten bir değer. Varsayılan değer false'tur. |
VectorEncodingFormat
Vektör alanı içeriklerini yorumlamak için kodlama biçimi.
| Değer | Description |
|---|---|
| packedBit |
Daha geniş bir veri türüne paketlenmiş bitleri temsil eden kodlama biçimi. |
VectorSearch
Vektör arama ile ilgili yapılandırma seçeneklerini içerir.
| Name | Tür | Description |
|---|---|---|
| algorithms | VectorSearchAlgorithmConfiguration[]: |
Dizin oluşturma veya sorgulama sırasında kullanılan algoritmaya özgü yapılandırma seçeneklerini içerir. |
| compressions | VectorSearchCompressionConfiguration[]: |
Dizin oluşturma veya sorgulama sırasında kullanılan sıkıştırma yöntemine özgü yapılandırma seçeneklerini içerir. |
| profiles |
Vektör aramasıyla kullanılacak konfigürasyon kombinasyonlarını tanımlar. |
|
| vectorizers | VectorSearchVectorizer[]: |
Metin vektör sorgularının nasıl vektörleştirileceğine ilişkin yapılandırma seçeneklerini içerir. |
VectorSearchAlgorithmKind
Dizin oluşturma ve sorgulama için kullanılan algoritma.
| Değer | Description |
|---|---|
| hnsw |
HNSW (Hiyerarşik Gezilebilir Küçük Dünya), bir tür yaklaşık en yakın komşular algoritması. |
| exhaustiveKnn |
Kaba kuvvet araması yapacak kapsamlı KNN algoritması. |
VectorSearchAlgorithmMetric
Vektör karşılaştırmaları için kullanılacak benzerlik metriği. Ekleme modelinin eğitildiği benzerlik metriğinin seçilmesi önerilir.
| Değer | Description |
|---|---|
| cosine |
Büyüklükleri göz ardı ederek benzerliklerini ölçmek için vektörler arasındaki açıyı ölçer. Açı ne kadar küçük olursa, benzerlik o kadar yakın olur. |
| euclidean |
Çok boyutlu bir uzayda vektörler arasındaki düz çizgi mesafesini hesaplar. Mesafe ne kadar küçük olursa, benzerlik o kadar yakın olur. |
| dotProduct |
Hizalama ve büyüklük benzerliğini ölçmek için öğe bazında ürünlerin toplamını hesaplar. Daha büyük ve ne kadar olumluysa, benzerlik o kadar yakın olur. |
| hamming |
Yalnızca bit paketli ikili veri türleri için geçerlidir. İkili vektörlerdeki farklı konumları sayarak farklılığı belirler. Farklılıklar ne kadar az olursa, benzerlik o kadar yakın olur. |
VectorSearchCompressionKind
Dizin oluşturma ve sorgulama için kullanılan sıkıştırma yöntemi.
| Değer | Description |
|---|---|
| scalarQuantization |
Skaler Kuantizasyon, bir tür sıkıştırma yöntemi. Skaler nicelemede, orijinal vektör değerleri, azaltılmış bir nicelenmiş değerler kümesi kullanılarak bir vektörün her bir bileşenini ayrıklaştırarak ve temsil ederek daha dar bir türe sıkıştırılır, böylece genel veri boyutu küçültülür. |
| binaryQuantization |
İkili Niceleme, bir tür sıkıştırma yöntemi. İkili nicelemede, orijinal vektör değerleri, ikili değerler kullanılarak bir vektörün her bir bileşenini ayrıklaştırarak ve temsil ederek daha dar ikili türe sıkıştırılır, böylece genel veri boyutu azaltılır. |
VectorSearchCompressionRescoreStorageMethod
Yeniden puanlama ve dahili dizin işlemleri için kullanılan orijinal tam duyarlıklı vektörler için depolama yöntemi.
| Değer | Description |
|---|---|
| preserveOriginals |
Bu seçenek, orijinal tam duyarlıklı vektörleri korur. Maksimum esneklik ve sıkıştırılmış arama sonuçlarının en yüksek kalitesi için bu seçeneği belirleyin. Bu, daha fazla depolama alanı tüketir ancak yeniden puanlamaya ve yüksek hızda örneklemeye izin verir. |
| discardOriginals |
Bu seçenek, orijinal tam duyarlıklı vektörleri atar. Maksimum depolama tasarrufu için bu seçeneği belirleyin. Bu seçenek yeniden puanlamaya ve aşırı örneklemeye izin vermediğinden, genellikle kalitede hafif ila orta derecede düşüşlere neden olur. |
VectorSearchCompressionTargetDataType
Sıkıştırılmış vektör değerlerinin nicelleştirilmiş veri türü.
| Değer | Description |
|---|---|
| int8 |
VectorSearchProfile
Vektör aramasıyla kullanılacak konfigürasyonların bir kombinasyonunu tanımlar.
| Name | Tür | Description |
|---|---|---|
| algorithm |
string |
Algoritmayı ve isteğe bağlı parametreleri belirten vektör arama algoritması yapılandırmasının adı. |
| compression |
string |
Sıkıştırma yöntemini ve isteğe bağlı parametreleri belirten sıkıştırma yöntemi yapılandırmasının adı. |
| name |
string |
Bu belirli vektör arama profiliyle ilişkilendirilecek ad. |
| vectorizer |
string |
Vektör aramasıyla kullanılmak üzere yapılandırılan vektörleştirmenin adı. |
VectorSearchVectorizerKind
Sorgu sırasında kullanılacak vektörleştirme yöntemi.
| Değer | Description |
|---|---|
| azureOpenAI |
Sorgu zamanında bir Azure OpenAI kaynağı kullanarak eklemeler oluşturun. |
| customWebApi |
Sorgu zamanında özel bir web uç noktası kullanarak eklemeler oluşturun. |
WebApiParameters
Kullanıcı tanımlı bir vektörleştiriciye bağlanmak için özellikleri belirtir.
| Name | Tür | Description |
|---|---|---|
| authIdentity | SearchIndexerDataIdentity: |
Giden bağlantılar için kullanılan, kullanıcı tarafından atanan yönetilen kimlik. Bir authResourceId sağlanırsa ve belirtilmezse, sistem tarafından atanan yönetilen kimlik kullanılır. Dizin oluşturucuda yapılan güncelleştirmelerde, kimlik belirtilmemişse değer değişmeden kalır. "Yok" olarak ayarlanırsa, bu özelliğin değeri temizlenir. |
| authResourceId |
string |
Bir Azure işlevindeki dış koda veya dönüştürmeleri sağlayan başka bir uygulamaya bağlanan özel uç noktalar için geçerlidir. Bu değer, Azure Active Directory'ye kaydedildiğinde işlev veya uygulama için oluşturulan uygulama kimliği olmalıdır. Belirtildiğinde, vektörleştirme, arama hizmetinin yönetilen kimliğini (sistem veya kullanıcı tarafından atanan) ve işlevin veya uygulamanın erişim belirtecini kullanarak işleve veya uygulamaya bağlanır ve bu değeri erişim belirtecinin kapsamını oluşturmak için kaynak kimliği olarak kullanır. |
| httpHeaders |
object |
HTTP isteğinde bulunmak için gereken üst bilgiler. |
| httpMethod |
string |
HTTP isteğinin yöntemi. |
| timeout |
string (duration) |
İstek için istenen zaman aşımı. Varsayılan değer 30 saniyedir. |
| uri |
string (uri) |
Vektörleştiriciyi sağlayan Web API'sinin URI'si. |
WebApiVectorizer
Bir sorgu dizesinin vektör katıştırmasını oluşturmak için kullanıcı tanımlı bir vektörleştirici belirtir. Harici bir vektörleştiricinin entegrasyonu, bir beceri kümesinin özel Web API arabirimi kullanılarak gerçekleştirilir.
| Name | Tür | Description |
|---|---|---|
| customWebApiParameters |
Kullanıcı tanımlı vektörleştiricinin özelliklerini belirtir. |
|
| kind |
string:
custom |
Vektör aramasıyla kullanılmak üzere yapılandırılan vektörleştirme yönteminin adı. |
| name |
string |
Bu özel vektörleştirme yöntemiyle ilişkilendirilecek ad. |
WordDelimiterTokenFilter
Sözcükleri alt sözcüklere böler ve alt sözcük gruplarında isteğe bağlı dönüştürmeler gerçekleştirir. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır.
| Name | Tür | Default value | Description |
|---|---|---|---|
| @odata.type |
string:
#Microsoft. |
Belirteç filtresinin türünü belirten bir URI parçası. |
|
| catenateAll |
boolean |
False |
Tüm alt sözcük bölümlerinin kategorilere ayrılıp ayrılmayacağını belirten bir değer. Örneğin, bu doğru olarak ayarlanırsa, "Azure-Search-1", "AzureSearch1" olur. Varsayılan değer false'tur. |
| catenateNumbers |
boolean |
False |
Sayı parçalarının maksimum sayıda çalışmasının kategorilere ayrılıp ayrılmayacağını gösteren bir değer. Örneğin, bu doğru olarak ayarlanırsa, "1-2", "12" olur. Varsayılan değer false'tur. |
| catenateWords |
boolean |
False |
Sözcük parçalarının en fazla sayıda çalıştırılıp sonlandırılmayacağını belirten bir değer. Örneğin, bu doğru olarak ayarlanırsa, "Azure-Search" "AzureSearch" olur. Varsayılan değer false'tur. |
| generateNumberParts |
boolean |
True |
Sayı alt sözcüklerinin oluşturulup oluşturulmayacağını gösteren bir değer. Varsayılan değer doğrudur |
| generateWordParts |
boolean |
True |
Parça sözcüklerinin oluşturulup oluşturulmayacağını gösteren bir değer. Ayarlanırsa, kelimelerin bölümlerinin oluşturulmasına neden olur; örneğin, "AzureSearch", "Azure", "Arama" olur. Varsayılan değer doğrudur |
| name |
string |
Belirteç filtresinin adı. Yalnızca harfler, rakamlar, boşluklar, kısa çizgiler veya alt çizgiler içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır. |
|
| preserveOriginal |
boolean |
False |
Orijinal sözcüklerin korunup korunmayacağını ve alt sözcük listesine eklenip eklenmeyeceğini belirten bir değer. Varsayılan değer false'tur. |
| protectedWords |
string[] |
Sınırlandırılmaktan korunacak belirteçlerin listesi. |
|
| splitOnCaseChange |
boolean |
True |
caseChange üzerinde sözcüklerin bölünüp bölünmeyeceğini gösteren bir değer. Örneğin, bu doğru olarak ayarlanırsa, "AzureSearch", "Azure" "Search" olur. Varsayılan değer doğrudur |
| splitOnNumerics |
boolean |
True |
Sayılara bölünüp bölünmeyeceğini gösteren bir değer. Örneğin, bu doğru olarak ayarlanırsa, "Azure1Search", "Azure" "1" "Arama" olur. Varsayılan değer doğrudur |
| stemEnglishPossessive |
boolean |
True |
Her alt sözcük için sondaki "'ler"in kaldırılıp kaldırılmayacağını belirten bir değer. Varsayılan değer doğrudur |