Indexes - Create Or Update
Yeni bir arama dizini oluşturur veya zaten varsa dizini güncelleştirir.
PUT {endpoint}/indexes('{indexName}')?api-version=2024-07-01
PUT {endpoint}/indexes('{indexName}')?allowIndexDowntime={allowIndexDowntime}&api-version=2024-07-01
URI Parametreleri
Name | İçinde | Gerekli | Tür | Description |
---|---|---|---|---|
endpoint
|
path | True |
string |
Arama hizmetinin uç nokta URL'si. |
index
|
path | True |
string |
Oluşturulacak veya güncelleştirilecek dizinin tanımı. |
api-version
|
query | True |
string |
İstemci Api Sürümü. |
allow
|
query |
boolean |
Dizini en az birkaç saniye çevrimdışına alarak yeni çözümleyicilerin, belirteçlerin, belirteç filtrelerinin veya karakter filtrelerinin dizine eklenmesine izin verir. Bu, dizin oluşturma ve sorgu isteklerinin geçici olarak başarısız olmasına neden olur. Dizinin performansı ve yazma kullanılabilirliği, dizin güncelleştirildikten sonra birkaç dakika veya çok büyük dizinler için daha uzun süre bozulabilir. |
İstek Başlığı
Name | Gerekli | Tür | Description |
---|---|---|---|
x-ms-client-request-id |
string uuid |
Hata ayıklamaya yardımcı olmak için istekle birlikte gönderilen izleme kimliği. |
|
If-Match |
string |
If-Match koşulunu tanımlar. İşlem yalnızca sunucudaki ETag bu değerle eşleşiyorsa gerçekleştirilir. |
|
If-None-Match |
string |
If-None-Match koşulunu tanımlar. İşlem yalnızca sunucudaki ETag bu değerle eşleşmiyorsa gerçekleştirilir. |
|
Prefer | True |
string |
HTTP PUT istekleri için, hizmete başarılı olduğunda oluşturulan/güncelleştirilen kaynağı döndürmesini bildirir. |
İstek Gövdesi
Name | Gerekli | Tür | Description |
---|---|---|---|
fields | True |
Dizinin alanları. |
|
name | True |
string |
Dizinin adı. |
@odata.etag |
string |
Dizinin ETag'i. |
|
analyzers | LexicalAnalyzer[]: |
Dizin için çözümleyiciler. |
|
charFilters | CharFilter[]: |
Dizin için karakter filtreleri. |
|
corsOptions |
Dizin için Çıkış Noktaları Arası Kaynak Paylaşımını (CORS) denetleme seçenekleri. |
||
defaultScoringProfile |
string |
Sorguda belirtilmemişse kullanılacak puanlama profilinin adı. Bu özellik ayarlanmazsa ve sorguda puanlama profili belirtilmezse, varsayılan puanlama (tf-idf) kullanılır. |
|
encryptionKey |
Azure Key Vault'ta oluşturduğunuz bir şifreleme anahtarının açıklaması. Bu anahtar, Microsoft'un bile değil kimsenin verilerinizin şifresini çözemediğini tam olarak güvenceye almak istediğinizde verileriniz için bekleyen ek bir şifreleme düzeyi sağlamak için kullanılır. Verilerinizi şifreledikten sonra her zaman şifrelenmiş olarak kalır. Arama hizmeti bu özelliği null olarak ayarlama girişimlerini yoksayar. Şifreleme anahtarınızı döndürmek istiyorsanız bu özelliği gerektiği gibi değiştirebilirsiniz; Verileriniz etkilenmez. Müşteri tarafından yönetilen anahtarlarla şifreleme, ücretsiz arama hizmetlerinde kullanılamaz ve yalnızca 1 Ocak 2019 veya sonrasında oluşturulan ücretli hizmetler için kullanılabilir. |
||
scoringProfiles |
Dizin için puanlama profilleri. |
||
semantic |
Anlamsal özellikleri etkileyen bir arama dizini için parametreleri tanımlar. |
||
similarity | Similarity: |
Arama sorgusuyla eşleşen belgeleri puanlama ve derecelendirme sırasında kullanılacak benzerlik algoritmasının türü. Benzerlik algoritması yalnızca dizin oluşturma zamanında tanımlanabilir ve mevcut dizinlerde değiştirilemez. Null ise ClassicSimilarity algoritması kullanılır. |
|
suggesters |
Dizin için öneride bulunanlar. |
||
tokenFilters |
TokenFilter[]:
|
Belirteç, dizin için filtreler. |
|
tokenizers | LexicalTokenizer[]: |
Dizin için belirteç oluşturucular. |
|
vectorSearch |
Vektör araması ile ilgili yapılandırma seçeneklerini içerir. |
Yanıtlar
Name | Tür | Description |
---|---|---|
200 OK | ||
201 Created | ||
Other Status Codes |
Hata yanıtı. |
Örnekler
SearchServiceCreateOrUpdateIndex
Örnek isteği
PUT https://myservice.search.windows.net/indexes('hotels')?allowIndexDowntime=False&api-version=2024-07-01
{
"name": "hotels",
"fields": [
{
"name": "hotelId",
"type": "Edm.String",
"key": true,
"searchable": false
},
{
"name": "baseRate",
"type": "Edm.Double"
},
{
"name": "description",
"type": "Edm.String",
"filterable": false,
"sortable": false,
"facetable": false
},
{
"name": "descriptionEmbedding",
"type": "Collection(Edm.Single)",
"dimensions": 1536,
"vectorSearchProfile": "myHnswProfile",
"searchable": true,
"retrievable": true
},
{
"name": "description_fr",
"type": "Edm.String",
"filterable": false,
"sortable": false,
"facetable": false,
"analyzer": "fr.lucene"
},
{
"name": "hotelName",
"type": "Edm.String"
},
{
"name": "category",
"type": "Edm.String"
},
{
"name": "tags",
"type": "Collection(Edm.String)",
"analyzer": "tagsAnalyzer"
},
{
"name": "parkingIncluded",
"type": "Edm.Boolean"
},
{
"name": "smokingAllowed",
"type": "Edm.Boolean"
},
{
"name": "lastRenovationDate",
"type": "Edm.DateTimeOffset"
},
{
"name": "rating",
"type": "Edm.Int32"
},
{
"name": "location",
"type": "Edm.GeographyPoint"
}
],
"scoringProfiles": [
{
"name": "geo",
"text": {
"weights": {
"hotelName": 5
}
},
"functions": [
{
"type": "distance",
"boost": 5,
"fieldName": "location",
"interpolation": "logarithmic",
"distance": {
"referencePointParameter": "currentLocation",
"boostingDistance": 10
}
}
]
}
],
"defaultScoringProfile": "geo",
"suggesters": [
{
"name": "sg",
"searchMode": "analyzingInfixMatching",
"sourceFields": [
"hotelName"
]
}
],
"analyzers": [
{
"name": "tagsAnalyzer",
"@odata.type": "#Microsoft.Azure.Search.CustomAnalyzer",
"charFilters": [
"html_strip"
],
"tokenizer": "standard_v2"
}
],
"corsOptions": {
"allowedOrigins": [
"tempuri.org"
],
"maxAgeInSeconds": 60
},
"encryptionKey": {
"keyVaultKeyName": "myUserManagedEncryptionKey-createdinAzureKeyVault",
"keyVaultKeyVersion": "myKeyVersion-32charAlphaNumericString",
"keyVaultUri": "https://myKeyVault.vault.azure.net",
"accessCredentials": null
},
"similarity": {
"@odata.type": "#Microsoft.Azure.Search.ClassicSimilarity"
},
"semantic": {
"configurations": [
{
"name": "semanticHotels",
"prioritizedFields": {
"titleField": {
"fieldName": "hotelName"
},
"prioritizedContentFields": [
{
"fieldName": "description"
},
{
"fieldName": "description_fr"
}
],
"prioritizedKeywordsFields": [
{
"fieldName": "tags"
},
{
"fieldName": "category"
}
]
}
}
]
},
"vectorSearch": {
"profiles": [
{
"name": "myHnswProfile",
"algorithm": "myHnsw"
},
{
"name": "myAlgorithm",
"algorithm": "myExhaustive"
}
],
"algorithms": [
{
"name": "myHnsw",
"kind": "hnsw",
"hnswParameters": {
"m": 4,
"metric": "cosine"
}
},
{
"name": "myExhaustive",
"kind": "exhaustiveKnn",
"exhaustiveKnnParameters": {
"metric": "cosine"
}
}
]
}
}
Örnek yanıt
{
"name": "hotels",
"fields": [
{
"name": "hotelId",
"type": "Edm.String",
"searchable": false,
"filterable": true,
"retrievable": true,
"sortable": true,
"facetable": true,
"key": true,
"indexAnalyzer": null,
"searchAnalyzer": null,
"analyzer": null,
"dimensions": null,
"vectorSearchProfile": null,
"synonymMaps": []
},
{
"name": "baseRate",
"type": "Edm.Double",
"searchable": false,
"filterable": true,
"retrievable": true,
"sortable": true,
"facetable": true,
"key": false,
"indexAnalyzer": null,
"searchAnalyzer": null,
"analyzer": null,
"dimensions": null,
"vectorSearchProfile": null,
"synonymMaps": []
},
{
"name": "description",
"type": "Edm.String",
"searchable": true,
"filterable": false,
"retrievable": true,
"sortable": false,
"facetable": false,
"key": false,
"indexAnalyzer": null,
"searchAnalyzer": null,
"analyzer": null,
"dimensions": null,
"vectorSearchProfile": null,
"synonymMaps": []
},
{
"name": "descriptionEmbedding",
"type": "Collection(Edm.Single)",
"searchable": true,
"filterable": false,
"retrievable": true,
"sortable": false,
"facetable": false,
"key": false,
"indexAnalyzer": null,
"searchAnalyzer": null,
"analyzer": null,
"dimensions": 1536,
"vectorSearchProfile": "myHnswProfile",
"synonymMaps": []
},
{
"name": "description_fr",
"type": "Edm.String",
"searchable": true,
"filterable": false,
"retrievable": true,
"sortable": false,
"facetable": false,
"key": false,
"indexAnalyzer": null,
"searchAnalyzer": null,
"analyzer": "fr.lucene",
"dimensions": null,
"vectorSearchProfile": null,
"synonymMaps": []
},
{
"name": "hotelName",
"type": "Edm.String",
"searchable": true,
"filterable": true,
"retrievable": true,
"sortable": true,
"facetable": true,
"key": false,
"indexAnalyzer": null,
"searchAnalyzer": null,
"analyzer": null,
"dimensions": null,
"vectorSearchProfile": null,
"synonymMaps": []
},
{
"name": "category",
"type": "Edm.String",
"searchable": true,
"filterable": true,
"retrievable": true,
"sortable": true,
"facetable": true,
"key": false,
"indexAnalyzer": null,
"searchAnalyzer": null,
"analyzer": null,
"dimensions": null,
"vectorSearchProfile": null,
"synonymMaps": []
},
{
"name": "tags",
"type": "Collection(Edm.String)",
"searchable": true,
"filterable": true,
"retrievable": true,
"sortable": false,
"facetable": true,
"key": false,
"indexAnalyzer": null,
"searchAnalyzer": null,
"analyzer": "tagsAnalyzer",
"dimensions": null,
"vectorSearchProfile": null,
"synonymMaps": []
},
{
"name": "parkingIncluded",
"type": "Edm.Boolean",
"searchable": false,
"filterable": true,
"retrievable": true,
"sortable": true,
"facetable": true,
"key": false,
"indexAnalyzer": null,
"searchAnalyzer": null,
"analyzer": null,
"dimensions": null,
"vectorSearchProfile": null,
"synonymMaps": []
},
{
"name": "smokingAllowed",
"type": "Edm.Boolean",
"searchable": false,
"filterable": true,
"retrievable": true,
"sortable": true,
"facetable": true,
"key": false,
"indexAnalyzer": null,
"searchAnalyzer": null,
"analyzer": null,
"dimensions": null,
"vectorSearchProfile": null,
"synonymMaps": []
},
{
"name": "lastRenovationDate",
"type": "Edm.DateTimeOffset",
"searchable": false,
"filterable": true,
"retrievable": true,
"sortable": true,
"facetable": true,
"key": false,
"indexAnalyzer": null,
"searchAnalyzer": null,
"analyzer": null,
"dimensions": null,
"vectorSearchProfile": null,
"synonymMaps": []
},
{
"name": "rating",
"type": "Edm.Int32",
"searchable": false,
"filterable": true,
"retrievable": true,
"sortable": true,
"facetable": true,
"key": false,
"indexAnalyzer": null,
"searchAnalyzer": null,
"analyzer": null,
"dimensions": null,
"vectorSearchProfile": null,
"synonymMaps": []
},
{
"name": "location",
"type": "Edm.GeographyPoint",
"searchable": false,
"filterable": true,
"retrievable": true,
"sortable": true,
"facetable": false,
"key": false,
"indexAnalyzer": null,
"searchAnalyzer": null,
"analyzer": null,
"dimensions": null,
"vectorSearchProfile": null,
"synonymMaps": []
}
],
"scoringProfiles": [
{
"name": "geo",
"functionAggregation": "sum",
"text": {
"weights": {
"hotelName": 5
}
},
"functions": [
{
"type": "distance",
"boost": 5,
"fieldName": "location",
"interpolation": "logarithmic",
"distance": {
"referencePointParameter": "currentLocation",
"boostingDistance": 10
}
}
]
}
],
"defaultScoringProfile": "geo",
"suggesters": [
{
"name": "sg",
"searchMode": "analyzingInfixMatching",
"sourceFields": [
"hotelName"
]
}
],
"analyzers": [
{
"name": "tagsAnalyzer",
"@odata.type": "#Microsoft.Azure.Search.CustomAnalyzer",
"charFilters": [
"html_strip"
],
"tokenizer": "standard_v2"
}
],
"tokenizers": [],
"tokenFilters": [],
"charFilters": [],
"corsOptions": {
"allowedOrigins": [
"tempuri.org"
],
"maxAgeInSeconds": 60
},
"encryptionKey": {
"keyVaultKeyName": "myUserManagedEncryptionKey-createdinAzureKeyVault",
"keyVaultKeyVersion": "myKeyVersion-32charAlphaNumericString",
"keyVaultUri": "https://myKeyVault.vault.azure.net",
"accessCredentials": null
},
"similarity": {
"@odata.type": "#Microsoft.Azure.Search.ClassicSimilarity"
},
"semantic": {
"configurations": [
{
"name": "semanticHotels",
"prioritizedFields": {
"titleField": {
"fieldName": "hotelName"
},
"prioritizedContentFields": [
{
"fieldName": "description"
},
{
"fieldName": "description_fr"
}
],
"prioritizedKeywordsFields": [
{
"fieldName": "tags"
},
{
"fieldName": "category"
}
]
}
}
]
},
"vectorSearch": {
"algorithms": [
{
"name": "myHnsw",
"kind": "hnsw",
"hnswParameters": {
"metric": "cosine",
"m": 4,
"efConstruction": 400,
"efSearch": 500
}
},
{
"name": "myExhaustive",
"kind": "exhaustiveKnn",
"exhaustiveKnnParameters": {
"metric": "cosine"
}
}
],
"profiles": [
{
"name": "myHnswProfile",
"algorithm": "myHnsw"
},
{
"name": "myAlgorithm",
"algorithm": "myExhaustive"
}
]
}
}
{
"name": "hotels",
"fields": [
{
"name": "hotelId",
"type": "Edm.String",
"searchable": false,
"filterable": true,
"retrievable": true,
"sortable": true,
"facetable": true,
"key": true,
"indexAnalyzer": null,
"searchAnalyzer": null,
"analyzer": null,
"dimensions": null,
"vectorSearchProfile": null,
"synonymMaps": []
},
{
"name": "baseRate",
"type": "Edm.Double",
"searchable": false,
"filterable": true,
"retrievable": true,
"sortable": true,
"facetable": true,
"key": false,
"indexAnalyzer": null,
"searchAnalyzer": null,
"analyzer": null,
"dimensions": null,
"vectorSearchProfile": null,
"synonymMaps": []
},
{
"name": "description",
"type": "Edm.String",
"searchable": true,
"filterable": false,
"retrievable": true,
"sortable": false,
"facetable": false,
"key": false,
"indexAnalyzer": null,
"searchAnalyzer": null,
"analyzer": null,
"dimensions": null,
"vectorSearchProfile": null,
"synonymMaps": []
},
{
"name": "descriptionEmbedding",
"type": "Collection(Edm.Single)",
"searchable": true,
"filterable": false,
"retrievable": true,
"sortable": false,
"facetable": false,
"key": false,
"indexAnalyzer": null,
"searchAnalyzer": null,
"analyzer": null,
"dimensions": 1536,
"vectorSearchProfile": "myHnswProfile",
"synonymMaps": []
},
{
"name": "description_fr",
"type": "Edm.String",
"searchable": true,
"filterable": false,
"retrievable": true,
"sortable": false,
"facetable": false,
"key": false,
"indexAnalyzer": null,
"searchAnalyzer": null,
"analyzer": "fr.lucene",
"dimensions": null,
"vectorSearchProfile": null,
"synonymMaps": []
},
{
"name": "hotelName",
"type": "Edm.String",
"searchable": true,
"filterable": true,
"retrievable": true,
"sortable": true,
"facetable": true,
"key": false,
"indexAnalyzer": null,
"searchAnalyzer": null,
"analyzer": null,
"dimensions": null,
"vectorSearchProfile": null,
"synonymMaps": []
},
{
"name": "category",
"type": "Edm.String",
"searchable": true,
"filterable": true,
"retrievable": true,
"sortable": true,
"facetable": true,
"key": false,
"indexAnalyzer": null,
"searchAnalyzer": null,
"analyzer": null,
"dimensions": null,
"vectorSearchProfile": null,
"synonymMaps": []
},
{
"name": "tags",
"type": "Collection(Edm.String)",
"searchable": true,
"filterable": true,
"retrievable": true,
"sortable": false,
"facetable": true,
"key": false,
"indexAnalyzer": null,
"searchAnalyzer": null,
"analyzer": "tagsAnalyzer",
"dimensions": null,
"vectorSearchProfile": null,
"synonymMaps": []
},
{
"name": "parkingIncluded",
"type": "Edm.Boolean",
"searchable": false,
"filterable": true,
"retrievable": true,
"sortable": true,
"facetable": true,
"key": false,
"indexAnalyzer": null,
"searchAnalyzer": null,
"analyzer": null,
"dimensions": null,
"vectorSearchProfile": null,
"synonymMaps": []
},
{
"name": "smokingAllowed",
"type": "Edm.Boolean",
"searchable": false,
"filterable": true,
"retrievable": true,
"sortable": true,
"facetable": true,
"key": false,
"indexAnalyzer": null,
"searchAnalyzer": null,
"analyzer": null,
"dimensions": null,
"vectorSearchProfile": null,
"synonymMaps": []
},
{
"name": "lastRenovationDate",
"type": "Edm.DateTimeOffset",
"searchable": false,
"filterable": true,
"retrievable": true,
"sortable": true,
"facetable": true,
"key": false,
"indexAnalyzer": null,
"searchAnalyzer": null,
"analyzer": null,
"dimensions": null,
"vectorSearchProfile": null,
"synonymMaps": []
},
{
"name": "rating",
"type": "Edm.Int32",
"searchable": false,
"filterable": true,
"retrievable": true,
"sortable": true,
"facetable": true,
"key": false,
"indexAnalyzer": null,
"searchAnalyzer": null,
"analyzer": null,
"dimensions": null,
"vectorSearchProfile": null,
"synonymMaps": []
},
{
"name": "location",
"type": "Edm.GeographyPoint",
"searchable": false,
"filterable": true,
"retrievable": true,
"sortable": true,
"facetable": false,
"key": false,
"indexAnalyzer": null,
"searchAnalyzer": null,
"analyzer": null,
"dimensions": null,
"vectorSearchProfile": null,
"synonymMaps": []
}
],
"scoringProfiles": [
{
"name": "geo",
"functionAggregation": "sum",
"text": {
"weights": {
"hotelName": 5
}
},
"functions": [
{
"type": "distance",
"boost": 5,
"fieldName": "location",
"interpolation": "logarithmic",
"distance": {
"referencePointParameter": "currentLocation",
"boostingDistance": 10
}
}
]
}
],
"defaultScoringProfile": "geo",
"suggesters": [
{
"name": "sg",
"searchMode": "analyzingInfixMatching",
"sourceFields": [
"hotelName"
]
}
],
"analyzers": [
{
"name": "tagsAnalyzer",
"@odata.type": "#Microsoft.Azure.Search.CustomAnalyzer",
"charFilters": [
"html_strip"
],
"tokenizer": "standard_v2"
}
],
"tokenizers": [],
"tokenFilters": [],
"charFilters": [],
"corsOptions": {
"allowedOrigins": [
"tempuri.org"
],
"maxAgeInSeconds": 60
},
"encryptionKey": {
"keyVaultKeyName": "myUserManagedEncryptionKey-createdinAzureKeyVault",
"keyVaultKeyVersion": "myKeyVersion-32charAlphaNumericString",
"keyVaultUri": "https://myKeyVault.vault.azure.net",
"accessCredentials": null
},
"semantic": {
"configurations": [
{
"name": "semanticHotels",
"prioritizedFields": {
"titleField": {
"fieldName": "hotelName"
},
"prioritizedContentFields": [
{
"fieldName": "description"
},
{
"fieldName": "description_fr"
}
],
"prioritizedKeywordsFields": [
{
"fieldName": "tags"
},
{
"fieldName": "category"
}
]
}
}
]
},
"vectorSearch": {
"algorithms": [
{
"name": "myHnsw",
"kind": "hnsw",
"hnswParameters": {
"metric": "cosine",
"m": 4,
"efConstruction": 400,
"efSearch": 500
}
},
{
"name": "myExhaustive",
"kind": "exhaustiveKnn",
"exhaustiveKnnParameters": {
"metric": "cosine"
}
}
],
"profiles": [
{
"name": "myHnswProfile",
"algorithm": "myHnsw"
},
{
"name": "myAlgorithm",
"algorithm": "myExhaustive"
}
]
}
}
Tanımlar
Name | Description |
---|---|
Ascii |
İlk 127 ASCII karakterde ("Temel Latin" Unicode bloğu) bulunmayan alfabetik, sayısal ve sembolik Unicode karakterlerini, bu eşdeğerler varsa ASCII eşdeğerlerine dönüştürür. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır. |
Azure |
Arama hizmetiniz için oluşturulan ve Azure Key Vault'ta depolanan şifreleme anahtarlarına kimliği doğrulanmış erişim için kullanılan kayıtlı bir uygulamanın kimlik bilgileri. |
Azure |
Azure OpenAI kaynağını kullanarak belirli bir metin girişi için vektör ekleme oluşturmanızı sağlar. |
Azure |
Çağrılacak Azure Open AI modeli adı. |
Azure |
Azure OpenAI kaynağına bağlanmak için parametreleri belirtir. |
Azure |
Sorgu dizesini vektörleştirmek için kullanılan Azure OpenAI kaynağını belirtir. |
Binary |
Dizin oluşturma ve sorgulama sırasında kullanılan ikili niceleme sıkıştırma yöntemine özgü yapılandırma seçeneklerini içerir. |
BM25Similarity |
Okapi BM25 benzerlik algoritmasını temel alan derecelendirme işlevi. BM25, uzunluk normalleştirmesi ('b' parametresi tarafından denetlenen) ve terim sıklığı doygunluğu ('k1' parametresiyle denetlenen) içeren TF-IDF benzeri bir algoritmadır. |
Char |
Arama altyapısı tarafından desteklenen tüm karakter filtrelerinin adlarını tanımlar. |
Cjk |
Standart belirteç oluşturucudan oluşturulan CJK terimlerinin büyük simgelerini oluşturur. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır. |
Cjk |
CjkBigramTokenFilter tarafından yoksayılabilir betikler. |
Classic |
TF-IDF'nin Lucene TFIDFSimilarity uygulamasını kullanan eski benzerlik algoritması. bu TF-IDF varyasyonu, statik belge uzunluğu normalleştirmesini ve arama yapılan sorgularla yalnızca kısmen eşleşen belgeleri cezalandıran faktörleri koordine eder. |
Classic |
Çoğu Avrupa dili belgesini işlemek için uygun olan dil bilgisi tabanlı belirteç oluşturucu. Bu belirteç oluşturucu Apache Lucene kullanılarak uygulanır. |
Common |
Dizin oluştururken sık karşılaşılan terimler için bigrams oluşturun. Tek terimler de dizine eklenir ve bigram'lar yer paylaşımlı olur. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır. |
Cors |
Dizin için Çıkış Noktaları Arası Kaynak Paylaşımını (CORS) denetleme seçeneklerini tanımlar. |
Custom |
Metni dizine alınabilen/aranabilir belirteçlere dönüştürme işlemi üzerinde denetim sahibi olmanıza olanak tanır. Önceden tanımlanmış tek bir belirteç oluşturucu ve bir veya daha fazla filtreden oluşan kullanıcı tanımlı bir yapılandırmadır. Belirteç oluşturucu, metinleri belirteçlere bölmek ve belirteç oluşturucu tarafından yayılan belirteçleri değiştirmek için filtrelerden sorumludur. |
Dictionary |
Birçok Almanca dilinde bulunan bileşik sözcükleri ayrıştırıyor. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır. |
Distance |
Coğrafi konumdan uzaklığı temel alarak puanları artıran bir işlev tanımlar. |
Distance |
Uzaklık puanlama işlevine parametre değerleri sağlar. |
Edge |
Giriş belirtecinin önünden veya arkasından başlayarak verilen boyutların n gramını oluşturur. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır. |
Edge |
Bir n-gram girişin hangi tarafından oluşturulması gerektiğini belirtir. |
Edge |
Giriş belirtecinin önünden veya arkasından başlayarak verilen boyutların n gramını oluşturur. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır. |
Edge |
Bir kenardan gelen girişi verilen boyutların n gramını belirteci haline getirmektedir. Bu belirteç oluşturucu Apache Lucene kullanılarak uygulanır. |
Elision |
İlanları kaldırır. Örneğin, "l'avion" (düzlem) "avion" (düzlem) olarak dönüştürülür. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır. |
Error |
Kaynak yönetimi hatası ek bilgileri. |
Error |
Hata ayrıntısı. |
Error |
Hata yanıtı |
Exhaustive |
Kapsamlı KNN algoritmasına özgü parametreleri içerir. |
Exhaustive |
Sorgulama sırasında kullanılan kapsamlı KNN algoritmasına özgü yapılandırma seçeneklerini içerir ve bu seçenek vektör dizininin tamamında deneme yanılma araması gerçekleştirir. |
Freshness |
Bir tarih-saat alanının değerine göre puanları artıran bir işlev tanımlar. |
Freshness |
Bir güncellik puanlama işlevine parametre değerleri sağlar. |
Hnsw |
HNSW algoritmasına özgü parametreleri içerir. |
Hnsw |
Dizin oluşturma ve sorgulama sırasında kullanılan HNSW yaklaşık en yakın komşular algoritmasına özgü yapılandırma seçeneklerini içerir. HNSW algoritması, arama hızı ve doğruluk arasında ayarlanabilir bir denge sağlar. |
Input |
Bir beceri için giriş alanı eşlemesi. |
Keep |
Belirteçleri yalnızca belirtilen sözcük listesinde yer alan metinle tutan bir belirteç filtresi. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır. |
Keyword |
Terimleri anahtar sözcük olarak işaretler. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır. |
Keyword |
Girişin tamamını tek bir belirteç olarak yayar. Bu belirteç oluşturucu Apache Lucene kullanılarak uygulanır. |
Keyword |
Girişin tamamını tek bir belirteç olarak yayar. Bu belirteç oluşturucu Apache Lucene kullanılarak uygulanır. |
Length |
Çok uzun veya çok kısa sözcükleri kaldırır. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır. |
Lexical |
Arama altyapısı tarafından desteklenen tüm metin çözümleyicilerinin adlarını tanımlar. |
Lexical |
Arama altyapısı tarafından desteklenen tüm belirteç oluşturucuların adlarını tanımlar. |
Limit |
Dizin oluşturma sırasında belirteç sayısını sınırlar. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır. |
Lucene |
Standart Apache Lucene çözümleyicisi; Standart belirteç oluşturucu, küçük harfli filtre ve durdurma filtresinden oluşur. |
Lucene |
Unicode Metin Kesimleme kurallarından sonra metni keser. Bu belirteç oluşturucu Apache Lucene kullanılarak uygulanır. |
Lucene |
Unicode Metin Kesimleme kurallarından sonra metni keser. Bu belirteç oluşturucu Apache Lucene kullanılarak uygulanır. |
Magnitude |
Sayısal alanın büyüklüğüne göre puanları artıran bir işlev tanımlar. |
Magnitude |
Bir büyük puanlama işlevine parametre değerleri sağlar. |
Mapping |
Eşlemeler seçeneğiyle tanımlanan eşlemeleri uygulayan karakter filtresi. Eşleştirme doyumsuzdur (belirli bir noktada en uzun desen eşleştirmesi kazanır). Değiştirmenin boş dize olması için izin verilir. Bu karakter filtresi Apache Lucene kullanılarak uygulanır. |
Microsoft |
Dile özgü kuralları kullanarak metni böler ve sözcükleri temel formlarına küçültür. |
Microsoft |
Dile özgü kuralları kullanarak metni böler. |
Microsoft |
Microsoft dil kaynak belirteci tarafından desteklenen dilleri listeler. |
Microsoft |
Microsoft dil belirteci tarafından desteklenen dilleri listeler. |
NGram |
Verilen boyutların n gramını oluşturur. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır. |
NGram |
Verilen boyutların n gramını oluşturur. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır. |
NGram |
Girişi verilen boyutların n gramını belirteci haline getirmektedir. Bu belirteç oluşturucu Apache Lucene kullanılarak uygulanır. |
Output |
Bir beceri için çıkış alanı eşlemesi. |
Path |
Yol benzeri hiyerarşiler için belirteç oluşturucu. Bu belirteç oluşturucu Apache Lucene kullanılarak uygulanır. |
Pattern |
Normal ifade deseni aracılığıyla metni esnek bir şekilde terimlere ayırır. Bu çözümleyici Apache Lucene kullanılarak uygulanır. |
Pattern |
Bir veya daha fazla desendeki her yakalama grubu için bir tane olmak üzere birden çok belirteç yaymak için Java regexes kullanır. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır. |
Pattern |
Giriş dizesindeki karakterlerin yerini alan karakter filtresi. Korunacak karakter dizilerini tanımlamak için normal bir ifade ve değiştirilecek karakterleri tanımlamak için bir değiştirme düzeni kullanır. Örneğin, "aa bb aa bb", desen "(aa)\s+(bb)" ve yerine "$1#$2" giriş metni verilmelidir, sonuç "aa#bb aa#bb" olacaktır. Bu karakter filtresi Apache Lucene kullanılarak uygulanır. |
Pattern |
Giriş dizesindeki karakterlerin yerini alan karakter filtresi. Korunacak karakter dizilerini tanımlamak için normal bir ifade ve değiştirilecek karakterleri tanımlamak için bir değiştirme düzeni kullanır. Örneğin, "aa bb aa bb", desen "(aa)\s+(bb)" ve yerine "$1#$2" giriş metni verilmelidir, sonuç "aa#bb aa#bb" olacaktır. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır. |
Pattern |
Farklı belirteçler oluşturmak için regex desen eşleştirmesi kullanan belirteç oluşturucu. Bu belirteç oluşturucu Apache Lucene kullanılarak uygulanır. |
Phonetic |
PhoneticTokenFilter ile kullanılacak fonetik kodlayıcının türünü tanımlar. |
Phonetic |
Fonetik eşleşmeler için belirteçler oluşturun. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır. |
Prioritized |
Anlam derecelendirmesi, açıklamalı alt yazılar, vurgular ve yanıtlar için kullanılacak başlık, içerik ve anahtar sözcük alanlarını açıklar. |
Regex |
Normal ifadelerin desen çözümleyicisinde ve desen belirtecinde nasıl kullanıldığını denetlemek için birleştirilebilen bayrakları tanımlar. |
Scalar |
Skaler Niceleme'ye özgü parametreleri içerir. |
Scalar |
Dizin oluşturma ve sorgulama sırasında kullanılan skaler niceleme sıkıştırma yöntemine özgü yapılandırma seçeneklerini içerir. |
Scoring |
Bir puanlama profilindeki tüm puanlama işlevlerinin sonuçlarını birleştirmek için kullanılan toplama işlevini tanımlar. |
Scoring |
Bir belge aralığında puan artırmayı ilişkilendirmek için kullanılan işlevi tanımlar. |
Scoring |
Arama sorgularında puanlama işlemini etkileyen bir arama dizininin parametrelerini tanımlar. |
Search |
Bir alanın adını, veri türünü ve arama davranışını açıklayan dizin tanımındaki bir alanı temsil eder. |
Search |
Arama dizinindeki bir alanın veri türünü tanımlar. |
Search |
Bir dizinin alanlarını ve arama davranışını açıklayan bir arama dizini tanımını temsil eder. |
Search |
Veri kaynağının kimlik özelliğini temizler. |
Search |
Kullanılacak veri kaynağının kimliğini belirtir. |
Search |
Azure Key Vault'ta müşteri tarafından yönetilen bir şifreleme anahtarı. Oluşturduğunuz ve yönettiğiniz anahtarlar, dizinler ve eş anlamlı haritalar gibi bekleyen verileri şifrelemek veya şifresini çözmek için kullanılabilir. |
Semantic |
Anlamsal özellikler bağlamında kullanılacak belirli bir yapılandırmayı tanımlar. |
Semantic |
Anlamsal yapılandırmanın bir parçası olarak kullanılan alan. |
Semantic |
Anlamsal özellikleri etkileyen bir arama dizini için parametreleri tanımlar. |
Shingle |
Belirteç birleşimlerini tek bir belirteç olarak oluşturur. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır. |
Snowball |
Snowball tarafından oluşturulan kök ayırıcı kullanarak sözcüklerin köklerini oluşturan bir filtre. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır. |
Snowball |
Snowball belirteci filtresi için kullanılacak dil. |
Stemmer |
Özel sözlük tabanlı kök oluşturma ile diğer kök filtreleme filtrelerini geçersiz kılma olanağı sağlar. Sözlük köküne sahip terimler anahtar sözcük olarak işaretlenir, böylece zincirdeki kök ayırıcılarla kaynaklanmaz. Herhangi bir köklendirme filtresinin önüne yerleştirilmelidir. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır. |
Stemmer |
Dile özgü gövde filtresi. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır. |
Stemmer |
Kökmer belirteci filtresi için kullanılacak dil. |
Stop |
Metni harf olmayanlara böler; Küçük harf ve stopword belirteci filtrelerini uygular. Bu çözümleyici Apache Lucene kullanılarak uygulanır. |
Stopwords |
Dile özgü stopword'lerin önceden tanımlanmış bir listesini tanımlar. |
Stopwords |
Belirteç akışından durdurma sözcüklerini kaldırır. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır. |
Suggester |
Öneri API'sinin dizindeki bir alan grubuna nasıl uygulanacağını tanımlar. |
Suggester |
Öneride bulunanın özelliklerini gösteren değer. |
Synonym |
Belirteç akışındaki tek veya çok sözcüklü eş anlamlılarla eşleşir. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır. |
Tag |
Belirli bir etiket listesiyle eşleşen dize değerleriyle belge puanlarını artıran bir işlev tanımlar. |
Tag |
Etiket puanlama işlevine parametre değerleri sağlar. |
Text |
Eşleşmelerin arama sorgularında puanlamanın artırılması gereken dizin alanlarında ağırlıkları tanımlar. |
Token |
Belirteç filtresinin üzerinde çalışabileceği karakter sınıflarını temsil eder. |
Token |
Arama altyapısı tarafından desteklenen tüm belirteç filtrelerinin adlarını tanımlar. |
Truncate |
Terimleri belirli bir uzunlukta kısaltın. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır. |
Uax |
Url'leri ve e-postaları tek bir belirteç olarak belirteçler. Bu belirteç oluşturucu Apache Lucene kullanılarak uygulanır. |
Unique |
Önceki belirteçle aynı metindeki belirteçleri filtreler. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır. |
Vector |
Vektör alanı içeriğini yorumlamak için kodlama biçimi. |
Vector |
Vektör araması ile ilgili yapılandırma seçeneklerini içerir. |
Vector |
Dizin oluşturma ve sorgulama için kullanılan algoritma. |
Vector |
Vektör karşılaştırmaları için kullanılacak benzerlik ölçümü. Ekleme modelinin eğitildiği benzerlik ölçümünü seçmeniz önerilir. |
Vector |
Dizin oluşturma ve sorgulama için kullanılan sıkıştırma yöntemi. |
Vector |
Sıkıştırılmış vektör değerlerinin nicelenmiş veri türü. |
Vector |
Vektör araması ile kullanılacak yapılandırmaların bir bileşimini tanımlar. |
Vector |
Sorgu zamanında kullanılacak vektörleştirme yöntemi. |
Web |
Kullanıcı tanımlı vektörleştiriciye bağlanma özelliklerini belirtir. |
Web |
Bir sorgu dizesinin vektör eklemesini oluşturmak için kullanıcı tanımlı bir vektörleştirici belirtir. Bir beceri kümesinin özel Web API arabirimi kullanılarak dış vektörleştiricinin tümleştirilmesi sağlanır. |
Word |
Sözcükleri alt sözcüklere böler ve alt sözcük gruplarında isteğe bağlı dönüştürmeler gerçekleştirir. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır. |
AsciiFoldingTokenFilter
İlk 127 ASCII karakterde ("Temel Latin" Unicode bloğu) bulunmayan alfabetik, sayısal ve sembolik Unicode karakterlerini, bu eşdeğerler varsa ASCII eşdeğerlerine dönüştürür. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır.
Name | Tür | Default value | Description |
---|---|---|---|
@odata.type |
string:
#Microsoft. |
Belirteç filtresinin türünü belirten bir URI parçası. |
|
name |
string |
Belirteç filtresinin adı. Yalnızca harf, basamak, boşluk, tire veya alt çizgi içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır. |
|
preserveOriginal |
boolean |
False |
Özgün belirtecin tutulup tutulmayacağını belirten bir değer. Varsayılan değer false'tur. |
AzureActiveDirectoryApplicationCredentials
Arama hizmetiniz için oluşturulan ve Azure Key Vault'ta depolanan şifreleme anahtarlarına kimliği doğrulanmış erişim için kullanılan kayıtlı bir uygulamanın kimlik bilgileri.
Name | Tür | Description |
---|---|---|
applicationId |
string |
Bekleyen verilerinizi şifrelerken kullanılacak Azure Key Vault'a gerekli erişim izinleri verilmiş bir AAD Uygulama Kimliği. Uygulama Kimliği, AAD Uygulamanızın Nesne Kimliği ile karıştırılmamalıdır. |
applicationSecret |
string |
Belirtilen AAD uygulamasının kimlik doğrulama anahtarı. |
AzureOpenAIEmbeddingSkill
Azure OpenAI kaynağını kullanarak belirli bir metin girişi için vektör ekleme oluşturmanızı sağlar.
Name | Tür | Description |
---|---|---|
@odata.type |
string:
#Microsoft. |
Beceri türünü belirten bir URI parçası. |
apiKey |
string |
Belirlenen Azure OpenAI kaynağının API anahtarı. |
authIdentity | SearchIndexerDataIdentity: |
Giden bağlantılar için kullanılan kullanıcı tarafından atanan yönetilen kimlik. |
context |
string |
Belge kök veya belge içeriği (örneğin, /document veya /document/content) gibi işlemlerin gerçekleştiği düzeyi temsil eder. Varsayılan değer /document'dır. |
deploymentId |
string |
Belirlenen kaynakta Azure OpenAI modeli dağıtımının kimliği. |
description |
string |
Becerinin girişlerini, çıkışlarını ve kullanımını açıklayan becerinin açıklaması. |
dimensions |
integer |
Sonuçta elde edilen çıktı eklemelerinin sahip olması gereken boyut sayısı. Yalnızca metin ekleme-3 ve üzeri modellerde desteklenir. |
inputs |
Becerilerin girişleri, kaynak veri kümesindeki bir sütun veya yukarı akış becerisinin çıkışı olabilir. |
|
modelName |
Sağlanan deploymentId yolunda dağıtılan ekleme modelinin adı. |
|
name |
string |
Beceri kümesi içinde benzersiz olarak tanımlayan becerinin adı. Tanımlı adı olmayan bir beceriye beceri dizisinde 1 tabanlı dizininin varsayılan adı verilir ve bu ada '#' karakteri eklenir. |
outputs |
Bir becerinin çıktısı, arama dizinindeki bir alan veya başka bir beceri tarafından giriş olarak kullanılabilecek bir değerdir. |
|
resourceUri |
string |
Azure OpenAI kaynağının kaynak URI'si. |
AzureOpenAIModelName
Çağrılacak Azure Open AI modeli adı.
Name | Tür | Description |
---|---|---|
text-embedding-3-large |
string |
|
text-embedding-3-small |
string |
|
text-embedding-ada-002 |
string |
AzureOpenAIParameters
Azure OpenAI kaynağına bağlanmak için parametreleri belirtir.
Name | Tür | Description |
---|---|---|
apiKey |
string |
Belirlenen Azure OpenAI kaynağının API anahtarı. |
authIdentity | SearchIndexerDataIdentity: |
Giden bağlantılar için kullanılan kullanıcı tarafından atanan yönetilen kimlik. |
deploymentId |
string |
Belirlenen kaynakta Azure OpenAI modeli dağıtımının kimliği. |
modelName |
Sağlanan deploymentId yolunda dağıtılan ekleme modelinin adı. |
|
resourceUri |
string |
Azure OpenAI kaynağının kaynak URI'si. |
AzureOpenAIVectorizer
Sorgu dizesini vektörleştirmek için kullanılan Azure OpenAI kaynağını belirtir.
Name | Tür | Description |
---|---|---|
azureOpenAIParameters | AzureOpenAIParameters: |
Azure OpenAI ekleme vektörleştirmesine özgü parametreleri içerir. |
kind |
string:
azure |
Vektör arama ile kullanılmak üzere yapılandırılan vektörleştirme yönteminin türü. |
name |
string |
Bu özel vektörleştirme yöntemiyle ilişkilendirilecek ad. |
BinaryQuantizationVectorSearchCompressionConfiguration
Dizin oluşturma ve sorgulama sırasında kullanılan ikili niceleme sıkıştırma yöntemine özgü yapılandırma seçeneklerini içerir.
Name | Tür | Default value | Description |
---|---|---|---|
defaultOversampling |
number |
Varsayılan fazla örnekleme faktörü. Fazla örnekleme, ilk aramada dahili olarak daha fazla belge (bu çarpan tarafından belirtilir) ister. Bu, tam duyarlıklı vektörlerden alınan yeniden derlenmiş benzerlik puanları kullanılarak yeniden dilimlenecek sonuç kümesini artırır. En düşük değer 1'dir, yani fazla örnekleme (1x). Bu parametre yalnızca rerankWithOriginalVectors true olduğunda ayarlanabilir. Daha yüksek değerler gecikme süresiyle geri çağırmayı iyileştirir. |
|
kind |
string:
binary |
Vektör araması ile kullanılmak üzere yapılandırılan sıkıştırma yönteminin türü. |
|
name |
string |
Bu özel yapılandırmayla ilişkilendirilecek ad. |
|
rerankWithOriginalVectors |
boolean |
True |
True olarak ayarlanırsa, sıkıştırılmış vektörler kullanılarak hesaplanan sıralı sonuç kümesi elde edildikten sonra, tam duyarlıklı benzerlik puanları yeniden hesaplanarak yeniden dilimlenir. Bu, gecikme süresine karşı geri çağırmayı iyileştirir. |
BM25Similarity
Okapi BM25 benzerlik algoritmasını temel alan derecelendirme işlevi. BM25, uzunluk normalleştirmesi ('b' parametresi tarafından denetlenen) ve terim sıklığı doygunluğu ('k1' parametresiyle denetlenen) içeren TF-IDF benzeri bir algoritmadır.
Name | Tür | Description |
---|---|---|
@odata.type |
string:
#Microsoft. |
|
b |
number |
Bu özellik, bir belgenin uzunluğunun ilgi puanını nasıl etkilediğini denetler. Varsayılan olarak 0,75 değeri kullanılır. 0,0 değeri uzunluk normalleştirmesi uygulanmadığı, 1,0 değeri ise puanın belgenin uzunluğuna göre tamamen normalleştirildiği anlamına gelir. |
k1 |
number |
Bu özellik, her eşleşen terimlerin terim sıklığı ile belge sorgusu çiftinin son ilgi puanı arasındaki ölçeklendirme işlevini denetler. Varsayılan olarak, 1,2 değeri kullanılır. 0,0 değeri, puanın terim sıklığındaki artışla ölçeklendirilmediği anlamına gelir. |
CharFilterName
Arama altyapısı tarafından desteklenen tüm karakter filtrelerinin adlarını tanımlar.
Name | Tür | Description |
---|---|---|
html_strip |
string |
HTML yapılarını ayırmaya çalışan bir karakter filtresi. Bkz. https://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/charfilter/HTMLStripCharFilter.html |
CjkBigramTokenFilter
Standart belirteç oluşturucudan oluşturulan CJK terimlerinin büyük simgelerini oluşturur. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır.
Name | Tür | Default value | Description |
---|---|---|---|
@odata.type |
string:
#Microsoft. |
Belirteç filtresinin türünü belirten bir URI parçası. |
|
ignoreScripts |
Yoksaymak için betikler. |
||
name |
string |
Belirteç filtresinin adı. Yalnızca harf, basamak, boşluk, tire veya alt çizgi içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır. |
|
outputUnigrams |
boolean |
False |
Hem tek birimlerin hem de büyük harflerin (doğruysa) veya yalnızca büyük harflerin (yanlışsa) çıkışını alıp almayacağını belirten bir değer. Varsayılan değer false'tur. |
CjkBigramTokenFilterScripts
CjkBigramTokenFilter tarafından yoksayılabilir betikler.
Name | Tür | Description |
---|---|---|
han |
string |
CJK terimlerinin büyük sayılarını oluştururken Han betiğini yoksayın. |
hangul |
string |
CJK terimlerinin büyük sayılarını oluştururken Hangul betiğini yoksayın. |
hiragana |
string |
CJK terimlerinin büyük sayılarını oluştururken Hiragana betiğini yoksayın. |
katakana |
string |
CJK terimlerinin büyük sayılarını oluştururken Katakana betiğini yoksayın. |
ClassicSimilarity
TF-IDF'nin Lucene TFIDFSimilarity uygulamasını kullanan eski benzerlik algoritması. bu TF-IDF varyasyonu, statik belge uzunluğu normalleştirmesini ve arama yapılan sorgularla yalnızca kısmen eşleşen belgeleri cezalandıran faktörleri koordine eder.
Name | Tür | Description |
---|---|---|
@odata.type |
string:
#Microsoft. |
ClassicTokenizer
Çoğu Avrupa dili belgesini işlemek için uygun olan dil bilgisi tabanlı belirteç oluşturucu. Bu belirteç oluşturucu Apache Lucene kullanılarak uygulanır.
Name | Tür | Default value | Description |
---|---|---|---|
@odata.type |
string:
#Microsoft. |
Belirteç oluşturucunun türünü belirten bir URI parçası. |
|
maxTokenLength |
integer |
255 |
En fazla belirteç uzunluğu. Varsayılan değer 255'tir. Uzunluk üst sınırından uzun olan belirteçler bölünür. Kullanılabilecek en fazla belirteç uzunluğu 300 karakterdir. |
name |
string |
Belirteç oluşturucunun adı. Yalnızca harf, basamak, boşluk, tire veya alt çizgi içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır. |
CommonGramTokenFilter
Dizin oluştururken sık karşılaşılan terimler için bigrams oluşturun. Tek terimler de dizine eklenir ve bigram'lar yer paylaşımlı olur. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır.
Name | Tür | Default value | Description |
---|---|---|---|
@odata.type |
string:
#Microsoft. |
Belirteç filtresinin türünü belirten bir URI parçası. |
|
commonWords |
string[] |
Ortak sözcükler kümesi. |
|
ignoreCase |
boolean |
False |
Ortak sözcükleri eşleştirmenin büyük/küçük harfe duyarsız olup olmayacağını gösteren bir değer. Varsayılan değer false'tur. |
name |
string |
Belirteç filtresinin adı. Yalnızca harf, basamak, boşluk, tire veya alt çizgi içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır. |
|
queryMode |
boolean |
False |
Belirteç filtresinin sorgu modunda olup olmadığını gösteren değer. Sorgu modundayken belirteç filtresi büyük harfler oluşturur ve ardından ortak sözcükleri ve tek terimleri ve ardından ortak bir sözcüğü kaldırır. Varsayılan değer false'tur. |
CorsOptions
Dizin için Çıkış Noktaları Arası Kaynak Paylaşımını (CORS) denetleme seçeneklerini tanımlar.
Name | Tür | Description |
---|---|---|
allowedOrigins |
string[] |
JavaScript kodunun dizininize erişim izni verileceği kaynak listesi. Tüm çıkış noktalarına izin vermek için {protocol}://{fully-qualified-domain-name}[:{port#}] biçimindeki konakların listesini veya tek bir '*' içerebilir (önerilmez). |
maxAgeInSeconds |
integer |
Tarayıcıların CORS denetim öncesi yanıtlarını önbelleğe alması gereken süre. Varsayılan değer 5 dakikadır. |
CustomAnalyzer
Metni dizine alınabilen/aranabilir belirteçlere dönüştürme işlemi üzerinde denetim sahibi olmanıza olanak tanır. Önceden tanımlanmış tek bir belirteç oluşturucu ve bir veya daha fazla filtreden oluşan kullanıcı tanımlı bir yapılandırmadır. Belirteç oluşturucu, metinleri belirteçlere bölmek ve belirteç oluşturucu tarafından yayılan belirteçleri değiştirmek için filtrelerden sorumludur.
Name | Tür | Description |
---|---|---|
@odata.type |
string:
#Microsoft. |
Çözümleyici türünü belirten bir URI parçası. |
charFilters |
Belirteç oluşturucu tarafından işlenmeden önce giriş metnini hazırlamak için kullanılan karakter filtreleri listesi. Örneğin, belirli karakterleri veya simgeleri değiştirebilirler. Filtreler, listelendikleri sırayla çalıştırılır. |
|
name |
string |
Çözümleyicinin adı. Yalnızca harf, basamak, boşluk, tire veya alt çizgi içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır. |
tokenFilters |
Belirteç oluşturucu tarafından oluşturulan belirteçleri filtrelemek veya değiştirmek için kullanılan belirteç filtrelerinin listesi. Örneğin, tüm karakterleri küçük harfe dönüştüren küçük harfli bir filtre belirtebilirsiniz. Filtreler, listelendikleri sırayla çalıştırılır. |
|
tokenizer |
Sürekli metni bir tümceyi sözcüklere bölmek gibi bir belirteç dizisine bölmek için kullanılacak belirteç oluşturucunun adı. |
DictionaryDecompounderTokenFilter
Birçok Almanca dilinde bulunan bileşik sözcükleri ayrıştırıyor. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır.
Name | Tür | Default value | Description |
---|---|---|---|
@odata.type |
string:
#Microsoft. |
Belirteç filtresinin türünü belirten bir URI parçası. |
|
maxSubwordSize |
integer |
15 |
En büyük alt kelime boyutu. Yalnızca bundan kısa alt sözler çıkarılır. Varsayılan değer 15'tir. Maksimum değer 300'dür. |
minSubwordSize |
integer |
2 |
En düşük alt kelime boyutu. Yalnızca bundan daha uzun alt ifadeler çıkarılır. Varsayılan değer 2'dir. Maksimum değer 300'dür. |
minWordSize |
integer |
5 |
En küçük sözcük boyutu. Yalnızca bundan daha uzun sözcükler işlenir. Varsayılan değer 5'tir. Maksimum değer 300'dür. |
name |
string |
Belirteç filtresinin adı. Yalnızca harf, basamak, boşluk, tire veya alt çizgi içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır. |
|
onlyLongestMatch |
boolean |
False |
Çıkışa yalnızca en uzun eşleşen alt sözcüğün eklenip eklenmeyeceğini gösteren değer. Varsayılan değer false'tur. |
wordList |
string[] |
Eşleşecek sözcüklerin listesi. |
DistanceScoringFunction
Coğrafi konumdan uzaklığı temel alarak puanları artıran bir işlev tanımlar.
Name | Tür | Description |
---|---|---|
boost |
number |
Ham puanın çarpanı. 1,0'a eşit olmayan pozitif bir sayı olmalıdır. |
distance |
Uzaklık puanlama işlevi için parametre değerleri. |
|
fieldName |
string |
Puanlama işlevine giriş olarak kullanılan alanın adı. |
interpolation |
Artırmanın belge puanları arasında nasıl ilişkilendirilmiş olacağını gösteren değer; varsayılan olarak "Doğrusal" olarak adlandırılır. |
|
type |
string:
distance |
Kullanılacak işlevin türünü gösterir. Geçerli değerler arasında büyüklük, tazelik, uzaklık ve etiket bulunur. İşlev türü küçük harf olmalıdır. |
DistanceScoringParameters
Uzaklık puanlama işlevine parametre değerleri sağlar.
Name | Tür | Description |
---|---|---|
boostingDistance |
number |
Destek aralığının sona erdiği referans konumdan kilometre cinsinden uzaklık. |
referencePointParameter |
string |
Başvuru konumunu belirtmek için arama sorgularında geçirilen parametrenin adı. |
EdgeNGramTokenFilter
Giriş belirtecinin önünden veya arkasından başlayarak verilen boyutların n gramını oluşturur. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır.
Name | Tür | Default value | Description |
---|---|---|---|
@odata.type |
string:
#Microsoft. |
Belirteç filtresinin türünü belirten bir URI parçası. |
|
maxGram |
integer |
2 |
En fazla n gram uzunluk. Varsayılan değer 2'dir. |
minGram |
integer |
1 |
En az n gram uzunluk. Varsayılan değer 1'dir. maxGram değerinden küçük olmalıdır. |
name |
string |
Belirteç filtresinin adı. Yalnızca harf, basamak, boşluk, tire veya alt çizgi içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır. |
|
side | front |
N-gram girişin hangi tarafından oluşturulması gerektiğini belirtir. Varsayılan değer "ön"dür. |
EdgeNGramTokenFilterSide
Bir n-gram girişin hangi tarafından oluşturulması gerektiğini belirtir.
Name | Tür | Description |
---|---|---|
back |
string |
Girişin arkasından n-gram oluşturulması gerektiğini belirtir. |
front |
string |
Girişin önünden n-gram oluşturulması gerektiğini belirtir. |
EdgeNGramTokenFilterV2
Giriş belirtecinin önünden veya arkasından başlayarak verilen boyutların n gramını oluşturur. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır.
Name | Tür | Default value | Description |
---|---|---|---|
@odata.type |
string:
#Microsoft. |
Belirteç filtresinin türünü belirten bir URI parçası. |
|
maxGram |
integer |
2 |
En fazla n gram uzunluk. Varsayılan değer 2'dir. Maksimum değer 300'dür. |
minGram |
integer |
1 |
En az n gram uzunluk. Varsayılan değer 1'dir. Maksimum değer 300'dür. maxGram değerinden küçük olmalıdır. |
name |
string |
Belirteç filtresinin adı. Yalnızca harf, basamak, boşluk, tire veya alt çizgi içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır. |
|
side | front |
N-gram girişin hangi tarafından oluşturulması gerektiğini belirtir. Varsayılan değer "ön"dür. |
EdgeNGramTokenizer
Bir kenardan gelen girişi verilen boyutların n gramını belirteci haline getirmektedir. Bu belirteç oluşturucu Apache Lucene kullanılarak uygulanır.
Name | Tür | Default value | Description |
---|---|---|---|
@odata.type |
string:
#Microsoft. |
Belirteç oluşturucunun türünü belirten bir URI parçası. |
|
maxGram |
integer |
2 |
En fazla n gram uzunluk. Varsayılan değer 2'dir. Maksimum değer 300'dür. |
minGram |
integer |
1 |
En az n gram uzunluk. Varsayılan değer 1'dir. Maksimum değer 300'dür. maxGram değerinden küçük olmalıdır. |
name |
string |
Belirteç oluşturucunun adı. Yalnızca harf, basamak, boşluk, tire veya alt çizgi içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır. |
|
tokenChars |
Belirteçlerde tutulacak karakter sınıfları. |
ElisionTokenFilter
İlanları kaldırır. Örneğin, "l'avion" (düzlem) "avion" (düzlem) olarak dönüştürülür. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır.
Name | Tür | Description |
---|---|---|
@odata.type |
string:
#Microsoft. |
Belirteç filtresinin türünü belirten bir URI parçası. |
articles |
string[] |
Kaldırılacak makale kümesi. |
name |
string |
Belirteç filtresinin adı. Yalnızca harf, basamak, boşluk, tire veya alt çizgi içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır. |
ErrorAdditionalInfo
Kaynak yönetimi hatası ek bilgileri.
Name | Tür | Description |
---|---|---|
info |
object |
Ek bilgiler. |
type |
string |
Ek bilgi türü. |
ErrorDetail
Hata ayrıntısı.
Name | Tür | Description |
---|---|---|
additionalInfo |
Hata ek bilgileri. |
|
code |
string |
Hata kodu. |
details |
Hata ayrıntıları. |
|
message |
string |
Hata iletisi. |
target |
string |
Hata hedefi. |
ErrorResponse
Hata yanıtı
Name | Tür | Description |
---|---|---|
error |
Hata nesnesi. |
ExhaustiveKnnParameters
Kapsamlı KNN algoritmasına özgü parametreleri içerir.
Name | Tür | Description |
---|---|---|
metric |
Vektör karşılaştırmaları için kullanılacak benzerlik ölçümü. |
ExhaustiveKnnVectorSearchAlgorithmConfiguration
Sorgulama sırasında kullanılan kapsamlı KNN algoritmasına özgü yapılandırma seçeneklerini içerir ve bu seçenek vektör dizininin tamamında deneme yanılma araması gerçekleştirir.
Name | Tür | Description |
---|---|---|
exhaustiveKnnParameters |
Kapsamlı KNN algoritmasına özgü parametreleri içerir. |
|
kind |
string:
exhaustive |
Vektör araması ile kullanılmak üzere yapılandırılan algoritma türünün adı. |
name |
string |
Bu özel yapılandırmayla ilişkilendirilecek ad. |
FreshnessScoringFunction
Bir tarih-saat alanının değerine göre puanları artıran bir işlev tanımlar.
Name | Tür | Description |
---|---|---|
boost |
number |
Ham puanın çarpanı. 1,0'a eşit olmayan pozitif bir sayı olmalıdır. |
fieldName |
string |
Puanlama işlevine giriş olarak kullanılan alanın adı. |
freshness |
Yenilik puanlama işlevi için parametre değerleri. |
|
interpolation |
Artırmanın belge puanları arasında nasıl ilişkilendirilmiş olacağını gösteren değer; varsayılan olarak "Doğrusal" olarak adlandırılır. |
|
type |
string:
freshness |
Kullanılacak işlevin türünü gösterir. Geçerli değerler arasında büyüklük, tazelik, uzaklık ve etiket bulunur. İşlev türü küçük harf olmalıdır. |
FreshnessScoringParameters
Bir güncellik puanlama işlevine parametre değerleri sağlar.
Name | Tür | Description |
---|---|---|
boostingDuration |
string |
Belirli bir belge için yükseltmenin durdurulacağı süre sonu. |
HnswParameters
HNSW algoritmasına özgü parametreleri içerir.
Name | Tür | Default value | Description |
---|---|---|---|
efConstruction |
integer |
400 |
Dizin zamanında kullanılan en yakın komşuları içeren dinamik listenin boyutu. Bu parametrenin artırılması dizin kalitesini artırarak dizin oluşturma süresinin artmasına neden olabilir. Belirli bir noktada bu parametrenin artırılması, dönüşlerin azalmasına neden olur. |
efSearch |
integer |
500 |
Arama sırasında kullanılan en yakın komşuları içeren dinamik listenin boyutu. Bu parametrenin artırılması, daha yavaş arama yapmak pahasına arama sonuçlarını iyileştirebilir. Belirli bir noktada bu parametrenin artırılması, dönüşlerin azalmasına neden olur. |
m |
integer |
4 |
İnşaat sırasında her yeni eleman için oluşturulan çift yönlü bağlantıların sayısı. Bu parametre değerinin artırılması, bellek tüketiminin artması ve daha uzun dizin oluşturma süresi karşılığında yüksek iç boyutsallığa sahip veri kümelerinde geri çağırma ve alma sürelerini azaltabilir. |
metric |
Vektör karşılaştırmaları için kullanılacak benzerlik ölçümü. |
HnswVectorSearchAlgorithmConfiguration
Dizin oluşturma ve sorgulama sırasında kullanılan HNSW yaklaşık en yakın komşular algoritmasına özgü yapılandırma seçeneklerini içerir. HNSW algoritması, arama hızı ve doğruluk arasında ayarlanabilir bir denge sağlar.
Name | Tür | Description |
---|---|---|
hnswParameters |
HNSW algoritmasına özgü parametreleri içerir. |
|
kind |
string:
hnsw |
Vektör araması ile kullanılmak üzere yapılandırılan algoritma türünün adı. |
name |
string |
Bu özel yapılandırmayla ilişkilendirilecek ad. |
InputFieldMappingEntry
Bir beceri için giriş alanı eşlemesi.
Name | Tür | Description |
---|---|---|
inputs |
Karmaşık bir tür oluştururken kullanılan özyinelemeli girişler. |
|
name |
string |
Girişin adı. |
source |
string |
Girişin kaynağı. |
sourceContext |
string |
Özyinelemeli girişleri seçmek için kullanılan kaynak bağlam. |
KeepTokenFilter
Belirteçleri yalnızca belirtilen sözcük listesinde yer alan metinle tutan bir belirteç filtresi. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır.
Name | Tür | Default value | Description |
---|---|---|---|
@odata.type |
string:
#Microsoft. |
Belirteç filtresinin türünü belirten bir URI parçası. |
|
keepWords |
string[] |
Tutulacak sözcüklerin listesi. |
|
keepWordsCase |
boolean |
False |
Önce tüm sözcüklerin küçük harfle yazılıp azaltılmayacağını gösteren bir değer. Varsayılan değer false'tur. |
name |
string |
Belirteç filtresinin adı. Yalnızca harf, basamak, boşluk, tire veya alt çizgi içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır. |
KeywordMarkerTokenFilter
Terimleri anahtar sözcük olarak işaretler. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır.
Name | Tür | Default value | Description |
---|---|---|---|
@odata.type |
string:
#Microsoft. |
Belirteç filtresinin türünü belirten bir URI parçası. |
|
ignoreCase |
boolean |
False |
Büyük/küçük harf yoksayılıp yoksayılmayacağını belirten bir değer. True ise, önce tüm sözcükler küçük harfe dönüştürülür. Varsayılan değer false'tur. |
keywords |
string[] |
Anahtar sözcük olarak işaretlenecek sözcüklerin listesi. |
|
name |
string |
Belirteç filtresinin adı. Yalnızca harf, basamak, boşluk, tire veya alt çizgi içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır. |
KeywordTokenizer
Girişin tamamını tek bir belirteç olarak yayar. Bu belirteç oluşturucu Apache Lucene kullanılarak uygulanır.
Name | Tür | Default value | Description |
---|---|---|---|
@odata.type |
string:
#Microsoft. |
Belirteç oluşturucunun türünü belirten bir URI parçası. |
|
bufferSize |
integer |
256 |
Bayt cinsinden okuma arabelleği boyutu. Varsayılan değer 256'dır. |
name |
string |
Belirteç oluşturucunun adı. Yalnızca harf, basamak, boşluk, tire veya alt çizgi içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır. |
KeywordTokenizerV2
Girişin tamamını tek bir belirteç olarak yayar. Bu belirteç oluşturucu Apache Lucene kullanılarak uygulanır.
Name | Tür | Default value | Description |
---|---|---|---|
@odata.type |
string:
#Microsoft. |
Belirteç oluşturucunun türünü belirten bir URI parçası. |
|
maxTokenLength |
integer |
256 |
En fazla belirteç uzunluğu. Varsayılan değer 256'dır. Uzunluk üst sınırından uzun olan belirteçler bölünür. Kullanılabilecek en fazla belirteç uzunluğu 300 karakterdir. |
name |
string |
Belirteç oluşturucunun adı. Yalnızca harf, basamak, boşluk, tire veya alt çizgi içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır. |
LengthTokenFilter
Çok uzun veya çok kısa sözcükleri kaldırır. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır.
Name | Tür | Default value | Description |
---|---|---|---|
@odata.type |
string:
#Microsoft. |
Belirteç filtresinin türünü belirten bir URI parçası. |
|
max |
integer |
300 |
Karakter cinsinden uzunluk üst sınırı. Varsayılan ve maksimum değer 300'dür. |
min |
integer |
0 |
Karakter cinsinden en küçük uzunluk. Varsayılan değer 0'dır. Maksimum değer 300'dür. En büyük değerinden küçük olmalıdır. |
name |
string |
Belirteç filtresinin adı. Yalnızca harf, basamak, boşluk, tire veya alt çizgi içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır. |
LexicalAnalyzerName
Arama altyapısı tarafından desteklenen tüm metin çözümleyicilerinin adlarını tanımlar.
Name | Tür | Description |
---|---|---|
ar.lucene |
string |
Arapça için Lucene çözümleyicisi. |
ar.microsoft |
string |
Arapça için Microsoft çözümleyicisi. |
bg.lucene |
string |
Bulgarca için Lucene çözümleyicisi. |
bg.microsoft |
string |
Bulgarca için Microsoft çözümleyicisi. |
bn.microsoft |
string |
Bangla için Microsoft çözümleyicisi. |
ca.lucene |
string |
Catalan için Lucene çözümleyicisi. |
ca.microsoft |
string |
Katalalan için Microsoft çözümleyicisi. |
cs.lucene |
string |
Çekçe için Lucene çözümleyicisi. |
cs.microsoft |
string |
Çekçe için Microsoft çözümleyicisi. |
da.lucene |
string |
Danca için Lucene çözümleyicisi. |
da.microsoft |
string |
Danca için Microsoft çözümleyicisi. |
de.lucene |
string |
Almanca için Lucene çözümleyicisi. |
de.microsoft |
string |
Almanca için Microsoft çözümleyicisi. |
el.lucene |
string |
Yunanca için Lucene çözümleyicisi. |
el.microsoft |
string |
Yunanca için Microsoft çözümleyicisi. |
en.lucene |
string |
İngilizce için Lucene çözümleyicisi. |
en.microsoft |
string |
İngilizce için Microsoft çözümleyicisi. |
es.lucene |
string |
İspanyolca için Lucene çözümleyicisi. |
es.microsoft |
string |
İspanyolca için Microsoft çözümleyicisi. |
et.microsoft |
string |
Estonca için Microsoft çözümleyicisi. |
eu.lucene |
string |
Bask için Lucene çözümleyicisi. |
fa.lucene |
string |
Farsça için Lucene çözümleyicisi. |
fi.lucene |
string |
Fince için Lucene çözümleyicisi. |
fi.microsoft |
string |
Fince için Microsoft çözümleyicisi. |
fr.lucene |
string |
Fransızca için Lucene çözümleyicisi. |
fr.microsoft |
string |
Fransızca için Microsoft çözümleyicisi. |
ga.lucene |
string |
lucene çözümleyicisi İrlandalı. |
gl.lucene |
string |
Galiçyalı için Lucene analizörü. |
gu.microsoft |
string |
Gujarati için Microsoft çözümleyicisi. |
he.microsoft |
string |
İbranice için Microsoft çözümleyicisi. |
hi.lucene |
string |
Hintçe için Lucene çözümleyicisi. |
hi.microsoft |
string |
Hintçe için Microsoft çözümleyicisi. |
hr.microsoft |
string |
Hırvat dili için Microsoft çözümleyicisi. |
hu.lucene |
string |
Macarca için Lucene çözümleyicisi. |
hu.microsoft |
string |
Macarca için Microsoft çözümleyicisi. |
hy.lucene |
string |
Ermeni için Lucene çözümleyicisi. |
id.lucene |
string |
Endonezya dili için Lucene çözümleyicisi. |
id.microsoft |
string |
Endonezya dili (Bahasa) için Microsoft çözümleyicisi. |
is.microsoft |
string |
İzlanda dili için Microsoft çözümleyicisi. |
it.lucene |
string |
İtalyanca için Lucene çözümleyicisi. |
it.microsoft |
string |
İtalyanca için Microsoft çözümleyicisi. |
ja.lucene |
string |
Japonca için Lucene çözümleyicisi. |
ja.microsoft |
string |
Japonca için Microsoft çözümleyicisi. |
keyword |
string |
Bir alanın içeriğinin tamamını tek bir belirteç olarak ele alır. Bu, posta kodları, kimlikler ve bazı ürün adları gibi veriler için kullanışlıdır. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/KeywordAnalyzer.html |
kn.microsoft |
string |
Kannada için Microsoft çözümleyicisi. |
ko.lucene |
string |
Korece için Lucene çözümleyicisi. |
ko.microsoft |
string |
Korece için Microsoft çözümleyicisi. |
lt.microsoft |
string |
Litvanca için Microsoft çözümleyicisi. |
lv.lucene |
string |
Lucene çözümleyicisi Letonyalı. |
lv.microsoft |
string |
Letonca için Microsoft çözümleyicisi. |
ml.microsoft |
string |
Malayalam için Microsoft çözümleyicisi. |
mr.microsoft |
string |
Marathi için Microsoft çözümleyicisi. |
ms.microsoft |
string |
Malay dili için Microsoft çözümleyicisi (Latin). |
nb.microsoft |
string |
Norveççe (Bokmål) için Microsoft analyzer. |
nl.lucene |
string |
Felemenkçe için Lucene çözümleyicisi. |
nl.microsoft |
string |
Felemenkçe için Microsoft çözümleyicisi. |
no.lucene |
string |
Norveç dili için Lucene çözümleyicisi. |
pa.microsoft |
string |
Pencap dili için Microsoft çözümleyicisi. |
pattern |
string |
Normal ifade deseni aracılığıyla metni esnek bir şekilde terimlere ayırır. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/PatternAnalyzer.html |
pl.lucene |
string |
Lehçe için Lucene çözümleyicisi. |
pl.microsoft |
string |
Lehçe için Microsoft çözümleyicisi. |
pt-BR.lucene |
string |
Portekizce (Brezilya) için Lucene çözümleyicisi. |
pt-BR.microsoft |
string |
Portekizce (Brezilya) için Microsoft çözümleyicisi. |
pt-PT.lucene |
string |
Portekizce (Portekiz) için Lucene çözümleyicisi. |
pt-PT.microsoft |
string |
Portekizce (Portekiz) için Microsoft çözümleyicisi. |
ro.lucene |
string |
Rumence için Lucene çözümleyicisi. |
ro.microsoft |
string |
Romence için Microsoft çözümleyicisi. |
ru.lucene |
string |
Rus için Lucene çözümleyicisi. |
ru.microsoft |
string |
Rusça için Microsoft çözümleyicisi. |
simple |
string |
Metni harf olmayanlara böler ve küçük harfe dönüştürür. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/SimpleAnalyzer.html |
sk.microsoft |
string |
Slovakça için Microsoft çözümleyicisi. |
sl.microsoft |
string |
Slovence için Microsoft çözümleyicisi. |
sr-cyrillic.microsoft |
string |
Sırp (Kiril) için Microsoft analyzer. |
sr-latin.microsoft |
string |
Sırplık için Microsoft çözümleyicisi (Latin). |
standard.lucene |
string |
Standart Lucene çözümleyicisi. |
standardasciifolding.lucene |
string |
Standart ASCII Katlanan Lucene çözümleyicisi. Bkz. https://learn.microsoft.com/rest/api/searchservice/Custom-analyzers-in-Azure-Search#Analyzers |
stop |
string |
Metni harf olmayanlara böler; Küçük harf ve stopword belirteci filtrelerini uygular. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/StopAnalyzer.html |
sv.lucene |
string |
İsveççe için Lucene çözümleyicisi. |
sv.microsoft |
string |
İsveççe için Microsoft çözümleyicisi. |
ta.microsoft |
string |
Tamil için Microsoft çözümleyicisi. |
te.microsoft |
string |
Telugu için Microsoft çözümleyicisi. |
th.lucene |
string |
Tay dili için Lucene çözümleyicisi. |
th.microsoft |
string |
Tay dili için Microsoft çözümleyicisi. |
tr.lucene |
string |
Türkçe için Lucene çözümleyicisi. |
tr.microsoft |
string |
Türkçe için Microsoft çözümleyicisi. |
uk.microsoft |
string |
Ukrayna dili için Microsoft çözümleyicisi. |
ur.microsoft |
string |
Urduca için Microsoft çözümleyicisi. |
vi.microsoft |
string |
Vietnam dili için Microsoft çözümleyicisi. |
whitespace |
string |
Boşluk belirteci kullanan bir çözümleyici. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/WhitespaceAnalyzer.html |
zh-Hans.lucene |
string |
Çince için Lucene çözümleyicisi (Basitleştirilmiş). |
zh-Hans.microsoft |
string |
Çince (Basitleştirilmiş) için Microsoft çözümleyicisi. |
zh-Hant.lucene |
string |
Çince (Geleneksel) için Lucene çözümleyicisi. |
zh-Hant.microsoft |
string |
Çince (Geleneksel) için Microsoft çözümleyicisi. |
LexicalTokenizerName
Arama altyapısı tarafından desteklenen tüm belirteç oluşturucuların adlarını tanımlar.
LimitTokenFilter
Dizin oluşturma sırasında belirteç sayısını sınırlar. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır.
Name | Tür | Default value | Description |
---|---|---|---|
@odata.type |
string:
#Microsoft. |
Belirteç filtresinin türünü belirten bir URI parçası. |
|
consumeAllTokens |
boolean |
False |
maxTokenCount değerine ulaşılsa bile girişten gelen tüm belirteçlerin tüketilip tüketilmeyeceğini gösteren değer. Varsayılan değer false'tur. |
maxTokenCount |
integer |
1 |
Üretilmesi gereken en fazla belirteç sayısı. Varsayılan değer 1'dir. |
name |
string |
Belirteç filtresinin adı. Yalnızca harf, basamak, boşluk, tire veya alt çizgi içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır. |
LuceneStandardAnalyzer
Standart Apache Lucene çözümleyicisi; Standart belirteç oluşturucu, küçük harfli filtre ve durdurma filtresinden oluşur.
Name | Tür | Default value | Description |
---|---|---|---|
@odata.type |
string:
#Microsoft. |
Çözümleyici türünü belirten bir URI parçası. |
|
maxTokenLength |
integer |
255 |
En fazla belirteç uzunluğu. Varsayılan değer 255'tir. Uzunluk üst sınırından uzun olan belirteçler bölünür. Kullanılabilecek en fazla belirteç uzunluğu 300 karakterdir. |
name |
string |
Çözümleyicinin adı. Yalnızca harf, basamak, boşluk, tire veya alt çizgi içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır. |
|
stopwords |
string[] |
Stopwords listesi. |
LuceneStandardTokenizer
Unicode Metin Kesimleme kurallarından sonra metni keser. Bu belirteç oluşturucu Apache Lucene kullanılarak uygulanır.
Name | Tür | Default value | Description |
---|---|---|---|
@odata.type |
string:
#Microsoft. |
Belirteç oluşturucunun türünü belirten bir URI parçası. |
|
maxTokenLength |
integer |
255 |
En fazla belirteç uzunluğu. Varsayılan değer 255'tir. Uzunluk üst sınırından uzun olan belirteçler bölünür. |
name |
string |
Belirteç oluşturucunun adı. Yalnızca harf, basamak, boşluk, tire veya alt çizgi içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır. |
LuceneStandardTokenizerV2
Unicode Metin Kesimleme kurallarından sonra metni keser. Bu belirteç oluşturucu Apache Lucene kullanılarak uygulanır.
Name | Tür | Default value | Description |
---|---|---|---|
@odata.type |
string:
#Microsoft. |
Belirteç oluşturucunun türünü belirten bir URI parçası. |
|
maxTokenLength |
integer |
255 |
En fazla belirteç uzunluğu. Varsayılan değer 255'tir. Uzunluk üst sınırından uzun olan belirteçler bölünür. Kullanılabilecek en fazla belirteç uzunluğu 300 karakterdir. |
name |
string |
Belirteç oluşturucunun adı. Yalnızca harf, basamak, boşluk, tire veya alt çizgi içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır. |
MagnitudeScoringFunction
Sayısal alanın büyüklüğüne göre puanları artıran bir işlev tanımlar.
Name | Tür | Description |
---|---|---|
boost |
number |
Ham puanın çarpanı. 1,0'a eşit olmayan pozitif bir sayı olmalıdır. |
fieldName |
string |
Puanlama işlevine giriş olarak kullanılan alanın adı. |
interpolation |
Artırmanın belge puanları arasında nasıl ilişkilendirilmiş olacağını gösteren değer; varsayılan olarak "Doğrusal" olarak adlandırılır. |
|
magnitude |
Büyük puanlama işlevinin parametre değerleri. |
|
type |
string:
magnitude |
Kullanılacak işlevin türünü gösterir. Geçerli değerler arasında büyüklük, tazelik, uzaklık ve etiket bulunur. İşlev türü küçük harf olmalıdır. |
MagnitudeScoringParameters
Bir büyük puanlama işlevine parametre değerleri sağlar.
Name | Tür | Description |
---|---|---|
boostingRangeEnd |
number |
Artırmanın sona erdiği alan değeri. |
boostingRangeStart |
number |
Artırmanın başladığı alan değeri. |
constantBoostBeyondRange |
boolean |
Aralık bitiş değerinin ötesindeki alan değerleri için sabit artırma uygulanıp uygulanmayacağını gösteren değer; varsayılan değer false'tur. |
MappingCharFilter
Eşlemeler seçeneğiyle tanımlanan eşlemeleri uygulayan karakter filtresi. Eşleştirme doyumsuzdur (belirli bir noktada en uzun desen eşleştirmesi kazanır). Değiştirmenin boş dize olması için izin verilir. Bu karakter filtresi Apache Lucene kullanılarak uygulanır.
Name | Tür | Description |
---|---|---|
@odata.type |
string:
#Microsoft. |
Karakter filtresinin türünü belirten bir URI parçası. |
mappings |
string[] |
Şu biçimdeki eşlemelerin listesi: "a=>b" ("a" karakterinin tüm oluşumları "b" karakteriyle değiştirilir). |
name |
string |
Karakter filtresinin adı. Yalnızca harf, basamak, boşluk, tire veya alt çizgi içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır. |
MicrosoftLanguageStemmingTokenizer
Dile özgü kuralları kullanarak metni böler ve sözcükleri temel formlarına küçültür.
Name | Tür | Default value | Description |
---|---|---|---|
@odata.type |
string:
#Microsoft. |
Belirteç oluşturucunun türünü belirten bir URI parçası. |
|
isSearchTokenizer |
boolean |
False |
Belirteç oluşturucunun nasıl kullanıldığını gösteren değer. Arama belirteci olarak kullanılırsa true olarak, dizin belirteç oluşturucu olarak kullanılıyorsa false olarak ayarlayın. Varsayılan değer false'tur. |
language |
Kullanılacak dil. Varsayılan değer İngilizce'dir. |
||
maxTokenLength |
integer |
255 |
En fazla belirteç uzunluğu. Uzunluk üst sınırından uzun olan belirteçler bölünür. Kullanılabilecek en fazla belirteç uzunluğu 300 karakterdir. 300 karakterden uzun belirteçler önce 300 uzunluğundaki belirteçlere bölünür ve ardından bu belirteçlerin her biri ayarlanan maksimum belirteç uzunluğuna göre bölünür. Varsayılan değer 255'tir. |
name |
string |
Belirteç oluşturucunun adı. Yalnızca harf, basamak, boşluk, tire veya alt çizgi içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır. |
MicrosoftLanguageTokenizer
Dile özgü kuralları kullanarak metni böler.
Name | Tür | Default value | Description |
---|---|---|---|
@odata.type |
string:
#Microsoft. |
Belirteç oluşturucunun türünü belirten bir URI parçası. |
|
isSearchTokenizer |
boolean |
False |
Belirteç oluşturucunun nasıl kullanıldığını gösteren değer. Arama belirteci olarak kullanılırsa true olarak, dizin belirteç oluşturucu olarak kullanılıyorsa false olarak ayarlayın. Varsayılan değer false'tur. |
language |
Kullanılacak dil. Varsayılan değer İngilizce'dir. |
||
maxTokenLength |
integer |
255 |
En fazla belirteç uzunluğu. Uzunluk üst sınırından uzun olan belirteçler bölünür. Kullanılabilecek en fazla belirteç uzunluğu 300 karakterdir. 300 karakterden uzun belirteçler önce 300 uzunluğundaki belirteçlere bölünür ve ardından bu belirteçlerin her biri ayarlanan maksimum belirteç uzunluğuna göre bölünür. Varsayılan değer 255'tir. |
name |
string |
Belirteç oluşturucunun adı. Yalnızca harf, basamak, boşluk, tire veya alt çizgi içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır. |
MicrosoftStemmingTokenizerLanguage
Microsoft dil kaynak belirteci tarafından desteklenen dilleri listeler.
Name | Tür | Description |
---|---|---|
arabic |
string |
Arapça için Microsoft stemming tokenizer'ı seçer. |
bangla |
string |
Bangla için Microsoft stemming tokenizer'ı seçer. |
bulgarian |
string |
Bulgarca için Microsoft stemming tokenizer'ı seçer. |
catalan |
string |
Katalalan için Microsoft stemming tokenizer'ı seçer. |
croatian |
string |
Hırvat dili için Microsoft stemming tokenizer'ı seçer. |
czech |
string |
Çekçe için Microsoft stemming tokenizer'ı seçer. |
danish |
string |
Danca için Microsoft stemming tokenizer'ı seçer. |
dutch |
string |
Felemenkçe için Microsoft stemming tokenizer'ı seçer. |
english |
string |
İngilizce için Microsoft stemming tokenizer'ı seçer. |
estonian |
string |
Estonca için Microsoft stemming tokenizer'ı seçer. |
finnish |
string |
Fince için Microsoft stemming tokenizer'ı seçer. |
french |
string |
Fransızca için Microsoft stemming tokenizer'ı seçer. |
german |
string |
Almanca için Microsoft stemming tokenizer'ı seçer. |
greek |
string |
Yunanca için Microsoft stemming tokenizer'ı seçer. |
gujarati |
string |
Gujarati için Microsoft stemming tokenizer'ı seçer. |
hebrew |
string |
İbranice için Microsoft kök belirteç oluşturucuyu seçer. |
hindi |
string |
Hintçe için Microsoft stemming tokenizer'ı seçer. |
hungarian |
string |
Macarca için Microsoft stemming tokenizer'ı seçer. |
icelandic |
string |
İzlanda dili için Microsoft kök belirteç oluşturucuyu seçer. |
indonesian |
string |
Endonezya dili için Microsoft stemming tokenizer'ı seçer. |
italian |
string |
İtalyanca için Microsoft stemming tokenizer'ı seçer. |
kannada |
string |
Kannada için Microsoft stemming tokenizer'ı seçer. |
latvian |
string |
Letonca için Microsoft stemming tokenizer'ı seçer. |
lithuanian |
string |
Litvanya dili için Microsoft kök belirteç oluşturucuyu seçer. |
malay |
string |
Malay için Microsoft stemming tokenizer'ı seçer. |
malayalam |
string |
Malayalam için Microsoft stemming tokenizer'ı seçer. |
marathi |
string |
Marathi için Microsoft stemming tokenizer'ı seçer. |
norwegianBokmaal |
string |
Norveççe (Bokmål) için Microsoft stemming tokenizer'ı seçer. |
polish |
string |
Lehçe için Microsoft stemming tokenizer'ı seçer. |
portuguese |
string |
Portekizce için Microsoft stemming tokenizer'ı seçer. |
portugueseBrazilian |
string |
Portekizce (Brezilya) için Microsoft stemming tokenizer'ı seçer. |
punjabi |
string |
Pencap dili için Microsoft kök belirteç oluşturucuyu seçer. |
romanian |
string |
Rumence için Microsoft kaynak belirteci belirteci seçer. |
russian |
string |
Rusça için Microsoft stemming tokenizer'ı seçer. |
serbianCyrillic |
string |
Sırp (Kiril) için Microsoft kök belirteci belirteç oluşturucuyu seçer. |
serbianLatin |
string |
Sırp (Latin) için Microsoft stemming tokenizer'ı seçer. |
slovak |
string |
Slovakça için Microsoft stemming tokenizer'ı seçer. |
slovenian |
string |
Slovence için Microsoft stemming tokenizer'ı seçer. |
spanish |
string |
İspanyolca için Microsoft stemming tokenizer'ı seçer. |
swedish |
string |
İsveççe için Microsoft stemming tokenizer'ı seçer. |
tamil |
string |
Tamil için Microsoft stemming tokenizer'ı seçer. |
telugu |
string |
Telugu için Microsoft stemming tokenizer'ı seçer. |
turkish |
string |
Türkçe için Microsoft stemming tokenizer'ı seçer. |
ukrainian |
string |
Ukrayna dili için Microsoft stemming tokenizer'ı seçer. |
urdu |
string |
Urduca için Microsoft stemming tokenizer'ı seçer. |
MicrosoftTokenizerLanguage
Microsoft dil belirteci tarafından desteklenen dilleri listeler.
Name | Tür | Description |
---|---|---|
bangla |
string |
Bangla için Microsoft belirteç oluşturucuyu seçer. |
bulgarian |
string |
Bulgarca için Microsoft belirteç oluşturucuyu seçer. |
catalan |
string |
Katalalan için Microsoft belirteç oluşturucuyu seçer. |
chineseSimplified |
string |
Çince (Basitleştirilmiş) için Microsoft belirteç oluşturucuyu seçer. |
chineseTraditional |
string |
Çince (Geleneksel) için Microsoft belirteç oluşturucuyu seçer. |
croatian |
string |
Hırvat dili için Microsoft belirteç oluşturucuyu seçer. |
czech |
string |
Çekçe için Microsoft belirteç oluşturucuyu seçer. |
danish |
string |
Danca için Microsoft belirteç oluşturucuyu seçer. |
dutch |
string |
Felemenkçe için Microsoft belirteç oluşturucuyu seçer. |
english |
string |
İngilizce için Microsoft belirteç oluşturucuyu seçer. |
french |
string |
Fransızca için Microsoft belirteç oluşturucuyu seçer. |
german |
string |
Almanca için Microsoft belirteç oluşturucuyu seçer. |
greek |
string |
Yunanca için Microsoft belirteç oluşturucuyu seçer. |
gujarati |
string |
Gujarati için Microsoft belirteç oluşturucuyu seçer. |
hindi |
string |
Hintçe için Microsoft belirteç oluşturucuyu seçer. |
icelandic |
string |
İzlanda dili için Microsoft belirteç oluşturucuyu seçer. |
indonesian |
string |
Endonezya dili için Microsoft belirteç oluşturucuyu seçer. |
italian |
string |
İtalyanca için Microsoft belirteç oluşturucuyu seçer. |
japanese |
string |
Japonca için Microsoft belirteç oluşturucuyu seçer. |
kannada |
string |
Kannada için Microsoft belirteç oluşturucuyu seçer. |
korean |
string |
Korece için Microsoft belirteç oluşturucuyu seçer. |
malay |
string |
Malay için Microsoft belirteç oluşturucuyu seçer. |
malayalam |
string |
Malayalam için Microsoft belirteç oluşturucuyu seçer. |
marathi |
string |
Marathi için Microsoft belirteç oluşturucuyu seçer. |
norwegianBokmaal |
string |
Norveççe (Bokmål) için Microsoft belirteç oluşturucuyu seçer. |
polish |
string |
Lehçe için Microsoft belirteç oluşturucuyu seçer. |
portuguese |
string |
Portekizce için Microsoft belirteç oluşturucuyu seçer. |
portugueseBrazilian |
string |
Portekizce (Brezilya) için Microsoft belirteç oluşturucuyu seçer. |
punjabi |
string |
Pencap dili için Microsoft belirteç oluşturucuyu seçer. |
romanian |
string |
Rumence için Microsoft belirteç oluşturucuyu seçer. |
russian |
string |
Rusça için Microsoft belirteç oluşturucuyu seçer. |
serbianCyrillic |
string |
Sırp (Kiril) için Microsoft belirteç oluşturucuyu seçer. |
serbianLatin |
string |
Sırp (Latin) için Microsoft belirteç oluşturucuyu seçer. |
slovenian |
string |
Slovence için Microsoft belirteç oluşturucuyu seçer. |
spanish |
string |
İspanyolca için Microsoft belirteç oluşturucuyu seçer. |
swedish |
string |
İsveççe için Microsoft belirteç oluşturucuyu seçer. |
tamil |
string |
Tamil için Microsoft belirteç oluşturucuyu seçer. |
telugu |
string |
Telugu için Microsoft belirteç oluşturucuyu seçer. |
thai |
string |
Tay dili için Microsoft belirteç oluşturucuyu seçer. |
ukrainian |
string |
Ukrayna dili için Microsoft belirteç oluşturucuyu seçer. |
urdu |
string |
Urduca için Microsoft belirteç oluşturucuyu seçer. |
vietnamese |
string |
Vietnamca için Microsoft belirteç oluşturucuyu seçer. |
NGramTokenFilter
Verilen boyutların n gramını oluşturur. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır.
Name | Tür | Default value | Description |
---|---|---|---|
@odata.type |
string:
#Microsoft. |
Belirteç filtresinin türünü belirten bir URI parçası. |
|
maxGram |
integer |
2 |
En fazla n gram uzunluk. Varsayılan değer 2'dir. |
minGram |
integer |
1 |
En az n gram uzunluk. Varsayılan değer 1'dir. maxGram değerinden küçük olmalıdır. |
name |
string |
Belirteç filtresinin adı. Yalnızca harf, basamak, boşluk, tire veya alt çizgi içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır. |
NGramTokenFilterV2
Verilen boyutların n gramını oluşturur. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır.
Name | Tür | Default value | Description |
---|---|---|---|
@odata.type |
string:
#Microsoft. |
Belirteç filtresinin türünü belirten bir URI parçası. |
|
maxGram |
integer |
2 |
En fazla n gram uzunluk. Varsayılan değer 2'dir. Maksimum değer 300'dür. |
minGram |
integer |
1 |
En az n gram uzunluk. Varsayılan değer 1'dir. Maksimum değer 300'dür. maxGram değerinden küçük olmalıdır. |
name |
string |
Belirteç filtresinin adı. Yalnızca harf, basamak, boşluk, tire veya alt çizgi içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır. |
NGramTokenizer
Girişi verilen boyutların n gramını belirteci haline getirmektedir. Bu belirteç oluşturucu Apache Lucene kullanılarak uygulanır.
Name | Tür | Default value | Description |
---|---|---|---|
@odata.type |
string:
#Microsoft. |
Belirteç oluşturucunun türünü belirten bir URI parçası. |
|
maxGram |
integer |
2 |
En fazla n gram uzunluk. Varsayılan değer 2'dir. Maksimum değer 300'dür. |
minGram |
integer |
1 |
En az n gram uzunluk. Varsayılan değer 1'dir. Maksimum değer 300'dür. maxGram değerinden küçük olmalıdır. |
name |
string |
Belirteç oluşturucunun adı. Yalnızca harf, basamak, boşluk, tire veya alt çizgi içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır. |
|
tokenChars |
Belirteçlerde tutulacak karakter sınıfları. |
OutputFieldMappingEntry
Bir beceri için çıkış alanı eşlemesi.
Name | Tür | Description |
---|---|---|
name |
string |
Beceri tarafından tanımlanan çıkışın adı. |
targetName |
string |
Çıkışın hedef adı. İsteğe bağlıdır ve varsayılan addır. |
PathHierarchyTokenizerV2
Yol benzeri hiyerarşiler için belirteç oluşturucu. Bu belirteç oluşturucu Apache Lucene kullanılarak uygulanır.
Name | Tür | Default value | Description |
---|---|---|---|
@odata.type |
string:
#Microsoft. |
Belirteç oluşturucunun türünü belirten bir URI parçası. |
|
delimiter |
string |
/ |
Kullanılacak sınırlayıcı karakteri. Varsayılan değer "/" şeklindedir. |
maxTokenLength |
integer |
300 |
En fazla belirteç uzunluğu. Varsayılan ve maksimum değer 300'dür. |
name |
string |
Belirteç oluşturucunun adı. Yalnızca harf, basamak, boşluk, tire veya alt çizgi içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır. |
|
replacement |
string |
/ |
Ayarlanırsa sınırlayıcı karakterinin yerini alan bir değer. Varsayılan değer "/" şeklindedir. |
reverse |
boolean |
False |
Belirteçlerin ters sırada oluşturulup oluşturulmayacağını gösteren bir değer. Varsayılan değer false'tur. |
skip |
integer |
0 |
Atlana ilk belirteçlerin sayısı. Varsayılan değer 0'dır. |
PatternAnalyzer
Normal ifade deseni aracılığıyla metni esnek bir şekilde terimlere ayırır. Bu çözümleyici Apache Lucene kullanılarak uygulanır.
Name | Tür | Default value | Description |
---|---|---|---|
@odata.type |
string:
#Microsoft. |
Çözümleyici türünü belirten bir URI parçası. |
|
flags |
Normal ifade bayrakları. |
||
lowercase |
boolean |
True |
Terimlerin küçük harfle yazılması gerekip gerekmediğini gösteren değer. Varsayılan değer true'dur. |
name |
string |
Çözümleyicinin adı. Yalnızca harf, basamak, boşluk, tire veya alt çizgi içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır. |
|
pattern |
string |
\W+ |
Belirteç ayırıcılarını eşleştirmek için normal ifade deseni. Varsayılan, bir veya daha fazla sözcük olmayan karakterle eşleşen bir ifadedir. |
stopwords |
string[] |
Stopwords listesi. |
PatternCaptureTokenFilter
Bir veya daha fazla desendeki her yakalama grubu için bir tane olmak üzere birden çok belirteç yaymak için Java regexes kullanır. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır.
Name | Tür | Default value | Description |
---|---|---|---|
@odata.type |
string:
#Microsoft. |
Belirteç filtresinin türünü belirten bir URI parçası. |
|
name |
string |
Belirteç filtresinin adı. Yalnızca harf, basamak, boşluk, tire veya alt çizgi içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır. |
|
patterns |
string[] |
Her belirteçle eşleşecek desenlerin listesi. |
|
preserveOriginal |
boolean |
True |
Desenlerden biri eşleşse bile özgün belirtecin döndürülip döndürülmeyeceğini belirten bir değer. Varsayılan değer true'dur. |
PatternReplaceCharFilter
Giriş dizesindeki karakterlerin yerini alan karakter filtresi. Korunacak karakter dizilerini tanımlamak için normal bir ifade ve değiştirilecek karakterleri tanımlamak için bir değiştirme düzeni kullanır. Örneğin, "aa bb aa bb", desen "(aa)\s+(bb)" ve yerine "$1#$2" giriş metni verilmelidir, sonuç "aa#bb aa#bb" olacaktır. Bu karakter filtresi Apache Lucene kullanılarak uygulanır.
Name | Tür | Description |
---|---|---|
@odata.type |
string:
#Microsoft. |
Karakter filtresinin türünü belirten bir URI parçası. |
name |
string |
Karakter filtresinin adı. Yalnızca harf, basamak, boşluk, tire veya alt çizgi içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır. |
pattern |
string |
Normal ifade deseni. |
replacement |
string |
Değiştirme metni. |
PatternReplaceTokenFilter
Giriş dizesindeki karakterlerin yerini alan karakter filtresi. Korunacak karakter dizilerini tanımlamak için normal bir ifade ve değiştirilecek karakterleri tanımlamak için bir değiştirme düzeni kullanır. Örneğin, "aa bb aa bb", desen "(aa)\s+(bb)" ve yerine "$1#$2" giriş metni verilmelidir, sonuç "aa#bb aa#bb" olacaktır. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır.
Name | Tür | Description |
---|---|---|
@odata.type |
string:
#Microsoft. |
Belirteç filtresinin türünü belirten bir URI parçası. |
name |
string |
Belirteç filtresinin adı. Yalnızca harf, basamak, boşluk, tire veya alt çizgi içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır. |
pattern |
string |
Normal ifade deseni. |
replacement |
string |
Değiştirme metni. |
PatternTokenizer
Farklı belirteçler oluşturmak için regex desen eşleştirmesi kullanan belirteç oluşturucu. Bu belirteç oluşturucu Apache Lucene kullanılarak uygulanır.
Name | Tür | Default value | Description |
---|---|---|---|
@odata.type |
string:
#Microsoft. |
Belirteç oluşturucunun türünü belirten bir URI parçası. |
|
flags |
Normal ifade bayrakları. |
||
group |
integer |
-1 |
Belirteçlere ayıklamak için normal ifade desenindeki eşleşen grubun sıfır tabanlı sıralı düzeni. Eşleşen gruplara bakılmadan girişi belirteçlere bölmek için desenin tamamını kullanmak istiyorsanız -1 kullanın. Varsayılan değer -1'dir. |
name |
string |
Belirteç oluşturucunun adı. Yalnızca harf, basamak, boşluk, tire veya alt çizgi içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır. |
|
pattern |
string |
\W+ |
Belirteç ayırıcılarını eşleştirmek için normal ifade deseni. Varsayılan, bir veya daha fazla sözcük olmayan karakterle eşleşen bir ifadedir. |
PhoneticEncoder
PhoneticTokenFilter ile kullanılacak fonetik kodlayıcının türünü tanımlar.
Name | Tür | Description |
---|---|---|
beiderMorse |
string |
Bir belirteci Beider-Morse bir değere kodlar. |
caverphone1 |
string |
Bir belirteci Caverphone 1.0 değerine kodlar. |
caverphone2 |
string |
Bir belirteci Caverphone 2.0 değerine kodlar. |
cologne |
string |
Bir belirteci Köln Fonetik değerine kodlar. |
doubleMetaphone |
string |
Bir belirteci çift meta telefon değerine kodlar. |
haasePhonetik |
string |
Kölner Phonetik algoritmasının Haase iyileştirmesini kullanarak bir belirteci kodlar. |
koelnerPhonetik |
string |
Kölner Phonetik algoritmasını kullanarak bir belirteci kodlar. |
metaphone |
string |
Bir belirteci meta telefon değerine kodlar. |
nysiis |
string |
Bir belirteci NYSIIS değerine kodlar. |
refinedSoundex |
string |
Bir belirteci Rafine Soundex değerine kodlar. |
soundex |
string |
Bir belirteci bir Soundex değerine kodlar. |
PhoneticTokenFilter
Fonetik eşleşmeler için belirteçler oluşturun. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır.
Name | Tür | Default value | Description |
---|---|---|---|
@odata.type |
string:
#Microsoft. |
Belirteç filtresinin türünü belirten bir URI parçası. |
|
encoder | metaphone |
Kullanılacak fonetik kodlayıcı. Varsayılan değer "metaphone" şeklindedir. |
|
name |
string |
Belirteç filtresinin adı. Yalnızca harf, basamak, boşluk, tire veya alt çizgi içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır. |
|
replace |
boolean |
True |
Kodlanmış belirteçlerin özgün belirteçlerin yerini alıp almayacağını gösteren değer. False ise kodlanmış belirteçler eş anlamlı olarak eklenir. Varsayılan değer true'dur. |
PrioritizedFields
Anlam derecelendirmesi, açıklamalı alt yazılar, vurgular ve yanıtlar için kullanılacak başlık, içerik ve anahtar sözcük alanlarını açıklar.
Name | Tür | Description |
---|---|---|
prioritizedContentFields |
Anlamsal derecelendirme, resim yazıları, vurgular ve yanıtlar için kullanılacak içerik alanlarını tanımlar. En iyi sonuç için, seçili alanlar doğal dil biçiminde metin içermelidir. Dizideki alanların sırası önceliklerini temsil eder. İçerik uzunsa daha düşük önceliğe sahip alanlar kesilebilir. |
|
prioritizedKeywordsFields |
Anlamsal derecelendirme, açıklamalı alt yazılar, vurgular ve yanıtlar için kullanılacak anahtar sözcük alanlarını tanımlar. En iyi sonuç için, seçilen alanlar bir anahtar sözcük listesi içermelidir. Dizideki alanların sırası önceliklerini temsil eder. İçerik uzunsa daha düşük önceliğe sahip alanlar kesilebilir. |
|
titleField |
Anlamsal derecelendirme, resim yazıları, vurgular ve yanıtlar için kullanılacak başlık alanını tanımlar. Dizininizde başlık alanı yoksa, bu alanı boş bırakın. |
RegexFlags
Normal ifadelerin desen çözümleyicisinde ve desen belirtecinde nasıl kullanıldığını denetlemek için birleştirilebilen bayrakları tanımlar.
Name | Tür | Description |
---|---|---|
CANON_EQ |
string |
Kurallı denkliği etkinleştirir. |
CASE_INSENSITIVE |
string |
Büyük/küçük harfe duyarsız eşleştirmeyi etkinleştirir. |
COMMENTS |
string |
Desende boşluk ve açıklamalara izin verir. |
DOTALL |
string |
Noktalı modu etkinleştirir. |
LITERAL |
string |
Desenin değişmez değer ayrıştırmasını etkinleştirir. |
MULTILINE |
string |
Çok satırlı modu etkinleştirir. |
UNICODE_CASE |
string |
Unicode kullanan büyük/küçük harf katlamasını etkinleştirir. |
UNIX_LINES |
string |
Unix çizgileri modunu etkinleştirir. |
ScalarQuantizationParameters
Skaler Niceleme'ye özgü parametreleri içerir.
Name | Tür | Description |
---|---|---|
quantizedDataType |
Sıkıştırılmış vektör değerlerinin nicelenmiş veri türü. |
ScalarQuantizationVectorSearchCompressionConfiguration
Dizin oluşturma ve sorgulama sırasında kullanılan skaler niceleme sıkıştırma yöntemine özgü yapılandırma seçeneklerini içerir.
Name | Tür | Default value | Description |
---|---|---|---|
defaultOversampling |
number |
Varsayılan fazla örnekleme faktörü. Fazla örnekleme, ilk aramada dahili olarak daha fazla belge (bu çarpan tarafından belirtilir) ister. Bu, tam duyarlıklı vektörlerden alınan yeniden derlenmiş benzerlik puanları kullanılarak yeniden dilimlenecek sonuç kümesini artırır. En düşük değer 1'dir, yani fazla örnekleme (1x). Bu parametre yalnızca rerankWithOriginalVectors true olduğunda ayarlanabilir. Daha yüksek değerler gecikme süresiyle geri çağırmayı iyileştirir. |
|
kind |
string:
scalar |
Vektör araması ile kullanılmak üzere yapılandırılan sıkıştırma yönteminin türü. |
|
name |
string |
Bu özel yapılandırmayla ilişkilendirilecek ad. |
|
rerankWithOriginalVectors |
boolean |
True |
True olarak ayarlanırsa, sıkıştırılmış vektörler kullanılarak hesaplanan sıralı sonuç kümesi elde edildikten sonra, tam duyarlıklı benzerlik puanları yeniden hesaplanarak yeniden dilimlenir. Bu, gecikme süresine karşı geri çağırmayı iyileştirir. |
scalarQuantizationParameters |
Skaler Niceleme'ye özgü parametreleri içerir. |
ScoringFunctionAggregation
Bir puanlama profilindeki tüm puanlama işlevlerinin sonuçlarını birleştirmek için kullanılan toplama işlevini tanımlar.
Name | Tür | Description |
---|---|---|
average |
string |
Puanları tüm puanlama işlevi sonuçlarının ortalaması kadar artırın. |
firstMatching |
string |
Puanlama profilindeki ilk geçerli puanlama işlevini kullanarak puanları artırın. |
maximum |
string |
Puanları tüm puanlama işlevi sonuçları üst sınırına kadar artırın. |
minimum |
string |
Puanları tüm puanlama işlevi sonuçlarının en azı kadar artırın. |
sum |
string |
Puanları tüm puanlama işlevi sonuçlarının toplamına göre artırın. |
ScoringFunctionInterpolation
Bir belge aralığında puan artırmayı ilişkilendirmek için kullanılan işlevi tanımlar.
Name | Tür | Description |
---|---|---|
constant |
string |
Puanları sabit bir faktöre göre artırır. |
linear |
string |
Puanları doğrusal olarak azalan bir miktara kadar artırır. Bu, puanlama işlevleri için varsayılan ilişkilendirmedir. |
logarithmic |
string |
Puanları logaritmik olarak azaltan bir miktar artırır. Daha yüksek puanlar için artışlar hızla azalır ve puanlar azaldıkça daha yavaş olur. Etiket puanlama işlevlerinde bu ilişkilendirme seçeneğine izin verilmez. |
quadratic |
string |
Puanları, dörtgen olarak azalan bir miktar artırır. Artışlar daha yüksek puanlar için yavaş ve puanlar azaldıkça daha hızlı azalır. Etiket puanlama işlevlerinde bu ilişkilendirme seçeneğine izin verilmez. |
ScoringProfile
Arama sorgularında puanlama işlemini etkileyen bir arama dizininin parametrelerini tanımlar.
Name | Tür | Description |
---|---|---|
functionAggregation |
Tek tek puanlama işlevlerinin sonuçlarının nasıl birleştirileceğine ilişkin bir değer. Varsayılan olarak "Topla" olur. Puanlama işlevi yoksayılır. |
|
functions | ScoringFunction[]: |
Belgelerin puanlanmasını etkileyen işlevlerin koleksiyonu. |
name |
string |
Puanlama profilinin adı. |
text |
Belirli dizin alanlarındaki metin eşleşmelerine göre puanlama işlemini artıran parametreler. |
SearchField
Bir alanın adını, veri türünü ve arama davranışını açıklayan dizin tanımındaki bir alanı temsil eder.
Name | Tür | Description |
---|---|---|
analyzer |
Alan için kullanılacak çözümleyicinin adı. Bu seçenek yalnızca aranabilir alanlarla kullanılabilir ve searchAnalyzer veya indexAnalyzer ile birlikte ayarlanamaz. Çözümleyici seçildikten sonra alan için değiştirilemez. Karmaşık alanlar için null olmalıdır. |
|
dimensions |
integer |
Vektör alanının boyutsallığı. |
facetable |
boolean |
Model sorgularında alana başvurulmasının etkinleştirilip etkinleştirilmeymeyeceğini gösteren değer. Genellikle kategoriye göre isabet sayısını içeren arama sonuçlarının bir sunumunda kullanılır (örneğin, dijital kameraları arayın ve markaya göre, megapiksellere, fiyata vb. göre isabetleri görün). Karmaşık alanlar için bu özellik null olmalıdır. Edm.GeographyPoint veya Collection(Edm.GeographyPoint) türünde alanlar modellenemez. Varsayılan değer diğer tüm basit alanlar için geçerlidir. |
fields |
Bu Edm.ComplexType veya Collection(Edm.ComplexType) türünde bir alansa, alt alanların listesi. Basit alanlar için null veya boş olmalıdır. |
|
filterable |
boolean |
$filter sorgularda alana başvurulmasının etkinleştirilip etkinleştirilmeymeyeceğini gösteren değer. filterable, dizelerin işlenme biçiminde aranabilirden farklıdır. Filtrelenebilir Edm.String veya Collection(Edm.String) türündeki alanlarda sözcük kesme işlemi yapılmaz, bu nedenle karşılaştırmalar yalnızca tam eşleşmeler içindir. Örneğin, f alanını "güneşli gün" olarak ayarlarsanız, $filter=f eq 'güneşli' eşleşme bulamaz, ancak $filter=f eq 'güneşli gün'. Karmaşık alanlar için bu özellik null olmalıdır. Varsayılan değer basit alanlar için geçerlidir ve karmaşık alanlar için null değeridir. |
indexAnalyzer |
Alan için dizin oluşturma zamanında kullanılan çözümleyicinin adı. Bu seçenek yalnızca aranabilir alanlarla kullanılabilir. SearchAnalyzer ile birlikte ayarlanmalıdır ve çözümleyici seçeneğiyle birlikte ayarlanamaz. Bu özellik bir dil çözümleyicisinin adına ayarlanamaz; dil çözümleyicisine ihtiyacınız varsa çözümleyici özelliğini kullanın. Çözümleyici seçildikten sonra alan için değiştirilemez. Karmaşık alanlar için null olmalıdır. |
|
key |
boolean |
Alanın dizindeki belgeleri benzersiz olarak tanımlayıp tanımlamadığını gösteren değer. Her dizinde tam olarak bir üst düzey alan anahtar alanı olarak seçilmeli ve Edm.String türünde olmalıdır. Önemli alanlar, belgeleri doğrudan aramak ve belirli belgeleri güncelleştirmek veya silmek için kullanılabilir. Basit alanlar için varsayılan değer false, karmaşık alanlar için null değeridir. |
name |
string |
Dizin veya üst alanın alan koleksiyonu içinde benzersiz olması gereken alanın adı. |
retrievable |
boolean |
Alanın bir arama sonucunda döndürülebilir olup olmadığını gösteren değer. Bir alanı (örneğin, kenar boşluğu) filtre, sıralama veya puanlama mekanizması olarak kullanmak ancak alanın son kullanıcıya görünür olmasını istemiyorsanız bu seçeneği devre dışı bırakabilirsiniz. Bu özellik anahtar alanlar için true ve karmaşık alanlar için null olmalıdır. Bu özellik mevcut alanlarda değiştirilebilir. Bu özelliğin etkinleştirilmesi dizin depolama gereksinimlerinde herhangi bir artışa neden olmaz. Varsayılan değer basit alanlar için true, vektör alanları için false ve karmaşık alanlar için null şeklindedir. |
searchAnalyzer |
Alan için arama zamanında kullanılan çözümleyicinin adı. Bu seçenek yalnızca aranabilir alanlarla kullanılabilir. indexAnalyzer ile birlikte ayarlanmalıdır ve çözümleyici seçeneğiyle birlikte ayarlanamaz. Bu özellik bir dil çözümleyicisinin adına ayarlanamaz; dil çözümleyicisine ihtiyacınız varsa çözümleyici özelliğini kullanın. Bu çözümleyici mevcut bir alanda güncelleştirilebilir. Karmaşık alanlar için null olmalıdır. |
|
searchable |
boolean |
Alanın tam metin aranabilir olup olmadığını gösteren değer. Bu, dizin oluşturma sırasında sözcük kesme gibi bir analizden geçeceği anlamına gelir. Aranabilir bir alanı "güneşli gün" gibi bir değere ayarlarsanız, dahili olarak "güneşli" ve "gün" belirteçlerine bölünür. Bu, bu terimler için tam metin aramaları sağlar. Edm.String veya Collection(Edm.String) türündeki alanlar varsayılan olarak aranabilir. Bu özellik, diğer dize olmayan veri türlerinin basit alanları için false ve karmaşık alanlar için null olmalıdır. Not: Aranabilir alanlar, tam metin aramaları için alan değerinin ek belirteçli sürümlerini barındırmak için dizininizde fazladan alan kullanır. Dizininizde yer kazanmak istiyorsanız ve aramalara bir alanın eklenmesi gerekmiyorsa, aranabilir değerini false olarak ayarlayın. |
sortable |
boolean |
$orderby ifadelerinde alana başvurulmasının etkinleştirilip etkinleştirilmeymeyeceğini gösteren değer. Varsayılan olarak, arama altyapısı sonuçları puana göre sıralar, ancak birçok deneyimde kullanıcılar belgelerdeki alanlara göre sıralamak isteyecektir. Basit bir alan yalnızca tek değerliyse sıralanabilir (üst belge kapsamında tek bir değere sahiptir). Basit koleksiyon alanları çok değerli olduğundan sıralanabilir olamaz. Karmaşık koleksiyonların basit alt alanları da çok değerlidir ve bu nedenle sıralanamaz. Bu, ister anlık bir üst alan ister bir üst alan olsun, karmaşık koleksiyondur. Karmaşık alanlar sıralanabilir olamaz ve bu tür alanlar için sıralanabilir özellik null olmalıdır. Sıralanabilir için varsayılan değer, tek değerli basit alanlar için true, çok değerli basit alanlar için false ve karmaşık alanlar için null şeklindedir. |
stored |
boolean |
Alanın bir arama sonucunda döndürülmek üzere diskte ayrı olarak kalıcı olup olmayacağını gösteren sabit bir değer. Depolama ek yükünden tasarruf etmek için arama yanıtında alan içeriğini döndürmeyi planlamıyorsanız bu seçeneği devre dışı bırakabilirsiniz. Bu yalnızca dizin oluşturma sırasında ve yalnızca vektör alanları için ayarlanabilir. Bu özellik mevcut alanlar için değiştirilemez veya yeni alanlar için false olarak ayarlanamaz. Bu özellik false olarak ayarlanırsa, 'alınabilir' özelliği de false olarak ayarlanmalıdır. Bu özellik anahtar alanlar, yeni alanlar ve vektör olmayan alanlar için true veya unset olmalı ve karmaşık alanlar için null olmalıdır. Bu özelliğin devre dışı bırakılması dizin depolama gereksinimlerini azaltır. Vektör alanları için varsayılan değer doğrudur. |
synonymMaps |
string[] |
Bu alanla ilişkilendirilecek eş anlamlı eşlemelerinin adlarının listesi. Bu seçenek yalnızca aranabilir alanlarla kullanılabilir. Şu anda alan başına yalnızca bir eş anlamlı eşleme desteklenir. Bir alana eş anlamlı eşlem atamak, bu alanı hedefleyen sorgu terimlerinin eş anlamlı eşlemedeki kurallar kullanılarak sorgu zamanında genişletilmesini sağlar. Bu öznitelik mevcut alanlarda değiştirilebilir. Karmaşık alanlar için null veya boş bir koleksiyon olmalıdır. |
type |
Alanın veri türü. |
|
vectorEncoding |
Alan içeriğini yorumlamak için kodlama biçimi. |
|
vectorSearchProfile |
string |
Vektör alanında arama yaparken kullanılacak algoritmayı ve vektörleştiriciyi belirten vektör arama profilinin adı. |
SearchFieldDataType
Arama dizinindeki bir alanın veri türünü tanımlar.
Name | Tür | Description |
---|---|---|
Edm.Boolean |
string |
Bir alanın Boole değeri (true veya false) içerdiğini gösterir. |
Edm.Byte |
string |
Bir alanın 8 bit işaretsiz tamsayı içerdiğini gösterir. Bu yalnızca Collection(Edm.Byte) ile kullanıldığında geçerlidir. |
Edm.ComplexType |
string |
Bir alanın, başka türlerde alt alanları olan bir veya daha fazla karmaşık nesne içerdiğini gösterir. |
Edm.DateTimeOffset |
string |
Bir alanın saat dilimi bilgileri de dahil olmak üzere bir tarih/saat değeri içerdiğini gösterir. |
Edm.Double |
string |
Bir alanın IEEE çift duyarlıklı kayan nokta numarası içerdiğini gösterir. |
Edm.GeographyPoint |
string |
Bir alanın boylam ve enlem açısından coğrafi konum içerdiğini gösterir. |
Edm.Half |
string |
Bir alanın yarım duyarlıklı kayan nokta numarası içerdiğini gösterir. Bu yalnızca Collection(Edm.Half) ile kullanıldığında geçerlidir. |
Edm.Int16 |
string |
Bir alanın 16 bit imzalı bir tamsayı içerdiğini gösterir. Bu yalnızca Collection(Edm.Int16) ile kullanıldığında geçerlidir. |
Edm.Int32 |
string |
Bir alanın 32 bit imzalı bir tamsayı içerdiğini gösterir. |
Edm.Int64 |
string |
Bir alanın 64 bit imzalı bir tamsayı içerdiğini gösterir. |
Edm.SByte |
string |
Bir alanın 8 bit imzalı bir tamsayı içerdiğini gösterir. Bu yalnızca Collection(Edm.SByte) ile kullanıldığında geçerlidir. |
Edm.Single |
string |
Bir alanın tek duyarlıklı kayan nokta numarası içerdiğini gösterir. Bu yalnızca Collection(Edm.Single) ile kullanıldığında geçerlidir. |
Edm.String |
string |
Bir alanın dize içerdiğini gösterir. |
SearchIndex
Bir dizinin alanlarını ve arama davranışını açıklayan bir arama dizini tanımını temsil eder.
Name | Tür | Description |
---|---|---|
@odata.etag |
string |
Dizinin ETag'i. |
analyzers | LexicalAnalyzer[]: |
Dizin için çözümleyiciler. |
charFilters | CharFilter[]: |
Dizin için karakter filtreleri. |
corsOptions |
Dizin için Çıkış Noktaları Arası Kaynak Paylaşımını (CORS) denetleme seçenekleri. |
|
defaultScoringProfile |
string |
Sorguda belirtilmemişse kullanılacak puanlama profilinin adı. Bu özellik ayarlanmazsa ve sorguda puanlama profili belirtilmezse, varsayılan puanlama (tf-idf) kullanılır. |
encryptionKey |
Azure Key Vault'ta oluşturduğunuz bir şifreleme anahtarının açıklaması. Bu anahtar, Microsoft'un bile değil kimsenin verilerinizin şifresini çözemediğini tam olarak güvenceye almak istediğinizde verileriniz için bekleyen ek bir şifreleme düzeyi sağlamak için kullanılır. Verilerinizi şifreledikten sonra her zaman şifrelenmiş olarak kalır. Arama hizmeti bu özelliği null olarak ayarlama girişimlerini yoksayar. Şifreleme anahtarınızı döndürmek istiyorsanız bu özelliği gerektiği gibi değiştirebilirsiniz; Verileriniz etkilenmez. Müşteri tarafından yönetilen anahtarlarla şifreleme, ücretsiz arama hizmetlerinde kullanılamaz ve yalnızca 1 Ocak 2019 veya sonrasında oluşturulan ücretli hizmetler için kullanılabilir. |
|
fields |
Dizinin alanları. |
|
name |
string |
Dizinin adı. |
scoringProfiles |
Dizin için puanlama profilleri. |
|
semantic |
Anlamsal özellikleri etkileyen bir arama dizini için parametreleri tanımlar. |
|
similarity | Similarity: |
Arama sorgusuyla eşleşen belgeleri puanlama ve derecelendirme sırasında kullanılacak benzerlik algoritmasının türü. Benzerlik algoritması yalnızca dizin oluşturma zamanında tanımlanabilir ve mevcut dizinlerde değiştirilemez. Null ise ClassicSimilarity algoritması kullanılır. |
suggesters |
Dizin için öneride bulunanlar. |
|
tokenFilters |
TokenFilter[]:
|
Belirteç, dizin için filtreler. |
tokenizers | LexicalTokenizer[]: |
Dizin için belirteç oluşturucular. |
vectorSearch |
Vektör araması ile ilgili yapılandırma seçeneklerini içerir. |
SearchIndexerDataNoneIdentity
Veri kaynağının kimlik özelliğini temizler.
Name | Tür | Description |
---|---|---|
@odata.type |
string:
#Microsoft. |
Kimlik türünü belirten bir URI parçası. |
SearchIndexerDataUserAssignedIdentity
Kullanılacak veri kaynağının kimliğini belirtir.
Name | Tür | Description |
---|---|---|
@odata.type |
string:
#Microsoft. |
Kimlik türünü belirten bir URI parçası. |
userAssignedIdentity |
string |
Kullanıcı tarafından atanan yönetilen kimliğin tam Azure kaynak kimliği genellikle arama hizmetine atanması gereken "/subscriptions/12345678-1234-1234-1234-123467890ab/resourceGroups/rg/providers/Microsoft.ManagedIdentity/userAssignedIdentities/myId" biçimindedir. |
SearchResourceEncryptionKey
Azure Key Vault'ta müşteri tarafından yönetilen bir şifreleme anahtarı. Oluşturduğunuz ve yönettiğiniz anahtarlar, dizinler ve eş anlamlı haritalar gibi bekleyen verileri şifrelemek veya şifresini çözmek için kullanılabilir.
Name | Tür | Description |
---|---|---|
accessCredentials |
Azure Key Vault'unuza erişmek için kullanılan isteğe bağlı Azure Active Directory kimlik bilgileri. Bunun yerine yönetilen kimlik kullanılıyorsa gerekli değildir. |
|
keyVaultKeyName |
string |
Bekleyen verilerinizi şifrelemek için kullanılacak Azure Key Vault anahtarınızın adı. |
keyVaultKeyVersion |
string |
Bekleyen verilerinizi şifrelemek için kullanılacak Azure Key Vault anahtarınızın sürümü. |
keyVaultUri |
string |
Bekleyen verilerinizi şifrelemek için kullanılacak anahtarı içeren, DNS adı olarak da adlandırılan Azure Key Vault URI'sidir. Örnek bir URI |
SemanticConfiguration
Anlamsal özellikler bağlamında kullanılacak belirli bir yapılandırmayı tanımlar.
Name | Tür | Description |
---|---|---|
name |
string |
Anlamsal yapılandırmanın adı. |
prioritizedFields |
Anlam derecelendirmesi, açıklamalı alt yazılar, vurgular ve yanıtlar için kullanılacak başlık, içerik ve anahtar sözcük alanlarını açıklar. Üç alt özellikten en az birinin (titleField, prioritizedKeywordsFields ve prioritizedContentFields) ayarlanması gerekir. |
SemanticField
Anlamsal yapılandırmanın bir parçası olarak kullanılan alan.
Name | Tür | Description |
---|---|---|
fieldName |
string |
SemanticSettings
Anlamsal özellikleri etkileyen bir arama dizini için parametreleri tanımlar.
Name | Tür | Description |
---|---|---|
configurations |
Dizin için anlamsal yapılandırmalar. |
|
defaultConfiguration |
string |
Dizininizde varsayılan bir semantik yapılandırmanın adını ayarlamanıza olanak tanır ve bunu her seferinde sorgu parametresi olarak geçirmeyi isteğe bağlı hale getirir. |
ShingleTokenFilter
Belirteç birleşimlerini tek bir belirteç olarak oluşturur. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır.
Name | Tür | Default value | Description |
---|---|---|---|
@odata.type |
string:
#Microsoft. |
Belirteç filtresinin türünü belirten bir URI parçası. |
|
filterToken |
string |
_ |
Belirtecin olmadığı her konum için eklenecek dize. Varsayılan, bir alt çizgidir ("_"). |
maxShingleSize |
integer |
2 |
Maksimum zona boyutu. Varsayılan ve en düşük değer 2'dir. |
minShingleSize |
integer |
2 |
En düşük zona boyutu. Varsayılan ve en düşük değer 2'dir. maxShingleSize değerinden küçük olmalıdır. |
name |
string |
Belirteç filtresinin adı. Yalnızca harf, basamak, boşluk, tire veya alt çizgi içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır. |
|
outputUnigrams |
boolean |
True |
Çıkış akışının hem giriş belirteçlerini (tek birimleri) hem de zonaları içerip içermeyeceğini gösteren bir değer. Varsayılan değer true'dur. |
outputUnigramsIfNoShingles |
boolean |
False |
Kullanılabilir zona olmadığı zamanlarda tek birimlerin çıkışını alıp almayacağını belirten bir değer. OutputUnigrams false olarak ayarlandığında bu özellik önceliklidir. Varsayılan değer false'tur. |
tokenSeparator |
string |
Bir shingle oluşturmak için bitişik belirteçleri birleştirirken kullanılacak dize. Varsayılan değer tek bir boşluk (" ") şeklindedir. |
SnowballTokenFilter
Snowball tarafından oluşturulan kök ayırıcı kullanarak sözcüklerin köklerini oluşturan bir filtre. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır.
Name | Tür | Description |
---|---|---|
@odata.type |
string:
#Microsoft. |
Belirteç filtresinin türünü belirten bir URI parçası. |
language |
Kullanılacak dil. |
|
name |
string |
Belirteç filtresinin adı. Yalnızca harf, basamak, boşluk, tire veya alt çizgi içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır. |
SnowballTokenFilterLanguage
Snowball belirteci filtresi için kullanılacak dil.
Name | Tür | Description |
---|---|---|
armenian |
string |
Ermeni için Lucene Snowball kök belirteçleştiricisini seçer. |
basque |
string |
Bask için Lucene Snowball stemming tokenizer'ı seçer. |
catalan |
string |
Catalan için Lucene Snowball kök belirteç oluşturucuyu seçer. |
danish |
string |
Danca için Lucene Snowball kök belirteçleştiricisini seçer. |
dutch |
string |
Felemenkçe için Lucene Snowball kök belirteçleştiricisini seçer. |
english |
string |
İngilizce için Lucene Snowball stemming tokenizer'ı seçer. |
finnish |
string |
Fince için Lucene Snowball stemming tokenizer'ı seçer. |
french |
string |
Fransızca için Lucene Snowball stemming tokenizer'ı seçer. |
german |
string |
Almanca için Lucene Snowball stemming tokenizer'ı seçer. |
german2 |
string |
Almanca değişken algoritmasını kullanan Lucene Snowball kök belirteçleştiricisini seçer. |
hungarian |
string |
Macarca için Lucene Snowball kök belirteçleştiricisini seçer. |
italian |
string |
İtalyanca için Lucene Snowball stemming tokenizer'ı seçer. |
kp |
string |
Felemenkçe için Kraaij-Pohlmann köklendirme algoritmasını kullanan Lucene Snowball köklendirme belirteçleştiricisini seçer. |
lovins |
string |
Lovins stemming algoritmasını kullanan İngilizce için Lucene Snowball stemming tokenizer'ı seçer. |
norwegian |
string |
Norveç dili için Lucene Snowball kök belirteç oluşturucuyu seçer. |
porter |
string |
Porter kök oluşturma algoritmasını kullanan İngilizce için Lucene Snowball stemming tokenizer'ı seçer. |
portuguese |
string |
Portekizce için Lucene Snowball kök belirteçleştiricisini seçer. |
romanian |
string |
Rumence için Lucene Snowball stemming tokenizer'ı seçer. |
russian |
string |
Rusça için Lucene Snowball stemming tokenizer'ı seçer. |
spanish |
string |
İspanyolca için Lucene Snowball kök belirteç oluşturucuyu seçer. |
swedish |
string |
İsveççe için Lucene Snowball kök belirteçleştiricisini seçer. |
turkish |
string |
Türkçe için Lucene Snowball stemming tokenizer'ı seçer. |
StemmerOverrideTokenFilter
Özel sözlük tabanlı kök oluşturma ile diğer kök filtreleme filtrelerini geçersiz kılma olanağı sağlar. Sözlük köküne sahip terimler anahtar sözcük olarak işaretlenir, böylece zincirdeki kök ayırıcılarla kaynaklanmaz. Herhangi bir köklendirme filtresinin önüne yerleştirilmelidir. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır.
Name | Tür | Description |
---|---|---|
@odata.type |
string:
#Microsoft. |
Belirteç filtresinin türünü belirten bir URI parçası. |
name |
string |
Belirteç filtresinin adı. Yalnızca harf, basamak, boşluk, tire veya alt çizgi içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır. |
rules |
string[] |
Şu biçimdeki kök oluşturma kurallarının listesi: "word => stem", örneğin: "ran => run". |
StemmerTokenFilter
Dile özgü gövde filtresi. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır.
Name | Tür | Description |
---|---|---|
@odata.type |
string:
#Microsoft. |
Belirteç filtresinin türünü belirten bir URI parçası. |
language |
Kullanılacak dil. |
|
name |
string |
Belirteç filtresinin adı. Yalnızca harf, basamak, boşluk, tire veya alt çizgi içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır. |
StemmerTokenFilterLanguage
Kökmer belirteci filtresi için kullanılacak dil.
Name | Tür | Description |
---|---|---|
arabic |
string |
Arapça için Lucene kök belirteç oluşturucuyu seçer. |
armenian |
string |
Ermeni için Lucene kök belirteç oluşturucuyu seçer. |
basque |
string |
Bask için Lucene kök belirteç oluşturucuyu seçer. |
brazilian |
string |
Portekizce (Brezilya) için Lucene kök belirteç oluşturucuyu seçer. |
bulgarian |
string |
Bulgarca için Lucene kök belirteç oluşturucuyu seçer. |
catalan |
string |
Katalalan için Lucene kök belirteç oluşturucuyu seçer. |
czech |
string |
Çekçe için Lucene kök belirteç oluşturucuyu seçer. |
danish |
string |
Danca için Lucene kök belirteç oluşturucuyu seçer. |
dutch |
string |
Felemenkçe için Lucene kök belirteç oluşturucuyu seçer. |
dutchKp |
string |
Felemenkçe için Kraaij-Pohlmann saplama algoritmasını kullanan Lucene köklendirme belirtecini seçer. |
english |
string |
İngilizce için Lucene kök belirteç oluşturucuyu seçer. |
finnish |
string |
Fince için Lucene kök belirteç oluşturucuyu seçer. |
french |
string |
Fransızca için Lucene kök belirteç oluşturucuyu seçer. |
galician |
string |
Galiçya dili için Lucene kök belirteç oluşturucuyu seçer. |
german |
string |
Almanca için Lucene kök belirteç oluşturucuyu seçer. |
german2 |
string |
Almanca değişken algoritmasını kullanan Lucene kök belirteç oluşturucuyu seçer. |
greek |
string |
Yunanca için Lucene kök belirteç oluşturucuyu seçer. |
hindi |
string |
Hintçe için Lucene kök belirteç oluşturucuyu seçer. |
hungarian |
string |
Macarca için Lucene kök belirteç oluşturucuyu seçer. |
indonesian |
string |
Endonezya dili için Lucene kök belirteç oluşturucuyu seçer. |
irish |
string |
İrlanda dili için Lucene kök belirteç oluşturucuyu seçer. |
italian |
string |
İtalyanca için Lucene kök belirteç oluşturucuyu seçer. |
latvian |
string |
Letonca için Lucene kök belirteç oluşturucuyu seçer. |
lightEnglish |
string |
Işık kökü oluşturma işlemine sahip İngilizce için Lucene köklendirme belirtecini seçer. |
lightFinnish |
string |
Fince için ışık saplama işlemine sahip Lucene köklendirme belirtecini seçer. |
lightFrench |
string |
Fransızca için ışık kökü oluşturma işlemine sahip Lucene köklendirme belirtecini seçer. |
lightGerman |
string |
Almanca için ışık kökü oluşturma işlemine sahip Lucene köklendirme belirtecini seçer. |
lightHungarian |
string |
Macarca için ışık kökü oluşturma işlemine sahip Lucene köklendirme belirtecini seçer. |
lightItalian |
string |
İtalyanca için ışık saplama işlemine sahip Lucene köklendirme belirtecini seçer. |
lightNorwegian |
string |
Norveççe (Bokmål) için ışık köklendirmesi kullanan Lucene köklendirme belirteçleştiricisini seçer. |
lightNynorsk |
string |
Norveç dili (Nynorsk) için ışık köklendirme yapan Lucene köklendirme belirtecini seçer. |
lightPortuguese |
string |
Portekizce için ışık kökü oluşturma işlemine sahip Lucene köklendirme belirtecini seçer. |
lightRussian |
string |
Rusça için ışık kökü oluşturma işlemine sahip Lucene köklendirme belirtecini seçer. |
lightSpanish |
string |
İspanyolca için ışık saplama işlemine sahip Lucene köklendirme belirtecini seçer. |
lightSwedish |
string |
İsveççe için ışık saplama işlemine sahip Lucene köklendirme belirtecini seçer. |
lovins |
string |
Lovins kök oluşturma algoritmasını kullanan İngilizce için Lucene kök belirteci belirtecini seçer. |
minimalEnglish |
string |
Minimum kök oluşturma işlemine sahip İngilizce için Lucene köklendirme belirtecini seçer. |
minimalFrench |
string |
Minimum kök oluşturma işlemine sahip Fransızca için Lucene köklendirme belirtecini seçer. |
minimalGalician |
string |
Galiçyalı için minimum köklendirme işlemine sahip Lucene köklendirme belirteçleştiricisini seçer. |
minimalGerman |
string |
Almanca için minimum kök oluşturma işlemine sahip Lucene köklendirme belirtecini seçer. |
minimalNorwegian |
string |
Norveççe (Bokmål) için minimum köklendirme işlemine sahip Lucene köklendirme belirteçleştiricisini seçer. |
minimalNynorsk |
string |
Norveç dili (Nynorsk) için minimum köklendirme yapan Lucene köklendirme belirtecini seçer. |
minimalPortuguese |
string |
Portekizce için minimum kök oluşturma işlemine sahip Lucene kök belirteci belirtecini seçer. |
norwegian |
string |
Norveççe (Bokmål) için Lucene kök belirteç oluşturucuyu seçer. |
porter2 |
string |
Porter2 kök oluşturma algoritmasını kullanan İngilizce için Lucene köklendirme belirtecini seçer. |
portuguese |
string |
Portekizce için Lucene kök belirteç oluşturucuyu seçer. |
portugueseRslp |
string |
RSLP kök oluşturma algoritmasını kullanan Portekizce için Lucene köklendirme belirtecini seçer. |
possessiveEnglish |
string |
sözcüklerden sondaki sahiplikleri kaldıran İngilizce için Lucene kök belirteç belirtecini seçer. |
romanian |
string |
Rumence için Lucene kök belirteç oluşturucuyu seçer. |
russian |
string |
Rusça için Lucene kök belirteç oluşturucuyu seçer. |
sorani |
string |
Sorani için Lucene kök belirteç oluşturucuyu seçer. |
spanish |
string |
İspanyolca için Lucene kök belirteç oluşturucuyu seçer. |
swedish |
string |
İsveççe için Lucene kök belirteç oluşturucuyu seçer. |
turkish |
string |
Türkçe için Lucene kök belirteç oluşturucuyu seçer. |
StopAnalyzer
Metni harf olmayanlara böler; Küçük harf ve stopword belirteci filtrelerini uygular. Bu çözümleyici Apache Lucene kullanılarak uygulanır.
Name | Tür | Description |
---|---|---|
@odata.type |
string:
#Microsoft. |
Çözümleyici türünü belirten bir URI parçası. |
name |
string |
Çözümleyicinin adı. Yalnızca harf, basamak, boşluk, tire veya alt çizgi içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır. |
stopwords |
string[] |
Stopwords listesi. |
StopwordsList
Dile özgü stopword'lerin önceden tanımlanmış bir listesini tanımlar.
Name | Tür | Description |
---|---|---|
arabic |
string |
Arapça için stopword listesini seçer. |
armenian |
string |
Ermeni için stopword listesini seçer. |
basque |
string |
Bask dili için stopword listesini seçer. |
brazilian |
string |
Portekizce (Brezilya) için stopword listesini seçer. |
bulgarian |
string |
Bulgarca için stopword listesini seçer. |
catalan |
string |
Katalalanın stopword listesini seçer. |
czech |
string |
Çekçe için stopword listesini seçer. |
danish |
string |
Danca için stopword listesini seçer. |
dutch |
string |
Felemenkçe için stopword listesini seçer. |
english |
string |
İngilizce için stopword listesini seçer. |
finnish |
string |
Fince için stopword listesini seçer. |
french |
string |
Fransızca için stopword listesini seçer. |
galician |
string |
Galiçya dili için stopword listesini seçer. |
german |
string |
Almanca için stopword listesini seçer. |
greek |
string |
Yunanca için stopword listesini seçer. |
hindi |
string |
Hintçe için stopword listesini seçer. |
hungarian |
string |
Macarca için stopword listesini seçer. |
indonesian |
string |
Endonezya dili için stopword listesini seçer. |
irish |
string |
İrlanda dili için stopword listesini seçer. |
italian |
string |
İtalyanca için stopword listesini seçer. |
latvian |
string |
Letonca için stopword listesini seçer. |
norwegian |
string |
Norveç dili için stopword listesini seçer. |
persian |
string |
Farsça için stopword listesini seçer. |
portuguese |
string |
Portekizce için stopword listesini seçer. |
romanian |
string |
Rumence için stopword listesini seçer. |
russian |
string |
Rusça için stopword listesini seçer. |
sorani |
string |
Sorani için stopword listesini seçer. |
spanish |
string |
İspanyolca için stopword listesini seçer. |
swedish |
string |
İsveççe için stopword listesini seçer. |
thai |
string |
Tay dili için stopword listesini seçer. |
turkish |
string |
Türkçe için stopword listesini seçer. |
StopwordsTokenFilter
Belirteç akışından durdurma sözcüklerini kaldırır. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır.
Name | Tür | Default value | Description |
---|---|---|---|
@odata.type |
string:
#Microsoft. |
Belirteç filtresinin türünü belirten bir URI parçası. |
|
ignoreCase |
boolean |
False |
Büyük/küçük harf yoksayılıp yoksayılmayacağını belirten bir değer. True ise, önce tüm sözcükler küçük harfe dönüştürülür. Varsayılan değer false'tur. |
name |
string |
Belirteç filtresinin adı. Yalnızca harf, basamak, boşluk, tire veya alt çizgi içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır. |
|
removeTrailing |
boolean |
True |
Bir durdurma sözcüğüyse son arama teriminin yoksayılıp yoksayılmayacağını belirten değer. Varsayılan değer true'dur. |
stopwords |
string[] |
Stopwords listesi. Bu özellik ve stopwords listesi özelliği ayarlanamaz. |
|
stopwordsList | english |
Kullanılacak önceden tanımlanmış bir stopword listesi. Bu özellik ve stopwords özelliği ayarlanamaz. Varsayılan değer İngilizce'dir. |
Suggester
Öneri API'sinin dizindeki bir alan grubuna nasıl uygulanacağını tanımlar.
Name | Tür | Description |
---|---|---|
name |
string |
Öneride bulunanın adı. |
searchMode |
Öneride bulunanın özelliklerini gösteren değer. |
|
sourceFields |
string[] |
Öneride bulunanın uygulandığı alan adlarının listesi. Her alan aranabilir olmalıdır. |
SuggesterSearchMode
Öneride bulunanın özelliklerini gösteren değer.
Name | Tür | Description |
---|---|---|
analyzingInfixMatching |
string |
Bir alandaki ardışık tüm terimleri ve ön ekleri eşleştirir. Örneğin, 'En hızlı kahverengi tilki' alanı için 'hızlı' ve 'en hızlı kaş' sorgularının her ikisi de eşleşir. |
SynonymTokenFilter
Belirteç akışındaki tek veya çok sözcüklü eş anlamlılarla eşleşir. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır.
Name | Tür | Default value | Description |
---|---|---|---|
@odata.type |
string:
#Microsoft. |
Belirteç filtresinin türünü belirten bir URI parçası. |
|
expand |
boolean |
True |
Eş anlamlılar listesindeki tüm sözcüklerin (eğer => gösterimi kullanılmazsa) birbiriyle eşlenip eşlenmediğini gösteren bir değer. True ise, eş anlamlılar listesindeki tüm sözcükler (eğer => gösterimi kullanılmazsa) birbiriyle eşlenir. Aşağıdaki liste: inanılmaz, inanılmaz, muhteşem, şaşırtıcı eşdeğerdir: inanılmaz, inanılmaz, muhteşem, şaşırtıcı => inanılmaz, inanılmaz, muhteşem, şaşırtıcı. False ise, şu liste: inanılmaz, inanılmaz, muhteşem, şaşırtıcı şunun eşdeğeri olacaktır: inanılmaz, inanılmaz, muhteşem, şaşırtıcı => inanılmaz. Varsayılan değer true'dur. |
ignoreCase |
boolean |
False |
Eşleştirme için büyük/küçük harfe katlanmış girişin yapılıp yapılmayacağını gösteren değer. Varsayılan değer false'tur. |
name |
string |
Belirteç filtresinin adı. Yalnızca harf, basamak, boşluk, tire veya alt çizgi içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır. |
|
synonyms |
string[] |
İki biçimden birini izleyen eş anlamlıların listesi: 1. inanılmaz, inanılmaz, muhteşem => şaşırtıcı - => simgesinin sol tarafındaki tüm terimler sağ tarafındaki tüm terimlerle değiştirilecek; 2. inanılmaz, inanılmaz, muhteşem, şaşırtıcı - eşdeğer sözcüklerin virgülle ayrılmış listesi. Bu listenin yorumlandığı şekli değiştirmek için genişletme seçeneğini ayarlayın. |
TagScoringFunction
Belirli bir etiket listesiyle eşleşen dize değerleriyle belge puanlarını artıran bir işlev tanımlar.
Name | Tür | Description |
---|---|---|
boost |
number |
Ham puanın çarpanı. 1,0'a eşit olmayan pozitif bir sayı olmalıdır. |
fieldName |
string |
Puanlama işlevine giriş olarak kullanılan alanın adı. |
interpolation |
Artırmanın belge puanları arasında nasıl ilişkilendirilmiş olacağını gösteren değer; varsayılan olarak "Doğrusal" olarak adlandırılır. |
|
tag |
Etiket puanlama işlevi için parametre değerleri. |
|
type |
string:
tag |
Kullanılacak işlevin türünü gösterir. Geçerli değerler arasında büyüklük, tazelik, uzaklık ve etiket bulunur. İşlev türü küçük harf olmalıdır. |
TagScoringParameters
Etiket puanlama işlevine parametre değerleri sağlar.
Name | Tür | Description |
---|---|---|
tagsParameter |
string |
Hedef alanla karşılaştırılacak etiketlerin listesini belirtmek için arama sorgularında geçirilen parametrenin adı. |
TextWeights
Eşleşmelerin arama sorgularında puanlamanın artırılması gereken dizin alanlarında ağırlıkları tanımlar.
Name | Tür | Description |
---|---|---|
weights |
object |
Belge puanlamasını artırmak için alan başına ağırlık sözlüğü. Anahtarlar alan adları ve değerler her alanın ağırlıklarıdır. |
TokenCharacterKind
Belirteç filtresinin üzerinde çalışabileceği karakter sınıflarını temsil eder.
Name | Tür | Description |
---|---|---|
digit |
string |
Basamakları belirteçlerde tutar. |
letter |
string |
Harfleri belirteç olarak tutar. |
punctuation |
string |
Belirteçlerde noktalama işaretlerini korur. |
symbol |
string |
Sembolleri belirteçlerde tutar. |
whitespace |
string |
Belirteçlerde boşluğu korur. |
TokenFilterName
Arama altyapısı tarafından desteklenen tüm belirteç filtrelerinin adlarını tanımlar.
TruncateTokenFilter
Terimleri belirli bir uzunlukta kısaltın. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır.
Name | Tür | Default value | Description |
---|---|---|---|
@odata.type |
string:
#Microsoft. |
Belirteç filtresinin türünü belirten bir URI parçası. |
|
length |
integer |
300 |
Koşulların kesileceği uzunluk. Varsayılan ve maksimum değer 300'dür. |
name |
string |
Belirteç filtresinin adı. Yalnızca harf, basamak, boşluk, tire veya alt çizgi içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır. |
UaxUrlEmailTokenizer
Url'leri ve e-postaları tek bir belirteç olarak belirteçler. Bu belirteç oluşturucu Apache Lucene kullanılarak uygulanır.
Name | Tür | Default value | Description |
---|---|---|---|
@odata.type |
string:
#Microsoft. |
Belirteç oluşturucunun türünü belirten bir URI parçası. |
|
maxTokenLength |
integer |
255 |
En fazla belirteç uzunluğu. Varsayılan değer 255'tir. Uzunluk üst sınırından uzun olan belirteçler bölünür. Kullanılabilecek en fazla belirteç uzunluğu 300 karakterdir. |
name |
string |
Belirteç oluşturucunun adı. Yalnızca harf, basamak, boşluk, tire veya alt çizgi içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır. |
UniqueTokenFilter
Önceki belirteçle aynı metindeki belirteçleri filtreler. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır.
Name | Tür | Default value | Description |
---|---|---|---|
@odata.type |
string:
#Microsoft. |
Belirteç filtresinin türünü belirten bir URI parçası. |
|
name |
string |
Belirteç filtresinin adı. Yalnızca harf, basamak, boşluk, tire veya alt çizgi içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır. |
|
onlyOnSamePosition |
boolean |
False |
Yinelenenlerin yalnızca aynı konumda kaldırılıp kaldırılmayacağını gösteren bir değer. Varsayılan değer false'tur. |
VectorEncodingFormat
Vektör alanı içeriğini yorumlamak için kodlama biçimi.
Name | Tür | Description |
---|---|---|
packedBit |
string |
Daha geniş bir veri türüne paketlenmiş bitleri temsil eden kodlama biçimi. |
VectorSearch
Vektör araması ile ilgili yapılandırma seçeneklerini içerir.
Name | Tür | Description |
---|---|---|
algorithms | VectorSearchAlgorithmConfiguration[]: |
Dizin oluşturma veya sorgulama sırasında kullanılan algoritmaya özgü yapılandırma seçeneklerini içerir. |
compressions | VectorSearchCompressionConfiguration[]: |
Dizin oluşturma veya sorgulama sırasında kullanılan sıkıştırma yöntemine özgü yapılandırma seçeneklerini içerir. |
profiles |
Vektör araması ile kullanılacak yapılandırma birleşimlerini tanımlar. |
|
vectorizers | VectorSearchVectorizer[]: |
Metin vektör sorgularını vektörleştirmeye ilişkin yapılandırma seçeneklerini içerir. |
VectorSearchAlgorithmKind
Dizin oluşturma ve sorgulama için kullanılan algoritma.
Name | Tür | Description |
---|---|---|
exhaustiveKnn |
string |
Deneme yanılma araması yapacak kapsamlı KNN algoritması. |
hnsw |
string |
HNSW (Hiyerarşik Gezinilebilir Küçük Dünya), yaklaşık en yakın komşular algoritması türü. |
VectorSearchAlgorithmMetric
Vektör karşılaştırmaları için kullanılacak benzerlik ölçümü. Ekleme modelinin eğitildiği benzerlik ölçümünü seçmeniz önerilir.
Name | Tür | Description |
---|---|---|
cosine |
string |
Benzerliklerini ölçmek için vektörler arasındaki açıyı ölçer ve büyüklüğünü göz ardı eder. Açı ne kadar küçük olursa benzerlik de o kadar yakın olur. |
dotProduct |
string |
Hizalamayı ve büyüklük benzerliğini ölçmek için elemana göre ürünlerin toplamını hesaplar. Ne kadar büyük ve daha pozitif olursa benzerlik o kadar yakın olur. |
euclidean |
string |
Çok boyutlu bir alanda vektörler arasındaki düz çizgi mesafesini hesaplar. Mesafe ne kadar küçük olursa benzerlik de o kadar yakın olur. |
hamming |
string |
Yalnızca bit dolu ikili veri türleri için geçerlidir. İkili vektörlerdeki farklı konumları sayarak eşitsizliği belirler. Ne kadar az fark olursa benzerlik o kadar yakın olur. |
VectorSearchCompressionKind
Dizin oluşturma ve sorgulama için kullanılan sıkıştırma yöntemi.
Name | Tür | Description |
---|---|---|
binaryQuantization |
string |
İkili Niceleme, bir sıkıştırma yöntemi türüdür. İkili nicelemede özgün vektör değerleri, ikili değerler kullanılarak bir vektördeki her bileşeni ayrıklaştırıp temsil ederek daha dar ikili türe sıkıştırılır ve böylece genel veri boyutu küçültülebilir. |
scalarQuantization |
string |
Skaler Niceleme, bir sıkıştırma yöntemi türüdür. Skaler nicelemede, özgün vektör değerleri daha dar bir türe sıkıştırılır ve azaltılmış bir nicelenmiş değer kümesi kullanılarak vektörün her bileşenini ayrık hale getirerek ve temsil ederek genel veri boyutunu küçültür. |
VectorSearchCompressionTargetDataType
Sıkıştırılmış vektör değerlerinin nicelenmiş veri türü.
Name | Tür | Description |
---|---|---|
int8 |
string |
VectorSearchProfile
Vektör araması ile kullanılacak yapılandırmaların bir bileşimini tanımlar.
Name | Tür | Description |
---|---|---|
algorithm |
string |
Algoritmayı ve isteğe bağlı parametreleri belirten vektör arama algoritması yapılandırmasının adı. |
compression |
string |
Sıkıştırma yöntemini ve isteğe bağlı parametreleri belirten sıkıştırma yöntemi yapılandırmasının adı. |
name |
string |
Bu özel vektör arama profiliyle ilişkilendirilecek ad. |
vectorizer |
string |
Vektör araması ile kullanılmak üzere yapılandırılan vektörleştirmenin adı. |
VectorSearchVectorizerKind
Sorgu zamanında kullanılacak vektörleştirme yöntemi.
Name | Tür | Description |
---|---|---|
azureOpenAI |
string |
Sorgu zamanında bir Azure OpenAI kaynağı kullanarak eklemeler oluşturun. |
customWebApi |
string |
Sorgu zamanında özel bir web uç noktası kullanarak eklemeler oluşturun. |
WebApiParameters
Kullanıcı tanımlı vektörleştiriciye bağlanma özelliklerini belirtir.
Name | Tür | Description |
---|---|---|
authIdentity | SearchIndexerDataIdentity: |
Giden bağlantılar için kullanılan kullanıcı tarafından atanan yönetilen kimlik. Bir authResourceId sağlanırsa ve belirtilmezse, sistem tarafından atanan yönetilen kimlik kullanılır. Dizin oluşturucu güncelleştirmelerinde kimlik belirtilmezse değer değişmeden kalır. "Hiçbiri" olarak ayarlanırsa, bu özelliğin değeri temizlenir. |
authResourceId |
string |
Bir Azure işlevindeki dış koda veya dönüştürmeleri sağlayan başka bir uygulamaya bağlanan özel uç noktalar için geçerlidir. Bu değer, Azure Active Directory'ye kaydedildiğinde işlev veya uygulama için oluşturulan uygulama kimliği olmalıdır. Belirtildiğinde vektörleştirme, arama hizmetinin yönetilen kimliğini (sistem veya kullanıcı tarafından atanan) ve işlevin veya uygulamanın erişim belirtecini kullanarak işleve veya uygulamaya bağlanır ve erişim belirtecinin kapsamını oluşturmak için bu değeri kaynak kimliği olarak kullanabilir. |
httpHeaders |
object |
HTTP isteğinde bulunmak için gereken üst bilgiler. |
httpMethod |
string |
HTTP isteğinin yöntemi. |
timeout |
string |
İstek için istenen zaman aşımı. Varsayılan değer 30 saniyedir. |
uri |
string |
Vektörleştiriciyi sağlayan Web API'sinin URI'si. |
WebApiVectorizer
Bir sorgu dizesinin vektör eklemesini oluşturmak için kullanıcı tanımlı bir vektörleştirici belirtir. Bir beceri kümesinin özel Web API arabirimi kullanılarak dış vektörleştiricinin tümleştirilmesi sağlanır.
Name | Tür | Description |
---|---|---|
customWebApiParameters |
Kullanıcı tanımlı vektörleştiricinin özelliklerini belirtir. |
|
kind |
string:
custom |
Vektör arama ile kullanılmak üzere yapılandırılan vektörleştirme yönteminin türü. |
name |
string |
Bu özel vektörleştirme yöntemiyle ilişkilendirilecek ad. |
WordDelimiterTokenFilter
Sözcükleri alt sözcüklere böler ve alt sözcük gruplarında isteğe bağlı dönüştürmeler gerçekleştirir. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır.
Name | Tür | Default value | Description |
---|---|---|---|
@odata.type |
string:
#Microsoft. |
Belirteç filtresinin türünü belirten bir URI parçası. |
|
catenateAll |
boolean |
False |
Tüm alt parçaların katılmış olup olmayacağını gösteren bir değer. Örneğin, bu true olarak ayarlanırsa, "Azure-Search-1" "AzureSearch1" olur. Varsayılan değer false'tur. |
catenateNumbers |
boolean |
False |
Sayı parçalarının en fazla çalıştırılıp çalıştırılmayacağını gösteren bir değer. Örneğin, bu true olarak ayarlanırsa, "1-2" "12" olur. Varsayılan değer false'tur. |
catenateWords |
boolean |
False |
Sözcük bölümlerinin en fazla çalıştırılıp çalıştırılmayacağını gösteren değer. Örneğin, bu true olarak ayarlanırsa, "Azure-Search" "AzureSearch" olur. Varsayılan değer false'tur. |
generateNumberParts |
boolean |
True |
Sayı alt sözcüğü oluşturulup oluşturulmayacağını gösteren değer. Varsayılan değer true'dur. |
generateWordParts |
boolean |
True |
Parça sözcükleri oluşturulup oluşturulmayacağını gösteren bir değer. Ayarlanırsa, sözcük parçalarının oluşturulmasına neden olur; Örneğin, "AzureSearch" "Azure" "Search" olur. Varsayılan değer true'dur. |
name |
string |
Belirteç filtresinin adı. Yalnızca harf, basamak, boşluk, tire veya alt çizgi içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır. |
|
preserveOriginal |
boolean |
False |
Özgün sözcüklerin korunup korunmayacağını ve alt sözcük listesine eklenip eklenmeyeceğini gösteren değer. Varsayılan değer false'tur. |
protectedWords |
string[] |
Sınırlandırılmaktan korunmak için belirteçlerin listesi. |
|
splitOnCaseChange |
boolean |
True |
caseChange üzerinde sözcüklerin bölünip bölünmeyeceğini belirten bir değer. Örneğin, bu true olarak ayarlanırsa, "AzureSearch" "Azure" "Search" olur. Varsayılan değer true'dur. |
splitOnNumerics |
boolean |
True |
Sayılara bölünip bölünmeyeceğini gösteren bir değer. Örneğin, bu true olarak ayarlanırsa, "Azure1Search" "Azure" "1" "Search" olur. Varsayılan değer true'dur. |
stemEnglishPossessive |
boolean |
True |
Her alt kelime için sondaki "'leri" kaldırılıp kaldırılmayacağını belirten bir değer. Varsayılan değer true'dur. |