Aracılığıyla paylaş


Indexes - Create

Yeni bir arama dizini oluşturur.

POST {endpoint}/indexes?api-version=2025-09-01

URI Parametreleri

Name İçinde Gerekli Tür Description
endpoint
path True

string

Arama hizmetinin uç nokta URL'si.

api-version
query True

string

İstemci Api Sürümü.

İstek Başlığı

Name Gerekli Tür Description
x-ms-client-request-id

string (uuid)

Hata ayıklamaya yardımcı olmak için istekle birlikte gönderilen izleme kimliği.

İstek Gövdesi

Name Gerekli Tür Description
fields True

SearchField[]

Dizinin alanları.

name True

string

Dizinin adı.

@odata.etag

string

Dizinin ETag'i.

analyzers LexicalAnalyzer[]:

Dizin için çözümleyiciler.

charFilters CharFilter[]:

Dizin için karakter filtreleri.

corsOptions

CorsOptions

Dizin için Çıkış Noktaları Arası Kaynak Paylaşımı'nı (CORS) denetleme seçenekleri.

defaultScoringProfile

string

Sorguda hiçbiri belirtilmemişse kullanılacak puanlama profilinin adı. Bu özellik ayarlanmamışsa ve sorguda puanlama profili belirtilmemişse, varsayılan puanlama (tf-idf) kullanılır.

description

string

Dizinin açıklaması.

encryptionKey

SearchResourceEncryptionKey

Azure Key Vault'ta oluşturduğunuz bir şifreleme anahtarının açıklaması. Bu anahtar, hiç kimsenin, hatta Microsoft'un bile verilerinizin şifresini çözemeyeceğinden tam olarak emin olmak istediğinizde, verileriniz için ek bir bekleyen şifreleme düzeyi sağlamak için kullanılır. Verilerinizi bir kez şifreledikten sonra, her zaman şifreli kalacaktır. Arama hizmeti, bu özelliği null olarak ayarlama girişimlerini yoksayar. Şifreleme anahtarınızı döndürmek istiyorsanız bu özelliği gerektiği gibi değiştirebilirsiniz; Verileriniz etkilenmeyecektir. Müşteri tarafından yönetilen anahtarlarla şifreleme, ücretsiz arama hizmetleri için kullanılamaz ve yalnızca 1 Ocak 2019'da veya sonrasında oluşturulan ücretli hizmetler için kullanılabilir.

normalizers LexicalNormalizer[]:

CustomNormalizer[]

Dizin için normalleştiriciler.

scoringProfiles

ScoringProfile[]

Dizin için puanlama profilleri.

semantic

SemanticSettings

Anlamsal yetenekleri etkileyen bir arama dizini için parametreleri tanımlar.

similarity Similarity:

Bir arama sorgusuyla eşleşen belgeleri puanlarken ve sıralarken kullanılacak benzerlik algoritmasının türü. Benzerlik algoritması yalnızca dizin oluşturma sırasında tanımlanabilir ve mevcut dizinlerde değiştirilemez. Null ise, ClassicSimilarity algoritması kullanılır.

suggesters

Suggester[]

Dizin için önerilerde bulunanlar.

tokenFilters TokenFilter[]:

Belirteç, dizin için filtre uygular.

tokenizers LexicalTokenizer[]:

Dizin için belirteçleştiriciler.

vectorSearch

VectorSearch

Vektör arama ile ilgili yapılandırma seçeneklerini içerir.

Yanıtlar

Name Tür Description
201 Created

SearchIndex

Other Status Codes

ErrorResponse

Hata yanıtı.

Örnekler

SearchServiceCreateIndex

Örnek isteği

POST https://stableexampleservice.search.windows.net/indexes?api-version=2025-09-01


{
  "name": "temp-stable-test",
  "description": "description",
  "fields": [
    {
      "name": "id",
      "type": "Edm.String",
      "key": true,
      "sortable": true
    },
    {
      "name": "vector1",
      "type": "Collection(Edm.Single)",
      "retrievable": true,
      "searchable": true,
      "dimensions": 20,
      "vectorSearchProfile": "config1"
    },
    {
      "name": "vector1b",
      "type": "Collection(Edm.Single)",
      "retrievable": true,
      "searchable": true,
      "dimensions": 10,
      "vectorSearchProfile": "config2"
    },
    {
      "name": "vector2",
      "type": "Collection(Edm.Single)",
      "retrievable": true,
      "searchable": true,
      "dimensions": 5,
      "vectorSearchProfile": "config3"
    },
    {
      "name": "vector3",
      "type": "Collection(Edm.Single)",
      "retrievable": true,
      "searchable": true,
      "dimensions": 5,
      "vectorSearchProfile": "config3"
    },
    {
      "name": "vector22",
      "type": "Collection(Edm.Single)",
      "retrievable": true,
      "searchable": true,
      "dimensions": 10,
      "vectorSearchProfile": "config2"
    },
    {
      "name": "name",
      "type": "Edm.String",
      "retrievable": true,
      "searchable": true,
      "filterable": true,
      "sortable": true,
      "facetable": true,
      "analyzer": "en.lucene"
    },
    {
      "name": "description",
      "type": "Edm.String",
      "retrievable": true,
      "searchable": true,
      "filterable": true,
      "sortable": true,
      "facetable": true,
      "analyzer": "standard.lucene"
    },
    {
      "name": "category",
      "type": "Edm.String",
      "retrievable": true,
      "searchable": true,
      "filterable": true,
      "sortable": true,
      "facetable": true,
      "analyzer": "en.lucene",
      "normalizer": "standard"
    },
    {
      "name": "ownerId",
      "type": "Edm.String",
      "retrievable": true,
      "searchable": true,
      "filterable": true,
      "sortable": true,
      "facetable": true,
      "analyzer": "en.lucene"
    }
  ],
  "scoringProfiles": [
    {
      "name": "stringFieldBoost",
      "text": {
        "weights": {
          "name": 3,
          "description": 1,
          "category": 2,
          "ownerId": 1
        }
      },
      "functions": [
        {
          "tag": {
            "tagsParameter": "categoryTag"
          },
          "type": "tag",
          "fieldName": "category",
          "boost": 2
        }
      ]
    }
  ],
  "defaultScoringProfile": "stringFieldBoost",
  "corsOptions": {
    "allowedOrigins": [
      "https://www.example.com/foo"
    ],
    "maxAgeInSeconds": 10
  },
  "suggesters": [
    {
      "name": "sg",
      "searchMode": "analyzingInfixMatching",
      "sourceFields": [
        "category",
        "ownerId"
      ]
    }
  ],
  "analyzers": [
    {
      "tokenizer": "standard_v2",
      "tokenFilters": [
        "common_grams"
      ],
      "charFilters": [
        "html_strip"
      ],
      "@odata.type": "#Microsoft.Azure.Search.CustomAnalyzer",
      "name": "tagsAnalyzer"
    }
  ],
  "tokenizers": [
    {
      "maxTokenLength": 100,
      "@odata.type": "#Microsoft.Azure.Search.StandardTokenizerV2",
      "name": "my_tokenizer"
    }
  ],
  "tokenFilters": [
    {
      "preserveOriginal": false,
      "@odata.type": "#Microsoft.Azure.Search.AsciiFoldingTokenFilter",
      "name": "my_tokenFilter"
    }
  ],
  "charFilters": [
    {
      "mappings": [
        ".=>,",
        "_=>-"
      ],
      "@odata.type": "#Microsoft.Azure.Search.MappingCharFilter",
      "name": "my_mapping"
    }
  ],
  "normalizers": [
    {
      "tokenFilters": [
        "asciifolding"
      ],
      "charFilters": [
        "my_mapping"
      ],
      "@odata.type": "#Microsoft.Azure.Search.CustomNormalizer",
      "name": "tagsNormalizer"
    }
  ],
  "similarity": {
    "k1": 10,
    "b": 0.1,
    "@odata.type": "#Microsoft.Azure.Search.BM25Similarity"
  },
  "semantic": {
    "defaultConfiguration": "testconfig",
    "configurations": [
      {
        "name": "testconfig",
        "prioritizedFields": {
          "titleField": {
            "fieldName": "category"
          },
          "prioritizedContentFields": [
            {
              "fieldName": "description"
            }
          ],
          "prioritizedKeywordsFields": [
            {
              "fieldName": "ownerId"
            }
          ]
        },
        "rankingOrder": "BoostedRerankerScore"
      }
    ]
  },
  "vectorSearch": {
    "profiles": [
      {
        "name": "config1",
        "algorithm": "cosine",
        "vectorizer": "openai",
        "compression": "mySQ8"
      },
      {
        "name": "config2",
        "algorithm": "euclidean",
        "vectorizer": "custom-web-api",
        "compression": "mySQ8"
      },
      {
        "name": "config3",
        "algorithm": "dotProduct",
        "vectorizer": "custom-web-api",
        "compression": "myBQC"
      }
    ],
    "algorithms": [
      {
        "hnswParameters": {
          "metric": "cosine"
        },
        "name": "cosine",
        "kind": "hnsw"
      },
      {
        "hnswParameters": {
          "metric": "euclidean"
        },
        "name": "euclidean",
        "kind": "hnsw"
      },
      {
        "hnswParameters": {
          "metric": "dotProduct"
        },
        "name": "dotProduct",
        "kind": "hnsw"
      }
    ],
    "vectorizers": [
      {
        "azureOpenAIParameters": {
          "resourceUri": "https://test-sample.openai.azure.com/",
          "deploymentId": "model",
          "apiKey": "api-key",
          "modelName": "text-embedding-3-large"
        },
        "name": "openai",
        "kind": "azureOpenAI"
      },
      {
        "customWebApiParameters": {
          "uri": "https://my-custom-endpoint.org/",
          "httpHeaders": {
            "header1": "value1",
            "header2": "value2"
          },
          "httpMethod": "POST",
          "timeout": "PT1M",
          "authResourceId": "api://f89d1c93-58a7-4b07-9a5b-5f89048b927b",
          "authIdentity": {
            "@odata.type": "#Microsoft.Azure.Search.DataNoneIdentity"
          }
        },
        "name": "custom-web-api",
        "kind": "customWebApi"
      }
    ],
    "compressions": [
      {
        "scalarQuantizationParameters": {
          "quantizedDataType": "int8"
        },
        "name": "mySQ8",
        "kind": "scalarQuantization",
        "truncationDimension": 2
      },
      {
        "name": "myBQC",
        "kind": "binaryQuantization",
        "truncationDimension": 2
      }
    ]
  },
  "@odata.etag": "0x1234568AE7E58A1"
}

Örnek yanıt

{
  "@odata.etag": "0x1234568AE7E58A1",
  "name": "temp-stable-test",
  "description": "description",
  "defaultScoringProfile": "stringFieldBoost",
  "fields": [
    {
      "name": "id",
      "type": "Edm.String",
      "searchable": true,
      "filterable": true,
      "retrievable": true,
      "stored": true,
      "sortable": true,
      "facetable": true,
      "key": true,
      "synonymMaps": []
    },
    {
      "name": "vector1",
      "type": "Collection(Edm.Single)",
      "searchable": true,
      "filterable": false,
      "retrievable": true,
      "stored": true,
      "sortable": false,
      "facetable": false,
      "key": false,
      "dimensions": 20,
      "vectorSearchProfile": "config1",
      "synonymMaps": []
    },
    {
      "name": "vector1b",
      "type": "Collection(Edm.Single)",
      "searchable": true,
      "filterable": false,
      "retrievable": true,
      "stored": true,
      "sortable": false,
      "facetable": false,
      "key": false,
      "dimensions": 10,
      "vectorSearchProfile": "config2",
      "synonymMaps": []
    },
    {
      "name": "vector2",
      "type": "Collection(Edm.Single)",
      "searchable": true,
      "filterable": false,
      "retrievable": true,
      "stored": true,
      "sortable": false,
      "facetable": false,
      "key": false,
      "dimensions": 5,
      "vectorSearchProfile": "config3",
      "synonymMaps": []
    },
    {
      "name": "vector3",
      "type": "Collection(Edm.Single)",
      "searchable": true,
      "filterable": false,
      "retrievable": true,
      "stored": true,
      "sortable": false,
      "facetable": false,
      "key": false,
      "dimensions": 5,
      "vectorSearchProfile": "config3",
      "synonymMaps": []
    },
    {
      "name": "vector22",
      "type": "Collection(Edm.Single)",
      "searchable": true,
      "filterable": false,
      "retrievable": true,
      "stored": true,
      "sortable": false,
      "facetable": false,
      "key": false,
      "dimensions": 10,
      "vectorSearchProfile": "config2",
      "synonymMaps": []
    },
    {
      "name": "name",
      "type": "Edm.String",
      "searchable": true,
      "filterable": true,
      "retrievable": true,
      "stored": true,
      "sortable": true,
      "facetable": true,
      "key": false,
      "analyzer": "en.lucene",
      "synonymMaps": []
    },
    {
      "name": "description",
      "type": "Edm.String",
      "searchable": true,
      "filterable": true,
      "retrievable": true,
      "stored": true,
      "sortable": true,
      "facetable": true,
      "key": false,
      "analyzer": "standard.lucene",
      "synonymMaps": []
    },
    {
      "name": "category",
      "type": "Edm.String",
      "searchable": true,
      "filterable": true,
      "retrievable": true,
      "stored": true,
      "sortable": true,
      "facetable": true,
      "key": false,
      "analyzer": "en.lucene",
      "normalizer": "standard",
      "synonymMaps": []
    },
    {
      "name": "ownerId",
      "type": "Edm.String",
      "searchable": true,
      "filterable": true,
      "retrievable": true,
      "stored": true,
      "sortable": true,
      "facetable": true,
      "key": false,
      "analyzer": "en.lucene",
      "synonymMaps": []
    }
  ],
  "scoringProfiles": [
    {
      "name": "stringFieldBoost",
      "functionAggregation": "sum",
      "text": {
        "weights": {
          "name": 3,
          "description": 1,
          "category": 2,
          "ownerId": 1
        }
      },
      "functions": [
        {
          "fieldName": "category",
          "interpolation": "linear",
          "type": "tag",
          "boost": 2,
          "tag": {
            "tagsParameter": "categoryTag"
          }
        }
      ]
    }
  ],
  "corsOptions": {
    "allowedOrigins": [
      "https://www.example.com/foo"
    ],
    "maxAgeInSeconds": 10
  },
  "suggesters": [
    {
      "name": "sg",
      "searchMode": "analyzingInfixMatching",
      "sourceFields": [
        "category",
        "ownerId"
      ]
    }
  ],
  "analyzers": [
    {
      "@odata.type": "#Microsoft.Azure.Search.CustomAnalyzer",
      "name": "tagsAnalyzer",
      "tokenizer": "standard_v2",
      "tokenFilters": [
        "common_grams"
      ],
      "charFilters": [
        "html_strip"
      ]
    }
  ],
  "normalizers": [
    {
      "@odata.type": "#Microsoft.Azure.Search.CustomNormalizer",
      "name": "tagsNormalizer",
      "tokenFilters": [
        "asciifolding"
      ],
      "charFilters": [
        "my_mapping"
      ]
    }
  ],
  "tokenizers": [
    {
      "@odata.type": "#Microsoft.Azure.Search.StandardTokenizerV2",
      "name": "my_tokenizer",
      "maxTokenLength": 100
    }
  ],
  "tokenFilters": [
    {
      "@odata.type": "#Microsoft.Azure.Search.AsciiFoldingTokenFilter",
      "name": "my_tokenFilter",
      "preserveOriginal": false
    }
  ],
  "charFilters": [
    {
      "@odata.type": "#Microsoft.Azure.Search.MappingCharFilter",
      "name": "my_mapping",
      "mappings": [
        ".=>,",
        "_=>-"
      ]
    }
  ],
  "similarity": {
    "@odata.type": "#Microsoft.Azure.Search.BM25Similarity",
    "k1": 10,
    "b": 0.1
  },
  "semantic": {
    "defaultConfiguration": "testconfig",
    "configurations": [
      {
        "name": "testconfig",
        "rankingOrder": "BoostedRerankerScore",
        "prioritizedFields": {
          "titleField": {
            "fieldName": "category"
          },
          "prioritizedContentFields": [
            {
              "fieldName": "description"
            }
          ],
          "prioritizedKeywordsFields": [
            {
              "fieldName": "ownerId"
            }
          ]
        }
      }
    ]
  },
  "vectorSearch": {
    "algorithms": [
      {
        "name": "cosine",
        "kind": "hnsw",
        "hnswParameters": {
          "metric": "cosine",
          "m": 4,
          "efConstruction": 400,
          "efSearch": 500
        }
      },
      {
        "name": "euclidean",
        "kind": "hnsw",
        "hnswParameters": {
          "metric": "euclidean",
          "m": 4,
          "efConstruction": 400,
          "efSearch": 500
        }
      },
      {
        "name": "dotProduct",
        "kind": "hnsw",
        "hnswParameters": {
          "metric": "dotProduct",
          "m": 4,
          "efConstruction": 400,
          "efSearch": 500
        }
      }
    ],
    "profiles": [
      {
        "name": "config1",
        "algorithm": "cosine",
        "vectorizer": "openai",
        "compression": "mySQ8"
      },
      {
        "name": "config2",
        "algorithm": "euclidean",
        "vectorizer": "custom-web-api",
        "compression": "mySQ8"
      },
      {
        "name": "config3",
        "algorithm": "dotProduct",
        "vectorizer": "custom-web-api",
        "compression": "myBQC"
      }
    ],
    "vectorizers": [
      {
        "name": "openai",
        "kind": "azureOpenAI",
        "azureOpenAIParameters": {
          "resourceUri": "https://test-sample.openai.azure.com",
          "deploymentId": "model",
          "apiKey": "api-key",
          "modelName": "text-embedding-3-large"
        }
      },
      {
        "name": "custom-web-api",
        "kind": "customWebApi",
        "customWebApiParameters": {
          "httpMethod": "POST",
          "uri": "https://my-custom-endpoint.org/",
          "timeout": "PT1M",
          "authResourceId": "api://f89d1c93-58a7-4b07-9a5b-5f89048b927b",
          "httpHeaders": {
            "header1": "value1",
            "header2": "value2"
          },
          "authIdentity": {
            "@odata.type": "#Microsoft.Azure.Search.DataNoneIdentity"
          }
        }
      }
    ],
    "compressions": [
      {
        "name": "mySQ8",
        "kind": "scalarQuantization",
        "truncationDimension": 2,
        "scalarQuantizationParameters": {
          "quantizedDataType": "int8"
        },
        "rescoringOptions": {
          "enableRescoring": true,
          "defaultOversampling": 4,
          "rescoreStorageMethod": "preserveOriginals"
        }
      },
      {
        "name": "myBQC",
        "kind": "binaryQuantization",
        "truncationDimension": 2,
        "rescoringOptions": {
          "enableRescoring": true,
          "defaultOversampling": 4,
          "rescoreStorageMethod": "preserveOriginals"
        }
      }
    ]
  }
}

Tanımlar

Name Description
AsciiFoldingTokenFilter

İlk 127 ASCII karakterde ("Temel Latince" Unicode bloğu) yer almayan alfabetik, sayısal ve sembolik Unicode karakterleri, bu tür eşdeğerler varsa ASCII eşdeğerlerine dönüştürür. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır.

AzureActiveDirectoryApplicationCredentials

Arama hizmetiniz için oluşturulan ve Azure Key Vault'ta depolanan şifreleme anahtarlarına kimliği doğrulanmış erişim için kullanılan kayıtlı bir uygulamanın kimlik bilgileri.

AzureOpenAIEmbeddingSkill

Azure OpenAI kaynağını kullanarak belirli bir metin girişi için bir vektör eklemesi oluşturmanıza olanak tanır.

AzureOpenAIModelName

Çağrılacak Azure Open AI model adı.

AzureOpenAIParameters

Azure OpenAI kaynağına bağlanmak için parametreleri belirtir.

AzureOpenAIVectorizer

Bir sorgu dizesini vektörleştirmek için kullanılan Azure OpenAI kaynağını belirtir.

BinaryQuantizationVectorSearchCompressionConfiguration

İndeksleme ve sorgulama sırasında kullanılan ikili niceleme sıkıştırma yöntemine özgü yapılandırma seçeneklerini içerir.

BM25Similarity

Okapi BM25 benzerlik algoritmasına dayalı sıralama fonksiyonu. BM25, uzunluk normalleştirmesini ('b' parametresi tarafından kontrol edilir) ve terim frekansı doygunluğunu ('k1' parametresi tarafından kontrol edilir) içeren TF-IDF benzeri bir algoritmadır.

CharFilterName

Arama motoru tarafından desteklenen tüm karakter filtrelerinin adlarını tanımlar.

CjkBigramTokenFilter

Standart belirteçleyiciden oluşturulan CJK terimlerinin bigramlarını oluşturur. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır.

CjkBigramTokenFilterScripts

CjkBigramTokenFilter tarafından yoksayılabilen betikler.

ClassicSimilarity

TF-IDF'nin Lucene TFIDFSimilarity uygulamasını kullanan eski benzerlik algoritması. Bu TF-IDF varyasyonu, statik belge uzunluğu normalleştirmesinin yanı sıra, aranan sorgularla yalnızca kısmen eşleşen belgeleri cezalandıran koordinasyon faktörlerini de beraberinde getirir.

ClassicTokenizer

Çoğu Avrupa dilindeki belgeyi işlemek için uygun olan dilbilgisi tabanlı belirteçleyici. Bu belirteç oluşturucu Apache Lucene kullanılarak uygulanır.

CommonGramTokenFilter

İndeksleme sırasında sık karşılaşılan terimler için bigramlar oluşturun. Tek terimler de indekslenmeye devam ediyor ve bigramlar üst üste bindiriliyor. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır.

CorsOptions

Bir dizin için Çıkış Noktaları Arası Kaynak Paylaşımı'nı (CORS) denetleme seçeneklerini tanımlar.

CustomAnalyzer

Metni dizine eklenebilir/aranabilir belirteçlere dönüştürme işlemi üzerinde kontrol sahibi olmanızı sağlar. Önceden tanımlanmış tek bir belirteç oluşturucu ve bir veya daha fazla filtreden oluşan kullanıcı tanımlı bir yapılandırmadır. Belirteçleştirici, metni belirteçlere bölmekten ve belirteç oluşturucu tarafından yayılan belirteçleri değiştirmek için filtrelerden sorumludur.

CustomNormalizer

Varsayılan olarak katı eşleştirmeyle çalışan filtrelenebilir, sıralanabilir ve facetable alanlar için normalleştirmeyi yapılandırmanıza olanak tanır. Bu, depolanan belirteci değiştiren en az bir veya daha fazla filtreden oluşan kullanıcı tanımlı bir yapılandırmadır.

DictionaryDecompounderTokenFilter

Birçok Cermen dilinde bulunan bileşik sözcükleri ayrıştırır. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır.

DistanceScoringFunction

Coğrafi bir konuma olan mesafeye bağlı olarak puanları artıran bir işlev tanımlar.

DistanceScoringParameters

Mesafe puanlama işlevine parametre değerleri sağlar.

EdgeNGramTokenFilter

Bir giriş belirtecinin önünden veya arkasından başlayarak verilen boyut(lar)ın n-gramını oluşturur. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır.

EdgeNGramTokenFilterSide

Bir n-gramın girişin hangi tarafından oluşturulması gerektiğini belirtir.

EdgeNGramTokenFilterV2

Bir giriş belirtecinin önünden veya arkasından başlayarak verilen boyut(lar)ın n-gramını oluşturur. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır.

EdgeNGramTokenizer

Bir kenardan gelen girdiyi, verilen boyut(lar)ın n-gramına tokenize eder. Bu belirteç oluşturucu Apache Lucene kullanılarak uygulanır.

ElisionTokenFilter

Elizyonları kaldırır. Örneğin, "l'avion" (uçak) "avion" (uçak) olarak dönüştürülecektir. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır.

ErrorAdditionalInfo

Kaynak yönetimi hatası ek bilgileri.

ErrorDetail

Hata ayrıntısı.

ErrorResponse

Hata yanıtı

ExhaustiveKnnParameters

Kapsamlı KNN algoritmasına özgü parametreleri içerir.

ExhaustiveKnnVectorSearchAlgorithmConfiguration

Sorgulama sırasında kullanılan ve tüm vektör dizini boyunca deneme yanılma araması gerçekleştirecek olan kapsamlı KNN algoritmasına özgü yapılandırma seçeneklerini içerir.

FreshnessScoringFunction

Tarih-saat alanının değerine bağlı olarak puanları artıran bir işlev tanımlar.

FreshnessScoringParameters

Tazelik puanlama işlevine parametre değerleri sağlar.

HnswParameters

HNSW algoritmasına özgü parametreleri içerir.

HnswVectorSearchAlgorithmConfiguration

Dizin oluşturma ve sorgulama sırasında kullanılan HNSW yaklaşık en yakın komşular algoritmasına özgü yapılandırma seçeneklerini içerir. HNSW algoritması, arama hızı ve doğruluğu arasında ayarlanabilir bir denge sunar.

InputFieldMappingEntry

Bir beceri için giriş alanı eşlemesi.

KeepTokenFilter

Yalnızca belirli bir sözcük listesinde yer alan metne sahip belirteçleri tutan bir belirteç filtresi. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır.

KeywordMarkerTokenFilter

Terimleri anahtar sözcük olarak işaretler. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır.

KeywordTokenizer

Tüm girişi tek bir belirteç olarak yayar. Bu belirteç oluşturucu Apache Lucene kullanılarak uygulanır.

KeywordTokenizerV2

Tüm girişi tek bir belirteç olarak yayar. Bu belirteç oluşturucu Apache Lucene kullanılarak uygulanır.

LengthTokenFilter

Çok uzun veya çok kısa sözcükleri kaldırır. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır.

LexicalAnalyzerName

Arama motoru tarafından desteklenen tüm metin çözümleyicilerinin adlarını tanımlar.

LexicalNormalizerName

Arama motoru tarafından desteklenen tüm metin normalleştiricilerinin adlarını tanımlar.

LexicalTokenizerName

Arama motoru tarafından desteklenen tüm tokenizer'ların adlarını tanımlar.

LimitTokenFilter

İndeksleme sırasında belirteç sayısını sınırlar. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır.

LuceneStandardAnalyzer

Standart Apache Lucene analizörü; Standart belirteçleyici, küçük harf filtresi ve durdurma filtresinden oluşur.

LuceneStandardTokenizer

Unicode Metin Bölütleme kurallarına uygun olarak metni keser. Bu belirteç oluşturucu Apache Lucene kullanılarak uygulanır.

LuceneStandardTokenizerV2

Unicode Metin Bölütleme kurallarına uygun olarak metni keser. Bu belirteç oluşturucu Apache Lucene kullanılarak uygulanır.

MagnitudeScoringFunction

Sayısal bir alanın büyüklüğüne bağlı olarak puanları artıran bir işlev tanımlar.

MagnitudeScoringParameters

Büyüklük puanlama işlevine parametre değerleri sağlar.

MappingCharFilter

Eşlemeler seçeneğiyle tanımlanan eşlemeleri uygulayan bir karakter filtresi. Eşleştirme açgözlüdür (belirli bir noktada en uzun desen eşleşmesi kazanır). Değiştirmenin boş dize olmasına izin verilir. Bu karakter filtresi Apache Lucene kullanılarak uygulanır.

MicrosoftLanguageStemmingTokenizer

Dile özgü kuralları kullanarak metni böler ve sözcükleri temel biçimlerine indirger.

MicrosoftLanguageTokenizer

Dile özgü kuralları kullanarak metni böler.

MicrosoftStemmingTokenizerLanguage

Microsoft dil köklendirme belirteç oluşturucusu tarafından desteklenen dilleri listeler.

MicrosoftTokenizerLanguage

Microsoft dil belirteci tarafından desteklenen dilleri listeler.

NGramTokenFilter

Verilen boyut(lar)dan n-gram üretir. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır.

NGramTokenFilterV2

Verilen boyut(lar)dan n-gram üretir. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır.

NGramTokenizer

Girdiyi, verilen boyut(lar)ın n-gramına tokenize eder. Bu belirteç oluşturucu Apache Lucene kullanılarak uygulanır.

OutputFieldMappingEntry

Bir beceri için çıktı alanı eşlemesi.

PathHierarchyTokenizerV2

Yol benzeri hiyerarşiler için belirteçleştirici. Bu belirteç oluşturucu Apache Lucene kullanılarak uygulanır.

PatternAnalyzer

Metni düzenli bir ifade deseni aracılığıyla esnek bir şekilde terimlere ayırır. Bu çözümleyici Apache Lucene kullanılarak uygulanır.

PatternCaptureTokenFilter

Bir veya daha fazla desende her yakalama grubu için bir tane olmak üzere birden çok belirteç yaymak için Java normal ifadelerini kullanır. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır.

PatternReplaceCharFilter

Giriş dizesindeki karakterlerin yerini alan bir karakter filtresi. Korunacak karakter dizilerini tanımlamak için normal bir ifade ve değiştirilecek karakterleri tanımlamak için bir değiştirme deseni kullanır. Örneğin, "aa bb aa bb" giriş metni, "(aa)\s+(bb)" deseni ve "$1#$2" yerine geçtiğinde, sonuç "aa#bb aa#bb" olacaktır. Bu karakter filtresi Apache Lucene kullanılarak uygulanır.

PatternReplaceTokenFilter

Giriş dizesindeki karakterlerin yerini alan bir karakter filtresi. Korunacak karakter dizilerini tanımlamak için normal bir ifade ve değiştirilecek karakterleri tanımlamak için bir değiştirme deseni kullanır. Örneğin, "aa bb aa bb" giriş metni, "(aa)\s+(bb)" deseni ve "$1#$2" yerine geçtiğinde, sonuç "aa#bb aa#bb" olacaktır. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır.

PatternTokenizer

Farklı belirteçler oluşturmak için normal ifade deseni eşleştirmesini kullanan belirteçleyici. Bu belirteç oluşturucu Apache Lucene kullanılarak uygulanır.

PhoneticEncoder

PhoneticTokenFilter ile kullanılacak fonetik kodlayıcı türünü tanımlar.

PhoneticTokenFilter

Fonetik eşleşmeler için belirteçler oluşturun. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır.

PrioritizedFields

Anlamsal sıralama, resim yazıları, vurgular ve yanıtlar için kullanılacak başlık, içerik ve anahtar sözcük alanlarını açıklar.

RankingOrder

Belgelerin sıralama düzeni için kullanılacak puanı temsil eder.

RegexFlags

Desen çözümleyicisinde ve desen belirteçleyicisinde normal ifadelerin nasıl kullanıldığını denetlemek için birleştirilebilecek bayrakları tanımlar.

RescoringOptions

Yeniden puanlama seçeneklerini içerir.

ScalarQuantizationParameters

Skaler Kuantizasyona özgü parametreleri içerir.

ScalarQuantizationVectorSearchCompressionConfiguration

İndeksleme ve sorgulama sırasında kullanılan skaler niceleme sıkıştırma yöntemine özgü yapılandırma seçeneklerini içerir.

ScoringFunctionAggregation

Bir puanlama profilindeki tüm puanlama işlevlerinin sonuçlarını birleştirmek için kullanılan toplama işlevini tanımlar.

ScoringFunctionInterpolation

Bir dizi belgede puan artırmayı enterpolasyon yapmak için kullanılan işlevi tanımlar.

ScoringProfile

Arama sorgularında puanlamayı etkileyen bir arama dizini için parametreleri tanımlar.

SearchField

Bir alanın adını, veri türünü ve arama davranışını açıklayan bir dizin tanımındaki bir alanı temsil eder.

SearchFieldDataType

Arama dizinindeki bir alanın veri türünü tanımlar.

SearchIndex

Bir dizinin alanlarını ve arama davranışını açıklayan bir arama dizini tanımını temsil eder.

SearchIndexerDataNoneIdentity

Bir veri kaynağının kimlik özelliğini temizler.

SearchIndexerDataUserAssignedIdentity

Kullanılacak veri kaynağının kimliğini belirtir.

SearchResourceEncryptionKey

Azure Key Vault'ta müşteri tarafından yönetilen bir şifreleme anahtarı. Oluşturduğunuz ve yönettiğiniz anahtarlar, dizinler ve eş anlamlı eşlemeler gibi bekleyen verileri şifrelemek veya şifresini çözmek için kullanılabilir.

SemanticConfiguration

Anlamsal yetenekler bağlamında kullanılacak belirli bir yapılandırmayı tanımlar.

SemanticField

Anlamsal yapılandırmanın bir parçası olarak kullanılan bir alan.

SemanticSettings

Anlamsal yetenekleri etkileyen bir arama dizini için parametreleri tanımlar.

ShingleTokenFilter

Tek bir belirteç olarak belirteç kombinasyonları oluşturur. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır.

SnowballTokenFilter

Snowball tarafından oluşturulan bir kök kullanarak sözcükleri köklendiren bir filtre. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır.

SnowballTokenFilterLanguage

Snowball belirteç filtresi için kullanılacak dil.

StemmerOverrideTokenFilter

Özel sözlük tabanlı kök oluşturma ile diğer kök filtrelerini geçersiz kılma olanağı sağlar. Sözlük tabanlı herhangi bir terim, anahtar kelime olarak işaretlenir, böylece zincirin aşağısındaki köklerle köklenmezler. Herhangi bir sap filtresinden önce yerleştirilmelidir. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır.

StemmerTokenFilter

Dile özel kök filtresi. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır.

StemmerTokenFilterLanguage

Stemmer belirteç filtresi için kullanılacak dil.

StopAnalyzer

Metni harf olmayanlara böler; Küçük harf ve stopword belirteç filtrelerini uygular. Bu çözümleyici Apache Lucene kullanılarak uygulanır.

StopwordsList

Dile özgü durdurma sözcüklerinin önceden tanımlanmış bir listesini tanımlar.

StopwordsTokenFilter

Belirteç akışından durdurma sözcüklerini kaldırır. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır.

Suggester

Suggest API'nin dizindeki bir alan grubuna nasıl uygulanması gerektiğini tanımlar.

SuggesterSearchMode

Önerenin yeteneklerini gösteren bir değer.

SynonymTokenFilter

Bir belirteç akışındaki tek veya çok sözcüklü eş anlamlılarla eşleşir. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır.

TagScoringFunction

Belirli bir etiket listesiyle eşleşen dize değerlerine sahip belgelerin puanlarını artıran bir işlev tanımlar.

TagScoringParameters

Etiket puanlama işlevine parametre değerleri sağlar.

TextWeights

Eşleşmelerin arama sorgularında puanlamayı artırması gereken dizin alanlarındaki ağırlıkları tanımlar.

TokenCharacterKind

Belirteç filtresinin üzerinde çalışabileceği karakter sınıflarını temsil eder.

TokenFilterName

Arama motoru tarafından desteklenen tüm belirteç filtrelerinin adlarını tanımlar.

TruncateTokenFilter

Terimleri belirli bir uzunlukta keser. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır.

UaxUrlEmailTokenizer

URL'leri ve e-postaları tek bir belirteç olarak belirteçleştirir. Bu belirteç oluşturucu Apache Lucene kullanılarak uygulanır.

UniqueTokenFilter

Önceki belirteçle aynı metne sahip belirteçleri filtreler. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır.

VectorEncodingFormat

Vektör alanı içeriklerini yorumlamak için kodlama biçimi.

VectorSearch

Vektör arama ile ilgili yapılandırma seçeneklerini içerir.

VectorSearchAlgorithmKind

Dizin oluşturma ve sorgulama için kullanılan algoritma.

VectorSearchAlgorithmMetric

Vektör karşılaştırmaları için kullanılacak benzerlik metriği. Ekleme modelinin eğitildiği benzerlik metriğinin seçilmesi önerilir.

VectorSearchCompressionKind

Dizin oluşturma ve sorgulama için kullanılan sıkıştırma yöntemi.

VectorSearchCompressionRescoreStorageMethod

Yeniden puanlama ve dahili dizin işlemleri için kullanılan orijinal tam duyarlıklı vektörler için depolama yöntemi.

VectorSearchCompressionTargetDataType

Sıkıştırılmış vektör değerlerinin nicelleştirilmiş veri türü.

VectorSearchProfile

Vektör aramasıyla kullanılacak konfigürasyonların bir kombinasyonunu tanımlar.

VectorSearchVectorizerKind

Sorgu sırasında kullanılacak vektörleştirme yöntemi.

WebApiParameters

Kullanıcı tanımlı bir vektörleştiriciye bağlanmak için özellikleri belirtir.

WebApiVectorizer

Bir sorgu dizesinin vektör katıştırmasını oluşturmak için kullanıcı tanımlı bir vektörleştirici belirtir. Harici bir vektörleştiricinin entegrasyonu, bir beceri kümesinin özel Web API arabirimi kullanılarak gerçekleştirilir.

WordDelimiterTokenFilter

Sözcükleri alt sözcüklere böler ve alt sözcük gruplarında isteğe bağlı dönüştürmeler gerçekleştirir. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır.

AsciiFoldingTokenFilter

İlk 127 ASCII karakterde ("Temel Latince" Unicode bloğu) yer almayan alfabetik, sayısal ve sembolik Unicode karakterleri, bu tür eşdeğerler varsa ASCII eşdeğerlerine dönüştürür. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır.

Name Tür Default value Description
@odata.type string:

#Microsoft.Azure.Search.AsciiFoldingTokenFilter

Belirteç filtresinin türünü belirten bir URI parçası.

name

string

Belirteç filtresinin adı. Yalnızca harfler, rakamlar, boşluklar, kısa çizgiler veya alt çizgiler içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır.

preserveOriginal

boolean

False

Orijinal belirtecin tutulup tutulmayacağını gösteren bir değer. Varsayılan değer false'tur.

AzureActiveDirectoryApplicationCredentials

Arama hizmetiniz için oluşturulan ve Azure Key Vault'ta depolanan şifreleme anahtarlarına kimliği doğrulanmış erişim için kullanılan kayıtlı bir uygulamanın kimlik bilgileri.

Name Tür Description
applicationId

string

Bekleyen verilerinizi şifrelerken kullanılacak Azure Key Vault için gerekli erişim izinleri verilmiş bir AAD Uygulama Kimliği. Uygulama Kimliği, AAD Uygulamanızın Nesne Kimliği ile karıştırılmamalıdır.

applicationSecret

string

Belirtilen AAD uygulamasının kimlik doğrulama anahtarı.

AzureOpenAIEmbeddingSkill

Azure OpenAI kaynağını kullanarak belirli bir metin girişi için bir vektör eklemesi oluşturmanıza olanak tanır.

Name Tür Description
@odata.type string:

#Microsoft.Skills.Text.AzureOpenAIEmbeddingSkill

Beceri türünü belirten bir URI parçası.

apiKey

string

Belirlenen Azure OpenAI kaynağının API anahtarı.

authIdentity SearchIndexerDataIdentity:

Giden bağlantılar için kullanılan, kullanıcı tarafından atanan yönetilen kimlik.

context

string

Belge kökü veya belge içeriği (örneğin, /document veya /document/content) gibi işlemlerin gerçekleştiği düzeyi temsil eder. Varsayılan değer /document'dir.

deploymentId

string

Belirlenen kaynakta Azure OpenAI modeli dağıtımının kimliği.

description

string

Becerinin girdilerini, çıktılarını ve kullanımını açıklayan becerinin açıklaması.

dimensions

integer (int32)

Sonuçta elde edilen çıktı eklemelerinin sahip olması gereken boyut sayısı. Yalnızca text-embedding-3 ve sonraki modellerde desteklenir.

inputs

InputFieldMappingEntry[]

Becerilerin girişleri, kaynak veri kümesindeki bir sütun veya yukarı akış becerisinin çıktısı olabilir.

modelName

AzureOpenAIModelName

Sağlanan deploymentId yolunda dağıtılan katıştırma modelinin adı.

name

string

Becerinin, onu beceri kümesi içinde benzersiz bir şekilde tanımlayan adı. Adı tanımlanmamış bir beceriye, beceriler dizisindeki 1 tabanlı dizininin varsayılan adı verilir ve önüne '#' karakteri eklenir.

outputs

OutputFieldMappingEntry[]

Bir becerinin çıktısı, arama dizinindeki bir alan veya başka bir beceri tarafından girdi olarak kullanılabilecek bir değerdir.

resourceUri

string (uri)

Azure OpenAI kaynağının kaynak URI'si.

AzureOpenAIModelName

Çağrılacak Azure Open AI model adı.

Değer Description
text-embedding-ada-002
text-embedding-3-large
text-embedding-3-small

AzureOpenAIParameters

Azure OpenAI kaynağına bağlanmak için parametreleri belirtir.

Name Tür Description
apiKey

string

Belirlenen Azure OpenAI kaynağının API anahtarı.

authIdentity SearchIndexerDataIdentity:

Giden bağlantılar için kullanılan, kullanıcı tarafından atanan yönetilen kimlik.

deploymentId

string

Belirlenen kaynakta Azure OpenAI modeli dağıtımının kimliği.

modelName

AzureOpenAIModelName

Sağlanan deploymentId yolunda dağıtılan katıştırma modelinin adı.

resourceUri

string (uri)

Azure OpenAI kaynağının kaynak URI'si.

AzureOpenAIVectorizer

Bir sorgu dizesini vektörleştirmek için kullanılan Azure OpenAI kaynağını belirtir.

Name Tür Description
azureOpenAIParameters AzureOpenAIParameters:

AzureOpenAIEmbeddingSkill

Azure OpenAI katıştırma vektörleştirmesine özgü parametreleri içerir.

kind string:

azureOpenAI

Vektör aramasıyla kullanılmak üzere yapılandırılan vektörleştirme yönteminin adı.

name

string

Bu özel vektörleştirme yöntemiyle ilişkilendirilecek ad.

BinaryQuantizationVectorSearchCompressionConfiguration

İndeksleme ve sorgulama sırasında kullanılan ikili niceleme sıkıştırma yöntemine özgü yapılandırma seçeneklerini içerir.

Name Tür Description
kind string:

binaryQuantization

Vektör aramasıyla kullanılmak üzere yapılandırılan sıkıştırma yönteminin adı.

name

string

Bu özel yapılandırmayla ilişkilendirilecek ad.

rescoringOptions

RescoringOptions

Yeniden puanlama seçeneklerini içerir.

truncationDimension

integer (int32)

Vektörlerin kesileceği boyut sayısı. Vektörlerin kesilmesi, vektörlerin boyutunu ve arama sırasında aktarılması gereken veri miktarını azaltır. Bu, depolama maliyetinden tasarruf sağlayabilir ve geri çağırma pahasına arama performansını iyileştirebilir. Yalnızca OpenAI text-embedding-3-large (small) gibi Matryoshka Representation Learning (MRL) ile eğitilen yerleştirmeler için kullanılmalıdır. Varsayılan değer null'dur, bu da kesme olmadığı anlamına gelir.

BM25Similarity

Okapi BM25 benzerlik algoritmasına dayalı sıralama fonksiyonu. BM25, uzunluk normalleştirmesini ('b' parametresi tarafından kontrol edilir) ve terim frekansı doygunluğunu ('k1' parametresi tarafından kontrol edilir) içeren TF-IDF benzeri bir algoritmadır.

Name Tür Description
@odata.type string:

#Microsoft.Azure.Search.BM25Similarity

b

number (double)

Bu özellik, bir belgenin uzunluğunun alaka düzeyi puanını nasıl etkilediğini denetler. Varsayılan olarak, 0,75 değeri kullanılır. 0,0 değeri, uzunluk normalleştirmesinin uygulanmadığı anlamına gelirken, 1,0 değeri, puanın belgenin uzunluğuna göre tamamen normalleştirildiği anlamına gelir.

k1

number (double)

Bu özellik, eşleşen her terimin terim sıklığı ile bir belge-sorgu çiftinin son alaka düzeyi puanı arasındaki ölçeklendirme işlevini denetler. Varsayılan olarak, 1,2 değeri kullanılır. 0,0 değeri, skorun terim sıklığındaki bir artışla ölçeklenmediği anlamına gelir.

CharFilterName

Arama motoru tarafından desteklenen tüm karakter filtrelerinin adlarını tanımlar.

Değer Description
html_strip

HTML yapılarını çıkarmaya çalışan bir karakter filtresi. Bkz. https://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/charfilter/HTMLStripCharFilter.html

CjkBigramTokenFilter

Standart belirteçleyiciden oluşturulan CJK terimlerinin bigramlarını oluşturur. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır.

Name Tür Default value Description
@odata.type string:

#Microsoft.Azure.Search.CjkBigramTokenFilter

Belirteç filtresinin türünü belirten bir URI parçası.

ignoreScripts

CjkBigramTokenFilterScripts[]

Görmezden gelinecek senaryolar.

name

string

Belirteç filtresinin adı. Yalnızca harfler, rakamlar, boşluklar, kısa çizgiler veya alt çizgiler içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır.

outputUnigrams

boolean

False

Hem unigramların hem de bigramların (doğruysa) veya yalnızca bigramların (yanlışsa) çıktısının alınıp alınmayacağını gösteren bir değer. Varsayılan değer false'tur.

CjkBigramTokenFilterScripts

CjkBigramTokenFilter tarafından yoksayılabilen betikler.

Değer Description
han

CJK terimlerinin bigramlarını oluştururken Han betiğini yoksayın.

hiragana

CJK terimlerinin bigramlarını oluştururken Hiragana komut dosyasını dikkate almayın.

katakana

CJK terimlerinin bigramlarını oluştururken Katakana komut dosyasını dikkate almayın.

hangul

CJK terimlerinin bigramlarını oluştururken Hangul komut dosyasını göz ardı edin.

ClassicSimilarity

TF-IDF'nin Lucene TFIDFSimilarity uygulamasını kullanan eski benzerlik algoritması. Bu TF-IDF varyasyonu, statik belge uzunluğu normalleştirmesinin yanı sıra, aranan sorgularla yalnızca kısmen eşleşen belgeleri cezalandıran koordinasyon faktörlerini de beraberinde getirir.

Name Tür Description
@odata.type string:

#Microsoft.Azure.Search.ClassicSimilarity

ClassicTokenizer

Çoğu Avrupa dilindeki belgeyi işlemek için uygun olan dilbilgisi tabanlı belirteçleyici. Bu belirteç oluşturucu Apache Lucene kullanılarak uygulanır.

Name Tür Default value Description
@odata.type string:

#Microsoft.Azure.Search.ClassicTokenizer

Belirteç oluşturucu türünü belirten bir URI parçası.

maxTokenLength

integer (int32)

maximum: 300
255

Maksimum belirteç uzunluğu. Varsayılan değer 255'tir. Maksimum uzunluktan daha uzun olan jetonlar bölünür. Kullanılabilecek maksimum belirteç uzunluğu 300 karakterdir.

name

string

Tokenizer'ın adı. Yalnızca harfler, rakamlar, boşluklar, kısa çizgiler veya alt çizgiler içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır.

CommonGramTokenFilter

İndeksleme sırasında sık karşılaşılan terimler için bigramlar oluşturun. Tek terimler de indekslenmeye devam ediyor ve bigramlar üst üste bindiriliyor. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır.

Name Tür Default value Description
@odata.type string:

#Microsoft.Azure.Search.CommonGramTokenFilter

Belirteç filtresinin türünü belirten bir URI parçası.

commonWords

string[]

Ortak kelimeler kümesi.

ignoreCase

boolean

False

Sık kullanılan sözcüklerle eşleşen sözcüklerin büyük/küçük harfe duyarlı olup olmayacağını gösteren bir değer. Varsayılan değer false'tur.

name

string

Belirteç filtresinin adı. Yalnızca harfler, rakamlar, boşluklar, kısa çizgiler veya alt çizgiler içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır.

queryMode

boolean

False

Belirteç filtresinin sorgu modunda olup olmadığını gösteren bir değer. Sorgu modundayken, belirteç filtresi bigramlar oluşturur ve ardından ortak sözcükleri ve tek terimleri ve ardından ortak bir sözcüğü kaldırır. Varsayılan değer false'tur.

CorsOptions

Bir dizin için Çıkış Noktaları Arası Kaynak Paylaşımı'nı (CORS) denetleme seçeneklerini tanımlar.

Name Tür Description
allowedOrigins

string[]

JavaScript koduna dizininize erişim izni verilecek kaynakların listesi. {protocol}://{fully-qualified-domain-name}[:{port#}] biçimindeki ana bilgisayarların bir listesini veya tüm çıkış noktalarına izin vermek için tek bir '*' içerebilir (önerilmez).

maxAgeInSeconds

integer (int64)

Tarayıcıların CORS ön kontrol yanıtlarını önbelleğe alması gereken süre. Varsayılan olarak 5 dakikadır.

CustomAnalyzer

Metni dizine eklenebilir/aranabilir belirteçlere dönüştürme işlemi üzerinde kontrol sahibi olmanızı sağlar. Önceden tanımlanmış tek bir belirteç oluşturucu ve bir veya daha fazla filtreden oluşan kullanıcı tanımlı bir yapılandırmadır. Belirteçleştirici, metni belirteçlere bölmekten ve belirteç oluşturucu tarafından yayılan belirteçleri değiştirmek için filtrelerden sorumludur.

Name Tür Description
@odata.type string:

#Microsoft.Azure.Search.CustomAnalyzer

Çözümleyici türünü belirten bir URI parçası.

charFilters

CharFilterName[]

Giriş metnini belirteç oluşturucu tarafından işlenmeden önce hazırlamak için kullanılan karakter filtrelerinin listesi. Örneğin, belirli karakterleri veya sembolleri değiştirebilirler. Filtreler listelenme sırasına göre çalıştırılır.

name

string

Çözümleyicinin adı. Yalnızca harfler, rakamlar, boşluklar, kısa çizgiler veya alt çizgiler içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır.

tokenFilters

TokenFilterName[]

Bir belirteç oluşturucu tarafından oluşturulan belirteçleri filtrelemek veya değiştirmek için kullanılan belirteç filtrelerinin listesi. Örneğin, tüm karakterleri küçük harfe dönüştüren bir küçük harf filtresi belirtebilirsiniz. Filtreler listelenme sırasına göre çalıştırılır.

tokenizer

LexicalTokenizerName

Sürekli metni, bir cümleyi sözcüklere bölme gibi bir belirteç dizisine bölmek için kullanılacak belirteç oluşturucunun adı.

CustomNormalizer

Varsayılan olarak katı eşleştirmeyle çalışan filtrelenebilir, sıralanabilir ve facetable alanlar için normalleştirmeyi yapılandırmanıza olanak tanır. Bu, depolanan belirteci değiştiren en az bir veya daha fazla filtreden oluşan kullanıcı tanımlı bir yapılandırmadır.

Name Tür Description
@odata.type string:

#Microsoft.Azure.Search.CustomNormalizer

Normalleştirici türünü belirten bir URI parçası.

charFilters

CharFilterName[]

Giriş metnini işlenmeden önce hazırlamak için kullanılan karakter filtrelerinin listesi. Örneğin, belirli karakterleri veya sembolleri değiştirebilirler. Filtreler listelenme sırasına göre çalıştırılır.

name

string

Normalleştiricinin adı. Yalnızca harfler, rakamlar, boşluklar, kısa çizgiler veya alt çizgiler içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır. '.microsoft' veya '.lucene' ile bitemez ve 'asciifolding', 'standart', 'küçük harf', 'büyük harf' veya 'elision' olarak adlandırılamaz.

tokenFilters

TokenFilterName[]

Giriş belirtecini filtrelemek veya değiştirmek için kullanılan belirteç filtrelerinin listesi. Örneğin, tüm karakterleri küçük harfe dönüştüren bir küçük harf filtresi belirtebilirsiniz. Filtreler listelenme sırasına göre çalıştırılır.

DictionaryDecompounderTokenFilter

Birçok Cermen dilinde bulunan bileşik sözcükleri ayrıştırır. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır.

Name Tür Default value Description
@odata.type string:

#Microsoft.Azure.Search.DictionaryDecompounderTokenFilter

Belirteç filtresinin türünü belirten bir URI parçası.

maxSubwordSize

integer (int32)

maximum: 300
15

En büyük alt sözcük boyutu. Yalnızca bundan daha kısa alt kelimelerin çıktısı alınır. Varsayılan değer 15'tir. Maksimum 300'dür.

minSubwordSize

integer (int32)

maximum: 300
2

Minimum alt sözcük boyutu. Yalnızca bundan daha uzun alt sözcüklerin çıktısı alınır. Varsayılan değer 2'dir. Maksimum 300'dür.

minWordSize

integer (int32)

maximum: 300
5

Minimum sözcük boyutu. Yalnızca bundan daha uzun kelimeler işlenir. Varsayılan değer 5'tir. Maksimum 300'dür.

name

string

Belirteç filtresinin adı. Yalnızca harfler, rakamlar, boşluklar, kısa çizgiler veya alt çizgiler içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır.

onlyLongestMatch

boolean

False

Çıktıya yalnızca en uzun eşleşen alt sözcüğün eklenip eklenmeyeceğini belirten bir değer. Varsayılan değer false'tur.

wordList

string[]

Eşleştirilecek kelimelerin listesi.

DistanceScoringFunction

Coğrafi bir konuma olan mesafeye bağlı olarak puanları artıran bir işlev tanımlar.

Name Tür Description
boost

number (double)

Ham puan için bir çarpan. 1.0'a eşit olmayan pozitif bir sayı olmalıdır.

distance

DistanceScoringParameters

Mesafe puanlama fonksiyonu için parametre değerleri.

fieldName

string

Puanlama işlevine giriş olarak kullanılan alanın adı.

interpolation

ScoringFunctionInterpolation

Yükseltmenin belge puanları arasında nasıl enterpolasyon yapılacağını gösteren bir değer; varsayılan olarak "Doğrusal" olarak ayarlanır.

type string:

distance

Kullanılacak işlevin türünü belirtir. Geçerli değerler büyüklük, tazelik, uzaklık ve etiketi içerir. İşlev türü küçük harf olmalıdır.

DistanceScoringParameters

Mesafe puanlama işlevine parametre değerleri sağlar.

Name Tür Description
boostingDistance

number (double)

Takviye aralığının sona erdiği referans konumundan kilometre cinsinden mesafe.

referencePointParameter

string

Başvuru konumunu belirtmek için arama sorgularında geçirilen parametrenin adı.

EdgeNGramTokenFilter

Bir giriş belirtecinin önünden veya arkasından başlayarak verilen boyut(lar)ın n-gramını oluşturur. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır.

Name Tür Default value Description
@odata.type string:

#Microsoft.Azure.Search.EdgeNGramTokenFilter

Belirteç filtresinin türünü belirten bir URI parçası.

maxGram

integer (int32)

2

Maksimum n-gram uzunluk. Varsayılan değer 2'dir.

minGram

integer (int32)

1

Minimum n-gram uzunluk. Varsayılan değer 1'dir. maxGram değerinden küçük olmalıdır.

name

string

Belirteç filtresinin adı. Yalnızca harfler, rakamlar, boşluklar, kısa çizgiler veya alt çizgiler içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır.

side

EdgeNGramTokenFilterSide

front

N-gramın girişin hangi tarafından oluşturulması gerektiğini belirtir. Varsayılan değer "ön"dür.

EdgeNGramTokenFilterSide

Bir n-gramın girişin hangi tarafından oluşturulması gerektiğini belirtir.

Değer Description
front

n-gramın girişin önünden oluşturulması gerektiğini belirtir.

back

n-gramın girişin arkasından oluşturulması gerektiğini belirtir.

EdgeNGramTokenFilterV2

Bir giriş belirtecinin önünden veya arkasından başlayarak verilen boyut(lar)ın n-gramını oluşturur. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır.

Name Tür Default value Description
@odata.type string:

#Microsoft.Azure.Search.EdgeNGramTokenFilterV2

Belirteç filtresinin türünü belirten bir URI parçası.

maxGram

integer (int32)

maximum: 300
2

Maksimum n-gram uzunluk. Varsayılan değer 2'dir. Maksimum 300'dür.

minGram

integer (int32)

maximum: 300
1

Minimum n-gram uzunluk. Varsayılan değer 1'dir. Maksimum 300'dür. maxGram değerinden küçük olmalıdır.

name

string

Belirteç filtresinin adı. Yalnızca harfler, rakamlar, boşluklar, kısa çizgiler veya alt çizgiler içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır.

side

EdgeNGramTokenFilterSide

front

N-gramın girişin hangi tarafından oluşturulması gerektiğini belirtir. Varsayılan değer "ön"dür.

EdgeNGramTokenizer

Bir kenardan gelen girdiyi, verilen boyut(lar)ın n-gramına tokenize eder. Bu belirteç oluşturucu Apache Lucene kullanılarak uygulanır.

Name Tür Default value Description
@odata.type string:

#Microsoft.Azure.Search.EdgeNGramTokenizer

Belirteç oluşturucu türünü belirten bir URI parçası.

maxGram

integer (int32)

maximum: 300
2

Maksimum n-gram uzunluk. Varsayılan değer 2'dir. Maksimum 300'dür.

minGram

integer (int32)

maximum: 300
1

Minimum n-gram uzunluk. Varsayılan değer 1'dir. Maksimum 300'dür. maxGram değerinden küçük olmalıdır.

name

string

Tokenizer'ın adı. Yalnızca harfler, rakamlar, boşluklar, kısa çizgiler veya alt çizgiler içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır.

tokenChars

TokenCharacterKind[]

Belirteçlerde tutulacak karakter sınıfları.

ElisionTokenFilter

Elizyonları kaldırır. Örneğin, "l'avion" (uçak) "avion" (uçak) olarak dönüştürülecektir. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır.

Name Tür Description
@odata.type string:

#Microsoft.Azure.Search.ElisionTokenFilter

Belirteç filtresinin türünü belirten bir URI parçası.

articles

string[]

Kaldırılacak makaleler kümesi.

name

string

Belirteç filtresinin adı. Yalnızca harfler, rakamlar, boşluklar, kısa çizgiler veya alt çizgiler içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır.

ErrorAdditionalInfo

Kaynak yönetimi hatası ek bilgileri.

Name Tür Description
info

object

Ek bilgiler.

type

string

Ek bilgi türü.

ErrorDetail

Hata ayrıntısı.

Name Tür Description
additionalInfo

ErrorAdditionalInfo[]

Hata ek bilgileri.

code

string

Hata kodu.

details

ErrorDetail[]

Hata ayrıntıları.

message

string

Hata iletisi.

target

string

Hata hedefi.

ErrorResponse

Hata yanıtı

Name Tür Description
error

ErrorDetail

Hata nesnesi.

ExhaustiveKnnParameters

Kapsamlı KNN algoritmasına özgü parametreleri içerir.

Name Tür Description
metric

VectorSearchAlgorithmMetric

Vektör karşılaştırmaları için kullanılacak benzerlik metriği.

ExhaustiveKnnVectorSearchAlgorithmConfiguration

Sorgulama sırasında kullanılan ve tüm vektör dizini boyunca deneme yanılma araması gerçekleştirecek olan kapsamlı KNN algoritmasına özgü yapılandırma seçeneklerini içerir.

Name Tür Description
exhaustiveKnnParameters

ExhaustiveKnnParameters

Kapsamlı KNN algoritmasına özgü parametreleri içerir.

kind string:

exhaustiveKnn

Vektör aramasıyla kullanılmak üzere yapılandırılan algoritma türünün adı.

name

string

Bu özel yapılandırmayla ilişkilendirilecek ad.

FreshnessScoringFunction

Tarih-saat alanının değerine bağlı olarak puanları artıran bir işlev tanımlar.

Name Tür Description
boost

number (double)

Ham puan için bir çarpan. 1.0'a eşit olmayan pozitif bir sayı olmalıdır.

fieldName

string

Puanlama işlevine giriş olarak kullanılan alanın adı.

freshness

FreshnessScoringParameters

Tazelik puanlama işlevi için parametre değerleri.

interpolation

ScoringFunctionInterpolation

Yükseltmenin belge puanları arasında nasıl enterpolasyon yapılacağını gösteren bir değer; varsayılan olarak "Doğrusal" olarak ayarlanır.

type string:

freshness

Kullanılacak işlevin türünü belirtir. Geçerli değerler büyüklük, tazelik, uzaklık ve etiketi içerir. İşlev türü küçük harf olmalıdır.

FreshnessScoringParameters

Tazelik puanlama işlevine parametre değerleri sağlar.

Name Tür Description
boostingDuration

string (duration)

Belirli bir belge için yükseltmenin durdurulacağı sona erme süresi.

HnswParameters

HNSW algoritmasına özgü parametreleri içerir.

Name Tür Default value Description
efConstruction

integer (int32)

minimum: 100
maximum: 1000
400

Dizin süresi boyunca kullanılan en yakın komşuları içeren dinamik listenin boyutu. Bu parametrenin artırılması, dizin oluşturma süresinin artması pahasına dizin kalitesini iyileştirebilir. Belli bir noktada, bu parametrenin arttırılması azalan getirilere yol açar.

efSearch

integer (int32)

minimum: 100
maximum: 1000
500

Arama sırasında kullanılan en yakın komşuları içeren dinamik listenin boyutu. Bu parametreyi artırmak, daha yavaş arama pahasına arama sonuçlarını iyileştirebilir. Belli bir noktada, bu parametrenin arttırılması azalan getirilere yol açar.

m

integer (int32)

minimum: 4
maximum: 10
4

İnşaat sırasında her yeni eleman için oluşturulan çift yönlü bağlantıların sayısı. Bu parametre değerinin artırılması, artan bellek tüketimi ve daha uzun dizin oluşturma süresi pahasına yüksek iç boyutluluğa sahip veri kümeleri için geri çağırmayı iyileştirebilir ve alma sürelerini azaltabilir.

metric

VectorSearchAlgorithmMetric

Vektör karşılaştırmaları için kullanılacak benzerlik metriği.

HnswVectorSearchAlgorithmConfiguration

Dizin oluşturma ve sorgulama sırasında kullanılan HNSW yaklaşık en yakın komşular algoritmasına özgü yapılandırma seçeneklerini içerir. HNSW algoritması, arama hızı ve doğruluğu arasında ayarlanabilir bir denge sunar.

Name Tür Description
hnswParameters

HnswParameters

HNSW algoritmasına özgü parametreleri içerir.

kind string:

hnsw

Vektör aramasıyla kullanılmak üzere yapılandırılan algoritma türünün adı.

name

string

Bu özel yapılandırmayla ilişkilendirilecek ad.

InputFieldMappingEntry

Bir beceri için giriş alanı eşlemesi.

Name Tür Description
inputs

InputFieldMappingEntry[]

Karmaşık bir tür oluştururken kullanılan özyinelemeli girişler.

name

string

Girişin adı.

source

string

Girişin kaynağı.

sourceContext

string

Özyinelemeli girişleri seçmek için kullanılan kaynak bağlamı.

KeepTokenFilter

Yalnızca belirli bir sözcük listesinde yer alan metne sahip belirteçleri tutan bir belirteç filtresi. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır.

Name Tür Default value Description
@odata.type string:

#Microsoft.Azure.Search.KeepTokenFilter

Belirteç filtresinin türünü belirten bir URI parçası.

keepWords

string[]

Saklanacak kelimelerin listesi.

keepWordsCase

boolean

False

Önce tüm sözcüklerin küçük harfle yazılıp yazılmayacağını gösteren bir değer. Varsayılan değer false'tur.

name

string

Belirteç filtresinin adı. Yalnızca harfler, rakamlar, boşluklar, kısa çizgiler veya alt çizgiler içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır.

KeywordMarkerTokenFilter

Terimleri anahtar sözcük olarak işaretler. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır.

Name Tür Default value Description
@odata.type string:

#Microsoft.Azure.Search.KeywordMarkerTokenFilter

Belirteç filtresinin türünü belirten bir URI parçası.

ignoreCase

boolean

False

Büyük/küçük harfin yok sayılıp sayılmayacağını belirten bir değer. Doğruysa, önce tüm sözcükler küçük harfe dönüştürülür. Varsayılan değer false'tur.

keywords

string[]

Anahtar sözcük olarak işaretlenecek sözcüklerin listesi.

name

string

Belirteç filtresinin adı. Yalnızca harfler, rakamlar, boşluklar, kısa çizgiler veya alt çizgiler içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır.

KeywordTokenizer

Tüm girişi tek bir belirteç olarak yayar. Bu belirteç oluşturucu Apache Lucene kullanılarak uygulanır.

Name Tür Default value Description
@odata.type string:

#Microsoft.Azure.Search.KeywordTokenizer

Belirteç oluşturucu türünü belirten bir URI parçası.

bufferSize

integer (int32)

256

Bayt cinsinden okuma arabelleği boyutu. Varsayılan değer 256'dır.

name

string

Tokenizer'ın adı. Yalnızca harfler, rakamlar, boşluklar, kısa çizgiler veya alt çizgiler içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır.

KeywordTokenizerV2

Tüm girişi tek bir belirteç olarak yayar. Bu belirteç oluşturucu Apache Lucene kullanılarak uygulanır.

Name Tür Default value Description
@odata.type string:

#Microsoft.Azure.Search.KeywordTokenizerV2

Belirteç oluşturucu türünü belirten bir URI parçası.

maxTokenLength

integer (int32)

maximum: 300
256

Maksimum belirteç uzunluğu. Varsayılan değer 256'dır. Maksimum uzunluktan daha uzun olan jetonlar bölünür. Kullanılabilecek maksimum belirteç uzunluğu 300 karakterdir.

name

string

Tokenizer'ın adı. Yalnızca harfler, rakamlar, boşluklar, kısa çizgiler veya alt çizgiler içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır.

LengthTokenFilter

Çok uzun veya çok kısa sözcükleri kaldırır. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır.

Name Tür Default value Description
@odata.type string:

#Microsoft.Azure.Search.LengthTokenFilter

Belirteç filtresinin türünü belirten bir URI parçası.

max

integer (int32)

maximum: 300
300

Karakter cinsinden maksimum uzunluk. Varsayılan ve maksimum 300'dür.

min

integer (int32)

maximum: 300
0

Karakter cinsinden minimum uzunluk. Varsayılan değer 0'dır. Maksimum 300'dür. Max değerinden küçük olmalıdır.

name

string

Belirteç filtresinin adı. Yalnızca harfler, rakamlar, boşluklar, kısa çizgiler veya alt çizgiler içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır.

LexicalAnalyzerName

Arama motoru tarafından desteklenen tüm metin çözümleyicilerinin adlarını tanımlar.

Değer Description
ar.microsoft

Arapça için Microsoft çözümleyicisi.

ar.lucene

Arapça için Lucene analizörü.

hy.lucene

Ermenice için Lucene analizörü.

bn.microsoft

Bangla için Microsoft çözümleyicisi.

eu.lucene

Bask için Lucene analizörü.

bg.microsoft

Bulgarca için Microsoft çözümleyicisi.

bg.lucene

Bulgarca için Lucene analizörü.

ca.microsoft

Katalanca için Microsoft çözümleyicisi.

ca.lucene

Katalanca için Lucene analizörü.

zh-Hans.microsoft

Çince (Basitleştirilmiş) için Microsoft çözümleyicisi.

zh-Hans.lucene

Çince için Lucene analizörü (Basitleştirilmiş).

zh-Hant.microsoft

Çince (Geleneksel) için Microsoft çözümleyicisi.

zh-Hant.lucene

Çince (Geleneksel) için Lucene analizörü.

hr.microsoft

Hırvatça için Microsoft çözümleyicisi.

cs.microsoft

Çekçe için Microsoft çözümleyicisi.

cs.lucene

Çekçe için Lucene analizörü.

da.microsoft

Danca için Microsoft çözümleyicisi.

da.lucene

Danca için Lucene analizörü.

nl.microsoft

Hollandaca için Microsoft çözümleyicisi.

nl.lucene

Hollandaca için Lucene analizörü.

en.microsoft

İngilizce için Microsoft çözümleyicisi.

en.lucene

İngilizce için Lucene analizörü.

et.microsoft

Estonca için Microsoft çözümleyicisi.

fi.microsoft

Fince için Microsoft çözümleyicisi.

fi.lucene

Fince için Lucene analizörü.

fr.microsoft

Fransızca için Microsoft çözümleyicisi.

fr.lucene

Fransızca için Lucene analizörü.

gl.lucene

Galiçyaca için Lucene analizörü.

de.microsoft

Almanca için Microsoft çözümleyicisi.

de.lucene

Almanca için Lucene analizörü.

el.microsoft

Yunanca için Microsoft çözümleyicisi.

el.lucene

Yunanca için Lucene analizörü.

gu.microsoft

Gujarati için Microsoft çözümleyicisi.

he.microsoft

İbranice için Microsoft çözümleyicisi.

hi.microsoft

Hintçe için Microsoft çözümleyicisi.

hi.lucene

Hintçe için Lucene analizörü.

hu.microsoft

Macarca için Microsoft çözümleyicisi.

hu.lucene

Macarca için Lucene analizörü.

is.microsoft

İzlandaca için Microsoft çözümleyicisi.

id.microsoft

Endonezce (Bahasa) için Microsoft çözümleyicisi.

id.lucene

Endonezya için Lucene analizörü.

ga.lucene

İrlandalılar için Lucene analizörü.

it.microsoft

İtalyanca için Microsoft çözümleyicisi.

it.lucene

İtalyanca için Lucene analizörü.

ja.microsoft

Japonca için Microsoft çözümleyicisi.

ja.lucene

Japonca için Lucene analizörü.

kn.microsoft

Kannada için Microsoft çözümleyicisi.

ko.microsoft

Korece için Microsoft çözümleyicisi.

ko.lucene

Korece için Lucene analizörü.

lv.microsoft

Letonca için Microsoft çözümleyicisi.

lv.lucene

Letonca için Lucene analizörü.

lt.microsoft

Litvanca için Microsoft çözümleyicisi.

ml.microsoft

Malayalam için Microsoft çözümleyicisi.

ms.microsoft

Malayca (Latince) için Microsoft çözümleyicisi.

mr.microsoft

Marathi için Microsoft çözümleyicisi.

nb.microsoft

Microsoft analyzer for Norwegian (Bokmål).

no.lucene

Norveççe için Lucene analizörü.

fa.lucene

Farsça için Lucene analizörü.

pl.microsoft

Lehçe için Microsoft çözümleyicisi.

pl.lucene

Lehçe için Lucene analizörü.

pt-BR.microsoft

Portekizce (Brezilya) için Microsoft çözümleyicisi.

pt-BR.lucene

Portekizce (Brezilya) için Lucene analizörü.

pt-PT.microsoft

Portekizce (Portekiz) için Microsoft çözümleyicisi.

pt-PT.lucene

Portekizce (Portekiz) için Lucene analizörü.

pa.microsoft

Punjabi için Microsoft çözümleyicisi.

ro.microsoft

Romence için Microsoft çözümleyicisi.

ro.lucene

Romence için Lucene analizörü.

ru.microsoft

Rusça için Microsoft analizörü.

ru.lucene

Rusça için Lucene analizörü.

sr-cyrillic.microsoft

Sırpça (Kiril) için Microsoft çözümleyicisi.

sr-latin.microsoft

Sırpça (Latin) için Microsoft çözümleyicisi.

sk.microsoft

Slovakça için Microsoft çözümleyicisi.

sl.microsoft

Slovence için Microsoft çözümleyicisi.

es.microsoft

İspanyolca için Microsoft çözümleyicisi.

es.lucene

İspanyolca için Lucene analizörü.

sv.microsoft

İsveççe için Microsoft çözümleyicisi.

sv.lucene

İsveççe için Lucene analizörü.

ta.microsoft

Tamil için Microsoft çözümleyicisi.

te.microsoft

Telugu için Microsoft çözümleyicisi.

th.microsoft

Tay dili için Microsoft çözümleyicisi.

th.lucene

Tay dili için Lucene analizörü.

tr.microsoft

Türkçe için Microsoft çözümleyicisi.

tr.lucene

Türkçe için Lucene analizörü.

uk.microsoft

Ukraynaca için Microsoft çözümleyicisi.

ur.microsoft

Urduca için Microsoft çözümleyicisi.

vi.microsoft

Vietnamca için Microsoft çözümleyicisi.

standard.lucene

Standart Lucene analizörü.

standardasciifolding.lucene

Standart ASCII Katlanır Lucene analizörü. Bkz. https://learn.microsoft.com/rest/api/searchservice/Custom-analyzers-in-Azure-Search#Analyzers

keyword

Bir alanın tüm içeriğini tek bir belirteç olarak değerlendirir. Bu, posta kodları, kimlikler ve bazı ürün adları gibi veriler için kullanışlıdır. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/KeywordAnalyzer.html

pattern

Metni düzenli bir ifade deseni aracılığıyla esnek bir şekilde terimlere ayırır. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/PatternAnalyzer.html

simple

Metni harf olmayan harflere böler ve küçük harfe dönüştürür. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/SimpleAnalyzer.html

stop

Metni harf olmayanlara böler; Küçük harf ve stopword belirteç filtrelerini uygular. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/StopAnalyzer.html

whitespace

Beyaz boşluk belirteç oluşturucusunu kullanan bir çözümleyici. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/WhitespaceAnalyzer.html

LexicalNormalizerName

Arama motoru tarafından desteklenen tüm metin normalleştiricilerinin adlarını tanımlar.

Değer Description
asciifolding

İlk 127 ASCII karakterde ("Temel Latince" Unicode bloğu) yer almayan alfabetik, sayısal ve sembolik Unicode karakterleri, bu tür eşdeğerler varsa ASCII eşdeğerlerine dönüştürür. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/ASCIIFoldingFilter.html

elision

Elizyonları kaldırır. Örneğin, "l'avion" (uçak) "avion" (uçak) olarak dönüştürülecektir. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/util/ElisionFilter.html

lowercase

Belirteç metnini küçük harf olarak normalleştirir. Bkz. https://lucene.apache.org/core/6_6_1/analyzers-common/org/apache/lucene/analysis/core/LowerCaseFilter.html

standard

Küçük harf ve asciifolding'den oluşan standart normalleştirici. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/reverse/ReverseStringFilter.html

uppercase

Belirteç metnini büyük harf olarak normalleştirir. Bkz. https://lucene.apache.org/core/6_6_1/analyzers-common/org/apache/lucene/analysis/core/UpperCaseFilter.html

LexicalTokenizerName

Arama motoru tarafından desteklenen tüm tokenizer'ların adlarını tanımlar.

Değer Description
classic

Çoğu Avrupa dilindeki belgeyi işlemek için uygun olan dilbilgisi tabanlı belirteçleyici. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/standard/ClassicTokenizer.html

edgeNGram

Bir kenardan gelen girdiyi, verilen boyut(lar)ın n-gramına tokenize eder. Bkz. https://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/ngram/EdgeNGramTokenizer.html

keyword_v2

Tüm girişi tek bir belirteç olarak yayar. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/KeywordTokenizer.html

letter

Metni harf olmayanlara böler. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/LetterTokenizer.html

lowercase

Metni harf olmayan harflere böler ve küçük harfe dönüştürür. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/LowerCaseTokenizer.html

microsoft_language_tokenizer

Dile özgü kuralları kullanarak metni böler.

microsoft_language_stemming_tokenizer

Dile özgü kuralları kullanarak metni böler ve sözcükleri temel biçimlerine indirger.

nGram

Girdiyi, verilen boyut(lar)ın n-gramına tokenize eder. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/ngram/NGramTokenizer.html

path_hierarchy_v2

Yol benzeri hiyerarşiler için belirteçleştirici. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/path/PathHierarchyTokenizer.html

pattern

Farklı belirteçler oluşturmak için normal ifade deseni eşleştirmesini kullanan belirteçleyici. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/pattern/PatternTokenizer.html

standard_v2

Standart Lucene analizörü; Standart belirteçleyici, küçük harf filtresi ve durdurma filtresinden oluşur. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/standard/StandardTokenizer.html

uax_url_email

URL'leri ve e-postaları tek bir belirteç olarak belirteçleştirir. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/standard/UAX29URLEmailTokenizer.html

whitespace

Metni boşlukta böler. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/WhitespaceTokenizer.html

LimitTokenFilter

İndeksleme sırasında belirteç sayısını sınırlar. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır.

Name Tür Default value Description
@odata.type string:

#Microsoft.Azure.Search.LimitTokenFilter

Belirteç filtresinin türünü belirten bir URI parçası.

consumeAllTokens

boolean

False

maxTokenCount'a ulaşılsa bile girişteki tüm belirteçlerin tüketilmesi gerekip gerekmediğini belirten bir değer. Varsayılan değer false'tur.

maxTokenCount

integer (int32)

1

Üretilecek maksimum jeton sayısı. Varsayılan değer 1'dir.

name

string

Belirteç filtresinin adı. Yalnızca harfler, rakamlar, boşluklar, kısa çizgiler veya alt çizgiler içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır.

LuceneStandardAnalyzer

Standart Apache Lucene analizörü; Standart belirteçleyici, küçük harf filtresi ve durdurma filtresinden oluşur.

Name Tür Default value Description
@odata.type string:

#Microsoft.Azure.Search.StandardAnalyzer

Çözümleyici türünü belirten bir URI parçası.

maxTokenLength

integer (int32)

maximum: 300
255

Maksimum belirteç uzunluğu. Varsayılan değer 255'tir. Maksimum uzunluktan daha uzun olan jetonlar bölünür. Kullanılabilecek maksimum belirteç uzunluğu 300 karakterdir.

name

string

Çözümleyicinin adı. Yalnızca harfler, rakamlar, boşluklar, kısa çizgiler veya alt çizgiler içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır.

stopwords

string[]

Durdurma sözcüklerinin bir listesi.

LuceneStandardTokenizer

Unicode Metin Bölütleme kurallarına uygun olarak metni keser. Bu belirteç oluşturucu Apache Lucene kullanılarak uygulanır.

Name Tür Default value Description
@odata.type string:

#Microsoft.Azure.Search.StandardTokenizer

Belirteç oluşturucu türünü belirten bir URI parçası.

maxTokenLength

integer (int32)

255

Maksimum belirteç uzunluğu. Varsayılan değer 255'tir. Maksimum uzunluktan daha uzun olan jetonlar bölünür.

name

string

Tokenizer'ın adı. Yalnızca harfler, rakamlar, boşluklar, kısa çizgiler veya alt çizgiler içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır.

LuceneStandardTokenizerV2

Unicode Metin Bölütleme kurallarına uygun olarak metni keser. Bu belirteç oluşturucu Apache Lucene kullanılarak uygulanır.

Name Tür Default value Description
@odata.type string:

#Microsoft.Azure.Search.StandardTokenizerV2

Belirteç oluşturucu türünü belirten bir URI parçası.

maxTokenLength

integer (int32)

maximum: 300
255

Maksimum belirteç uzunluğu. Varsayılan değer 255'tir. Maksimum uzunluktan daha uzun olan jetonlar bölünür. Kullanılabilecek maksimum belirteç uzunluğu 300 karakterdir.

name

string

Tokenizer'ın adı. Yalnızca harfler, rakamlar, boşluklar, kısa çizgiler veya alt çizgiler içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır.

MagnitudeScoringFunction

Sayısal bir alanın büyüklüğüne bağlı olarak puanları artıran bir işlev tanımlar.

Name Tür Description
boost

number (double)

Ham puan için bir çarpan. 1.0'a eşit olmayan pozitif bir sayı olmalıdır.

fieldName

string

Puanlama işlevine giriş olarak kullanılan alanın adı.

interpolation

ScoringFunctionInterpolation

Yükseltmenin belge puanları arasında nasıl enterpolasyon yapılacağını gösteren bir değer; varsayılan olarak "Doğrusal" olarak ayarlanır.

magnitude

MagnitudeScoringParameters

Büyüklük puanlama fonksiyonu için parametre değerleri.

type string:

magnitude

Kullanılacak işlevin türünü belirtir. Geçerli değerler büyüklük, tazelik, uzaklık ve etiketi içerir. İşlev türü küçük harf olmalıdır.

MagnitudeScoringParameters

Büyüklük puanlama işlevine parametre değerleri sağlar.

Name Tür Description
boostingRangeEnd

number (double)

Yükseltmenin sona erdiği alan değeri.

boostingRangeStart

number (double)

Yükseltmenin başladığı alan değeri.

constantBoostBeyondRange

boolean

Aralık bitiş değerinin ötesindeki alan değerleri için sabit bir artırma uygulanıp uygulanmayacağını gösteren bir değer; Varsayılan değer false'tur.

MappingCharFilter

Eşlemeler seçeneğiyle tanımlanan eşlemeleri uygulayan bir karakter filtresi. Eşleştirme açgözlüdür (belirli bir noktada en uzun desen eşleşmesi kazanır). Değiştirmenin boş dize olmasına izin verilir. Bu karakter filtresi Apache Lucene kullanılarak uygulanır.

Name Tür Description
@odata.type string:

#Microsoft.Azure.Search.MappingCharFilter

Karakter filtresinin türünü belirten bir URI parçası.

mappings

string[]

Aşağıdaki biçimdeki eşlemelerin listesi: "a=>b" ("a" karakterinin tüm yinelemeleri "b" karakteriyle değiştirilir).

name

string

Char filtresinin adı. Yalnızca harfler, rakamlar, boşluklar, kısa çizgiler veya alt çizgiler içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır.

MicrosoftLanguageStemmingTokenizer

Dile özgü kuralları kullanarak metni böler ve sözcükleri temel biçimlerine indirger.

Name Tür Default value Description
@odata.type string:

#Microsoft.Azure.Search.MicrosoftLanguageStemmingTokenizer

Belirteç oluşturucu türünü belirten bir URI parçası.

isSearchTokenizer

boolean

False

Tokenizer'ın nasıl kullanıldığını gösteren bir değer. Arama belirteci olarak kullanılıyorsa true olarak ayarlayın, dizin oluşturma belirteci olarak kullanılıyorsa false olarak ayarlayın. Varsayılan değer false'tur.

language

MicrosoftStemmingTokenizerLanguage

Kullanılacak dil. Varsayılan değer İngilizce'dir.

maxTokenLength

integer (int32)

maximum: 300
255

Maksimum belirteç uzunluğu. Maksimum uzunluktan daha uzun olan jetonlar bölünür. Kullanılabilecek maksimum belirteç uzunluğu 300 karakterdir. 300 karakterden daha uzun jetonlar önce 300 uzunluğundaki jetonlara bölünür ve ardından bu jetonların her biri belirlenen maksimum jeton uzunluğuna göre bölünür. Varsayılan değer 255'tir.

name

string

Tokenizer'ın adı. Yalnızca harfler, rakamlar, boşluklar, kısa çizgiler veya alt çizgiler içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır.

MicrosoftLanguageTokenizer

Dile özgü kuralları kullanarak metni böler.

Name Tür Default value Description
@odata.type string:

#Microsoft.Azure.Search.MicrosoftLanguageTokenizer

Belirteç oluşturucu türünü belirten bir URI parçası.

isSearchTokenizer

boolean

False

Tokenizer'ın nasıl kullanıldığını gösteren bir değer. Arama belirteci olarak kullanılıyorsa true olarak ayarlayın, dizin oluşturma belirteci olarak kullanılıyorsa false olarak ayarlayın. Varsayılan değer false'tur.

language

MicrosoftTokenizerLanguage

Kullanılacak dil. Varsayılan değer İngilizce'dir.

maxTokenLength

integer (int32)

maximum: 300
255

Maksimum belirteç uzunluğu. Maksimum uzunluktan daha uzun olan jetonlar bölünür. Kullanılabilecek maksimum belirteç uzunluğu 300 karakterdir. 300 karakterden daha uzun jetonlar önce 300 uzunluğundaki jetonlara bölünür ve ardından bu jetonların her biri belirlenen maksimum jeton uzunluğuna göre bölünür. Varsayılan değer 255'tir.

name

string

Tokenizer'ın adı. Yalnızca harfler, rakamlar, boşluklar, kısa çizgiler veya alt çizgiler içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır.

MicrosoftStemmingTokenizerLanguage

Microsoft dil köklendirme belirteç oluşturucusu tarafından desteklenen dilleri listeler.

Değer Description
arabic

Arapça için Microsoft kök tokenizer'ı seçer.

bangla

Bangla için Microsoft kök tokenizer'ı seçer.

bulgarian

Bulgarca için Microsoft kök tokenizer'ı seçer.

catalan

Katalanca için Microsoft kök tokenizer'ı seçer.

croatian

Hırvatça için Microsoft kök tokenizer'ı seçer.

czech

Çekçe için Microsoft kök tokenizer'ı seçer.

danish

Danca için Microsoft kök tokenizer'ı seçer.

dutch

Felemenkçe için Microsoft kök tokenizer'ı seçer.

english

İngilizce için Microsoft kök tokenizer'ı seçer.

estonian

Estonca için Microsoft kök tokenizer'ı seçer.

finnish

Fince için Microsoft kök tokenizer'ı seçer.

french

Fransızca için Microsoft kök tokenizer'ı seçer.

german

Almanca için Microsoft kök oluşturma belirteç oluşturucusunu seçer.

greek

Yunanca için Microsoft kök tokenizer'ı seçer.

gujarati

Gujarati için Microsoft kök belirtecini seçer.

hebrew

İbranice için Microsoft kök oluşturma belirteç oluşturucusunu seçer.

hindi

Hintçe için Microsoft kök tokenizer'ı seçer.

hungarian

Macarca için Microsoft kök tokenizer'ını seçer.

icelandic

İzlandaca için Microsoft kök tokenizer'ı seçer.

indonesian

Endonezce için Microsoft kök tokenizer'ı seçer.

italian

İtalyanca için Microsoft kök tokenizer'ı seçer.

kannada

Kannada için Microsoft kök tokenizer'ı seçer.

latvian

Letonca için Microsoft kök tokenizer'ı seçer.

lithuanian

Litvanca için Microsoft kök belirtecini seçer.

malay

Malay dili için Microsoft kök tokenizer'ı seçer.

malayalam

Malayalam için Microsoft kök tokenizer'ı seçer.

marathi

Marathi için Microsoft kök tokenizer'ı seçer.

norwegianBokmaal

Norveççe (Bokmål) için Microsoft kök tokenizer'ı seçer.

polish

Lehçe için Microsoft kök tokenizer'ı seçer.

portuguese

Portekizce için Microsoft kök tokenizer'ı seçer.

portugueseBrazilian

Portekizce (Brezilya) için Microsoft kök tokenizer'ı seçer.

punjabi

Punjabi için Microsoft kök belirteç oluşturucusunu seçer.

romanian

Romence için Microsoft kök tokenizer'ı seçer.

russian

Rusça için Microsoft kök tokenizer'ı seçer.

serbianCyrillic

Sırpça (Kiril) için Microsoft kök belirtecini seçer.

serbianLatin

Sırpça (Latince) için Microsoft kök tokenizer'ı seçer.

slovak

Slovakça için Microsoft kök tokenizer'ı seçer.

slovenian

Slovence için Microsoft kök tokenizer'ı seçer.

spanish

İspanyolca için Microsoft kök tokenizer'ı seçer.

swedish

İsveççe için Microsoft kök tokenizer'ı seçer.

tamil

Tamilce için Microsoft kök oluşturma belirteç oluşturucusunu seçer.

telugu

Telugu için Microsoft kök oluşturma belirteç oluşturucusunu seçer.

turkish

Türkçe için Microsoft stemming tokenizer'ı seçer.

ukrainian

Ukraynaca için Microsoft kök tokenizer'ı seçer.

urdu

Urduca için Microsoft kök belirteç oluşturucusunu seçer.

MicrosoftTokenizerLanguage

Microsoft dil belirteci tarafından desteklenen dilleri listeler.

Değer Description
bangla

Bangla için Microsoft tokenizer'ı seçer.

bulgarian

Bulgarca için Microsoft tokenizer'ı seçer.

catalan

Katalanca için Microsoft tokenizer'ı seçer.

chineseSimplified

Çince (Basitleştirilmiş) için Microsoft tokenizer'ı seçer.

chineseTraditional

Çince (Geleneksel) için Microsoft tokenizer'ı seçer.

croatian

Hırvatça için Microsoft tokenizer'ı seçer.

czech

Çekçe için Microsoft tokenizer'ı seçer.

danish

Danca için Microsoft tokenizer'ı seçer.

dutch

Felemenkçe için Microsoft tokenizer'ı seçer.

english

İngilizce için Microsoft belirteç oluşturucuyu seçer.

french

Fransızca için Microsoft tokenizer'ı seçer.

german

Almanca için Microsoft tokenizer'ı seçer.

greek

Yunanca için Microsoft tokenizer'ı seçer.

gujarati

Gujarati için Microsoft tokenizer'ı seçer.

hindi

Hintçe için Microsoft tokenizer'ı seçer.

icelandic

İzlandaca için Microsoft tokenizer'ı seçer.

indonesian

Endonezce için Microsoft tokenizer'ı seçer.

italian

İtalyanca için Microsoft tokenizer'ı seçer.

japanese

Japonca için Microsoft tokenizer'ı seçer.

kannada

Kannada için Microsoft tokenizer'ı seçer.

korean

Korece için Microsoft tokenizer'ı seçer.

malay

Malay dili için Microsoft tokenizer'ı seçer.

malayalam

Malayalam için Microsoft tokenizer'ı seçer.

marathi

Marathi için Microsoft belirteç oluşturucuyu seçer.

norwegianBokmaal

Norveççe (Bokmål) için Microsoft tokenizer'ı seçer.

polish

Lehçe için Microsoft tokenizer'ı seçer.

portuguese

Portekizce için Microsoft tokenizer'ı seçer.

portugueseBrazilian

Portekizce (Brezilya) için Microsoft tokenizer'ı seçer.

punjabi

Punjabi için Microsoft tokenizer'ı seçer.

romanian

Romence için Microsoft tokenizer'ı seçer.

russian

Rusça için Microsoft tokenizer'ı seçer.

serbianCyrillic

Sırpça (Kiril) için Microsoft tokenizer'ı seçer.

serbianLatin

Sırpça (Latin) için Microsoft tokenizer'ı seçer.

slovenian

Slovence için Microsoft tokenizer'ı seçer.

spanish

İspanyolca için Microsoft tokenizer'ı seçer.

swedish

İsveççe için Microsoft tokenizer'ı seçer.

tamil

Tamil için Microsoft belirteç oluşturucuyu seçer.

telugu

Telugu için Microsoft tokenizer'ı seçer.

thai

Tay dili için Microsoft tokenizer'ı seçer.

ukrainian

Ukraynaca için Microsoft tokenizer'ı seçer.

urdu

Urduca için Microsoft tokenizer'ı seçer.

vietnamese

Vietnamca için Microsoft tokenizer'ı seçer.

NGramTokenFilter

Verilen boyut(lar)dan n-gram üretir. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır.

Name Tür Default value Description
@odata.type string:

#Microsoft.Azure.Search.NGramTokenFilter

Belirteç filtresinin türünü belirten bir URI parçası.

maxGram

integer (int32)

2

Maksimum n-gram uzunluk. Varsayılan değer 2'dir.

minGram

integer (int32)

1

Minimum n-gram uzunluk. Varsayılan değer 1'dir. maxGram değerinden küçük olmalıdır.

name

string

Belirteç filtresinin adı. Yalnızca harfler, rakamlar, boşluklar, kısa çizgiler veya alt çizgiler içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır.

NGramTokenFilterV2

Verilen boyut(lar)dan n-gram üretir. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır.

Name Tür Default value Description
@odata.type string:

#Microsoft.Azure.Search.NGramTokenFilterV2

Belirteç filtresinin türünü belirten bir URI parçası.

maxGram

integer (int32)

maximum: 300
2

Maksimum n-gram uzunluk. Varsayılan değer 2'dir. Maksimum 300'dür.

minGram

integer (int32)

maximum: 300
1

Minimum n-gram uzunluk. Varsayılan değer 1'dir. Maksimum 300'dür. maxGram değerinden küçük olmalıdır.

name

string

Belirteç filtresinin adı. Yalnızca harfler, rakamlar, boşluklar, kısa çizgiler veya alt çizgiler içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır.

NGramTokenizer

Girdiyi, verilen boyut(lar)ın n-gramına tokenize eder. Bu belirteç oluşturucu Apache Lucene kullanılarak uygulanır.

Name Tür Default value Description
@odata.type string:

#Microsoft.Azure.Search.NGramTokenizer

Belirteç oluşturucu türünü belirten bir URI parçası.

maxGram

integer (int32)

maximum: 300
2

Maksimum n-gram uzunluk. Varsayılan değer 2'dir. Maksimum 300'dür.

minGram

integer (int32)

maximum: 300
1

Minimum n-gram uzunluk. Varsayılan değer 1'dir. Maksimum 300'dür. maxGram değerinden küçük olmalıdır.

name

string

Tokenizer'ın adı. Yalnızca harfler, rakamlar, boşluklar, kısa çizgiler veya alt çizgiler içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır.

tokenChars

TokenCharacterKind[]

Belirteçlerde tutulacak karakter sınıfları.

OutputFieldMappingEntry

Bir beceri için çıktı alanı eşlemesi.

Name Tür Description
name

string

Beceri tarafından tanımlanan çıktının adı.

targetName

string

Çıktının hedef adı. İsteğe bağlıdır ve varsayılan olarak adlandırılır.

PathHierarchyTokenizerV2

Yol benzeri hiyerarşiler için belirteçleştirici. Bu belirteç oluşturucu Apache Lucene kullanılarak uygulanır.

Name Tür Default value Description
@odata.type string:

#Microsoft.Azure.Search.PathHierarchyTokenizerV2

Belirteç oluşturucu türünü belirten bir URI parçası.

delimiter

string (char)

/

Kullanılacak sınırlayıcı karakter. Varsayılan değer "/" dir.

maxTokenLength

integer (int32)

maximum: 300
300

Maksimum belirteç uzunluğu. Varsayılan ve maksimum 300'dür.

name

string

Tokenizer'ın adı. Yalnızca harfler, rakamlar, boşluklar, kısa çizgiler veya alt çizgiler içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır.

replacement

string (char)

/

Ayarlanırsa, sınırlayıcı karakterin yerini alan bir değer. Varsayılan değer "/" dir.

reverse

boolean

False

Belirteçlerin ters sırada oluşturulup oluşturulmayacağını gösteren bir değer. Varsayılan değer false'tur.

skip

integer (int32)

0

Atlanacak ilk jeton sayısı. Varsayılan değer 0'dır.

PatternAnalyzer

Metni düzenli bir ifade deseni aracılığıyla esnek bir şekilde terimlere ayırır. Bu çözümleyici Apache Lucene kullanılarak uygulanır.

Name Tür Default value Description
@odata.type string:

#Microsoft.Azure.Search.PatternAnalyzer

Çözümleyici türünü belirten bir URI parçası.

flags

RegexFlags

Normal ifade bayrakları.

lowercase

boolean

True

Terimlerin küçük harfle yazılıp yazılmayacağını belirten bir değer. Varsayılan değer doğrudur

name

string

Çözümleyicinin adı. Yalnızca harfler, rakamlar, boşluklar, kısa çizgiler veya alt çizgiler içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır.

pattern

string

\W+

Belirteç ayırıcılarıyla eşleşmesi için bir normal ifade deseni. Varsayılan, sözcük olmayan bir veya daha fazla karakterle eşleşen bir ifadedir.

stopwords

string[]

Durdurma sözcüklerinin bir listesi.

PatternCaptureTokenFilter

Bir veya daha fazla desende her yakalama grubu için bir tane olmak üzere birden çok belirteç yaymak için Java normal ifadelerini kullanır. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır.

Name Tür Default value Description
@odata.type string:

#Microsoft.Azure.Search.PatternCaptureTokenFilter

Belirteç filtresinin türünü belirten bir URI parçası.

name

string

Belirteç filtresinin adı. Yalnızca harfler, rakamlar, boşluklar, kısa çizgiler veya alt çizgiler içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır.

patterns

string[]

Her bir belirteçle eşleştirilecek desenlerin listesi.

preserveOriginal

boolean

True

Desenlerden biri eşleşse bile orijinal belirtecin döndürülüp döndürülmeyeceğini gösteren bir değer. Varsayılan değer doğrudur

PatternReplaceCharFilter

Giriş dizesindeki karakterlerin yerini alan bir karakter filtresi. Korunacak karakter dizilerini tanımlamak için normal bir ifade ve değiştirilecek karakterleri tanımlamak için bir değiştirme deseni kullanır. Örneğin, "aa bb aa bb" giriş metni, "(aa)\s+(bb)" deseni ve "$1#$2" yerine geçtiğinde, sonuç "aa#bb aa#bb" olacaktır. Bu karakter filtresi Apache Lucene kullanılarak uygulanır.

Name Tür Description
@odata.type string:

#Microsoft.Azure.Search.PatternReplaceCharFilter

Karakter filtresinin türünü belirten bir URI parçası.

name

string

Char filtresinin adı. Yalnızca harfler, rakamlar, boşluklar, kısa çizgiler veya alt çizgiler içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır.

pattern

string

Normal ifade deseni.

replacement

string

Değiştirilen metin.

PatternReplaceTokenFilter

Giriş dizesindeki karakterlerin yerini alan bir karakter filtresi. Korunacak karakter dizilerini tanımlamak için normal bir ifade ve değiştirilecek karakterleri tanımlamak için bir değiştirme deseni kullanır. Örneğin, "aa bb aa bb" giriş metni, "(aa)\s+(bb)" deseni ve "$1#$2" yerine geçtiğinde, sonuç "aa#bb aa#bb" olacaktır. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır.

Name Tür Description
@odata.type string:

#Microsoft.Azure.Search.PatternReplaceTokenFilter

Belirteç filtresinin türünü belirten bir URI parçası.

name

string

Belirteç filtresinin adı. Yalnızca harfler, rakamlar, boşluklar, kısa çizgiler veya alt çizgiler içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır.

pattern

string

Normal ifade deseni.

replacement

string

Değiştirilen metin.

PatternTokenizer

Farklı belirteçler oluşturmak için normal ifade deseni eşleştirmesini kullanan belirteçleyici. Bu belirteç oluşturucu Apache Lucene kullanılarak uygulanır.

Name Tür Default value Description
@odata.type string:

#Microsoft.Azure.Search.PatternTokenizer

Belirteç oluşturucu türünü belirten bir URI parçası.

flags

RegexFlags

Normal ifade bayrakları.

group

integer (int32)

-1

Belirteçlere ayıklamak için normal ifade desenindeki eşleşen grubun sıfır tabanlı sırası. Eşleşen gruplardan bağımsız olarak girdiyi belirteçlere bölmek için tüm deseni kullanmak istiyorsanız -1 kullanın. Varsayılan değer -1'dir.

name

string

Tokenizer'ın adı. Yalnızca harfler, rakamlar, boşluklar, kısa çizgiler veya alt çizgiler içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır.

pattern

string

\W+

Belirteç ayırıcılarıyla eşleşmesi için bir normal ifade deseni. Varsayılan, sözcük olmayan bir veya daha fazla karakterle eşleşen bir ifadedir.

PhoneticEncoder

PhoneticTokenFilter ile kullanılacak fonetik kodlayıcı türünü tanımlar.

Değer Description
metaphone

Bir belirteci Metafon değerine kodlar.

doubleMetaphone

Bir belirteci çift metafon değerine kodlar.

soundex

Bir belirteci Soundex değerine kodlar.

refinedSoundex

Bir belirteci Rafine Soundex değerine kodlar.

caverphone1

Bir belirteci Caverphone 1.0 değerine kodlar.

caverphone2

Bir belirteci Caverphone 2.0 değerine kodlar.

cologne

Bir belirteci Köln Fonetik değerine kodlar.

nysiis

Bir belirteci bir NYSIIS değerine kodlar.

koelnerPhonetik

Kölner Phonetik algoritmasını kullanarak bir belirteci kodlar.

haasePhonetik

Kölner Phonetik algoritmasının Haase iyileştirmesini kullanarak bir belirteci kodlar.

beiderMorse

Belirteci Beider-Morse bir değere kodlar.

PhoneticTokenFilter

Fonetik eşleşmeler için belirteçler oluşturun. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır.

Name Tür Default value Description
@odata.type string:

#Microsoft.Azure.Search.PhoneticTokenFilter

Belirteç filtresinin türünü belirten bir URI parçası.

encoder

PhoneticEncoder

metaphone

Kullanılacak fonetik kodlayıcı. Varsayılan değer "metafon"dur.

name

string

Belirteç filtresinin adı. Yalnızca harfler, rakamlar, boşluklar, kısa çizgiler veya alt çizgiler içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır.

replace

boolean

True

Kodlanmış belirteçlerin orijinal belirteçlerin yerini alması gerekip gerekmediğini belirten bir değer. false ise, kodlanmış belirteçler eş anlamlı olarak eklenir. Varsayılan değer doğrudur

PrioritizedFields

Anlamsal sıralama, resim yazıları, vurgular ve yanıtlar için kullanılacak başlık, içerik ve anahtar sözcük alanlarını açıklar.

Name Tür Description
prioritizedContentFields

SemanticField[]

Anlamsal sıralama, başlıklar, vurgular ve yanıtlar için kullanılacak içerik alanlarını tanımlar. En iyi sonucu elde etmek için, seçilen alanların doğal dil biçiminde metin içermesi gerekir. Dizideki alanların sırası, önceliklerini temsil eder. İçerik uzunsa daha düşük önceliğe sahip alanlar kesilebilir.

prioritizedKeywordsFields

SemanticField[]

Anlamsal sıralama, başlıklar, vurgular ve yanıtlar için kullanılacak anahtar kelime alanlarını tanımlar. En iyi sonucu elde etmek için, seçilen alanlar bir anahtar kelime listesi içermelidir. Dizideki alanların sırası, önceliklerini temsil eder. İçerik uzunsa daha düşük önceliğe sahip alanlar kesilebilir.

titleField

SemanticField

Anlamsal sıralama, başlıklar, vurgular ve yanıtlar için kullanılacak başlık alanını tanımlar. Dizininizde bir başlık alanınız yoksa, bu alanı boş bırakın.

RankingOrder

Belgelerin sıralama düzeni için kullanılacak puanı temsil eder.

Değer Description
BoostedRerankerScore

Sıralama düzenini BoostedRerankerScore olarak ayarlar

RerankerScore

Sıralama düzenini ReRankerScore olarak ayarlar

RegexFlags

Desen çözümleyicisinde ve desen belirteçleyicisinde normal ifadelerin nasıl kullanıldığını denetlemek için birleştirilebilecek bayrakları tanımlar.

Değer Description
CANON_EQ

Kanonik eşdeğerliği etkinleştirir.

CASE_INSENSITIVE

Büyük/küçük harfe duyarlı olmayan eşleştirmeyi etkinleştirir.

COMMENTS

Desendeki boşluklara ve yorumlara izin verir.

DOTALL

Dotall modunu etkinleştirir.

LITERAL

Desenin harfi harfine ayrıştırılmasını sağlar.

MULTILINE

Çok satırlı modu etkinleştirir.

UNICODE_CASE

Unicode uyumlu büyük/küçük harf katlamayı etkinleştirir.

UNIX_LINES

Unix hatları modunu etkinleştirir.

RescoringOptions

Yeniden puanlama seçeneklerini içerir.

Name Tür Default value Description
defaultOversampling

number (double)

Varsayılan aşırı örnekleme faktörü. Yüksek hızda örnekleme, nicelemeden kaynaklanan çözünürlük kaybını dengelemek için daha büyük bir potansiyel belge kümesini alır. Bu, tam duyarlıklı vektörlerde yeniden puanlanacak sonuç kümesini artırır. Minimum değer 1'dir, yani fazla örnekleme yoktur (1x). Bu parametre yalnızca 'enableRescoring' true olduğunda ayarlanabilir. Daha yüksek değerler, gecikme pahasına geri çağırmayı iyileştirir.

enableRescoring

boolean

True

Doğru olarak ayarlanırsa, sıkıştırılmış vektörler üzerinde yapılan ilk aramadan sonra, benzerlik puanları tam duyarlıklı vektörler kullanılarak yeniden hesaplanır. Bu, gecikme pahasına geri çağırmayı iyileştirecektir.

rescoreStorageMethod

VectorSearchCompressionRescoreStorageMethod

preserveOriginals

Orijinal vektörler için depolama yöntemini kontrol eder. Bu ayar sabittir.

ScalarQuantizationParameters

Skaler Kuantizasyona özgü parametreleri içerir.

Name Tür Description
quantizedDataType

VectorSearchCompressionTargetDataType

Sıkıştırılmış vektör değerlerinin nicelleştirilmiş veri türü.

ScalarQuantizationVectorSearchCompressionConfiguration

İndeksleme ve sorgulama sırasında kullanılan skaler niceleme sıkıştırma yöntemine özgü yapılandırma seçeneklerini içerir.

Name Tür Description
kind string:

scalarQuantization

Vektör aramasıyla kullanılmak üzere yapılandırılan sıkıştırma yönteminin adı.

name

string

Bu özel yapılandırmayla ilişkilendirilecek ad.

rescoringOptions

RescoringOptions

Yeniden puanlama seçeneklerini içerir.

scalarQuantizationParameters

ScalarQuantizationParameters

Skaler Kuantizasyona özgü parametreleri içerir.

truncationDimension

integer (int32)

Vektörlerin kesileceği boyut sayısı. Vektörlerin kesilmesi, vektörlerin boyutunu ve arama sırasında aktarılması gereken veri miktarını azaltır. Bu, depolama maliyetinden tasarruf sağlayabilir ve geri çağırma pahasına arama performansını iyileştirebilir. Yalnızca OpenAI text-embedding-3-large (small) gibi Matryoshka Representation Learning (MRL) ile eğitilen yerleştirmeler için kullanılmalıdır. Varsayılan değer null'dur, bu da kesme olmadığı anlamına gelir.

ScoringFunctionAggregation

Bir puanlama profilindeki tüm puanlama işlevlerinin sonuçlarını birleştirmek için kullanılan toplama işlevini tanımlar.

Değer Description
sum

Puanları, tüm puanlama işlevi sonuçlarının toplamına göre artırın.

average

Puanları, tüm puanlama işlevi sonuçlarının ortalaması kadar artırın.

minimum

Puanları, tüm puanlama işlevi sonuçlarının minimumu kadar artırın.

maximum

Puanları, tüm puanlama işlevi sonuçlarının maksimumu kadar artırın.

firstMatching

Puanlama profilinde ilk geçerli puanlama işlevini kullanarak puanları artırın.

ScoringFunctionInterpolation

Bir dizi belgede puan artırmayı enterpolasyon yapmak için kullanılan işlevi tanımlar.

Değer Description
linear

Puanları doğrusal olarak azalan bir miktarda artırır. Bu, puanlama işlevleri için varsayılan enterpolasyondur.

constant

Puanları sabit bir faktörle artırır.

quadratic

Puanları ikinci dereceden azalan bir miktarda artırır. Takviyeler, daha yüksek puanlar için yavaş ve puanlar azaldıkça daha hızlı azalır. Bu enterpolasyon seçeneğine, etiket puanlama işlevlerinde izin verilmez.

logarithmic

Puanları logaritmik olarak azalan bir miktarda artırır. Artışlar, daha yüksek puanlar için hızlı bir şekilde azalır ve puanlar azaldıkça daha yavaş azalır. Bu enterpolasyon seçeneğine, etiket puanlama işlevlerinde izin verilmez.

ScoringProfile

Arama sorgularında puanlamayı etkileyen bir arama dizini için parametreleri tanımlar.

Name Tür Description
functionAggregation

ScoringFunctionAggregation

Tek tek puanlama işlevlerinin sonuçlarının nasıl birleştirilmesi gerektiğini gösteren bir değer. Varsayılan olarak "Toplam" kullanılır. Puanlama işlevi yoksa yoksayılır.

functions ScoringFunction[]:

Belgelerin puanlanmasını etkileyen işlevlerin toplamı.

name

string

Puanlama profilinin adı.

text

TextWeights

Belirli dizin alanlarındaki metin eşleşmelerine dayalı olarak puanlamayı artıran parametreler.

SearchField

Bir alanın adını, veri türünü ve arama davranışını açıklayan bir dizin tanımındaki bir alanı temsil eder.

Name Tür Description
analyzer

LexicalAnalyzerName

Alan için kullanılacak çözümleyicinin adı. Bu seçenek yalnızca aranabilir alanlarla kullanılabilir ve searchAnalyzer veya indexAnalyzer ile birlikte ayarlanamaz. Analizör seçildikten sonra alan için değiştirilemez. Karmaşık alanlar için null olmalıdır.

dimensions

integer (int32)

minimum: 2
maximum: 4096

Vektör alanının boyutluluğu.

facetable

boolean

Faset sorgularında alana başvurulacak alanın etkinleştirilip etkinleştirilmeyeceğini belirten bir değer. Genellikle kategoriye göre isabet sayısını içeren arama sonuçlarının bir sunumunda kullanılır (örneğin, dijital kameraları arayın ve markaya göre, megapiksellere, fiyata vb. göre isabetleri görün). Bu özellik karmaşık alanlar için null olmalıdır. Edm.GeographyPoint veya Collection(Edm.GeographyPoint) türündeki alanlar facetable olamaz. Varsayılan değer, diğer tüm basit alanlar için geçerlidir.

fields

SearchField[]

Bu Edm.ComplexType veya Collection(Edm.ComplexType) türünde bir alansa, alt alanların listesi. Basit alanlar için null veya boş olmalıdır.

filterable

boolean

Alanın $filter sorgularda başvurulup başvurulmayacağının etkinleştirilip etkinleştirilmeyeceğini belirten bir değer. Filterable, dizelerin nasıl işlendiği konusunda aranabilir olandan farklıdır. Filtrelenebilir Edm.String veya Collection(Edm.String) türündeki alanlar sözcük bölünmesine uğramaz, bu nedenle karşılaştırmalar yalnızca tam eşleşmeler içindir. Örneğin, böyle bir f alanını "güneşli gün" olarak ayarlarsanız, $filter=f eq 'güneşli' eşleşme bulamaz, ancak $filter=f eq 'güneşli gün' bulur. Bu özellik karmaşık alanlar için null olmalıdır. Varsayılan değer basit alanlar için doğru, karmaşık alanlar için null değeridir.

indexAnalyzer

LexicalAnalyzerName

Alan için indeksleme zamanında kullanılan çözümleyicinin adı. Bu seçenek yalnızca aranabilir alanlarla kullanılabilir. searchAnalyzer ile birlikte ayarlanmalıdır ve analyzer seçeneğiyle birlikte ayarlanamaz. Bu özellik bir dil çözümleyicisinin adına ayarlanamaz; Dil çözümleyicisine ihtiyacınız varsa bunun yerine Analyzer özelliğini kullanın. Analizör seçildikten sonra alan için değiştirilemez. Karmaşık alanlar için null olmalıdır.

key

boolean

Alanın, dizindeki belgeleri benzersiz bir şekilde tanımlayıp tanımlamadığını gösteren bir değer. Her dizinde tam olarak bir üst düzey alan anahtar alan olarak seçilmelidir ve bu alan Edm.String türünde olmalıdır. Önemli alanlar, belgeleri doğrudan aramak ve belirli belgeleri güncelleştirmek veya silmek için kullanılabilir. Varsayılan değer, basit alanlar için false ve karmaşık alanlar için null değeridir.

name

string

Dizin veya üst alanın fields koleksiyonu içinde benzersiz olması gereken alanın adı.

normalizer

LexicalNormalizerName

Alan için kullanılacak normalleştiricinin adı. Bu seçenek yalnızca filtrelenebilir, sıralanabilir veya facetable özelliği etkinleştirilmiş alanlarla kullanılabilir. Normalleştirici seçildikten sonra, alan için değiştirilemez. Karmaşık alanlar için null olmalıdır.

retrievable

boolean

Alanın bir arama sonucunda döndürülüp döndürülemeyeceğini belirten bir değer. Bir alanı (örneğin, kenar boşluğu) filtre, sıralama veya puanlama mekanizması olarak kullanmak istiyor ancak alanın son kullanıcı tarafından görülebilmesini istemiyorsanız bu seçeneği devre dışı bırakabilirsiniz. Bu özellik anahtar alanlar için true olmalı ve karmaşık alanlar için null olmalıdır. Bu özellik mevcut alanlarda değiştirilebilir. Bu özelliğin etkinleştirilmesi, dizin depolama gereksinimlerinde herhangi bir artışa neden olmaz. Varsayılan değer basit alanlar için true, vektör alanları için false ve karmaşık alanlar için null değeridir.

searchAnalyzer

LexicalAnalyzerName

Alan için arama zamanında kullanılan çözümleyicinin adı. Bu seçenek yalnızca aranabilir alanlarla kullanılabilir. indexAnalyzer ile birlikte ayarlanmalıdır ve çözümleyici seçeneğiyle birlikte ayarlanamaz. Bu özellik bir dil çözümleyicisinin adına ayarlanamaz; Dil çözümleyicisine ihtiyacınız varsa bunun yerine Analyzer özelliğini kullanın. Bu çözümleyici mevcut bir alanda güncellenebilir. Karmaşık alanlar için null olmalıdır.

searchable

boolean

Alanın tam metin aranabilir olup olmadığını belirten bir değer. Bu, indeksleme sırasında kelime kırma gibi analizlere tabi tutulacağı anlamına gelir. Aranabilir bir alanı "güneşli gün" gibi bir değere ayarlarsanız, dahili olarak "güneşli" ve "gün" belirteçlerine bölünür. Bu, bu terimler için tam metin aramaları sağlar. Edm.String veya Collection(Edm.String) türündeki alanlar varsayılan olarak aranabilir. Bu özellik, diğer dize olmayan veri türlerinin basit alanları için false olmalı ve karmaşık alanlar için null olmalıdır. Not: Aranabilir alanlar, tam metin aramaları için alan değerinin ek belirteçleştirilmiş sürümlerini barındırmak için dizininizde fazladan alan kullanır. Dizininizde yer kazanmak istiyorsanız ve aramalara dahil edilecek bir alana ihtiyacınız yoksa, aranabilir değerini false olarak ayarlayın.

sortable

boolean

Alanın $orderby ifadelerde başvurulmasının etkinleştirilip etkinleştirilmeyeceğini belirten bir değer. Varsayılan olarak, arama motoru sonuçları puana göre sıralar, ancak birçok deneyimde kullanıcılar belgelerdeki alanlara göre sıralamak isteyecektir. Basit bir alan yalnızca tek değerliyse (ana belge kapsamında tek bir değere sahipse) sıralanabilir olabilir. Basit toplama alanları, çok değerli oldukları için sıralanabilir olamaz. Karmaşık koleksiyonların basit alt alanları da çok değerlidir ve bu nedenle sıralanabilir olamaz. Bu, ister anlık bir üst alan ister bir üst alan olsun, karmaşık koleksiyondur. Karmaşık alanlar sıralanabilir olamaz ve bu tür alanlar için sıralanabilir özelliğin null olması gerekir. Sıralanabilir için varsayılan değer, tek değerli basit alanlar için doğru, çok değerli basit alanlar için false ve karmaşık alanlar için null değeridir.

stored

boolean

Alanın, bir arama sonucunda döndürülmek üzere diskte ayrı olarak kalıcı olup olmayacağını belirten sabit bir değer. Depolama yükünden tasarruf etmek için alan içeriğini bir arama yanıtında döndürmeyi planlamıyorsanız, bu seçeneği devre dışı bırakabilirsiniz. Bu, yalnızca dizin oluşturma sırasında ve yalnızca vektör alanları için ayarlanabilir. Bu özellik mevcut alanlar için değiştirilemez veya yeni alanlar için false olarak ayarlanamaz. Bu özellik false olarak ayarlanırsa, 'retrievable' özelliği de false olarak ayarlanmalıdır. Bu özellik, anahtar alanlar, yeni alanlar ve vektör olmayan alanlar için doğru veya ayarlanmamış olmalıdır ve karmaşık alanlar için null olmalıdır. Bu özelliğin devre dışı bırakılması dizin depolama gereksinimlerini azaltır. Vektör alanları için varsayılan değer doğrudur.

synonymMaps

string[]

Bu alanla ilişkilendirilecek eş anlamlı eşlemelerinin adlarının listesi. Bu seçenek yalnızca aranabilir alanlarla kullanılabilir. Şu anda alan başına yalnızca bir eş anlamlı eşleme desteklenir. Bir alana eş anlamlı eşlem atamak, bu alanı hedefleyen sorgu terimlerinin eş anlamlı eşlemedeki kurallar kullanılarak sorgu zamanında genişletilmesini sağlar. Bu öznitelik mevcut alanlarda değiştirilebilir. Karmaşık alanlar için null veya boş bir koleksiyon olmalıdır.

type

SearchFieldDataType

Alanın veri türü.

vectorEncoding

VectorEncodingFormat

Alan içeriğini yorumlamak için kodlama biçimi.

vectorSearchProfile

string

Vektör alanında arama yaparken kullanılacak algoritmayı ve vektörleştiriciyi belirten vektör arama profilinin adı.

SearchFieldDataType

Arama dizinindeki bir alanın veri türünü tanımlar.

Değer Description
Edm.String

Bir alanın bir dize içerdiğini gösterir.

Edm.Int32

Bir alanın 32 bit işaretli bir tamsayı içerdiğini gösterir.

Edm.Int64

Bir alanın 64 bit işaretli bir tamsayı içerdiğini gösterir.

Edm.Double

Bir alanın IEEE çift duyarlıklı kayan nokta numarası içerdiğini gösterir.

Edm.Boolean

Bir alanın bir Boole değeri (doğru veya yanlış) içerdiğini gösterir.

Edm.DateTimeOffset

Bir alanın, saat dilimi bilgileri de dahil olmak üzere bir tarih/saat değeri içerdiğini gösterir.

Edm.GeographyPoint

Bir alanın boylam ve enlem cinsinden bir coğrafi konum içerdiğini gösterir.

Edm.ComplexType

Bir alanın, diğer türlerin alt alanlarına sahip olan bir veya daha fazla karmaşık nesne içerdiğini gösterir.

Edm.Single

Bir alanın tek duyarlıklı kayan nokta sayısı içerdiğini gösterir. Bu yalnızca Collection(Edm.Single) ile kullanıldığında geçerlidir.

Edm.Half

Bir alanın yarı duyarlıklı kayan nokta sayısı içerdiğini gösterir. Bu yalnızca Collection(Edm.Half) ile kullanıldığında geçerlidir.

Edm.Int16

Bir alanın 16 bit işaretli bir tamsayı içerdiğini gösterir. Bu yalnızca Collection(Edm.Int16) ile kullanıldığında geçerlidir.

Edm.SByte

Bir alanın 8 bitlik işaretli bir tamsayı içerdiğini gösterir. Bu yalnızca Collection(Edm.SByte) ile kullanıldığında geçerlidir.

Edm.Byte

Bir alanın 8 bitlik işaretsiz bir tamsayı içerdiğini gösterir. Bu yalnızca Collection(Edm.Byte) ile kullanıldığında geçerlidir.

SearchIndex

Bir dizinin alanlarını ve arama davranışını açıklayan bir arama dizini tanımını temsil eder.

Name Tür Description
@odata.etag

string

Dizinin ETag'i.

analyzers LexicalAnalyzer[]:

Dizin için çözümleyiciler.

charFilters CharFilter[]:

Dizin için karakter filtreleri.

corsOptions

CorsOptions

Dizin için Çıkış Noktaları Arası Kaynak Paylaşımı'nı (CORS) denetleme seçenekleri.

defaultScoringProfile

string

Sorguda hiçbiri belirtilmemişse kullanılacak puanlama profilinin adı. Bu özellik ayarlanmamışsa ve sorguda puanlama profili belirtilmemişse, varsayılan puanlama (tf-idf) kullanılır.

description

string

Dizinin açıklaması.

encryptionKey

SearchResourceEncryptionKey

Azure Key Vault'ta oluşturduğunuz bir şifreleme anahtarının açıklaması. Bu anahtar, hiç kimsenin, hatta Microsoft'un bile verilerinizin şifresini çözemeyeceğinden tam olarak emin olmak istediğinizde, verileriniz için ek bir bekleyen şifreleme düzeyi sağlamak için kullanılır. Verilerinizi bir kez şifreledikten sonra, her zaman şifreli kalacaktır. Arama hizmeti, bu özelliği null olarak ayarlama girişimlerini yoksayar. Şifreleme anahtarınızı döndürmek istiyorsanız bu özelliği gerektiği gibi değiştirebilirsiniz; Verileriniz etkilenmeyecektir. Müşteri tarafından yönetilen anahtarlarla şifreleme, ücretsiz arama hizmetleri için kullanılamaz ve yalnızca 1 Ocak 2019'da veya sonrasında oluşturulan ücretli hizmetler için kullanılabilir.

fields

SearchField[]

Dizinin alanları.

name

string

Dizinin adı.

normalizers LexicalNormalizer[]:

CustomNormalizer[]

Dizin için normalleştiriciler.

scoringProfiles

ScoringProfile[]

Dizin için puanlama profilleri.

semantic

SemanticSettings

Anlamsal yetenekleri etkileyen bir arama dizini için parametreleri tanımlar.

similarity Similarity:

Bir arama sorgusuyla eşleşen belgeleri puanlarken ve sıralarken kullanılacak benzerlik algoritmasının türü. Benzerlik algoritması yalnızca dizin oluşturma sırasında tanımlanabilir ve mevcut dizinlerde değiştirilemez. Null ise, ClassicSimilarity algoritması kullanılır.

suggesters

Suggester[]

Dizin için önerilerde bulunanlar.

tokenFilters TokenFilter[]:

Belirteç, dizin için filtre uygular.

tokenizers LexicalTokenizer[]:

Dizin için belirteçleştiriciler.

vectorSearch

VectorSearch

Vektör arama ile ilgili yapılandırma seçeneklerini içerir.

SearchIndexerDataNoneIdentity

Bir veri kaynağının kimlik özelliğini temizler.

Name Tür Description
@odata.type string:

#Microsoft.Azure.Search.DataNoneIdentity

Kimlik türünü belirten bir URI parçası.

SearchIndexerDataUserAssignedIdentity

Kullanılacak veri kaynağının kimliğini belirtir.

Name Tür Description
@odata.type string:

#Microsoft.Azure.Search.DataUserAssignedIdentity

Kimlik türünü belirten bir URI parçası.

userAssignedIdentity

string

Genellikle "/subscriptions/12345678-1234-1234-1234-1234567890ab/resourceGroups/rg/providers/Microsoft.ManagedIdentity/userAssignedIdentities/myId" biçiminde yönetilen kimlik atanan bir kullanıcının tam Azure kaynak kimliği.

SearchResourceEncryptionKey

Azure Key Vault'ta müşteri tarafından yönetilen bir şifreleme anahtarı. Oluşturduğunuz ve yönettiğiniz anahtarlar, dizinler ve eş anlamlı eşlemeler gibi bekleyen verileri şifrelemek veya şifresini çözmek için kullanılabilir.

Name Tür Description
accessCredentials

AzureActiveDirectoryApplicationCredentials

Azure Key Vault erişmek için kullanılan isteğe bağlı Azure Active Directory kimlik bilgileri. Bunun yerine yönetilen kimlik kullanılıyorsa gerekli değildir.

keyVaultKeyName

string

Bekleyen verilerinizi şifrelemek için kullanılacak Azure Key Vault anahtarınızın adı.

keyVaultKeyVersion

string

Bekleyen verilerinizi şifrelemek için kullanılacak Azure Key Vault anahtarınızın sürümü.

keyVaultUri

string

DNS adı olarak da adlandırılan Azure Key Vault URI'si, bekleyen verilerinizi şifrelemek için kullanılacak anahtarı içerir. Örnek bir URI olabilir https://my-keyvault-name.vault.azure.net.

SemanticConfiguration

Anlamsal yetenekler bağlamında kullanılacak belirli bir yapılandırmayı tanımlar.

Name Tür Description
name

string

Anlamsal yapılandırmanın adı.

prioritizedFields

PrioritizedFields

Anlamsal sıralama, başlıklar, vurgular ve yanıtlar için kullanılacak başlık, içerik ve anahtar sözcük alanlarını açıklar. Üç alt özellikten (titleField, prioritizedKeywordsFields ve prioritizedContentFields) en az birinin ayarlanması gerekir.

rankingOrder

RankingOrder

Arama sonuçlarının sıralama düzeni için kullanılacak puan türünü belirtir.

SemanticField

Anlamsal yapılandırmanın bir parçası olarak kullanılan bir alan.

Name Tür Description
fieldName

string

SemanticSettings

Anlamsal yetenekleri etkileyen bir arama dizini için parametreleri tanımlar.

Name Tür Description
configurations

SemanticConfiguration[]

Dizin için anlamsal yapılandırmalar.

defaultConfiguration

string

Dizininizde varsayılan bir anlamsal yapılandırmanın adını ayarlamanıza olanak tanır ve her seferinde sorgu parametresi olarak geçirmeyi isteğe bağlı hale getirir.

ShingleTokenFilter

Tek bir belirteç olarak belirteç kombinasyonları oluşturur. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır.

Name Tür Default value Description
@odata.type string:

#Microsoft.Azure.Search.ShingleTokenFilter

Belirteç filtresinin türünü belirten bir URI parçası.

filterToken

string

_

Belirteç olmayan her konum için eklenecek dize. Varsayılan değer bir alt çizgidir ("_").

maxShingleSize

integer (int32)

minimum: 2
2

Maksimum kiremit boyutu. Varsayılan ve minimum değer 2'dir.

minShingleSize

integer (int32)

minimum: 2
2

Minimum shingle boyutu. Varsayılan ve minimum değer 2'dir. maxShingleSize değerinden küçük olmalıdır.

name

string

Belirteç filtresinin adı. Yalnızca harfler, rakamlar, boşluklar, kısa çizgiler veya alt çizgiler içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır.

outputUnigrams

boolean

True

Çıkış akışının giriş belirteçlerini (unigramlar) ve zonaları içerip içermeyeceğini gösteren bir değer. Varsayılan değer doğrudur

outputUnigramsIfNoShingles

boolean

False

Zona bulunmadığı zamanlar için unigram çıktısı alınıp alınmayacağını gösteren bir değer. outputUnigrams false olarak ayarlandığında bu özellik önceliklidir. Varsayılan değer false'tur.

tokenSeparator

string

Bir kiremit oluşturmak için bitişik belirteçleri birleştirirken kullanılacak dize. Varsayılan değer tek bir boşluktur (" ").

SnowballTokenFilter

Snowball tarafından oluşturulan bir kök kullanarak sözcükleri köklendiren bir filtre. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır.

Name Tür Description
@odata.type string:

#Microsoft.Azure.Search.SnowballTokenFilter

Belirteç filtresinin türünü belirten bir URI parçası.

language

SnowballTokenFilterLanguage

Kullanılacak dil.

name

string

Belirteç filtresinin adı. Yalnızca harfler, rakamlar, boşluklar, kısa çizgiler veya alt çizgiler içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır.

SnowballTokenFilterLanguage

Snowball belirteç filtresi için kullanılacak dil.

Değer Description
armenian

Ermenice için Lucene Snowball köklendirme tokenizer'ını seçer.

basque

Bask için Lucene Snowball köklendirme tokenizer'ını seçer.

catalan

Katalanca için Lucene Snowball köklendirme tokenizer'ını seçer.

danish

Danca için Lucene Snowball köklendirme tokenizer'ını seçer.

dutch

Felemenkçe için Lucene Snowball köklendirme tokenizer'ını seçer.

english

İngilizce için Lucene Snowball köklendirme belirteç oluşturucusunu seçer.

finnish

Fince için Lucene Snowball köklendirme tokenizer'ını seçer.

french

Fransızca için Lucene Snowball köklendirme tokenizer'ını seçer.

german

Almanca için Lucene Snowball köklendirme tokenizer'ını seçer.

german2

Alman varyant algoritmasını kullanan Lucene Snowball kök belirteç oluşturucusunu seçer.

hungarian

Macarca için Lucene Snowball köklendirme tokenizer'ını seçer.

italian

İtalyanca için Lucene Snowball köklendirme tokenizer'ını seçer.

kp

Hollandaca için Kraaij-Pohlmann köklendirme algoritmasını kullanan Lucene Snowball köklendirme belirteçleyicisini seçer.

lovins

Lovins köklendirme algoritmasını kullanan İngilizce için Lucene Snowball köklendirme belirteçleyicisini seçer.

norwegian

Norveççe için Lucene Snowball köklendirme tokenizer'ını seçer.

porter

Porter köklendirme algoritmasını kullanan İngilizce için Lucene Snowball köklendirme belirteçleyicisini seçer.

portuguese

Portekizce için Lucene Snowball köklendirme belirteç oluşturucusunu seçer.

romanian

Romence için Lucene Snowball köklendirme tokenizer'ını seçer.

russian

Rusça için Lucene Snowball köklendirme tokenizer'ını seçer.

spanish

İspanyolca için Lucene Snowball köklendirme tokenizer'ını seçer.

swedish

İsveççe için Lucene Snowball köklendirme tokenizer'ını seçer.

turkish

Türkçe için Lucene Snowball köklendirme tokenizer'ını seçer.

StemmerOverrideTokenFilter

Özel sözlük tabanlı kök oluşturma ile diğer kök filtrelerini geçersiz kılma olanağı sağlar. Sözlük tabanlı herhangi bir terim, anahtar kelime olarak işaretlenir, böylece zincirin aşağısındaki köklerle köklenmezler. Herhangi bir sap filtresinden önce yerleştirilmelidir. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır.

Name Tür Description
@odata.type string:

#Microsoft.Azure.Search.StemmerOverrideTokenFilter

Belirteç filtresinin türünü belirten bir URI parçası.

name

string

Belirteç filtresinin adı. Yalnızca harfler, rakamlar, boşluklar, kısa çizgiler veya alt çizgiler içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır.

rules

string[]

Aşağıdaki biçimde köklendirme kurallarının listesi: "word => stem", örneğin: "ran => run".

StemmerTokenFilter

Dile özel kök filtresi. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır.

Name Tür Description
@odata.type string:

#Microsoft.Azure.Search.StemmerTokenFilter

Belirteç filtresinin türünü belirten bir URI parçası.

language

StemmerTokenFilterLanguage

Kullanılacak dil.

name

string

Belirteç filtresinin adı. Yalnızca harfler, rakamlar, boşluklar, kısa çizgiler veya alt çizgiler içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır.

StemmerTokenFilterLanguage

Stemmer belirteç filtresi için kullanılacak dil.

Değer Description
arabic

Arapça için Lucene köklendirme belirteç oluşturucusunu seçer.

armenian

Ermenice için Lucene kök tokenizer'ı seçer.

basque

Bask için Lucene köklendirme tokenizer'ını seçer.

brazilian

Portekizce (Brezilya) için Lucene köklendirme tokenizer'ını seçer.

bulgarian

Bulgarca için Lucene köklendirme tokenizer'ını seçer.

catalan

Katalanca için Lucene köklendirme tokenizer'ını seçer.

czech

Çekçe için Lucene köklendirme tokenizer'ını seçer.

danish

Danca için Lucene köklendirme tokenizer'ını seçer.

dutch

Felemenkçe için Lucene köklendirme tokenizer'ını seçer.

dutchKp

Hollandaca için Kraaij-Pohlmann köklendirme algoritmasını kullanan Lucene köklendirme belirteçleyicisini seçer.

english

İngilizce için Lucene köklendirme tokenizer'ını seçer.

lightEnglish

İngilizce için hafif köklendirme yapan Lucene köklendirme belirteçleyicisini seçer.

minimalEnglish

Minimum köklendirme yapan İngilizce için Lucene köklendirme belirteçleyicisini seçer.

possessiveEnglish

Sözcüklerden sondaki iyelik eklerini kaldıran İngilizce için Lucene köklendirme belirteçleyicisini seçer.

porter2

Porter2 köklendirme algoritmasını kullanan İngilizce için Lucene köklendirme belirteçleyicisini seçer.

lovins

Lovins köklendirme algoritmasını kullanan İngilizce için Lucene köklendirme belirteçleyicisini seçer.

finnish

Fince için Lucene köklendirme tokenizer'ını seçer.

lightFinnish

Fince için hafif köklendirme yapan Lucene köklendirme belirteçleyicisini seçer.

french

Fransızca için Lucene köklendirme tokenizer'ını seçer.

lightFrench

Fransızca için hafif köklendirme yapan Lucene köklendirme belirteçleyicisini seçer.

minimalFrench

Fransızca için minimum köklendirme yapan Lucene köklendirme belirteçleyicisini seçer.

galician

Galiçya dili için Lucene kök tokenizer'ı seçer.

minimalGalician

Galiçya dili için minimum köklendirme yapan Lucene köklendirme belirteçleyicisini seçer.

german

Almanca için Lucene köklendirme tokenizer'ını seçer.

german2

Alman varyant algoritmasını kullanan Lucene kök tokenizer'ı seçer.

lightGerman

Almanca için hafif köklendirme yapan Lucene köklendirme belirteçleyicisini seçer.

minimalGerman

Almanca için minimum köklendirme yapan Lucene köklendirme belirteçleyicisini seçer.

greek

Yunanca için Lucene köklendirme tokenizer'ını seçer.

hindi

Hintçe için Lucene köklendirme belirteç oluşturucusunu seçer.

hungarian

Macarca için Lucene köklendirme tokenizer'ını seçer.

lightHungarian

Macarca için hafif köklendirme yapan Lucene köklendirme belirteçleyicisini seçer.

indonesian

Endonezce için Lucene köklendirme tokenizer'ını seçer.

irish

İrlandaca için Lucene köklendirme tokenizer'ını seçer.

italian

İtalyanca için Lucene köklendirme tokenizer'ını seçer.

lightItalian

İtalyanca için hafif köklendirme yapan Lucene köklendirme belirteçleyicisini seçer.

sorani

Sorani için Lucene köklendirme tokenizer'ını seçer.

latvian

Letonca için Lucene köklendirme tokenizer'ını seçer.

norwegian

Norveççe (Bokmål) için Lucene köklendirme tokenizer'ını seçer.

lightNorwegian

Norveççe (Bokmål) için hafif köklendirme yapan Lucene köklendirme tokenizer'ını seçer.

minimalNorwegian

Minimum köklendirme yapan Norveççe (Bokmål) için Lucene köklendirme belirteçleyicisini seçer.

lightNynorsk

Hafif köklendirme yapan Norveççe (Nynorsk) için Lucene köklendirme belirteçleyicisini seçer.

minimalNynorsk

Minimum köklendirme yapan Norveççe (Nynorsk) için Lucene köklendirme tokenizer'ını seçer.

portuguese

Portekizce için Lucene köklendirme tokenizer'ını seçer.

lightPortuguese

Portekizce için hafif köklendirme yapan Lucene köklendirme belirteçleyicisini seçer.

minimalPortuguese

Portekizce için minimum köklendirme yapan Lucene köklendirme belirteçleyicisini seçer.

portugueseRslp

RSLP köklendirme algoritmasını kullanan Portekizce için Lucene köklendirme belirteçleyicisini seçer.

romanian

Romence için Lucene köklendirme tokenizer'ını seçer.

russian

Rusça için Lucene köklendirme tokenizer'ını seçer.

lightRussian

Rusça için hafif köklendirme yapan Lucene köklendirme belirteçleyicisini seçer.

spanish

İspanyolca için Lucene köklendirme tokenizer'ını seçer.

lightSpanish

İspanyolca için hafif köklendirme yapan Lucene köklendirme belirteçleyicisini seçer.

swedish

İsveççe için Lucene köklendirme tokenizer'ını seçer.

lightSwedish

İsveççe için hafif köklendirme yapan Lucene köklendirme belirteçleyicisini seçer.

turkish

Türkçe için Lucene köklendirme tokenizer'ını seçer.

StopAnalyzer

Metni harf olmayanlara böler; Küçük harf ve stopword belirteç filtrelerini uygular. Bu çözümleyici Apache Lucene kullanılarak uygulanır.

Name Tür Description
@odata.type string:

#Microsoft.Azure.Search.StopAnalyzer

Çözümleyici türünü belirten bir URI parçası.

name

string

Çözümleyicinin adı. Yalnızca harfler, rakamlar, boşluklar, kısa çizgiler veya alt çizgiler içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır.

stopwords

string[]

Durdurma sözcüklerinin bir listesi.

StopwordsList

Dile özgü durdurma sözcüklerinin önceden tanımlanmış bir listesini tanımlar.

Değer Description
arabic

Arapça için durdurma sözcüğü listesini seçer.

armenian

Ermenice için durdurma sözcüğü listesini seçer.

basque

Bask için durdurma sözcüğü listesini seçer.

brazilian

Portekizce (Brezilya) için stopword listesini seçer.

bulgarian

Bulgarca için durdurma sözcüğü listesini seçer.

catalan

Katalanca için durdurma sözcüğü listesini seçer.

czech

Çekçe için durdurma sözcüğü listesini seçer.

danish

Danca için durdurma sözcüğü listesini seçer.

dutch

Felemenkçe için durdurma sözcüğü listesini seçer.

english

İngilizce için durdurma sözcüğü listesini seçer.

finnish

Fince için durdurma sözcüğü listesini seçer.

french

Fransızca için durdurma sözcüğü listesini seçer.

galician

Galiçyaca için durdurma sözcüğü listesini seçer.

german

Almanca için durdurma sözcüğü listesini seçer.

greek

Yunanca için durdurma sözcüğü listesini seçer.

hindi

Hintçe için durdurma sözcüğü listesini seçer.

hungarian

Macarca için durdurma sözcüğü listesini seçer.

indonesian

Endonezce için durdurma sözcüğü listesini seçer.

irish

İrlandaca için durdurma sözcüğü listesini seçer.

italian

İtalyanca için durdurma sözcüğü listesini seçer.

latvian

Letonca için durdurma sözcüğü listesini seçer.

norwegian

Norveççe için durdurma sözcüğü listesini seçer.

persian

Farsça için durdurma sözcüğü listesini seçer.

portuguese

Portekizce için durdurma sözcüğü listesini seçer.

romanian

Romence için durdurma sözcüğü listesini seçer.

russian

Rusça için durdurma sözcüğü listesini seçer.

sorani

Sorani için durdurma sözcüğü listesini seçer.

spanish

İspanyolca için durdurma sözcüğü listesini seçer.

swedish

İsveççe için durdurma sözcüğü listesini seçer.

thai

Tay dili için durdurma sözcüğü listesini seçer.

turkish

Türkçe için durdurma sözcüğü listesini seçer.

StopwordsTokenFilter

Belirteç akışından durdurma sözcüklerini kaldırır. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır.

Name Tür Default value Description
@odata.type string:

#Microsoft.Azure.Search.StopwordsTokenFilter

Belirteç filtresinin türünü belirten bir URI parçası.

ignoreCase

boolean

False

Büyük/küçük harfin yok sayılıp sayılmayacağını belirten bir değer. Doğruysa, önce tüm sözcükler küçük harfe dönüştürülür. Varsayılan değer false'tur.

name

string

Belirteç filtresinin adı. Yalnızca harfler, rakamlar, boşluklar, kısa çizgiler veya alt çizgiler içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır.

removeTrailing

boolean

True

Durdurma sözcüğü olması durumunda son arama teriminin yok sayılıp sayılmayacağını belirten bir değer. Varsayılan değer doğrudur

stopwords

string[]

Durdurma sözcüklerinin listesi. Bu özellik ve stopwords list özelliğinin her ikisi de ayarlanamaz.

stopwordsList

StopwordsList

english

Kullanılacak önceden tanımlanmış bir durdurma sözcükleri listesi. Bu özellik ve stopwords özelliğinin her ikisi de ayarlanamaz. Varsayılan değer İngilizce'dir.

Suggester

Suggest API'nin dizindeki bir alan grubuna nasıl uygulanması gerektiğini tanımlar.

Name Tür Description
name

string

Önerenin adı.

searchMode

SuggesterSearchMode

Önerenin yeteneklerini gösteren bir değer.

sourceFields

string[]

Önerinin uygulandığı alan adlarının listesi. Her alan aranabilir olmalıdır.

SuggesterSearchMode

Önerenin yeteneklerini gösteren bir değer.

Değer Description
analyzingInfixMatching

Bir alandaki ardışık tam terimleri ve önekleri eşleştirir. Örneğin, 'En hızlı kahverengi tilki' alanı için 'hızlı' ve 'en hızlı kaş' sorgularının her ikisi de eşleşir.

SynonymTokenFilter

Bir belirteç akışındaki tek veya çok sözcüklü eş anlamlılarla eşleşir. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır.

Name Tür Default value Description
@odata.type string:

#Microsoft.Azure.Search.SynonymTokenFilter

Belirteç filtresinin türünü belirten bir URI parçası.

expand

boolean

True

Eş anlamlılar listesindeki tüm sözcüklerin (if => gösterimi kullanılmıyorsa) birbiriyle eşlenip eşlenmeyeceğini gösteren bir değer. Doğruysa, eşanlamlılar listesindeki tüm kelimeler (= gösterimi kullanılmazsa> ) birbiriyle eşlenir. Aşağıdaki liste: inanılmaz, inanılmaz, muhteşem, şaşırtıcı: inanılmaz, inanılmaz, muhteşem, şaşırtıcı => inanılmaz, inanılmaz, muhteşem, şaşırtıcı. Yanlışsa, aşağıdaki liste: inanılmaz, inanılmaz, muhteşem, şaşırtıcı şuna eşdeğer olacaktır: inanılmaz, inanılmaz, muhteşem, şaşırtıcı => inanılmaz. Varsayılan değer doğrudur

ignoreCase

boolean

False

Eşleştirme için büyük/küçük harf katlamalı girişin yapılıp yapılmayacağını gösteren bir değer. Varsayılan değer false'tur.

name

string

Belirteç filtresinin adı. Yalnızca harfler, rakamlar, boşluklar, kısa çizgiler veya alt çizgiler içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır.

synonyms

string[]

Aşağıdaki iki biçimdeki eş anlamlıların listesi: 1. inanılmaz, inanılmaz, muhteşem => şaşırtıcı - => sembolünün sol tarafındaki tüm terimler, sağ tarafındaki tüm terimlerle değiştirilecektir; 2. İnanılmaz, inanılmaz, muhteşem, şaşırtıcı - eşdeğer kelimelerin virgülle ayrılmış listesi. Bu listenin yorumlanma şeklini değiştirmek için genişletme seçeneğini ayarlayın.

TagScoringFunction

Belirli bir etiket listesiyle eşleşen dize değerlerine sahip belgelerin puanlarını artıran bir işlev tanımlar.

Name Tür Description
boost

number (double)

Ham puan için bir çarpan. 1.0'a eşit olmayan pozitif bir sayı olmalıdır.

fieldName

string

Puanlama işlevine giriş olarak kullanılan alanın adı.

interpolation

ScoringFunctionInterpolation

Yükseltmenin belge puanları arasında nasıl enterpolasyon yapılacağını gösteren bir değer; varsayılan olarak "Doğrusal" olarak ayarlanır.

tag

TagScoringParameters

Etiket puanlama işlevi için parametre değerleri.

type string:

tag

Kullanılacak işlevin türünü belirtir. Geçerli değerler büyüklük, tazelik, uzaklık ve etiketi içerir. İşlev türü küçük harf olmalıdır.

TagScoringParameters

Etiket puanlama işlevine parametre değerleri sağlar.

Name Tür Description
tagsParameter

string

Hedef alanla karşılaştırılacak etiketlerin listesini belirtmek için arama sorgularında geçirilen parametrenin adı.

TextWeights

Eşleşmelerin arama sorgularında puanlamayı artırması gereken dizin alanlarındaki ağırlıkları tanımlar.

Name Tür Description
weights

object

Belge puanlamasını artırmak için alan başına ağırlıklar sözlüğü. Anahtarlar alan adlarıdır ve değerler her alanın ağırlıklarıdır.

TokenCharacterKind

Belirteç filtresinin üzerinde çalışabileceği karakter sınıflarını temsil eder.

Değer Description
letter

Harfleri jeton halinde tutar.

digit

Rakamları jetonlarda tutar.

whitespace

Boşlukları belirteçlerde tutar.

punctuation

Noktalama işaretlerini belirteçlerde tutar.

symbol

Sembolleri jetonlarda tutar.

TokenFilterName

Arama motoru tarafından desteklenen tüm belirteç filtrelerinin adlarını tanımlar.

Değer Description
arabic_normalization

Yazımı normalleştirmek için Arapça normalleştiriciyi uygulayan bir belirteç filtresi. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/ar/ArabicNormalizationFilter.html

apostrophe

Kesme işaretinden sonraki tüm karakterleri çıkarır (kesme işaretinin kendisi dahil). Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/tr/ApostropheFilter.html

asciifolding

İlk 127 ASCII karakterde ("Temel Latince" Unicode bloğu) yer almayan alfabetik, sayısal ve sembolik Unicode karakterleri, bu tür eşdeğerler varsa ASCII eşdeğerlerine dönüştürür. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/ASCIIFoldingFilter.html

cjk_bigram

Standart belirteçleyiciden oluşturulan CJK terimlerinin bigramlarını oluşturur. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/cjk/CJKBigramFilter.html

cjk_width

CJK genişlik farklarını normalleştirir. Tam genişlikte ASCII varyantlarını eşdeğer temel Latince'ye ve yarım genişlikte Katakana varyantlarını eşdeğer Kana'ya katlar. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/cjk/CJKWidthFilter.html

classic

Kısaltmalardan İngilizce iyelik eklerini ve noktaları kaldırır. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/standard/ClassicFilter.html

common_grams

İndeksleme sırasında sık karşılaşılan terimler için bigramlar oluşturun. Tek terimler de indekslenmeye devam ediyor ve bigramlar üst üste bindiriliyor. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/commongrams/CommonGramsFilter.html

edgeNGram_v2

Bir giriş belirtecinin önünden veya arkasından başlayarak verilen boyut(lar)ın n-gramını oluşturur. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/ngram/EdgeNGramTokenFilter.html

elision

Elizyonları kaldırır. Örneğin, "l'avion" (uçak) "avion" (uçak) olarak dönüştürülecektir. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/util/ElisionFilter.html

german_normalization

Almanca karakterleri, German2 kartopu algoritmasının buluşsal yöntemlerine göre normalleştirir. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/de/GermanNormalizationFilter.html

hindi_normalization

Yazım farklılıklarındaki bazı farklılıkları ortadan kaldırmak için Hintçe metni normalleştirir. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/hi/HindiNormalizationFilter.html

indic_normalization

Hint dillerindeki metnin Unicode gösterimini normalleştirir. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/in/IndicNormalizationFilter.html

keyword_repeat

Gelen her belirteci bir kez anahtar sözcük olarak ve bir kez anahtar sözcük olmayan olarak olmak üzere iki kez yayar. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/KeywordRepeatFilter.html

kstem

İngilizce için yüksek performanslı bir kstem filtresi. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/en/KStemFilter.html

length

Çok uzun veya çok kısa sözcükleri kaldırır. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/LengthFilter.html

limit

İndeksleme sırasında belirteç sayısını sınırlar. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/LimitTokenCountFilter.html

lowercase

Belirteç metnini küçük harf olarak normalleştirir. Bkz. https://lucene.apache.org/core/6_6_1/analyzers-common/org/apache/lucene/analysis/core/LowerCaseFilter.html

nGram_v2

Verilen boyut(lar)dan n-gram üretir. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/ngram/NGramTokenFilter.html

persian_normalization

Farsça için normalleştirme uygular. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/fa/PersianNormalizationFilter.html

phonetic

Fonetik eşleşmeler için belirteçler oluşturun. Bkz. https://lucene.apache.org/core/4_10_3/analyzers-phonetic/org/apache/lucene/analysis/phonetic/package-tree.html

porter_stem

Belirteç akışını dönüştürmek için Porter köklendirme algoritmasını kullanır. Bkz. http://tartarus.org/~martin/PorterStemmer

reverse

Belirteç dizesini tersine çevirir. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/reverse/ReverseStringFilter.html

scandinavian_normalization

Değiştirilebilir İskandinav karakterlerinin kullanımını normalleştirir. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/ScandinavianNormalizationFilter.html

scandinavian_folding

İskandinav karakterleri åÅäæÄÆ-a> ve öÖøØ-o'yu> katlar. Ayrıca aa, ae, ao, oe ve oo çift ünlülerinin kullanımına karşı ayrım yapar ve sadece ilkini bırakır. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/ScandinavianFoldingFilter.html

shingle

Tek bir belirteç olarak belirteç kombinasyonları oluşturur. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/shingle/ShingleFilter.html

snowball

Snowball tarafından oluşturulan bir kök kullanarak sözcükleri köklendiren bir filtre. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/snowball/SnowballFilter.html

sorani_normalization

Sorani metninin Unicode temsilini normalleştirir. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/ckb/SoraniNormalizationFilter.html

stemmer

Dile özel kök filtresi. Bkz. https://learn.microsoft.com/rest/api/searchservice/Custom-analyzers-in-Azure-Search#TokenFilters

stopwords

Belirteç akışından durdurma sözcüklerini kaldırır. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/StopFilter.html

trim

Belirteçlerden baştaki ve sondaki boşlukları keser. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/TrimFilter.html

truncate

Terimleri belirli bir uzunlukta keser. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/TruncateTokenFilter.html

unique

Önceki belirteçle aynı metne sahip belirteçleri filtreler. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/RemoveDuplicatesTokenFilter.html

uppercase

Belirteç metnini büyük harf olarak normalleştirir. Bkz. https://lucene.apache.org/core/6_6_1/analyzers-common/org/apache/lucene/analysis/core/UpperCaseFilter.html

word_delimiter

Sözcükleri alt sözcüklere böler ve alt sözcük gruplarında isteğe bağlı dönüştürmeler gerçekleştirir.

TruncateTokenFilter

Terimleri belirli bir uzunlukta keser. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır.

Name Tür Default value Description
@odata.type string:

#Microsoft.Azure.Search.TruncateTokenFilter

Belirteç filtresinin türünü belirten bir URI parçası.

length

integer (int32)

maximum: 300
300

Terimlerin kısaltılacağı uzunluk. Varsayılan ve maksimum 300'dür.

name

string

Belirteç filtresinin adı. Yalnızca harfler, rakamlar, boşluklar, kısa çizgiler veya alt çizgiler içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır.

UaxUrlEmailTokenizer

URL'leri ve e-postaları tek bir belirteç olarak belirteçleştirir. Bu belirteç oluşturucu Apache Lucene kullanılarak uygulanır.

Name Tür Default value Description
@odata.type string:

#Microsoft.Azure.Search.UaxUrlEmailTokenizer

Belirteç oluşturucu türünü belirten bir URI parçası.

maxTokenLength

integer (int32)

maximum: 300
255

Maksimum belirteç uzunluğu. Varsayılan değer 255'tir. Maksimum uzunluktan daha uzun olan jetonlar bölünür. Kullanılabilecek maksimum belirteç uzunluğu 300 karakterdir.

name

string

Tokenizer'ın adı. Yalnızca harfler, rakamlar, boşluklar, kısa çizgiler veya alt çizgiler içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır.

UniqueTokenFilter

Önceki belirteçle aynı metne sahip belirteçleri filtreler. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır.

Name Tür Default value Description
@odata.type string:

#Microsoft.Azure.Search.UniqueTokenFilter

Belirteç filtresinin türünü belirten bir URI parçası.

name

string

Belirteç filtresinin adı. Yalnızca harfler, rakamlar, boşluklar, kısa çizgiler veya alt çizgiler içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır.

onlyOnSamePosition

boolean

False

Yalnızca aynı konumdaki kopyaların kaldırılıp kaldırılmayacağını belirten bir değer. Varsayılan değer false'tur.

VectorEncodingFormat

Vektör alanı içeriklerini yorumlamak için kodlama biçimi.

Değer Description
packedBit

Daha geniş bir veri türüne paketlenmiş bitleri temsil eden kodlama biçimi.

VectorSearch

Vektör arama ile ilgili yapılandırma seçeneklerini içerir.

Name Tür Description
algorithms VectorSearchAlgorithmConfiguration[]:

Dizin oluşturma veya sorgulama sırasında kullanılan algoritmaya özgü yapılandırma seçeneklerini içerir.

compressions VectorSearchCompressionConfiguration[]:

Dizin oluşturma veya sorgulama sırasında kullanılan sıkıştırma yöntemine özgü yapılandırma seçeneklerini içerir.

profiles

VectorSearchProfile[]

Vektör aramasıyla kullanılacak konfigürasyon kombinasyonlarını tanımlar.

vectorizers VectorSearchVectorizer[]:

Metin vektör sorgularının nasıl vektörleştirileceğine ilişkin yapılandırma seçeneklerini içerir.

VectorSearchAlgorithmKind

Dizin oluşturma ve sorgulama için kullanılan algoritma.

Değer Description
hnsw

HNSW (Hiyerarşik Gezilebilir Küçük Dünya), bir tür yaklaşık en yakın komşular algoritması.

exhaustiveKnn

Kaba kuvvet araması yapacak kapsamlı KNN algoritması.

VectorSearchAlgorithmMetric

Vektör karşılaştırmaları için kullanılacak benzerlik metriği. Ekleme modelinin eğitildiği benzerlik metriğinin seçilmesi önerilir.

Değer Description
cosine

Büyüklükleri göz ardı ederek benzerliklerini ölçmek için vektörler arasındaki açıyı ölçer. Açı ne kadar küçük olursa, benzerlik o kadar yakın olur.

euclidean

Çok boyutlu bir uzayda vektörler arasındaki düz çizgi mesafesini hesaplar. Mesafe ne kadar küçük olursa, benzerlik o kadar yakın olur.

dotProduct

Hizalama ve büyüklük benzerliğini ölçmek için öğe bazında ürünlerin toplamını hesaplar. Daha büyük ve ne kadar olumluysa, benzerlik o kadar yakın olur.

hamming

Yalnızca bit paketli ikili veri türleri için geçerlidir. İkili vektörlerdeki farklı konumları sayarak farklılığı belirler. Farklılıklar ne kadar az olursa, benzerlik o kadar yakın olur.

VectorSearchCompressionKind

Dizin oluşturma ve sorgulama için kullanılan sıkıştırma yöntemi.

Değer Description
scalarQuantization

Skaler Kuantizasyon, bir tür sıkıştırma yöntemi. Skaler nicelemede, orijinal vektör değerleri, azaltılmış bir nicelenmiş değerler kümesi kullanılarak bir vektörün her bir bileşenini ayrıklaştırarak ve temsil ederek daha dar bir türe sıkıştırılır, böylece genel veri boyutu küçültülür.

binaryQuantization

İkili Niceleme, bir tür sıkıştırma yöntemi. İkili nicelemede, orijinal vektör değerleri, ikili değerler kullanılarak bir vektörün her bir bileşenini ayrıklaştırarak ve temsil ederek daha dar ikili türe sıkıştırılır, böylece genel veri boyutu azaltılır.

VectorSearchCompressionRescoreStorageMethod

Yeniden puanlama ve dahili dizin işlemleri için kullanılan orijinal tam duyarlıklı vektörler için depolama yöntemi.

Değer Description
preserveOriginals

Bu seçenek, orijinal tam duyarlıklı vektörleri korur. Maksimum esneklik ve sıkıştırılmış arama sonuçlarının en yüksek kalitesi için bu seçeneği belirleyin. Bu, daha fazla depolama alanı tüketir ancak yeniden puanlamaya ve yüksek hızda örneklemeye izin verir.

discardOriginals

Bu seçenek, orijinal tam duyarlıklı vektörleri atar. Maksimum depolama tasarrufu için bu seçeneği belirleyin. Bu seçenek yeniden puanlamaya ve aşırı örneklemeye izin vermediğinden, genellikle kalitede hafif ila orta derecede düşüşlere neden olur.

VectorSearchCompressionTargetDataType

Sıkıştırılmış vektör değerlerinin nicelleştirilmiş veri türü.

Değer Description
int8

VectorSearchProfile

Vektör aramasıyla kullanılacak konfigürasyonların bir kombinasyonunu tanımlar.

Name Tür Description
algorithm

string

Algoritmayı ve isteğe bağlı parametreleri belirten vektör arama algoritması yapılandırmasının adı.

compression

string

Sıkıştırma yöntemini ve isteğe bağlı parametreleri belirten sıkıştırma yöntemi yapılandırmasının adı.

name

string

Bu belirli vektör arama profiliyle ilişkilendirilecek ad.

vectorizer

string

Vektör aramasıyla kullanılmak üzere yapılandırılan vektörleştirmenin adı.

VectorSearchVectorizerKind

Sorgu sırasında kullanılacak vektörleştirme yöntemi.

Değer Description
azureOpenAI

Sorgu zamanında bir Azure OpenAI kaynağı kullanarak eklemeler oluşturun.

customWebApi

Sorgu zamanında özel bir web uç noktası kullanarak eklemeler oluşturun.

WebApiParameters

Kullanıcı tanımlı bir vektörleştiriciye bağlanmak için özellikleri belirtir.

Name Tür Description
authIdentity SearchIndexerDataIdentity:

Giden bağlantılar için kullanılan, kullanıcı tarafından atanan yönetilen kimlik. Bir authResourceId sağlanırsa ve belirtilmezse, sistem tarafından atanan yönetilen kimlik kullanılır. Dizin oluşturucuda yapılan güncelleştirmelerde, kimlik belirtilmemişse değer değişmeden kalır. "Yok" olarak ayarlanırsa, bu özelliğin değeri temizlenir.

authResourceId

string

Bir Azure işlevindeki dış koda veya dönüştürmeleri sağlayan başka bir uygulamaya bağlanan özel uç noktalar için geçerlidir. Bu değer, Azure Active Directory'ye kaydedildiğinde işlev veya uygulama için oluşturulan uygulama kimliği olmalıdır. Belirtildiğinde, vektörleştirme, arama hizmetinin yönetilen kimliğini (sistem veya kullanıcı tarafından atanan) ve işlevin veya uygulamanın erişim belirtecini kullanarak işleve veya uygulamaya bağlanır ve bu değeri erişim belirtecinin kapsamını oluşturmak için kaynak kimliği olarak kullanır.

httpHeaders

object

HTTP isteğinde bulunmak için gereken üst bilgiler.

httpMethod

string

HTTP isteğinin yöntemi.

timeout

string (duration)

İstek için istenen zaman aşımı. Varsayılan değer 30 saniyedir.

uri

string (uri)

Vektörleştiriciyi sağlayan Web API'sinin URI'si.

WebApiVectorizer

Bir sorgu dizesinin vektör katıştırmasını oluşturmak için kullanıcı tanımlı bir vektörleştirici belirtir. Harici bir vektörleştiricinin entegrasyonu, bir beceri kümesinin özel Web API arabirimi kullanılarak gerçekleştirilir.

Name Tür Description
customWebApiParameters

WebApiParameters

Kullanıcı tanımlı vektörleştiricinin özelliklerini belirtir.

kind string:

customWebApi

Vektör aramasıyla kullanılmak üzere yapılandırılan vektörleştirme yönteminin adı.

name

string

Bu özel vektörleştirme yöntemiyle ilişkilendirilecek ad.

WordDelimiterTokenFilter

Sözcükleri alt sözcüklere böler ve alt sözcük gruplarında isteğe bağlı dönüştürmeler gerçekleştirir. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır.

Name Tür Default value Description
@odata.type string:

#Microsoft.Azure.Search.WordDelimiterTokenFilter

Belirteç filtresinin türünü belirten bir URI parçası.

catenateAll

boolean

False

Tüm alt sözcük bölümlerinin kategorilere ayrılıp ayrılmayacağını belirten bir değer. Örneğin, bu doğru olarak ayarlanırsa, "Azure-Search-1", "AzureSearch1" olur. Varsayılan değer false'tur.

catenateNumbers

boolean

False

Sayı parçalarının maksimum sayıda çalışmasının kategorilere ayrılıp ayrılmayacağını gösteren bir değer. Örneğin, bu doğru olarak ayarlanırsa, "1-2", "12" olur. Varsayılan değer false'tur.

catenateWords

boolean

False

Sözcük parçalarının en fazla sayıda çalıştırılıp sonlandırılmayacağını belirten bir değer. Örneğin, bu doğru olarak ayarlanırsa, "Azure-Search" "AzureSearch" olur. Varsayılan değer false'tur.

generateNumberParts

boolean

True

Sayı alt sözcüklerinin oluşturulup oluşturulmayacağını gösteren bir değer. Varsayılan değer doğrudur

generateWordParts

boolean

True

Parça sözcüklerinin oluşturulup oluşturulmayacağını gösteren bir değer. Ayarlanırsa, kelimelerin bölümlerinin oluşturulmasına neden olur; örneğin, "AzureSearch", "Azure", "Arama" olur. Varsayılan değer doğrudur

name

string

Belirteç filtresinin adı. Yalnızca harfler, rakamlar, boşluklar, kısa çizgiler veya alt çizgiler içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır.

preserveOriginal

boolean

False

Orijinal sözcüklerin korunup korunmayacağını ve alt sözcük listesine eklenip eklenmeyeceğini belirten bir değer. Varsayılan değer false'tur.

protectedWords

string[]

Sınırlandırılmaktan korunacak belirteçlerin listesi.

splitOnCaseChange

boolean

True

caseChange üzerinde sözcüklerin bölünüp bölünmeyeceğini gösteren bir değer. Örneğin, bu doğru olarak ayarlanırsa, "AzureSearch", "Azure" "Search" olur. Varsayılan değer doğrudur

splitOnNumerics

boolean

True

Sayılara bölünüp bölünmeyeceğini gösteren bir değer. Örneğin, bu doğru olarak ayarlanırsa, "Azure1Search", "Azure" "1" "Arama" olur. Varsayılan değer doğrudur

stemEnglishPossessive

boolean

True

Her alt sözcük için sondaki "'ler"in kaldırılıp kaldırılmayacağını belirten bir değer. Varsayılan değer doğrudur