Indexes - Create Or Update

Yeni bir arama dizini oluşturur veya zaten varsa dizini güncelleştirir.

PUT {endpoint}/indexes('{indexName}')?api-version=2023-11-01
PUT {endpoint}/indexes('{indexName}')?allowIndexDowntime={allowIndexDowntime}&api-version=2023-11-01

URI Parametreleri

Name İçinde Gerekli Tür Description
endpoint
path True

string

Arama hizmetinin uç nokta URL'si.

indexName
path True

string

Oluşturulacak veya güncelleştirilecek dizinin tanımı.

api-version
query True

string

İstemci Api Sürümü.

allowIndexDowntime
query

boolean

Dizini en az birkaç saniye çevrimdışına alarak yeni çözümleyicilerin, belirteçlerin, belirteç filtrelerinin veya karakter filtrelerinin dizine eklenmesine izin verir. Bu, dizin oluşturma ve sorgu isteklerinin geçici olarak başarısız olmasına neden olur. Dizinin performansı ve yazma kullanılabilirliği, dizin güncelleştirildikten sonra birkaç dakika veya çok büyük dizinler için daha uzun süre bozulabilir.

İstek Başlığı

Name Gerekli Tür Description
x-ms-client-request-id

string

uuid

Hata ayıklamaya yardımcı olmak için istekle birlikte gönderilen izleme kimliği.

If-Match

string

If-Match koşulunu tanımlar. İşlem yalnızca sunucudaki ETag bu değerle eşleşiyorsa gerçekleştirilir.

If-None-Match

string

If-None-Match koşulunu tanımlar. İşlem yalnızca sunucudaki ETag bu değerle eşleşmiyorsa gerçekleştirilir.

Prefer True

string

HTTP PUT istekleri için, hizmete başarılı olduğunda oluşturulan/güncelleştirilen kaynağı döndürmesini bildirir.

İstek Gövdesi

Name Gerekli Tür Description
fields True

SearchField[]

Dizinin alanları.

name True

string

Dizinin adı.

@odata.etag

string

Dizinin ETag'i.

analyzers LexicalAnalyzer[]:

Dizin için çözümleyiciler.

charFilters CharFilter[]:

Dizin için karakter filtreleri.

corsOptions

CorsOptions

Dizin için Çıkış Noktaları Arası Kaynak Paylaşımı'nı (CORS) denetleme seçenekleri.

defaultScoringProfile

string

Sorguda belirtilmemişse kullanılacak puanlama profilinin adı. Bu özellik ayarlanmazsa ve sorguda puanlama profili belirtilmezse, varsayılan puanlama (tf-idf) kullanılır.

encryptionKey

SearchResourceEncryptionKey

Azure Key Vault'de oluşturduğunuz şifreleme anahtarının açıklaması. Bu anahtar, Microsoft'un bile değil, kimsenin verilerinizin şifresini çözemediğini tam olarak güvenceye almak istediğinizde verileriniz için ek bir bekleyen şifreleme düzeyi sağlamak için kullanılır. Verilerinizi şifreledikten sonra her zaman şifrelenmiş olarak kalır. Arama hizmeti bu özelliği null olarak ayarlama girişimlerini yoksayar. Şifreleme anahtarınızı döndürmek istiyorsanız bu özelliği gerektiği gibi değiştirebilirsiniz; Verileriniz etkilenmez. Müşteri tarafından yönetilen anahtarlarla şifreleme ücretsiz arama hizmetleri için kullanılamaz ve yalnızca 1 Ocak 2019 veya sonrasında oluşturulan ücretli hizmetler için kullanılabilir.

scoringProfiles

ScoringProfile[]

Dizin için puanlama profilleri.

semantic

SemanticSettings

Anlamsal özellikleri etkileyen bir arama dizini için parametreleri tanımlar.

similarity Similarity:

Arama sorgusuyla eşleşen belgeleri puanlama ve derecelendirme sırasında kullanılacak benzerlik algoritmasının türü. Benzerlik algoritması yalnızca dizin oluşturma zamanında tanımlanabilir ve mevcut dizinlerde değiştirilemez. Null ise ClassicSimilarity algoritması kullanılır.

suggesters

Suggester[]

Dizin için önerenler.

tokenFilters TokenFilter[]:

Dizin için belirteç filtreleri.

tokenizers LexicalTokenizer[]:

Dizin için belirteç oluşturucular.

vectorSearch

VectorSearch

Vektör araması ile ilgili yapılandırma seçeneklerini içerir.

Yanıtlar

Name Tür Description
200 OK

SearchIndex

201 Created

SearchIndex

Other Status Codes

SearchError

Hata yanıtı.

Örnekler

SearchServiceCreateOrUpdateIndex

Sample Request

PUT https://myservice.search.windows.net/indexes('hotels')?allowIndexDowntime=False&api-version=2023-11-01


{
  "name": "hotels",
  "fields": [
    {
      "name": "hotelId",
      "type": "Edm.String",
      "key": true,
      "searchable": false
    },
    {
      "name": "baseRate",
      "type": "Edm.Double"
    },
    {
      "name": "description",
      "type": "Edm.String",
      "filterable": false,
      "sortable": false,
      "facetable": false
    },
    {
      "name": "descriptionEmbedding",
      "type": "Collection(Edm.Single)",
      "dimensions": 1536,
      "vectorSearchProfile": "myHnswProfile",
      "searchable": true,
      "retrievable": true
    },
    {
      "name": "description_fr",
      "type": "Edm.String",
      "filterable": false,
      "sortable": false,
      "facetable": false,
      "analyzer": "fr.lucene"
    },
    {
      "name": "hotelName",
      "type": "Edm.String"
    },
    {
      "name": "category",
      "type": "Edm.String"
    },
    {
      "name": "tags",
      "type": "Collection(Edm.String)",
      "analyzer": "tagsAnalyzer"
    },
    {
      "name": "parkingIncluded",
      "type": "Edm.Boolean"
    },
    {
      "name": "smokingAllowed",
      "type": "Edm.Boolean"
    },
    {
      "name": "lastRenovationDate",
      "type": "Edm.DateTimeOffset"
    },
    {
      "name": "rating",
      "type": "Edm.Int32"
    },
    {
      "name": "location",
      "type": "Edm.GeographyPoint"
    }
  ],
  "scoringProfiles": [
    {
      "name": "geo",
      "text": {
        "weights": {
          "hotelName": 5
        }
      },
      "functions": [
        {
          "type": "distance",
          "boost": 5,
          "fieldName": "location",
          "interpolation": "logarithmic",
          "distance": {
            "referencePointParameter": "currentLocation",
            "boostingDistance": 10
          }
        }
      ]
    }
  ],
  "defaultScoringProfile": "geo",
  "suggesters": [
    {
      "name": "sg",
      "searchMode": "analyzingInfixMatching",
      "sourceFields": [
        "hotelName"
      ]
    }
  ],
  "analyzers": [
    {
      "name": "tagsAnalyzer",
      "@odata.type": "#Microsoft.Azure.Search.CustomAnalyzer",
      "charFilters": [
        "html_strip"
      ],
      "tokenizer": "standard_v2"
    }
  ],
  "corsOptions": {
    "allowedOrigins": [
      "tempuri.org"
    ],
    "maxAgeInSeconds": 60
  },
  "encryptionKey": {
    "keyVaultKeyName": "myUserManagedEncryptionKey-createdinAzureKeyVault",
    "keyVaultKeyVersion": "myKeyVersion-32charAlphaNumericString",
    "keyVaultUri": "https://myKeyVault.vault.azure.net",
    "accessCredentials": null
  },
  "similarity": {
    "@odata.type": "#Microsoft.Azure.Search.ClassicSimilarity"
  },
  "semantic": {
    "configurations": [
      {
        "name": "semanticHotels",
        "prioritizedFields": {
          "titleField": {
            "fieldName": "hotelName"
          },
          "prioritizedContentFields": [
            {
              "fieldName": "description"
            },
            {
              "fieldName": "description_fr"
            }
          ],
          "prioritizedKeywordsFields": [
            {
              "fieldName": "tags"
            },
            {
              "fieldName": "category"
            }
          ]
        }
      }
    ]
  },
  "vectorSearch": {
    "profiles": [
      {
        "name": "myHnswProfile",
        "algorithm": "myHnsw"
      },
      {
        "name": "myAlgorithm",
        "algorithm": "myExhaustive"
      }
    ],
    "algorithms": [
      {
        "name": "myHnsw",
        "kind": "hnsw",
        "hnswParameters": {
          "m": 4,
          "metric": "cosine"
        }
      },
      {
        "name": "myExhaustive",
        "kind": "exhaustiveKnn",
        "exhaustiveKnnParameters": {
          "metric": "cosine"
        }
      }
    ]
  }
}

Sample Response

{
  "name": "hotels",
  "fields": [
    {
      "name": "hotelId",
      "type": "Edm.String",
      "searchable": false,
      "filterable": true,
      "retrievable": true,
      "sortable": true,
      "facetable": true,
      "key": true,
      "indexAnalyzer": null,
      "searchAnalyzer": null,
      "analyzer": null,
      "dimensions": null,
      "vectorSearchProfile": null,
      "synonymMaps": []
    },
    {
      "name": "baseRate",
      "type": "Edm.Double",
      "searchable": false,
      "filterable": true,
      "retrievable": true,
      "sortable": true,
      "facetable": true,
      "key": false,
      "indexAnalyzer": null,
      "searchAnalyzer": null,
      "analyzer": null,
      "dimensions": null,
      "vectorSearchProfile": null,
      "synonymMaps": []
    },
    {
      "name": "description",
      "type": "Edm.String",
      "searchable": true,
      "filterable": false,
      "retrievable": true,
      "sortable": false,
      "facetable": false,
      "key": false,
      "indexAnalyzer": null,
      "searchAnalyzer": null,
      "analyzer": null,
      "dimensions": null,
      "vectorSearchProfile": null,
      "synonymMaps": []
    },
    {
      "name": "descriptionEmbedding",
      "type": "Collection(Edm.Single)",
      "searchable": true,
      "filterable": false,
      "retrievable": true,
      "sortable": false,
      "facetable": false,
      "key": false,
      "indexAnalyzer": null,
      "searchAnalyzer": null,
      "analyzer": null,
      "dimensions": 1536,
      "vectorSearchProfile": "myHnswProfile",
      "synonymMaps": []
    },
    {
      "name": "description_fr",
      "type": "Edm.String",
      "searchable": true,
      "filterable": false,
      "retrievable": true,
      "sortable": false,
      "facetable": false,
      "key": false,
      "indexAnalyzer": null,
      "searchAnalyzer": null,
      "analyzer": "fr.lucene",
      "dimensions": null,
      "vectorSearchProfile": null,
      "synonymMaps": []
    },
    {
      "name": "hotelName",
      "type": "Edm.String",
      "searchable": true,
      "filterable": true,
      "retrievable": true,
      "sortable": true,
      "facetable": true,
      "key": false,
      "indexAnalyzer": null,
      "searchAnalyzer": null,
      "analyzer": null,
      "dimensions": null,
      "vectorSearchProfile": null,
      "synonymMaps": []
    },
    {
      "name": "category",
      "type": "Edm.String",
      "searchable": true,
      "filterable": true,
      "retrievable": true,
      "sortable": true,
      "facetable": true,
      "key": false,
      "indexAnalyzer": null,
      "searchAnalyzer": null,
      "analyzer": null,
      "dimensions": null,
      "vectorSearchProfile": null,
      "synonymMaps": []
    },
    {
      "name": "tags",
      "type": "Collection(Edm.String)",
      "searchable": true,
      "filterable": true,
      "retrievable": true,
      "sortable": false,
      "facetable": true,
      "key": false,
      "indexAnalyzer": null,
      "searchAnalyzer": null,
      "analyzer": "tagsAnalyzer",
      "dimensions": null,
      "vectorSearchProfile": null,
      "synonymMaps": []
    },
    {
      "name": "parkingIncluded",
      "type": "Edm.Boolean",
      "searchable": false,
      "filterable": true,
      "retrievable": true,
      "sortable": true,
      "facetable": true,
      "key": false,
      "indexAnalyzer": null,
      "searchAnalyzer": null,
      "analyzer": null,
      "dimensions": null,
      "vectorSearchProfile": null,
      "synonymMaps": []
    },
    {
      "name": "smokingAllowed",
      "type": "Edm.Boolean",
      "searchable": false,
      "filterable": true,
      "retrievable": true,
      "sortable": true,
      "facetable": true,
      "key": false,
      "indexAnalyzer": null,
      "searchAnalyzer": null,
      "analyzer": null,
      "dimensions": null,
      "vectorSearchProfile": null,
      "synonymMaps": []
    },
    {
      "name": "lastRenovationDate",
      "type": "Edm.DateTimeOffset",
      "searchable": false,
      "filterable": true,
      "retrievable": true,
      "sortable": true,
      "facetable": true,
      "key": false,
      "indexAnalyzer": null,
      "searchAnalyzer": null,
      "analyzer": null,
      "dimensions": null,
      "vectorSearchProfile": null,
      "synonymMaps": []
    },
    {
      "name": "rating",
      "type": "Edm.Int32",
      "searchable": false,
      "filterable": true,
      "retrievable": true,
      "sortable": true,
      "facetable": true,
      "key": false,
      "indexAnalyzer": null,
      "searchAnalyzer": null,
      "analyzer": null,
      "dimensions": null,
      "vectorSearchProfile": null,
      "synonymMaps": []
    },
    {
      "name": "location",
      "type": "Edm.GeographyPoint",
      "searchable": false,
      "filterable": true,
      "retrievable": true,
      "sortable": true,
      "facetable": false,
      "key": false,
      "indexAnalyzer": null,
      "searchAnalyzer": null,
      "analyzer": null,
      "dimensions": null,
      "vectorSearchProfile": null,
      "synonymMaps": []
    }
  ],
  "scoringProfiles": [
    {
      "name": "geo",
      "functionAggregation": "sum",
      "text": {
        "weights": {
          "hotelName": 5
        }
      },
      "functions": [
        {
          "type": "distance",
          "boost": 5,
          "fieldName": "location",
          "interpolation": "logarithmic",
          "distance": {
            "referencePointParameter": "currentLocation",
            "boostingDistance": 10
          }
        }
      ]
    }
  ],
  "defaultScoringProfile": "geo",
  "suggesters": [
    {
      "name": "sg",
      "searchMode": "analyzingInfixMatching",
      "sourceFields": [
        "hotelName"
      ]
    }
  ],
  "analyzers": [
    {
      "name": "tagsAnalyzer",
      "@odata.type": "#Microsoft.Azure.Search.CustomAnalyzer",
      "charFilters": [
        "html_strip"
      ],
      "tokenizer": "standard_v2"
    }
  ],
  "tokenizers": [],
  "tokenFilters": [],
  "charFilters": [],
  "corsOptions": {
    "allowedOrigins": [
      "tempuri.org"
    ],
    "maxAgeInSeconds": 60
  },
  "encryptionKey": {
    "keyVaultKeyName": "myUserManagedEncryptionKey-createdinAzureKeyVault",
    "keyVaultKeyVersion": "myKeyVersion-32charAlphaNumericString",
    "keyVaultUri": "https://myKeyVault.vault.azure.net",
    "accessCredentials": null
  },
  "similarity": {
    "@odata.type": "#Microsoft.Azure.Search.ClassicSimilarity"
  },
  "semantic": {
    "configurations": [
      {
        "name": "semanticHotels",
        "prioritizedFields": {
          "titleField": {
            "fieldName": "hotelName"
          },
          "prioritizedContentFields": [
            {
              "fieldName": "description"
            },
            {
              "fieldName": "description_fr"
            }
          ],
          "prioritizedKeywordsFields": [
            {
              "fieldName": "tags"
            },
            {
              "fieldName": "category"
            }
          ]
        }
      }
    ]
  },
  "vectorSearch": {
    "algorithms": [
      {
        "name": "myHnsw",
        "kind": "hnsw",
        "hnswParameters": {
          "metric": "cosine",
          "m": 4,
          "efConstruction": 400,
          "efSearch": 500
        }
      },
      {
        "name": "myExhaustive",
        "kind": "exhaustiveKnn",
        "exhaustiveKnnParameters": {
          "metric": "cosine"
        }
      }
    ],
    "profiles": [
      {
        "name": "myHnswProfile",
        "algorithm": "myHnsw"
      },
      {
        "name": "myAlgorithm",
        "algorithm": "myExhaustive"
      }
    ]
  }
}
{
  "name": "hotels",
  "fields": [
    {
      "name": "hotelId",
      "type": "Edm.String",
      "searchable": false,
      "filterable": true,
      "retrievable": true,
      "sortable": true,
      "facetable": true,
      "key": true,
      "indexAnalyzer": null,
      "searchAnalyzer": null,
      "analyzer": null,
      "dimensions": null,
      "vectorSearchProfile": null,
      "synonymMaps": []
    },
    {
      "name": "baseRate",
      "type": "Edm.Double",
      "searchable": false,
      "filterable": true,
      "retrievable": true,
      "sortable": true,
      "facetable": true,
      "key": false,
      "indexAnalyzer": null,
      "searchAnalyzer": null,
      "analyzer": null,
      "dimensions": null,
      "vectorSearchProfile": null,
      "synonymMaps": []
    },
    {
      "name": "description",
      "type": "Edm.String",
      "searchable": true,
      "filterable": false,
      "retrievable": true,
      "sortable": false,
      "facetable": false,
      "key": false,
      "indexAnalyzer": null,
      "searchAnalyzer": null,
      "analyzer": null,
      "dimensions": null,
      "vectorSearchProfile": null,
      "synonymMaps": []
    },
    {
      "name": "descriptionEmbedding",
      "type": "Collection(Edm.Single)",
      "searchable": true,
      "filterable": false,
      "retrievable": true,
      "sortable": false,
      "facetable": false,
      "key": false,
      "indexAnalyzer": null,
      "searchAnalyzer": null,
      "analyzer": null,
      "dimensions": 1536,
      "vectorSearchProfile": "myHnswProfile",
      "synonymMaps": []
    },
    {
      "name": "description_fr",
      "type": "Edm.String",
      "searchable": true,
      "filterable": false,
      "retrievable": true,
      "sortable": false,
      "facetable": false,
      "key": false,
      "indexAnalyzer": null,
      "searchAnalyzer": null,
      "analyzer": "fr.lucene",
      "dimensions": null,
      "vectorSearchProfile": null,
      "synonymMaps": []
    },
    {
      "name": "hotelName",
      "type": "Edm.String",
      "searchable": true,
      "filterable": true,
      "retrievable": true,
      "sortable": true,
      "facetable": true,
      "key": false,
      "indexAnalyzer": null,
      "searchAnalyzer": null,
      "analyzer": null,
      "dimensions": null,
      "vectorSearchProfile": null,
      "synonymMaps": []
    },
    {
      "name": "category",
      "type": "Edm.String",
      "searchable": true,
      "filterable": true,
      "retrievable": true,
      "sortable": true,
      "facetable": true,
      "key": false,
      "indexAnalyzer": null,
      "searchAnalyzer": null,
      "analyzer": null,
      "dimensions": null,
      "vectorSearchProfile": null,
      "synonymMaps": []
    },
    {
      "name": "tags",
      "type": "Collection(Edm.String)",
      "searchable": true,
      "filterable": true,
      "retrievable": true,
      "sortable": false,
      "facetable": true,
      "key": false,
      "indexAnalyzer": null,
      "searchAnalyzer": null,
      "analyzer": "tagsAnalyzer",
      "dimensions": null,
      "vectorSearchProfile": null,
      "synonymMaps": []
    },
    {
      "name": "parkingIncluded",
      "type": "Edm.Boolean",
      "searchable": false,
      "filterable": true,
      "retrievable": true,
      "sortable": true,
      "facetable": true,
      "key": false,
      "indexAnalyzer": null,
      "searchAnalyzer": null,
      "analyzer": null,
      "dimensions": null,
      "vectorSearchProfile": null,
      "synonymMaps": []
    },
    {
      "name": "smokingAllowed",
      "type": "Edm.Boolean",
      "searchable": false,
      "filterable": true,
      "retrievable": true,
      "sortable": true,
      "facetable": true,
      "key": false,
      "indexAnalyzer": null,
      "searchAnalyzer": null,
      "analyzer": null,
      "dimensions": null,
      "vectorSearchProfile": null,
      "synonymMaps": []
    },
    {
      "name": "lastRenovationDate",
      "type": "Edm.DateTimeOffset",
      "searchable": false,
      "filterable": true,
      "retrievable": true,
      "sortable": true,
      "facetable": true,
      "key": false,
      "indexAnalyzer": null,
      "searchAnalyzer": null,
      "analyzer": null,
      "dimensions": null,
      "vectorSearchProfile": null,
      "synonymMaps": []
    },
    {
      "name": "rating",
      "type": "Edm.Int32",
      "searchable": false,
      "filterable": true,
      "retrievable": true,
      "sortable": true,
      "facetable": true,
      "key": false,
      "indexAnalyzer": null,
      "searchAnalyzer": null,
      "analyzer": null,
      "dimensions": null,
      "vectorSearchProfile": null,
      "synonymMaps": []
    },
    {
      "name": "location",
      "type": "Edm.GeographyPoint",
      "searchable": false,
      "filterable": true,
      "retrievable": true,
      "sortable": true,
      "facetable": false,
      "key": false,
      "indexAnalyzer": null,
      "searchAnalyzer": null,
      "analyzer": null,
      "dimensions": null,
      "vectorSearchProfile": null,
      "synonymMaps": []
    }
  ],
  "scoringProfiles": [
    {
      "name": "geo",
      "functionAggregation": "sum",
      "text": {
        "weights": {
          "hotelName": 5
        }
      },
      "functions": [
        {
          "type": "distance",
          "boost": 5,
          "fieldName": "location",
          "interpolation": "logarithmic",
          "distance": {
            "referencePointParameter": "currentLocation",
            "boostingDistance": 10
          }
        }
      ]
    }
  ],
  "defaultScoringProfile": "geo",
  "suggesters": [
    {
      "name": "sg",
      "searchMode": "analyzingInfixMatching",
      "sourceFields": [
        "hotelName"
      ]
    }
  ],
  "analyzers": [
    {
      "name": "tagsAnalyzer",
      "@odata.type": "#Microsoft.Azure.Search.CustomAnalyzer",
      "charFilters": [
        "html_strip"
      ],
      "tokenizer": "standard_v2"
    }
  ],
  "tokenizers": [],
  "tokenFilters": [],
  "charFilters": [],
  "corsOptions": {
    "allowedOrigins": [
      "tempuri.org"
    ],
    "maxAgeInSeconds": 60
  },
  "encryptionKey": {
    "keyVaultKeyName": "myUserManagedEncryptionKey-createdinAzureKeyVault",
    "keyVaultKeyVersion": "myKeyVersion-32charAlphaNumericString",
    "keyVaultUri": "https://myKeyVault.vault.azure.net",
    "accessCredentials": null
  },
  "semantic": {
    "configurations": [
      {
        "name": "semanticHotels",
        "prioritizedFields": {
          "titleField": {
            "fieldName": "hotelName"
          },
          "prioritizedContentFields": [
            {
              "fieldName": "description"
            },
            {
              "fieldName": "description_fr"
            }
          ],
          "prioritizedKeywordsFields": [
            {
              "fieldName": "tags"
            },
            {
              "fieldName": "category"
            }
          ]
        }
      }
    ]
  },
  "vectorSearch": {
    "algorithms": [
      {
        "name": "myHnsw",
        "kind": "hnsw",
        "hnswParameters": {
          "metric": "cosine",
          "m": 4,
          "efConstruction": 400,
          "efSearch": 500
        }
      },
      {
        "name": "myExhaustive",
        "kind": "exhaustiveKnn",
        "exhaustiveKnnParameters": {
          "metric": "cosine"
        }
      }
    ],
    "profiles": [
      {
        "name": "myHnswProfile",
        "algorithm": "myHnsw"
      },
      {
        "name": "myAlgorithm",
        "algorithm": "myExhaustive"
      }
    ]
  }
}

Tanımlar

Name Description
AsciiFoldingTokenFilter

İlk 127 ASCII karakterde ("Temel Latin" Unicode bloğu) bulunmayan alfabetik, sayısal ve sembolik Unicode karakterleri, bu eşdeğerler varsa ASCII eşdeğerlerine dönüştürür. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır.

AzureActiveDirectoryApplicationCredentials

Arama hizmetiniz için oluşturulan ve Azure Key Vault'de depolanan şifreleme anahtarlarına kimliği doğrulanmış erişim için kullanılan kayıtlı bir uygulamanın kimlik bilgileri.

BM25Similarity

Okapi BM25 benzerlik algoritmasına dayalı sıralama işlevi. BM25, uzunluk normalleştirmesi ('b' parametresiyle denetlenen) ve terim sıklığı doygunluğunu ('k1' parametresiyle denetlenen) içeren TF-IDF benzeri bir algoritmadır.

CharFilterName

Arama altyapısı tarafından desteklenen tüm karakter filtrelerinin adlarını tanımlar.

CjkBigramTokenFilter

Standart belirteç oluşturucudan oluşturulan CJK terimlerinin büyük bileşenlerini oluşturur. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır.

CjkBigramTokenFilterScripts

CjkBigramTokenFilter tarafından yoksayılabilir betikler.

ClassicSimilarity

TF-IDF'nin Lucene TFIDFSimilarity uygulamasını kullanan eski benzerlik algoritması. TF-IDF'nin bu varyasyonu, statik belge uzunluğunu normalleştirmenin yanı sıra, arama yapılan sorgularla yalnızca kısmen eşleşen belgeleri cezalandıran koordinat faktörleri de ekler.

ClassicTokenizer

Çoğu Avrupa dili belgesini işlemek için uygun olan dil bilgisi tabanlı belirteç oluşturucu. Bu belirteç oluşturucu Apache Lucene kullanılarak uygulanır.

CommonGramTokenFilter

Dizin oluştururken sık karşılaşılan terimler için bigrams oluşturun. Tek terimler de dizine eklenir ve bigrams yer paylaşımlı olur. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır.

CorsOptions

Dizin için Çıkış Noktaları Arası Kaynak Paylaşımı'nı (CORS) denetleme seçeneklerini tanımlar.

CustomAnalyzer

Metni dizinlenebilir/aranabilir belirteçlere dönüştürme işlemi üzerinde denetime sahip olmanıza olanak tanır. Önceden tanımlanmış tek bir belirteç oluşturucu ve bir veya daha fazla filtreden oluşan kullanıcı tanımlı bir yapılandırmadır. Belirteç oluşturucu, metni belirteçlere bölmek ve belirteç oluşturucu tarafından yayılan belirteçleri değiştirmek için filtreler sorumludur.

DictionaryDecompounderTokenFilter

Birçok Almanca dilinde bulunan bileşik sözcükleri ayrıştırıyor. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır.

DistanceScoringFunction

Coğrafi konumdan uzaklığı temel alarak puanları artıran bir işlev tanımlar.

DistanceScoringParameters

Uzaklık puanlama işlevine parametre değerleri sağlar.

EdgeNGramTokenFilter

Giriş belirtecinin önünden veya arkasından başlayarak verilen boyutların n gramını oluşturur. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır.

EdgeNGramTokenFilterSide

Bir n-gram girişin hangi tarafından oluşturulması gerektiğini belirtir.

EdgeNGramTokenFilterV2

Giriş belirtecinin önünden veya arkasından başlayarak verilen boyutların n gramını oluşturur. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır.

EdgeNGramTokenizer

Bir kenardan gelen girişi verilen boyutların n gramını belirteci haline getirmektedir. Bu belirteç oluşturucu Apache Lucene kullanılarak uygulanır.

ElisionTokenFilter

İknaları kaldırır. Örneğin, "l'avion" (düzlem) "avion" (düzlem) olarak dönüştürülür. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır.

ExhaustiveKnnParameters

Kapsamlı KNN algoritmasına özgü parametreleri içerir.

ExhaustiveKnnVectorSearchAlgorithmConfiguration

Sorgulama sırasında kullanılan kapsamlı KNN algoritmasına özgü yapılandırma seçeneklerini içerir ve bu seçenek vektör dizininin tamamında deneme yanılma araması gerçekleştirir.

FreshnessScoringFunction

Tarih-saat alanının değerine göre puanları artıran bir işlev tanımlar.

FreshnessScoringParameters

Bir güncellik puanlama işlevine parametre değerleri sağlar.

HnswParameters

HNSW algoritmasına özgü parametreleri içerir.

HnswVectorSearchAlgorithmConfiguration

Dizin oluşturma ve sorgulama sırasında kullanılan HNSW yaklaşık en yakın komşular algoritmasına özgü yapılandırma seçeneklerini içerir. HNSW algoritması, arama hızı ve doğruluk arasında ayarlanabilir bir denge sağlar.

KeepTokenFilter

Yalnızca belirtilen sözcükler listesinde bulunan metinle belirteçleri tutan belirteç filtresi. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır.

KeywordMarkerTokenFilter

Terimleri anahtar sözcük olarak işaretler. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır.

KeywordTokenizer

Girişin tamamını tek bir belirteç olarak yayar. Bu belirteç oluşturucu Apache Lucene kullanılarak uygulanır.

KeywordTokenizerV2

Girişin tamamını tek bir belirteç olarak yayar. Bu belirteç oluşturucu Apache Lucene kullanılarak uygulanır.

LengthTokenFilter

Çok uzun veya çok kısa sözcükleri kaldırır. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır.

LexicalAnalyzerName

Arama altyapısı tarafından desteklenen tüm metin çözümleyicilerinin adlarını tanımlar.

LexicalTokenizerName

Arama altyapısı tarafından desteklenen tüm belirteç oluşturucuların adlarını tanımlar.

LimitTokenFilter

Dizin oluşturma sırasında belirteç sayısını sınırlar. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır.

LuceneStandardAnalyzer

Standart Apache Lucene çözümleyicisi; Standart belirteç oluşturucu, küçük harfli filtre ve durdurma filtresinden oluşur.

LuceneStandardTokenizer

Unicode Metin Kesimleme kurallarını izleyerek metni keser. Bu belirteç oluşturucu Apache Lucene kullanılarak uygulanır.

LuceneStandardTokenizerV2

Unicode Metin Kesimleme kurallarını izleyerek metni keser. Bu belirteç oluşturucu Apache Lucene kullanılarak uygulanır.

MagnitudeScoringFunction

Sayısal alanın büyüklüğüne göre puanları artıran bir işlev tanımlar.

MagnitudeScoringParameters

Bir büyüklük puanlama işlevine parametre değerleri sağlar.

MappingCharFilter

Eşlemeler seçeneğiyle tanımlanan eşlemeleri uygulayan bir karakter filtresi. Eşleştirme doyumsuzdur (belirli bir noktadaki en uzun desen eşleştirmesi kazanır). Değiştirmenin boş dize olması için izin verilir. Bu karakter filtresi Apache Lucene kullanılarak uygulanır.

MicrosoftLanguageStemmingTokenizer

Dile özgü kuralları kullanarak metni böler ve sözcükleri temel formlarına küçültür.

MicrosoftLanguageTokenizer

Dile özgü kuralları kullanarak metni böler.

MicrosoftStemmingTokenizerLanguage

Microsoft dil saplama belirteci tarafından desteklenen dilleri Listeler.

MicrosoftTokenizerLanguage

Microsoft dil belirteci tarafından desteklenen dilleri Listeler.

NGramTokenFilter

Verilen boyutların n gramını oluşturur. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır.

NGramTokenFilterV2

Verilen boyutların n gramını oluşturur. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır.

NGramTokenizer

Girişi verilen boyutların n gramı olarak belirteci haline getirmektedir. Bu belirteç oluşturucu Apache Lucene kullanılarak uygulanır.

PathHierarchyTokenizerV2

Yol benzeri hiyerarşiler için belirteç oluşturucu. Bu belirteç oluşturucu Apache Lucene kullanılarak uygulanır.

PatternAnalyzer

Normal ifade deseni aracılığıyla metni terimlere esnek bir şekilde ayırır. Bu çözümleyici Apache Lucene kullanılarak uygulanır.

PatternCaptureTokenFilter

Bir veya daha fazla desendeki her yakalama grubu için bir tane olmak üzere birden çok belirteç yaymak için Java regexes kullanır. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır.

PatternReplaceCharFilter

Giriş dizesindeki karakterlerin yerini alan bir karakter filtresi. Korunacak karakter dizilerini tanımlamak için normal bir ifade ve değiştirilecek karakterleri tanımlamak için bir değiştirme deseni kullanır. Örneğin, "aa bb aa bb", "(aa)\s+(bb)" deseni ve "$1#$2" yerine "aa#bb aa#bb" giriş metni verilmelidir. Bu karakter filtresi Apache Lucene kullanılarak uygulanır.

PatternReplaceTokenFilter

Giriş dizesindeki karakterlerin yerini alan karakter filtresi. Korunacak karakter dizilerini tanımlamak için normal bir ifade ve değiştirilecek karakterleri tanımlamak için bir değiştirme düzeni kullanır. Örneğin, "aa bb aa bb" giriş metni, "(aa)\s+(bb)" deseni ve "$1#$2" yerine "aa#bb aa#bb" sonucu elde edilebilir. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır.

PatternTokenizer

Farklı belirteçler oluşturmak için regex desen eşleştirmesi kullanan belirteç oluşturucu. Bu belirteç oluşturucu Apache Lucene kullanılarak uygulanır.

PhoneticEncoder

PhoneticTokenFilter ile kullanılacak fonetik kodlayıcı türünü tanımlar.

PhoneticTokenFilter

Fonetik eşleşmeler için belirteçler oluşturun. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır.

PrioritizedFields

Anlam sıralaması, açıklamalı alt yazılar, vurgular ve yanıtlar için kullanılacak başlık, içerik ve anahtar sözcük alanlarını açıklar.

RegexFlags

Normal ifadelerin desen çözümleyicisinde ve desen belirteci'nde nasıl kullanıldığını denetlemek için birleştirilebilen bayrakları tanımlar.

ScoringFunctionAggregation

Bir puanlama profilindeki tüm puanlama işlevlerinin sonuçlarını birleştirmek için kullanılan toplama işlevini tanımlar.

ScoringFunctionInterpolation

Bir belge aralığında puan artırmayı ilişkilendirmek için kullanılan işlevi tanımlar.

ScoringProfile

Arama sorgularında puanlama işlemini etkileyen arama dizini parametrelerini tanımlar.

SearchError

API için bir hata koşulu açıklar.

SearchField

Dizin tanımında bir alanın adını, veri türünü ve arama davranışını açıklayan bir alanı temsil eder.

SearchFieldDataType

Arama dizinindeki bir alanın veri türünü tanımlar.

SearchIndex

Bir dizinin alanlarını ve arama davranışını açıklayan bir arama dizini tanımını temsil eder.

SearchResourceEncryptionKey

Azure Key Vault'da müşteri tarafından yönetilen bir şifreleme anahtarı. Oluşturduğunuz ve yönettiğiniz anahtarlar, dizinler ve eş anlamlı eşlemeler gibi arama hizmetinizdeki bekleyen verileri şifrelemek veya şifresini çözmek için kullanılabilir.

SemanticConfiguration

Anlamsal özellikler bağlamında kullanılacak belirli bir yapılandırmayı tanımlar.

SemanticField

Anlamsal yapılandırmanın bir parçası olarak kullanılan alan.

SemanticSettings

Anlamsal özellikleri etkileyen bir arama dizini için parametreleri tanımlar.

ShingleTokenFilter

Belirteç birleşimlerini tek bir belirteç olarak oluşturur. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır.

SnowballTokenFilter

Snowball tarafından oluşturulan bir kök ayırıcı kullanarak sözcükleri saplayan bir filtre. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır.

SnowballTokenFilterLanguage

Kartopu belirteç filtresi için kullanılacak dil.

StemmerOverrideTokenFilter

Özel sözlük tabanlı kök oluşturma ile diğer kök oluşturma filtrelerini geçersiz kılma olanağı sağlar. Sözlük saplı terimler anahtar sözcük olarak işaretlenir, böylece zincirde kök ayırıcılarla saplanmaz. Herhangi bir kök filtreden önce yerleştirilmelidir. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır.

StemmerTokenFilter

Dile özgü köklendirme filtresi. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır.

StemmerTokenFilterLanguage

Kök ayırıcı belirteç filtresi için kullanılacak dil.

StopAnalyzer

Metni harf olmayana böler; Küçük harf ve stopword belirteç filtrelerini uygular. Bu çözümleyici Apache Lucene kullanılarak uygulanır.

StopwordsList

Dile özgü stopword'lerin önceden tanımlanmış bir listesini tanımlar.

StopwordsTokenFilter

Belirteç akışından durdurma sözcüklerini kaldırır. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır.

Suggester

Öneri API'sinin dizindeki bir alan grubuna nasıl uygulanacağını tanımlar.

SuggesterSearchMode

Öneride bulunanın özelliklerini gösteren değer.

SynonymTokenFilter

Belirteç akışındaki tek veya çok sözcüklü eş anlamlılarla eşleşir. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır.

TagScoringFunction

Belirli bir etiket listesiyle eşleşen dize değerlerine sahip belge puanlarını artıran bir işlev tanımlar.

TagScoringParameters

Etiket puanlama işlevine parametre değerleri sağlar.

TextWeights

Eşleşmelerin arama sorgularında puanlama düzeyini artırması gereken dizin alanlarındaki ağırlıkları tanımlar.

TokenCharacterKind

Belirteç filtresinin üzerinde çalışabileceği karakter sınıflarını temsil eder.

TokenFilterName

Arama altyapısı tarafından desteklenen tüm belirteç filtrelerinin adlarını tanımlar.

TruncateTokenFilter

Terimleri belirli bir uzunlukta kısaltılır. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır.

UaxUrlEmailTokenizer

Url'leri ve e-postaları tek bir belirteç olarak belirteç haline döndürür. Bu belirteç oluşturucu Apache Lucene kullanılarak uygulanır.

UniqueTokenFilter

Önceki belirteçle aynı metindeki belirteçleri filtreler. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır.

VectorSearch

Vektör araması ile ilgili yapılandırma seçeneklerini içerir.

VectorSearchAlgorithmKind

Dizin oluşturma ve sorgulama için kullanılan algoritma.

VectorSearchAlgorithmMetric

Vektör karşılaştırmaları için kullanılacak benzerlik ölçümü.

VectorSearchProfile

Vektör araması ile kullanılacak yapılandırmaların bir bileşimini tanımlar.

WordDelimiterTokenFilter

Sözcükleri alt sözcüklere böler ve alt sözcük gruplarında isteğe bağlı dönüştürmeler gerçekleştirir. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır.

AsciiFoldingTokenFilter

İlk 127 ASCII karakterde ("Temel Latin" Unicode bloğu) bulunmayan alfabetik, sayısal ve sembolik Unicode karakterleri, bu eşdeğerler varsa ASCII eşdeğerlerine dönüştürür. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır.

Name Tür Varsayılan değer Description
@odata.type string:

#Microsoft.Azure.Search.AsciiFoldingTokenFilter

Belirteç filtresinin türünü belirten bir URI parçası.

name

string

Belirteç filtresinin adı. Yalnızca harf, rakam, boşluk, kısa çizgi veya alt çizgi içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır.

preserveOriginal

boolean

False

Özgün belirtecin tutulup tutulmayacağını belirten bir değer. Varsayılan değer false’tur.

AzureActiveDirectoryApplicationCredentials

Arama hizmetiniz için oluşturulan ve Azure Key Vault'de depolanan şifreleme anahtarlarına kimliği doğrulanmış erişim için kullanılan kayıtlı bir uygulamanın kimlik bilgileri.

Name Tür Description
applicationId

string

Bekleyen verilerinizi şifrelerken kullanılacak Azure Key Vault gerekli erişim izinleri verilmiş bir AAD Uygulama Kimliği. Uygulama Kimliği, AAD Uygulamanızın Nesne Kimliği ile karıştırılmamalıdır.

applicationSecret

string

Belirtilen AAD uygulamasının kimlik doğrulama anahtarı.

BM25Similarity

Okapi BM25 benzerlik algoritmasına dayalı sıralama işlevi. BM25, uzunluk normalleştirmesi ('b' parametresiyle denetlenen) ve terim sıklığı doygunluğunu ('k1' parametresiyle denetlenen) içeren TF-IDF benzeri bir algoritmadır.

Name Tür Description
@odata.type string:

#Microsoft.Azure.Search.BM25Similarity

b

number

Bu özellik, bir belgenin uzunluğunun ilgi puanını nasıl etkilediğini denetler. Varsayılan olarak 0,75 değeri kullanılır. 0,0 değeri uzunluk normalleştirmesi uygulanmadığı, 1,0 değeri ise puanın belgenin uzunluğuna göre tamamen normalleştirildiği anlamına gelir.

k1

number

Bu özellik, her eşleşen terimlerin terim sıklığı ile belge sorgusu çiftinin son ilgi puanı arasındaki ölçeklendirme işlevini denetler. Varsayılan olarak 1,2 değeri kullanılır. 0,0 değeri, puanın terim sıklığındaki artışla ölçeklendirilmediği anlamına gelir.

CharFilterName

Arama altyapısı tarafından desteklenen tüm karakter filtrelerinin adlarını tanımlar.

Name Tür Description
html_strip

string

HTML yapılarını ayırmaya çalışan bir karakter filtresi. Bkz. https://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/charfilter/HTMLStripCharFilter.html

CjkBigramTokenFilter

Standart belirteç oluşturucudan oluşturulan CJK terimlerinin büyük bileşenlerini oluşturur. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır.

Name Tür Varsayılan değer Description
@odata.type string:

#Microsoft.Azure.Search.CjkBigramTokenFilter

Belirteç filtresinin türünü belirten bir URI parçası.

ignoreScripts

CjkBigramTokenFilterScripts[]

Yoksaymak için betikler.

name

string

Belirteç filtresinin adı. Yalnızca harf, rakam, boşluk, kısa çizgi veya alt çizgi içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır.

outputUnigrams

boolean

False

Hem tek birimlerin hem de büyük harflerin (true ise) veya yalnızca bigrams (false ise) çıkışının yapılıp yapılmayacağını belirten bir değer. Varsayılan değer false’tur.

CjkBigramTokenFilterScripts

CjkBigramTokenFilter tarafından yoksayılabilir betikler.

Name Tür Description
han

string

CJK terimlerinin bigram'larını oluştururken Han betiğini yoksayın.

hangul

string

CJK terimlerinin bigram'larını oluştururken Hangul betiğini yoksayın.

hiragana

string

CJK terimlerinin bigram'larını oluştururken Hiragana betiğini yoksayın.

katakana

string

CJK terimlerinin bigram'larını oluştururken Katakana betiğini yoksayın.

ClassicSimilarity

TF-IDF'nin Lucene TFIDFSimilarity uygulamasını kullanan eski benzerlik algoritması. TF-IDF'nin bu varyasyonu, statik belge uzunluğunu normalleştirmenin yanı sıra, arama yapılan sorgularla yalnızca kısmen eşleşen belgeleri cezalandıran koordinat faktörleri de ekler.

Name Tür Description
@odata.type string:

#Microsoft.Azure.Search.ClassicSimilarity

ClassicTokenizer

Çoğu Avrupa dili belgesini işlemek için uygun olan dil bilgisi tabanlı belirteç oluşturucu. Bu belirteç oluşturucu Apache Lucene kullanılarak uygulanır.

Name Tür Varsayılan değer Description
@odata.type string:

#Microsoft.Azure.Search.ClassicTokenizer

Belirteç oluşturucunun türünü belirten bir URI parçası.

maxTokenLength

integer

255

En fazla belirteç uzunluğu. Varsayılan değer 255'tir. Uzunluk üst sınırından daha uzun olan belirteçler bölünür. Kullanılabilecek en fazla belirteç uzunluğu 300 karakterdir.

name

string

Belirteç oluşturucunun adı. Yalnızca harf, rakam, boşluk, tire veya alt çizgi içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır.

CommonGramTokenFilter

Dizin oluştururken sık karşılaşılan terimler için bigrams oluşturun. Tek terimler de dizine eklenir ve bigrams yer paylaşımlı olur. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır.

Name Tür Varsayılan değer Description
@odata.type string:

#Microsoft.Azure.Search.CommonGramTokenFilter

Belirteç filtresinin türünü belirten bir URI parçası.

commonWords

string[]

Ortak sözcükler kümesi.

ignoreCase

boolean

False

Ortak sözcükler eşleştirmenin büyük/küçük harfe duyarsız olup olmayacağını belirten bir değer. Varsayılan değer false’tur.

name

string

Belirteç filtresinin adı. Yalnızca harf, rakam, boşluk, kısa çizgi veya alt çizgi içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır.

queryMode

boolean

False

Belirteç filtresinin sorgu modunda olup olmadığını gösteren değer. Sorgu modundayken belirteç filtresi bigrams oluşturur ve ardından sık kullanılan sözcükleri ve tek terimleri ve ardından ortak bir sözcüğü kaldırır. Varsayılan değer false’tur.

CorsOptions

Dizin için Çıkış Noktaları Arası Kaynak Paylaşımı'nı (CORS) denetleme seçeneklerini tanımlar.

Name Tür Description
allowedOrigins

string[]

JavaScript kodunun dizininize erişim izni verileceği kaynak listesi. {protocol}://{fully-qualified-domain-name}[:{port#}] biçimindeki konakların listesini veya tüm kaynaklara izin vermek için tek * bir konak (önerilmez) içerebilir.

maxAgeInSeconds

integer

Tarayıcıların CORS denetim öncesi yanıtlarını önbelleğe alması gereken süre. Varsayılan değer 5 dakikadır.

CustomAnalyzer

Metni dizinlenebilir/aranabilir belirteçlere dönüştürme işlemi üzerinde denetime sahip olmanıza olanak tanır. Önceden tanımlanmış tek bir belirteç oluşturucu ve bir veya daha fazla filtreden oluşan kullanıcı tanımlı bir yapılandırmadır. Belirteç oluşturucu, metni belirteçlere bölmek ve belirteç oluşturucu tarafından yayılan belirteçleri değiştirmek için filtreler sorumludur.

Name Tür Description
@odata.type string:

#Microsoft.Azure.Search.CustomAnalyzer

Çözümleyici türünü belirten bir URI parçası.

charFilters

CharFilterName[]

Belirteç oluşturucu tarafından işlenmeden önce giriş metnini hazırlamak için kullanılan karakter filtrelerinin listesi. Örneğin, belirli karakterleri veya simgeleri değiştirebilirler. Filtreler, listelendikleri sırayla çalıştırılır.

name

string

Çözümleyicinin adı. Yalnızca harf, rakam, boşluk, tire veya alt çizgi içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır.

tokenFilters

TokenFilterName[]

Belirteç oluşturucu tarafından oluşturulan belirteçleri filtrelemek veya değiştirmek için kullanılan belirteç filtrelerinin listesi. Örneğin, tüm karakterleri küçük harfe dönüştüren küçük harfli bir filtre belirtebilirsiniz. Filtreler, listelendikleri sırayla çalıştırılır.

tokenizer

LexicalTokenizerName

Sürekli metni bir tümceyi sözcüklere bölmek gibi bir belirteç dizisine bölmek için kullanılacak belirteç oluşturucunun adı.

DictionaryDecompounderTokenFilter

Birçok Almanca dilinde bulunan bileşik sözcükleri ayrıştırıyor. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır.

Name Tür Varsayılan değer Description
@odata.type string:

#Microsoft.Azure.Search.DictionaryDecompounderTokenFilter

Belirteç filtresinin türünü belirten bir URI parçası.

maxSubwordSize

integer

15

En büyük alt kelime boyutu. Yalnızca bundan kısa alt sözler çıkarılır. Varsayılan değer 15'tir. Maksimum değer 300'dür.

minSubwordSize

integer

2

En küçük alt kelime boyutu. Yalnızca bundan daha uzun alt sözler çıkarılır. Varsayılan değer 2'dir. Maksimum değer 300'dür.

minWordSize

integer

5

En küçük sözcük boyutu. Yalnızca bundan daha uzun sözcükler işlenir. Varsayılan değer 5'tir. Maksimum değer 300'dür.

name

string

Belirteç filtresinin adı. Yalnızca harf, rakam, boşluk, kısa çizgi veya alt çizgi içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır.

onlyLongestMatch

boolean

False

Çıkışa yalnızca en uzun eşleşen alt sözcüğün eklenip eklenmeyeceğini belirten bir değer. Varsayılan değer false’tur.

wordList

string[]

Eşleşecek sözcüklerin listesi.

DistanceScoringFunction

Coğrafi konumdan uzaklığı temel alarak puanları artıran bir işlev tanımlar.

Name Tür Description
boost

number

Ham puan için çarpan. 1,0'a eşit olmayan pozitif bir sayı olmalıdır.

distance

DistanceScoringParameters

Uzaklık puanlama işlevi için parametre değerleri.

fieldName

string

Puanlama işlevinin girişi olarak kullanılan alanın adı.

interpolation

ScoringFunctionInterpolation

Artırmanın belge puanları arasında nasıl ilişkilendirilmiş olacağını gösteren bir değer; varsayılan olarak "Doğrusal" olarak adlandırılır.

type string:

distance

Kullanılacak işlevin türünü gösterir. Geçerli değerler büyüklük, güncellik, uzaklık ve etikettir. İşlev türü küçük harf olmalıdır.

DistanceScoringParameters

Uzaklık puanlama işlevine parametre değerleri sağlar.

Name Tür Description
boostingDistance

number

Artırma aralığının sona erdiği referans konumdan kilometre cinsinden uzaklık.

referencePointParameter

string

Başvuru konumunu belirtmek için arama sorgularında geçirilen parametrenin adı.

EdgeNGramTokenFilter

Giriş belirtecinin önünden veya arkasından başlayarak verilen boyutların n gramını oluşturur. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır.

Name Tür Varsayılan değer Description
@odata.type string:

#Microsoft.Azure.Search.EdgeNGramTokenFilter

Belirteç filtresinin türünü belirten bir URI parçası.

maxGram

integer

2

Maksimum n gram uzunluk. Varsayılan değer 2'dir.

minGram

integer

1

En az n gram uzunluk. Varsayılan değer 1'dir. maxGram değerinden küçük olmalıdır.

name

string

Belirteç filtresinin adı. Yalnızca harf, rakam, boşluk, kısa çizgi veya alt çizgi içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır.

side

EdgeNGramTokenFilterSide

front

N-gram girişin hangi tarafından oluşturulması gerektiğini belirtir. Varsayılan değer "ön"dür.

EdgeNGramTokenFilterSide

Bir n-gram girişin hangi tarafından oluşturulması gerektiğini belirtir.

Name Tür Description
back

string

Girişin arkasından n-gram oluşturulması gerektiğini belirtir.

front

string

Girişin önünden n-gram oluşturulması gerektiğini belirtir.

EdgeNGramTokenFilterV2

Giriş belirtecinin önünden veya arkasından başlayarak verilen boyutların n gramını oluşturur. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır.

Name Tür Varsayılan değer Description
@odata.type string:

#Microsoft.Azure.Search.EdgeNGramTokenFilterV2

Belirteç filtresinin türünü belirten bir URI parçası.

maxGram

integer

2

Maksimum n gram uzunluk. Varsayılan değer 2'dir. Maksimum değer 300'dür.

minGram

integer

1

En az n gram uzunluk. Varsayılan değer 1'dir. Maksimum değer 300'dür. maxGram değerinden küçük olmalıdır.

name

string

Belirteç filtresinin adı. Yalnızca harf, rakam, boşluk, kısa çizgi veya alt çizgi içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır.

side

EdgeNGramTokenFilterSide

front

N-gram girişin hangi tarafından oluşturulması gerektiğini belirtir. Varsayılan değer "ön"dür.

EdgeNGramTokenizer

Bir kenardan gelen girişi verilen boyutların n gramını belirteci haline getirmektedir. Bu belirteç oluşturucu Apache Lucene kullanılarak uygulanır.

Name Tür Varsayılan değer Description
@odata.type string:

#Microsoft.Azure.Search.EdgeNGramTokenizer

Belirteç oluşturucunun türünü belirten bir URI parçası.

maxGram

integer

2

Maksimum n gram uzunluk. Varsayılan değer 2'dir. Maksimum değer 300'dür.

minGram

integer

1

En az n gram uzunluk. Varsayılan değer 1'dir. Maksimum değer 300'dür. maxGram değerinden küçük olmalıdır.

name

string

Belirteç oluşturucunun adı. Yalnızca harf, rakam, boşluk, kısa çizgi veya alt çizgi içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır.

tokenChars

TokenCharacterKind[]

Belirteçlerde tutulacak karakter sınıfları.

ElisionTokenFilter

İknaları kaldırır. Örneğin, "l'avion" (düzlem) "avion" (düzlem) olarak dönüştürülür. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır.

Name Tür Description
@odata.type string:

#Microsoft.Azure.Search.ElisionTokenFilter

Belirteç filtresinin türünü belirten bir URI parçası.

articles

string[]

Kaldırılacak makale kümesi.

name

string

Belirteç filtresinin adı. Yalnızca harf, rakam, boşluk, kısa çizgi veya alt çizgi içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır.

ExhaustiveKnnParameters

Kapsamlı KNN algoritmasına özgü parametreleri içerir.

Name Tür Description
metric

VectorSearchAlgorithmMetric

Vektör karşılaştırmaları için kullanılacak benzerlik ölçümü.

ExhaustiveKnnVectorSearchAlgorithmConfiguration

Sorgulama sırasında kullanılan kapsamlı KNN algoritmasına özgü yapılandırma seçeneklerini içerir ve bu seçenek vektör dizininin tamamında deneme yanılma araması gerçekleştirir.

Name Tür Description
exhaustiveKnnParameters

ExhaustiveKnnParameters

Kapsamlı KNN algoritmasına özgü parametreleri içerir.

kind string:

exhaustiveKnn

Vektör araması ile kullanılmak üzere yapılandırılan algoritma türünün adı.

name

string

Bu özel yapılandırmayla ilişkilendirilecek ad.

FreshnessScoringFunction

Tarih-saat alanının değerine göre puanları artıran bir işlev tanımlar.

Name Tür Description
boost

number

Ham puan için çarpan. 1,0'a eşit olmayan pozitif bir sayı olmalıdır.

fieldName

string

Puanlama işlevinin girişi olarak kullanılan alanın adı.

freshness

FreshnessScoringParameters

Güncellik puanlama işlevi için parametre değerleri.

interpolation

ScoringFunctionInterpolation

Artırmanın belge puanları arasında nasıl ilişkilendirilmiş olacağını gösteren bir değer; varsayılan olarak "Doğrusal" olarak adlandırılır.

type string:

freshness

Kullanılacak işlevin türünü gösterir. Geçerli değerler büyüklük, güncellik, uzaklık ve etikettir. İşlev türü küçük harf olmalıdır.

FreshnessScoringParameters

Bir güncellik puanlama işlevine parametre değerleri sağlar.

Name Tür Description
boostingDuration

string

Belirli bir belge için yükseltmenin durdurulacağı süre sonu.

HnswParameters

HNSW algoritmasına özgü parametreleri içerir.

Name Tür Varsayılan değer Description
efConstruction

integer

400

Dizin zamanında kullanılan en yakın komşuları içeren dinamik listenin boyutu. Bu parametrenin artırılması dizin kalitesini artırarak dizin oluşturma süresinin artmasına neden olabilir. Belirli bir noktada bu parametrenin artırılması, dönüşlerin azalmasına neden olur.

efSearch

integer

500

Arama sırasında kullanılan en yakın komşuları içeren dinamik listenin boyutu. Bu parametrenin artırılması, daha yavaş arama yapmak için arama sonuçlarını iyileştirebilir. Belirli bir noktada bu parametrenin artırılması, dönüşlerin azalmasına neden olur.

m

integer

4

İnşaat sırasında her yeni eleman için oluşturulan çift yönlü bağlantıların sayısı. Bu parametre değerinin artırılması, bellek tüketiminin artması ve dizin oluşturma süresinin daha uzun sürmesi karşılığında yüksek iç boyutluluk düzeyine sahip veri kümelerinde geri çağırma ve alma sürelerini kısaltabilir.

metric

VectorSearchAlgorithmMetric

Vektör karşılaştırmaları için kullanılacak benzerlik ölçümü.

HnswVectorSearchAlgorithmConfiguration

Dizin oluşturma ve sorgulama sırasında kullanılan HNSW yaklaşık en yakın komşular algoritmasına özgü yapılandırma seçeneklerini içerir. HNSW algoritması, arama hızı ve doğruluk arasında ayarlanabilir bir denge sağlar.

Name Tür Description
hnswParameters

HnswParameters

HNSW algoritmasına özgü parametreleri içerir.

kind string:

hnsw

Vektör araması ile kullanılmak üzere yapılandırılan algoritma türünün adı.

name

string

Bu özel yapılandırmayla ilişkilendirilecek ad.

KeepTokenFilter

Yalnızca belirtilen sözcükler listesinde bulunan metinle belirteçleri tutan belirteç filtresi. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır.

Name Tür Varsayılan değer Description
@odata.type string:

#Microsoft.Azure.Search.KeepTokenFilter

Belirteç filtresinin türünü belirten bir URI parçası.

keepWords

string[]

Tutulacak sözcüklerin listesi.

keepWordsCase

boolean

False

Önce tüm sözcüklerin küçük harfle yazılıp küçük harfe yazılmayacağını belirten değer. Varsayılan değer false’tur.

name

string

Belirteç filtresinin adı. Yalnızca harf, rakam, boşluk, kısa çizgi veya alt çizgi içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır.

KeywordMarkerTokenFilter

Terimleri anahtar sözcük olarak işaretler. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır.

Name Tür Varsayılan değer Description
@odata.type string:

#Microsoft.Azure.Search.KeywordMarkerTokenFilter

Belirteç filtresinin türünü belirten bir URI parçası.

ignoreCase

boolean

False

Büyük/küçük harf yoksayılıp yoksayılmayacağını belirten bir değer. True ise, önce tüm sözcükler küçük harfe dönüştürülür. Varsayılan değer false’tur.

keywords

string[]

Anahtar sözcük olarak işaretlenecek sözcüklerin listesi.

name

string

Belirteç filtresinin adı. Yalnızca harf, rakam, boşluk, kısa çizgi veya alt çizgi içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır.

KeywordTokenizer

Girişin tamamını tek bir belirteç olarak yayar. Bu belirteç oluşturucu Apache Lucene kullanılarak uygulanır.

Name Tür Varsayılan değer Description
@odata.type string:

#Microsoft.Azure.Search.KeywordTokenizer

Belirteç oluşturucunun türünü belirten bir URI parçası.

bufferSize

integer

256

Bayt cinsinden okuma arabelleği boyutu. Varsayılan değer 256'dır.

name

string

Belirteç oluşturucunun adı. Yalnızca harf, rakam, boşluk, kısa çizgi veya alt çizgi içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır.

KeywordTokenizerV2

Girişin tamamını tek bir belirteç olarak yayar. Bu belirteç oluşturucu Apache Lucene kullanılarak uygulanır.

Name Tür Varsayılan değer Description
@odata.type string:

#Microsoft.Azure.Search.KeywordTokenizerV2

Belirteç oluşturucunun türünü belirten bir URI parçası.

maxTokenLength

integer

256

En fazla belirteç uzunluğu. Varsayılan değer 256'dır. Uzunluk üst sınırından daha uzun olan belirteçler bölünür. Kullanılabilecek en fazla belirteç uzunluğu 300 karakterdir.

name

string

Belirteç oluşturucunun adı. Yalnızca harf, rakam, boşluk, kısa çizgi veya alt çizgi içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır.

LengthTokenFilter

Çok uzun veya çok kısa sözcükleri kaldırır. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır.

Name Tür Varsayılan değer Description
@odata.type string:

#Microsoft.Azure.Search.LengthTokenFilter

Belirteç filtresinin türünü belirten bir URI parçası.

max

integer

300

Karakter cinsinden uzunluk üst sınırı. Varsayılan ve maksimum değer 300'dür.

min

integer

0

Karakter cinsinden en küçük uzunluk. Varsayılan değer 0'dır. Maksimum değer 300'dür. Maksimum değerinden küçük olmalıdır.

name

string

Belirteç filtresinin adı. Yalnızca harf, rakam, boşluk, kısa çizgi veya alt çizgi içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır.

LexicalAnalyzerName

Arama altyapısı tarafından desteklenen tüm metin çözümleyicilerinin adlarını tanımlar.

Name Tür Description
ar.lucene

string

Arapça için Lucene çözümleyicisi.

ar.microsoft

string

Arapça için Microsoft çözümleyicisi.

bg.lucene

string

Bulgarca için Lucene çözümleyicisi.

bg.microsoft

string

Bulgarca için Microsoft çözümleyicisi.

bn.microsoft

string

Bangla için Microsoft çözümleyicisi.

ca.lucene

string

Catalan için Lucene çözümleyicisi.

ca.microsoft

string

Katalan için Microsoft çözümleyicisi.

cs.lucene

string

Çekçe için Lucene analizörü.

cs.microsoft

string

Çekçe için Microsoft çözümleyicisi.

da.lucene

string

Danca için Lucene çözümleyicisi.

da.microsoft

string

Danca için Microsoft çözümleyicisi.

de.lucene

string

Almanca için Lucene çözümleyicisi.

de.microsoft

string

Almanca için Microsoft çözümleyicisi.

el.lucene

string

Yunanca için Lucene çözümleyicisi.

el.microsoft

string

Yunanca için Microsoft çözümleyicisi.

en.lucene

string

İngilizce için Lucene çözümleyicisi.

en.microsoft

string

İngilizce için Microsoft çözümleyicisi.

es.lucene

string

İspanyolca için Lucene çözümleyicisi.

es.microsoft

string

İspanyolca için Microsoft çözümleyicisi.

et.microsoft

string

Estonca için Microsoft çözümleyicisi.

eu.lucene

string

Bask dili için Lucene çözümleyicisi.

fa.lucene

string

Farsça için Lucene analizörü.

fi.lucene

string

Fince için Lucene çözümleyicisi.

fi.microsoft

string

Fince için Microsoft çözümleyicisi.

fr.lucene

string

Fransızca için Lucene çözümleyicisi.

fr.microsoft

string

Fransızca için Microsoft çözümleyicisi.

ga.lucene

string

lucene çözümleyicisi İrlandalı.

gl.lucene

string

Galiçyalı için Lucene analizörü.

gu.microsoft

string

Gujarati için Microsoft Çözümleyicisi.

he.microsoft

string

İbranice için Microsoft çözümleyicisi.

hi.lucene

string

Hintçe için Lucene çözümleyicisi.

hi.microsoft

string

Hintçe için Microsoft çözümleyicisi.

hr.microsoft

string

Hırvat dili için Microsoft çözümleyicisi.

hu.lucene

string

Macarca için Lucene çözümleyicisi.

hu.microsoft

string

Macarca için Microsoft çözümleyicisi.

hy.lucene

string

Ermeniler için Lucene analizörü.

id.lucene

string

Endonezya dili için Lucene çözümleyicisi.

id.microsoft

string

Endonezya dili (Bahasa) için Microsoft çözümleyicisi.

is.microsoft

string

İzlanda dili için Microsoft çözümleyicisi.

it.lucene

string

İtalyanca için Lucene çözümleyicisi.

it.microsoft

string

İtalyanca için Microsoft çözümleyicisi.

ja.lucene

string

Japonca için Lucene çözümleyicisi.

ja.microsoft

string

Japonca için Microsoft çözümleyicisi.

keyword

string

Bir alanın içeriğinin tamamını tek bir belirteç olarak ele alır. Bu, posta kodları, kimlikler ve bazı ürün adları gibi veriler için kullanışlıdır. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/KeywordAnalyzer.html

kn.microsoft

string

Kannada için Microsoft çözümleyicisi.

ko.lucene

string

Korece için Lucene çözümleyicisi.

ko.microsoft

string

Korece için Microsoft çözümleyicisi.

lt.microsoft

string

Litvanca için Microsoft çözümleyicisi.

lv.lucene

string

Letonca için Lucene çözümleyicisi.

lv.microsoft

string

Letonca için Microsoft çözümleyicisi.

ml.microsoft

string

Malayalam için Microsoft çözümleyicisi.

mr.microsoft

string

Marathi için Microsoft çözümleyicisi.

ms.microsoft

string

Malay dili (Latin) için Microsoft çözümleyicisi.

nb.microsoft

string

Norveççe (Bokmål) için Microsoft analyzer.

nl.lucene

string

Felemenkçe için Lucene çözümleyicisi.

nl.microsoft

string

Felemenkçe için Microsoft çözümleyicisi.

no.lucene

string

Norveçli lucene çözümleyicisi.

pa.microsoft

string

Punjabi için Microsoft çözümleyicisi.

pattern

string

Normal ifade deseni aracılığıyla metni terimlere esnek bir şekilde ayırır. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/PatternAnalyzer.html

pl.lucene

string

Lehçe için Lucene çözümleyicisi.

pl.microsoft

string

Lehçe için Microsoft çözümleyicisi.

pt-BR.lucene

string

Portekizce (Brezilya) için Lucene çözümleyicisi.

pt-BR.microsoft

string

Portekizce (Brezilya) için Microsoft çözümleyicisi.

pt-PT.lucene

string

Portekizce (Portekiz) için Lucene çözümleyicisi.

pt-PT.microsoft

string

Portekizce (Portekiz) için Microsoft çözümleyicisi.

ro.lucene

string

Rumence için Lucene analizörü.

ro.microsoft

string

Rumence için Microsoft çözümleyicisi.

ru.lucene

string

Rus için Lucene analizörü.

ru.microsoft

string

Rusça için Microsoft çözümleyicisi.

simple

string

Metni harf olmayana böler ve küçük harfe dönüştürür. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/SimpleAnalyzer.html

sk.microsoft

string

Slovakça için Microsoft çözümleyicisi.

sl.microsoft

string

Slovence için Microsoft çözümleyicisi.

sr-cyrillic.microsoft

string

Sırp (Kiril) için Microsoft analyzer.

sr-latin.microsoft

string

Sırp dili (Latin) için Microsoft çözümleyicisi.

standard.lucene

string

Standart Lucene çözümleyicisi.

standardasciifolding.lucene

string

Standart ASCII Katlama Lucene çözümleyicisi. Bkz. https://docs.microsoft.com/rest/api/searchservice/Custom-analyzers-in-Azure-Search#Analyzers

stop

string

Metni harf olmayana böler; Küçük harf ve stopword belirteç filtrelerini uygular. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/StopAnalyzer.html

sv.lucene

string

İsveççe için Lucene çözümleyicisi.

sv.microsoft

string

İsveççe için Microsoft çözümleyicisi.

ta.microsoft

string

Tamil için Microsoft Çözümleyicisi.

te.microsoft

string

Telugu için Microsoft çözümleyicisi.

th.lucene

string

Tay dili için Lucene çözümleyicisi.

th.microsoft

string

Tay dili için Microsoft çözümleyicisi.

tr.lucene

string

Türkçe için Lucene çözümleyicisi.

tr.microsoft

string

Türkçe için Microsoft çözümleyicisi.

uk.microsoft

string

Ukrayna dili için Microsoft çözümleyicisi.

ur.microsoft

string

Urduca için Microsoft çözümleyicisi.

vi.microsoft

string

Vietnam dili için Microsoft çözümleyicisi.

whitespace

string

Boşluk belirteci kullanan bir çözümleyici. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/WhitespaceAnalyzer.html

zh-Hans.lucene

string

Çince (Basitleştirilmiş) için Lucene çözümleyicisi.

zh-Hans.microsoft

string

Çince (Basitleştirilmiş) için Microsoft çözümleyicisi.

zh-Hant.lucene

string

Çince (Geleneksel) için Lucene çözümleyicisi.

zh-Hant.microsoft

string

Çince (Geleneksel) için Microsoft çözümleyicisi.

LexicalTokenizerName

Arama altyapısı tarafından desteklenen tüm belirteç oluşturucuların adlarını tanımlar.

Name Tür Description
classic

string

Çoğu Avrupa dili belgesini işlemek için uygun olan dil bilgisi tabanlı belirteç oluşturucu. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/standard/ClassicTokenizer.html

edgeNGram

string

Bir kenardan gelen girişi verilen boyutların n gramını belirteci haline getirmektedir. Bkz. https://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/ngram/EdgeNGramTokenizer.html

keyword_v2

string

Girişin tamamını tek bir belirteç olarak yayar. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/KeywordTokenizer.html

letter

string

Metni harf olmayanlara böler. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/LetterTokenizer.html

lowercase

string

Metni harf olmayana böler ve küçük harfe dönüştürür. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/LowerCaseTokenizer.html

microsoft_language_stemming_tokenizer

string

Dile özgü kuralları kullanarak metni böler ve sözcükleri temel formlarına küçültür.

microsoft_language_tokenizer

string

Dile özgü kuralları kullanarak metni böler.

nGram

string

Girişi verilen boyutların n gramını belirteci haline getirmektedir. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/ngram/NGramTokenizer.html

path_hierarchy_v2

string

Yol benzeri hiyerarşiler için belirteç oluşturucu. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/path/PathHierarchyTokenizer.html

pattern

string

Farklı belirteçler oluşturmak için regex desen eşleştirmesi kullanan belirteç oluşturucu. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/pattern/PatternTokenizer.html

standard_v2

string

Standart Lucene çözümleyicisi; Standart belirteç oluşturucu, küçük harfli filtre ve durdurma filtresinden oluşur. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/standard/StandardTokenizer.html

uax_url_email

string

URL'leri ve e-postaları tek bir belirteç olarak belirteç haline alır. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/standard/UAX29URLEmailTokenizer.html

whitespace

string

Metni boşlukta böler. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/WhitespaceTokenizer.html

LimitTokenFilter

Dizin oluşturma sırasında belirteç sayısını sınırlar. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır.

Name Tür Varsayılan değer Description
@odata.type string:

#Microsoft.Azure.Search.LimitTokenFilter

Belirteç filtresinin türünü belirten bir URI parçası.

consumeAllTokens

boolean

False

maxTokenCount değerine ulaşılsa bile girişten gelen tüm belirteçlerin tüketilip tüketilmeyeceğini belirten bir değer. Varsayılan değer false’tur.

maxTokenCount

integer

1

Üretilmesi gereken en fazla belirteç sayısı. Varsayılan değer 1'dir.

name

string

Belirteç filtresinin adı. Yalnızca harf, rakam, boşluk, kısa çizgi veya alt çizgi içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır.

LuceneStandardAnalyzer

Standart Apache Lucene çözümleyicisi; Standart belirteç oluşturucu, küçük harfli filtre ve durdurma filtresinden oluşur.

Name Tür Varsayılan değer Description
@odata.type string:

#Microsoft.Azure.Search.StandardAnalyzer

Çözümleyici türünü belirten bir URI parçası.

maxTokenLength

integer

255

En fazla belirteç uzunluğu. Varsayılan değer 255'tir. Uzunluk üst sınırından daha uzun olan belirteçler bölünür. Kullanılabilecek en fazla belirteç uzunluğu 300 karakterdir.

name

string

Çözümleyicinin adı. Yalnızca harf, rakam, boşluk, tire veya alt çizgi içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır.

stopwords

string[]

Stopwords listesi.

LuceneStandardTokenizer

Unicode Metin Kesimleme kurallarını izleyerek metni keser. Bu belirteç oluşturucu Apache Lucene kullanılarak uygulanır.

Name Tür Varsayılan değer Description
@odata.type string:

#Microsoft.Azure.Search.StandardTokenizer

Belirteç oluşturucunun türünü belirten bir URI parçası.

maxTokenLength

integer

255

En fazla belirteç uzunluğu. Varsayılan değer 255'tir. Uzunluk üst sınırından daha uzun olan belirteçler bölünür.

name

string

Belirteç oluşturucunun adı. Yalnızca harf, rakam, boşluk, kısa çizgi veya alt çizgi içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır.

LuceneStandardTokenizerV2

Unicode Metin Kesimleme kurallarını izleyerek metni keser. Bu belirteç oluşturucu Apache Lucene kullanılarak uygulanır.

Name Tür Varsayılan değer Description
@odata.type string:

#Microsoft.Azure.Search.StandardTokenizerV2

Belirteç oluşturucunun türünü belirten bir URI parçası.

maxTokenLength

integer

255

En fazla belirteç uzunluğu. Varsayılan değer 255'tir. Uzunluk üst sınırından daha uzun olan belirteçler bölünür. Kullanılabilecek en fazla belirteç uzunluğu 300 karakterdir.

name

string

Belirteç oluşturucunun adı. Yalnızca harf, rakam, boşluk, kısa çizgi veya alt çizgi içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır.

MagnitudeScoringFunction

Sayısal alanın büyüklüğüne göre puanları artıran bir işlev tanımlar.

Name Tür Description
boost

number

Ham puan için çarpan. 1,0'a eşit olmayan pozitif bir sayı olmalıdır.

fieldName

string

Puanlama işlevinin girişi olarak kullanılan alanın adı.

interpolation

ScoringFunctionInterpolation

Artırmanın belge puanları arasında nasıl ilişkilendirilmiş olacağını gösteren bir değer; varsayılan olarak "Doğrusal" olarak adlandırılır.

magnitude

MagnitudeScoringParameters

Büyük puanlama işlevinin parametre değerleri.

type string:

magnitude

Kullanılacak işlevin türünü gösterir. Geçerli değerler büyüklük, güncellik, uzaklık ve etikettir. İşlev türü küçük harf olmalıdır.

MagnitudeScoringParameters

Bir büyüklük puanlama işlevine parametre değerleri sağlar.

Name Tür Description
boostingRangeEnd

number

Artırmanın sona erdiği alan değeri.

boostingRangeStart

number

Artırmanın başladığı alan değeri.

constantBoostBeyondRange

boolean

Aralık bitiş değerinin ötesindeki alan değerleri için sabit artırma uygulanıp uygulanmayacağını belirten değer; varsayılan değer false'tur.

MappingCharFilter

Eşlemeler seçeneğiyle tanımlanan eşlemeleri uygulayan bir karakter filtresi. Eşleştirme doyumsuzdur (belirli bir noktadaki en uzun desen eşleştirmesi kazanır). Değiştirmenin boş dize olması için izin verilir. Bu karakter filtresi Apache Lucene kullanılarak uygulanır.

Name Tür Description
@odata.type string:

#Microsoft.Azure.Search.MappingCharFilter

Karakter filtresinin türünü belirten bir URI parçası.

mappings

string[]

Şu biçimdeki eşlemelerin listesi: "a=>b" ("a" karakterinin tüm oluşumları "b" karakteriyle değiştirilir).

name

string

Karakter filtresinin adı. Yalnızca harf, rakam, boşluk, tire veya alt çizgi içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır.

MicrosoftLanguageStemmingTokenizer

Dile özgü kuralları kullanarak metni böler ve sözcükleri temel formlarına küçültür.

Name Tür Varsayılan değer Description
@odata.type string:

#Microsoft.Azure.Search.MicrosoftLanguageStemmingTokenizer

Belirteç oluşturucunun türünü belirten bir URI parçası.

isSearchTokenizer

boolean

False

Belirteç oluşturucunun nasıl kullanıldığını gösteren bir değer. Arama belirteci olarak kullanılırsa true olarak, dizin belirteç oluşturucu olarak kullanılırsa false olarak ayarlayın. Varsayılan değer false’tur.

language

MicrosoftStemmingTokenizerLanguage

Kullanılacak dil. Varsayılan değer İngilizce'dir.

maxTokenLength

integer

255

En fazla belirteç uzunluğu. Uzunluk üst sınırından daha uzun olan belirteçler bölünür. Kullanılabilecek en fazla belirteç uzunluğu 300 karakterdir. 300 karakterden uzun belirteçler önce 300 uzunluğundaki belirteçlere bölünür ve ardından bu belirteçlerin her biri ayarlanan maksimum belirteç uzunluğuna göre bölünür. Varsayılan değer 255'tir.

name

string

Belirteç oluşturucunun adı. Yalnızca harf, rakam, boşluk, kısa çizgi veya alt çizgi içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır.

MicrosoftLanguageTokenizer

Dile özgü kuralları kullanarak metni böler.

Name Tür Varsayılan değer Description
@odata.type string:

#Microsoft.Azure.Search.MicrosoftLanguageTokenizer

Belirteç oluşturucunun türünü belirten bir URI parçası.

isSearchTokenizer

boolean

False

Belirteç oluşturucunun nasıl kullanıldığını gösteren bir değer. Arama belirteci olarak kullanılırsa true olarak, dizin belirteç oluşturucu olarak kullanılırsa false olarak ayarlayın. Varsayılan değer false’tur.

language

MicrosoftTokenizerLanguage

Kullanılacak dil. Varsayılan değer İngilizce'dir.

maxTokenLength

integer

255

En fazla belirteç uzunluğu. Uzunluk üst sınırından daha uzun olan belirteçler bölünür. Kullanılabilecek en fazla belirteç uzunluğu 300 karakterdir. 300 karakterden uzun belirteçler önce 300 uzunluğundaki belirteçlere bölünür ve ardından bu belirteçlerin her biri ayarlanan maksimum belirteç uzunluğuna göre bölünür. Varsayılan değer 255'tir.

name

string

Belirteç oluşturucunun adı. Yalnızca harf, rakam, boşluk, kısa çizgi veya alt çizgi içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır.

MicrosoftStemmingTokenizerLanguage

Microsoft dil saplama belirteci tarafından desteklenen dilleri Listeler.

Name Tür Description
arabic

string

Arapça için Microsoft stemming tokenizer'ı seçer.

bangla

string

Bangla için Microsoft stemming tokenizer'ı seçer.

bulgarian

string

Bulgarca için Microsoft stemming tokenizer'ı seçer.

catalan

string

Katala dili için Microsoft stemming tokenizer'ı seçer.

croatian

string

Hırvat dili için Microsoft stemming tokenizer'ı seçer.

czech

string

Çekçe için Microsoft stemming tokenizer'ı seçer.

danish

string

Danca için Microsoft stemming tokenizer'ı seçer.

dutch

string

Felemenkçe için Microsoft stemming tokenizer'ı seçer.

english

string

İngilizce için Microsoft stemming tokenizer'ı seçer.

estonian

string

Estonca için Microsoft stemming tokenizer'ı seçer.

finnish

string

Fince için Microsoft stemming tokenizer'ı seçer.

french

string

Fransızca için Microsoft stemming tokenizer'ı seçer.

german

string

Almanca için Microsoft stemming tokenizer'ı seçer.

greek

string

Yunanca için Microsoft stemming tokenizer'ı seçer.

gujarati

string

Gujarati için Microsoft stemming tokenizer'ı seçer.

hebrew

string

İbranice için Microsoft stemming tokenizer'ı seçer.

hindi

string

Hintçe için Microsoft stemming tokenizer'ı seçer.

hungarian

string

Macarca için Microsoft stemming tokenizer'ı seçer.

icelandic

string

İzlanda dili için Microsoft stemming tokenizer'ı seçer.

indonesian

string

Endonezya dili için Microsoft stemming tokenizer'ı seçer.

italian

string

İtalyanca için Microsoft stemming tokenizer'ı seçer.

kannada

string

Kannada için Microsoft stemming tokenizer'ı seçer.

latvian

string

Letonca için Microsoft stemming tokenizer'ı seçer.

lithuanian

string

Litvanca için Microsoft stemming tokenizer'ı seçer.

malay

string

Malay dili için Microsoft stemming tokenizer'ı seçer.

malayalam

string

Malayalam için Microsoft stemming tokenizer'ı seçer.

marathi

string

Marathi için Microsoft stemming tokenizer'ı seçer.

norwegianBokmaal

string

Norveççe (Bokmål) için Microsoft stemming tokenizer'ı seçer.

polish

string

Lehçe için Microsoft stemming tokenizer'ı seçer.

portuguese

string

Portekizce için Microsoft stemming tokenizer'ı seçer.

portugueseBrazilian

string

Portekizce (Brezilya) için Microsoft stemming tokenizer'ı seçer.

punjabi

string

Punjabi için Microsoft stemming tokenizer'ı seçer.

romanian

string

Rumence için Microsoft stemming tokenizer'ı seçer.

russian

string

Rusça için Microsoft stemming tokenizer'ı seçer.

serbianCyrillic

string

Sırp (Kiril) için Microsoft stemming tokenizer'ı seçer.

serbianLatin

string

Sırplık (Latin) için Microsoft stemming tokenizer'ı seçer.

slovak

string

Slovakça için Microsoft stemming tokenizer'ı seçer.

slovenian

string

Slovence için Microsoft stemming tokenizer'ı seçer.

spanish

string

İspanyolca için Microsoft stemming tokenizer'ı seçer.

swedish

string

İsveççe için Microsoft stemming tokenizer'ı seçer.

tamil

string

Tamil için Microsoft stemming tokenizer'ı seçer.

telugu

string

Telugu için Microsoft stemming tokenizer'ı seçer.

turkish

string

Türkçe için Microsoft stemming tokenizer'ı seçer.

ukrainian

string

Ukrayna dili için Microsoft stemming tokenizer'ı seçer.

urdu

string

Urduca için Microsoft stemming tokenizer'ı seçer.

MicrosoftTokenizerLanguage

Microsoft dil belirteci tarafından desteklenen dilleri Listeler.

Name Tür Description
bangla

string

Bangla için Microsoft belirteç oluşturucuyu seçer.

bulgarian

string

Bulgarca için Microsoft belirteç oluşturucuyu seçer.

catalan

string

Katala dili için Microsoft belirteç oluşturucuyu seçer.

chineseSimplified

string

Çince (Basitleştirilmiş) için Microsoft belirteç oluşturucuyu seçer.

chineseTraditional

string

Çince (Geleneksel) için Microsoft belirteç oluşturucuyu seçer.

croatian

string

Hırvat dili için Microsoft belirteç oluşturucuyu seçer.

czech

string

Çekçe için Microsoft belirteç oluşturucuyu seçer.

danish

string

Danca için Microsoft belirteç oluşturucuyu seçer.

dutch

string

Felemenkçe için Microsoft belirteç oluşturucuyu seçer.

english

string

İngilizce için Microsoft belirteç oluşturucuyu seçer.

french

string

Fransızca için Microsoft belirteç oluşturucuyu seçer.

german

string

Almanca için Microsoft belirteç oluşturucuyu seçer.

greek

string

Yunanca için Microsoft belirteç oluşturucuyu seçer.

gujarati

string

Gujarati için Microsoft belirteç oluşturucuyu seçer.

hindi

string

Hintçe için Microsoft belirteç oluşturucuyu seçer.

icelandic

string

İzlanda dili için Microsoft belirteç oluşturucuyu seçer.

indonesian

string

Endonezya dili için Microsoft belirteç oluşturucuyu seçer.

italian

string

İtalyanca için Microsoft belirteç oluşturucuyu seçer.

japanese

string

Japonca için Microsoft belirteç oluşturucuyu seçer.

kannada

string

Kannada için Microsoft belirteç oluşturucuyu seçer.

korean

string

Korece için Microsoft belirteç oluşturucuyu seçer.

malay

string

Malay dili için Microsoft belirteç oluşturucuyu seçer.

malayalam

string

Malayalam için Microsoft belirteç oluşturucuyu seçer.

marathi

string

Marathi için Microsoft belirteç oluşturucuyu seçer.

norwegianBokmaal

string

Norveççe (Bokmål) için Microsoft belirteç oluşturucuyu seçer.

polish

string

Lehçe için Microsoft belirteç oluşturucuyu seçer.

portuguese

string

Portekizce için Microsoft belirteç oluşturucuyu seçer.

portugueseBrazilian

string

Portekizce (Brezilya) için Microsoft belirteç oluşturucuyu seçer.

punjabi

string

Punjabi için Microsoft belirteç oluşturucuyu seçer.

romanian

string

Rumence için Microsoft belirteç oluşturucuyu seçer.

russian

string

Rusça için Microsoft belirteç oluşturucuyu seçer.

serbianCyrillic

string

Sırp (Kiril) için Microsoft belirteç oluşturucuyu seçer.

serbianLatin

string

Sırplık (Latin) için Microsoft belirteç oluşturucuyu seçer.

slovenian

string

Slovence için Microsoft belirteç oluşturucuyu seçer.

spanish

string

İspanyolca için Microsoft belirteç oluşturucuyu seçer.

swedish

string

İsveççe için Microsoft belirteç oluşturucuyu seçer.

tamil

string

Tamil için Microsoft belirteç oluşturucuyu seçer.

telugu

string

Telugu için Microsoft belirteç oluşturucuyu seçer.

thai

string

Tay dili için Microsoft belirteç oluşturucuyu seçer.

ukrainian

string

Ukrayna dili için Microsoft belirteç oluşturucuyu seçer.

urdu

string

Urduca için Microsoft belirteç oluşturucuyu seçer.

vietnamese

string

Vietnam dili için Microsoft belirteç oluşturucuyu seçer.

NGramTokenFilter

Verilen boyutların n gramını oluşturur. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır.

Name Tür Varsayılan değer Description
@odata.type string:

#Microsoft.Azure.Search.NGramTokenFilter

Belirteç filtresinin türünü belirten bir URI parçası.

maxGram

integer

2

Maksimum n gram uzunluk. Varsayılan değer 2'dir.

minGram

integer

1

En az n gram uzunluk. Varsayılan değer 1'dir. maxGram değerinden küçük olmalıdır.

name

string

Belirteç filtresinin adı. Yalnızca harf, rakam, boşluk, kısa çizgi veya alt çizgi içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır.

NGramTokenFilterV2

Verilen boyutların n gramını oluşturur. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır.

Name Tür Varsayılan değer Description
@odata.type string:

#Microsoft.Azure.Search.NGramTokenFilterV2

Belirteç filtresinin türünü belirten bir URI parçası.

maxGram

integer

2

Maksimum n gram uzunluk. Varsayılan değer 2'dir. Maksimum değer 300'dür.

minGram

integer

1

En az n gram uzunluk. Varsayılan değer 1'dir. Maksimum değer 300'dür. maxGram değerinden küçük olmalıdır.

name

string

Belirteç filtresinin adı. Yalnızca harf, rakam, boşluk, kısa çizgi veya alt çizgi içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır.

NGramTokenizer

Girişi verilen boyutların n gramı olarak belirteci haline getirmektedir. Bu belirteç oluşturucu Apache Lucene kullanılarak uygulanır.

Name Tür Varsayılan değer Description
@odata.type string:

#Microsoft.Azure.Search.NGramTokenizer

Belirteç oluşturucunun türünü belirten bir URI parçası.

maxGram

integer

2

Maksimum n gram uzunluk. Varsayılan değer 2'dir. Maksimum değer 300'dür.

minGram

integer

1

En az n gram uzunluk. Varsayılan değer 1'dir. Maksimum değer 300'dür. maxGram değerinden küçük olmalıdır.

name

string

Belirteç oluşturucunun adı. Yalnızca harf, rakam, boşluk, kısa çizgi veya alt çizgi içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır.

tokenChars

TokenCharacterKind[]

Belirteçlerde tutulacak karakter sınıfları.

PathHierarchyTokenizerV2

Yol benzeri hiyerarşiler için belirteç oluşturucu. Bu belirteç oluşturucu Apache Lucene kullanılarak uygulanır.

Name Tür Varsayılan değer Description
@odata.type string:

#Microsoft.Azure.Search.PathHierarchyTokenizerV2

Belirteç oluşturucunun türünü belirten bir URI parçası.

delimiter

string

/

Kullanılacak sınırlayıcı karakteri. Varsayılan değer "/" şeklindedir.

maxTokenLength

integer

300

En fazla belirteç uzunluğu. Varsayılan ve maksimum değer 300'dür.

name

string

Belirteç oluşturucunun adı. Yalnızca harf, rakam, boşluk, kısa çizgi veya alt çizgi içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır.

replacement

string

/

Ayarlanırsa sınırlayıcı karakterinin yerini alan bir değer. Varsayılan değer "/" şeklindedir.

reverse

boolean

False

Belirteçlerin ters sırada oluşturulup oluşturulmayacağını belirten bir değer. Varsayılan değer false’tur.

skip

integer

0

Atlana ilk belirteçlerin sayısı. Varsayılan değer 0'dır.

PatternAnalyzer

Normal ifade deseni aracılığıyla metni terimlere esnek bir şekilde ayırır. Bu çözümleyici Apache Lucene kullanılarak uygulanır.

Name Tür Varsayılan değer Description
@odata.type string:

#Microsoft.Azure.Search.PatternAnalyzer

Çözümleyici türünü belirten bir URI parçası.

flags

RegexFlags

Normal ifade bayrakları.

lowercase

boolean

True

Terimlerin küçük harfle yazılması gerekip gerekmediğini gösteren değer. Varsayılan değer doğru değeridir.

name

string

Çözümleyicinin adı. Yalnızca harf, rakam, boşluk, tire veya alt çizgi içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır.

pattern

string

\W+

Belirteç ayırıcılarını eşleştirmek için normal ifade deseni. Varsayılan, bir veya daha fazla sözcük olmayan karakterle eşleşen bir ifadedir.

stopwords

string[]

Stopwords listesi.

PatternCaptureTokenFilter

Bir veya daha fazla desendeki her yakalama grubu için bir tane olmak üzere birden çok belirteç yaymak için Java regexes kullanır. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır.

Name Tür Varsayılan değer Description
@odata.type string:

#Microsoft.Azure.Search.PatternCaptureTokenFilter

Belirteç filtresinin türünü belirten bir URI parçası.

name

string

Belirteç filtresinin adı. Yalnızca harf, rakam, boşluk, kısa çizgi veya alt çizgi içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır.

patterns

string[]

Her belirteçle eşleşecek desenlerin listesi.

preserveOriginal

boolean

True

Desenlerden biri eşleşse bile özgün belirtecin döndürülip döndürülmeyeceğini belirten bir değer. Varsayılan değer doğru değeridir.

PatternReplaceCharFilter

Giriş dizesindeki karakterlerin yerini alan bir karakter filtresi. Korunacak karakter dizilerini tanımlamak için normal bir ifade ve değiştirilecek karakterleri tanımlamak için bir değiştirme deseni kullanır. Örneğin, "aa bb aa bb", "(aa)\s+(bb)" deseni ve "$1#$2" yerine "aa#bb aa#bb" giriş metni verilmelidir. Bu karakter filtresi Apache Lucene kullanılarak uygulanır.

Name Tür Description
@odata.type string:

#Microsoft.Azure.Search.PatternReplaceCharFilter

Karakter filtresinin türünü belirten bir URI parçası.

name

string

Karakter filtresinin adı. Yalnızca harf, rakam, boşluk, tire veya alt çizgi içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır.

pattern

string

Normal ifade deseni.

replacement

string

Değiştirme metni.

PatternReplaceTokenFilter

Giriş dizesindeki karakterlerin yerini alan karakter filtresi. Korunacak karakter dizilerini tanımlamak için normal bir ifade ve değiştirilecek karakterleri tanımlamak için bir değiştirme düzeni kullanır. Örneğin, "aa bb aa bb" giriş metni, "(aa)\s+(bb)" deseni ve "$1#$2" yerine "aa#bb aa#bb" sonucu elde edilebilir. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır.

Name Tür Description
@odata.type string:

#Microsoft.Azure.Search.PatternReplaceTokenFilter

Belirteç filtresinin türünü belirten bir URI parçası.

name

string

Belirteç filtresinin adı. Yalnızca harf, rakam, boşluk, kısa çizgi veya alt çizgi içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır.

pattern

string

Normal bir ifade deseni.

replacement

string

Yeni metin.

PatternTokenizer

Farklı belirteçler oluşturmak için regex desen eşleştirmesi kullanan belirteç oluşturucu. Bu belirteç oluşturucu Apache Lucene kullanılarak uygulanır.

Name Tür Varsayılan değer Description
@odata.type string:

#Microsoft.Azure.Search.PatternTokenizer

Belirteç oluşturucunun türünü belirten bir URI parçası.

flags

RegexFlags

Normal ifade bayrakları.

group

integer

-1

Belirteçlere ayıklamak için normal ifade desenindeki eşleşen grubun sıfır tabanlı sıralı düzeni. Eşleşen gruplara bakılmadan girişi belirteçlere bölmek için tüm düzeni kullanmak istiyorsanız -1 kullanın. Varsayılan değer -1'dir.

name

string

Belirteç oluşturucunun adı. Yalnızca harf, rakam, boşluk, kısa çizgi veya alt çizgi içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır.

pattern

string

\W+

Belirteç ayırıcılarını eşleştirmek için normal bir ifade deseni. Varsayılan, bir veya daha fazla sözcük olmayan karakterle eşleşen bir ifadedir.

PhoneticEncoder

PhoneticTokenFilter ile kullanılacak fonetik kodlayıcı türünü tanımlar.

Name Tür Description
beiderMorse

string

Belirteci Beider-Morse bir değere kodlar.

caverphone1

string

Bir belirteci Caverphone 1.0 değerine kodlar.

caverphone2

string

Bir belirteci Caverphone 2.0 değerine kodlar.

cologne

string

Bir belirteci Köln Fonetiği değerine kodlar.

doubleMetaphone

string

Bir belirteci çift metaphone değerine kodlar.

haasePhonetik

string

Kölner Phonetik algoritmasının Haase geliştirmesini kullanarak bir belirteci kodlar.

koelnerPhonetik

string

Kölner Phonetik algoritmasını kullanarak bir belirteci kodlar.

metaphone

string

Bir belirteci Metaphone değerine kodlar.

nysiis

string

Bir belirteci NYSIIS değerine kodlar.

refinedSoundex

string

Bir belirteci Geliştirilmiş Soundex değerine kodlar.

soundex

string

Bir belirteci Soundex değerine kodlar.

PhoneticTokenFilter

Fonetik eşleşmeler için belirteçler oluşturun. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır.

Name Tür Varsayılan değer Description
@odata.type string:

#Microsoft.Azure.Search.PhoneticTokenFilter

Belirteç filtresinin türünü belirten bir URI parçası.

encoder

PhoneticEncoder

metaphone

Kullanılacak fonetik kodlayıcı. Varsayılan değer "metaphone" şeklindedir.

name

string

Belirteç filtresinin adı. Yalnızca harf, rakam, boşluk, kısa çizgi veya alt çizgi içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır.

replace

boolean

True

Kodlanmış belirteçlerin özgün belirteçleri değiştirip değiştirmeyeceğini belirten bir değer. False ise, kodlanmış belirteçler eş anlamlı olarak eklenir. Varsayılan değer doğru değeridir.

PrioritizedFields

Anlam sıralaması, açıklamalı alt yazılar, vurgular ve yanıtlar için kullanılacak başlık, içerik ve anahtar sözcük alanlarını açıklar.

Name Tür Description
prioritizedContentFields

SemanticField[]

Anlamsal derecelendirme, açıklamalı alt yazılar, vurgular ve yanıtlar için kullanılacak içerik alanlarını tanımlar. En iyi sonuç için, seçili alanlar doğal dil biçiminde metin içermelidir. Dizideki alanların sırası önceliklerini temsil eder. İçerik uzunsa, düşük önceliğe sahip alanlar kesilebilir.

prioritizedKeywordsFields

SemanticField[]

Anlamsal derecelendirme, açıklamalı alt yazılar, vurgular ve yanıtlar için kullanılacak anahtar sözcük alanlarını tanımlar. En iyi sonuç için, seçilen alanlar bir anahtar sözcük listesi içermelidir. Dizideki alanların sırası önceliklerini temsil eder. İçerik uzunsa, düşük önceliğe sahip alanlar kesilebilir.

titleField

SemanticField

Anlamsal derecelendirme, açıklamalı alt yazılar, vurgular ve yanıtlar için kullanılacak başlık alanını tanımlar. Dizininizde başlık alanı yoksa, bu alanı boş bırakın.

RegexFlags

Normal ifadelerin desen çözümleyicisinde ve desen belirteci'nde nasıl kullanıldığını denetlemek için birleştirilebilen bayrakları tanımlar.

Name Tür Description
CANON_EQ

string

Kurallı eşdeğerliği etkinleştirir.

CASE_INSENSITIVE

string

Büyük/küçük harfe duyarsız eşleştirmeyi etkinleştirir.

COMMENTS

string

Desende boşluk ve açıklamalara izin verir.

DOTALL

string

Noktalı modu etkinleştirir.

LITERAL

string

Desenin değişmez değer ayrıştırma işlemini etkinleştirir.

MULTILINE

string

Çok satırlı modu etkinleştirir.

UNICODE_CASE

string

Unicode kullanan büyük/küçük harf katlamasını etkinleştirir.

UNIX_LINES

string

Unix çizgileri modunu etkinleştirir.

ScoringFunctionAggregation

Bir puanlama profilindeki tüm puanlama işlevlerinin sonuçlarını birleştirmek için kullanılan toplama işlevini tanımlar.

Name Tür Description
average

string

Puanları tüm puanlama işlevi sonuçlarının ortalaması kadar artırın.

firstMatching

string

Puanlama profilindeki ilk geçerli puanlama işlevini kullanarak puanları artırın.

maximum

string

Puanları tüm puanlama işlevi sonuçlarının üst sınırına kadar artırın.

minimum

string

Puanlama işlevi sonuçlarının en azını alarak puanları artırın.

sum

string

Tüm puanlama işlevi sonuçlarının toplamına göre puanları artırın.

ScoringFunctionInterpolation

Bir belge aralığında puan artırmayı ilişkilendirmek için kullanılan işlevi tanımlar.

Name Tür Description
constant

string

Puanları sabit bir faktöre göre artırır.

linear

string

Puanlamaları doğrusal olarak azalan bir miktara kadar artırır. Bu, puanlama işlevleri için varsayılan ilişkilendirmedir.

logarithmic

string

Puanları logaritmik olarak azaltan bir miktar artırır. Daha yüksek puanlar için artışlar hızla azalır ve puanlar azaldıkça daha yavaştır. Etiket puanlama işlevlerinde bu ilişkilendirme seçeneğine izin verilmez.

quadratic

string

Skorları, çeyreksel olarak azalan bir miktar artırır. Artışlar daha yüksek puanlar için yavaş yavaş ve puanlar azaldıkça daha hızlı azalır. Etiket puanlama işlevlerinde bu ilişkilendirme seçeneğine izin verilmez.

ScoringProfile

Arama sorgularında puanlama işlemini etkileyen arama dizini parametrelerini tanımlar.

Name Tür Description
functionAggregation

ScoringFunctionAggregation

Tek tek puanlama işlevlerinin sonuçlarının nasıl birleştirileceğine ilişkin bir değer. Varsayılan olarak "Toplam" kullanılır. Puanlama işlevi yoksayılır.

functions ScoringFunction[]:

Belgelerin puanlanmasını etkileyen işlevler koleksiyonu.

name

string

Puanlama profilinin adı.

text

TextWeights

Belirli dizin alanlarındaki metin eşleşmelerine göre puanlama işlemini artıran parametreler.

SearchError

API için bir hata koşulu açıklar.

Name Tür Description
code

string

Sunucu tanımlı hata kodları kümesinden biri.

details

SearchError[]

Bu bildirilen hataya yol açan belirli hatalarla ilgili ayrıntılar dizisi.

message

string

Hatanın insan tarafından okunabilen bir gösterimi.

SearchField

Dizin tanımında bir alanın adını, veri türünü ve arama davranışını açıklayan bir alanı temsil eder.

Name Tür Description
analyzer

LexicalAnalyzerName

Alan için kullanılacak çözümleyicinin adı. Bu seçenek yalnızca aranabilir alanlarla kullanılabilir ve searchAnalyzer veya indexAnalyzer ile birlikte ayarlanamaz. Çözümleyici seçildikten sonra alan için değiştirilemez. Karmaşık alanlar için null olmalıdır.

dimensions

integer

Vektör alanının boyutsallığı.

facetable

boolean

Model sorgularında alana başvurulmasının etkinleştirilip etkinleştirilmeymeyeceğini belirten bir değer. Genellikle kategoriye göre isabet sayısını içeren arama sonuçlarının sunumunda kullanılır (örneğin, dijital kameraları arayın ve markaya, megapiksellere, fiyata vb. göre isabetleri görün). Bu özellik karmaşık alanlar için null olmalıdır. Edm.GeographyPoint veya Collection (Edm.GeographyPoint) türü alanlar modellenebilir olamaz. Varsayılan değer diğer tüm basit alanlar için geçerlidir.

fields

SearchField[]

Edm.ComplexType veya Collection(Edm.ComplexType) türünde bir alansa, alt alanların listesi. Basit alanlar için null veya boş olmalıdır.

filterable

boolean

$filter sorgularında alana başvurulmasının etkinleştirilip etkinleştirilmeymeyeceğini gösteren değer. filterable, dizelerin işlenme biçiminde aranabilirden farklıdır. Filtrelenebilir Edm.String veya Collection (Edm.String) türündeki alanlarda sözcük kesme işlemi yapılmaz, bu nedenle karşılaştırmalar yalnızca tam eşleşmeler içindir. Örneğin, f alanını "güneşli gün" olarak ayarlarsanız, $filter=f eq 'sunny' eşleşme bulamaz, ancak $filter=f eq 'güneşli gün' olur. Bu özellik karmaşık alanlar için null olmalıdır. Basit alanlar için varsayılan değer true, karmaşık alanlar için null değeridir.

indexAnalyzer

LexicalAnalyzerName

Alan için dizin oluşturma sırasında kullanılan çözümleyicinin adı. Bu seçenek yalnızca aranabilir alanlarla kullanılabilir. SearchAnalyzer ile birlikte ayarlanmalıdır ve çözümleyici seçeneğiyle birlikte ayarlanamaz. Bu özellik bir dil çözümleyicisinin adına ayarlanamaz; dil çözümleyicisine ihtiyacınız varsa çözümleyici özelliğini kullanın. Çözümleyici seçildikten sonra alan için değiştirilemez. Karmaşık alanlar için null olmalıdır.

key

boolean

Alanın dizindeki belgeleri benzersiz olarak tanımlayıp tanımlamadığını gösteren değer. Her dizinde tam olarak bir üst düzey alan anahtar alanı olarak seçilmelidir ve Edm.String türünde olmalıdır. Önemli alanlar, belgeleri doğrudan aramak ve belirli belgeleri güncelleştirmek veya silmek için kullanılabilir. Basit alanlar için varsayılan değer false, karmaşık alanlar için null değeridir.

name

string

Dizin veya üst alanın alan koleksiyonu içinde benzersiz olması gereken alanın adı.

retrievable

boolean

Alanın bir arama sonucunda döndürülip döndürülemeyeceğini gösteren bir değer. Bir alanı (örneğin, kenar boşluğu) filtre, sıralama veya puanlama mekanizması olarak kullanmak ancak alanın son kullanıcıya görünür olmasını istemiyorsanız bu seçeneği devre dışı bırakabilirsiniz. Bu özellik anahtar alanlar için true ve karmaşık alanlar için null olmalıdır. Bu özellik mevcut alanlarda değiştirilebilir. Bu özelliğin etkinleştirilmesi dizin depolama gereksinimlerinde herhangi bir artışa neden olmaz. Basit alanlar için varsayılan değer true, karmaşık alanlar için null değeridir.

searchAnalyzer

LexicalAnalyzerName

Alan için arama zamanında kullanılan çözümleyicinin adı. Bu seçenek yalnızca aranabilir alanlarla kullanılabilir. IndexAnalyzer ile birlikte ayarlanmalıdır ve çözümleyici seçeneğiyle birlikte ayarlanamaz. Bu özellik bir dil çözümleyicisinin adına ayarlanamaz; dil çözümleyicisine ihtiyacınız varsa çözümleyici özelliğini kullanın. Bu çözümleyici mevcut bir alanda güncelleştirilebilir. Karmaşık alanlar için null olmalıdır.

searchable

boolean

Alanın tam metin aranabilir olup olmadığını gösteren değer. Bu, dizin oluşturma sırasında sözcük kesme gibi bir analize tabi tutulacağı anlamına gelir. Aranabilir bir alanı, "güneşli gün" gibi bir değere ayarlarsanız, dahili olarak bu "güneşli" ve "gün" belirteçlerine bölünür. Bu, bu terimler için tam metin aramaları sağlar. Edm.String veya Collection(Edm.String) türündeki alanlar varsayılan olarak aranabilir. Bu özellik, diğer dize olmayan veri türlerinin basit alanları için false ve karmaşık alanlar için null olmalıdır. Not: Aranabilir alanlar, tam metin aramaları için alan değerinin ek belirteçli sürümlerini barındırmak için dizininizde fazladan alan kullanır. Dizininizde yer kazanmak istiyorsanız ve aramalara bir alanın eklenmesi gerekmiyorsa, aranabilir değerini false olarak ayarlayın.

sortable

boolean

$orderby ifadelerinde alana başvurulmasının etkinleştirilip etkinleştirilmeymeyeceğini gösteren değer. Varsayılan olarak, arama altyapısı sonuçları puana göre sıralar, ancak çoğu deneyimde kullanıcılar belgelerdeki alanlara göre sıralamak isteyecektir. Basit bir alan yalnızca tek değerliyse (üst belge kapsamında tek bir değere sahiptir) sıralanabilir. Basit koleksiyon alanları çok değerli olduğundan sıralanabilir olamaz. Karmaşık koleksiyonların basit alt alanları da çok değerlidir ve bu nedenle sıralanabilir olamaz. Bu, ister hemen üst alan ister üst alan olsun, bir üst alan, karmaşık koleksiyondur. Karmaşık alanlar sıralanabilir olamaz ve bu tür alanlar için sıralanabilir özellik null olmalıdır. Sıralanabilir için varsayılan değer, tek değerli basit alanlar için true, çok değerli basit alanlar için false ve karmaşık alanlar için null şeklindedir.

synonymMaps

string[]

Bu alanla ilişkilendirilecek eş anlamlı eşlemelerinin adlarının listesi. Bu seçenek yalnızca aranabilir alanlarla kullanılabilir. Şu anda alan başına yalnızca bir eş anlamlı eşleme desteklenir. Bir alana eş anlamlı eşlem atamak, söz dizim eşlemesindeki kurallar kullanılarak bu alanı hedefleyen sorgu terimlerinin sorgu zamanında genişletilmesini sağlar. Bu öznitelik mevcut alanlarda değiştirilebilir. Karmaşık alanlar için null veya boş bir koleksiyon olmalıdır.

type

SearchFieldDataType

Alanın veri türü.

vectorSearchProfile

string

Vektör alanında arama yaparken kullanılacak algoritmayı belirten vektör arama profilinin adı.

SearchFieldDataType

Arama dizinindeki bir alanın veri türünü tanımlar.

Name Tür Description
Edm.Boolean

string

Bir alanın Boole değeri (true veya false) içerdiğini gösterir.

Edm.ComplexType

string

Bir alanın, başka türlerde alt alanları olan bir veya daha fazla karmaşık nesne içerdiğini gösterir.

Edm.DateTimeOffset

string

Bir alanın saat dilimi bilgileri de dahil olmak üzere bir tarih/saat değeri içerdiğini gösterir.

Edm.Double

string

Bir alanın IEEE çift duyarlıklı kayan nokta numarası içerdiğini gösterir.

Edm.GeographyPoint

string

Alanın boylam ve enlem açısından coğrafi konum içerdiğini gösterir.

Edm.Int32

string

Bir alanın 32 bit imzalı bir tamsayı içerdiğini gösterir.

Edm.Int64

string

Bir alanın 64 bit işaretli bir tamsayı içerdiğini gösterir.

Edm.Single

string

Bir alanın tek duyarlıklı kayan nokta sayısı içerdiğini gösterir. Bu yalnızca Collection(Edm.Single) ile kullanıldığında geçerlidir.

Edm.String

string

Bir alanın dize içerdiğini gösterir.

SearchIndex

Bir dizinin alanlarını ve arama davranışını açıklayan bir arama dizini tanımını temsil eder.

Name Tür Description
@odata.etag

string

Dizinin ETag'i.

analyzers LexicalAnalyzer[]:

Dizin için çözümleyiciler.

charFilters CharFilter[]:

Dizin için karakter filtreleri.

corsOptions

CorsOptions

Dizin için Çıkış Noktaları Arası Kaynak Paylaşımı'nı (CORS) denetleme seçenekleri.

defaultScoringProfile

string

Sorguda belirtilmemişse kullanılacak puanlama profilinin adı. Bu özellik ayarlanmazsa ve sorguda puanlama profili belirtilmezse, varsayılan puanlama (tf-idf) kullanılır.

encryptionKey

SearchResourceEncryptionKey

Azure Key Vault'de oluşturduğunuz şifreleme anahtarının açıklaması. Bu anahtar, verilerinizin şifresini Microsoft'un bile çözemediğinin tam güvencesini almak istediğinizde verileriniz için ek bir bekleyen şifreleme düzeyi sağlamak için kullanılır. Verilerinizi şifreledikten sonra her zaman şifrelenmiş olarak kalır. Arama hizmeti bu özelliği null olarak ayarlama girişimlerini yoksayar. Şifreleme anahtarınızı döndürmek istiyorsanız bu özelliği gerektiği gibi değiştirebilirsiniz; Verileriniz etkilenmez. Müşteri tarafından yönetilen anahtarlarla şifreleme ücretsiz arama hizmetleri için kullanılamaz ve yalnızca 1 Ocak 2019 veya sonrasında oluşturulan ücretli hizmetler için kullanılabilir.

fields

SearchField[]

Dizinin alanları.

name

string

Dizinin adı.

scoringProfiles

ScoringProfile[]

Dizin için puanlama profilleri.

semantic

SemanticSettings

Anlamsal özellikleri etkileyen bir arama dizininin parametrelerini tanımlar.

similarity Similarity:

Arama sorgusuyla eşleşen belgeleri puanlama ve derecelendirme sırasında kullanılacak benzerlik algoritmasının türü. Benzerlik algoritması yalnızca dizin oluşturma zamanında tanımlanabilir ve mevcut dizinlerde değiştirilemez. Null ise ClassicSimilarity algoritması kullanılır.

suggesters

Suggester[]

Dizin için öneride bulunanlar.

tokenFilters TokenFilter[]:

Dizin için belirteç filtreleri.

tokenizers LexicalTokenizer[]:

Dizin için belirteç oluşturucular.

vectorSearch

VectorSearch

Vektör araması ile ilgili yapılandırma seçeneklerini içerir.

SearchResourceEncryptionKey

Azure Key Vault'da müşteri tarafından yönetilen bir şifreleme anahtarı. Oluşturduğunuz ve yönettiğiniz anahtarlar, dizinler ve eş anlamlı eşlemeler gibi arama hizmetinizdeki bekleyen verileri şifrelemek veya şifresini çözmek için kullanılabilir.

Name Tür Description
accessCredentials

AzureActiveDirectoryApplicationCredentials

Azure Key Vault erişmek için kullanılan isteğe bağlı Azure Active Directory kimlik bilgileri. Bunun yerine yönetilen kimlik kullanılıyorsa gerekli değildir.

keyVaultKeyName

string

Bekleyen verilerinizi şifrelemek için kullanılacak Azure Key Vault anahtarınızın adı.

keyVaultKeyVersion

string

Bekleyen verilerinizi şifrelemek için kullanılacak Azure Key Vault anahtarınızın sürümü.

keyVaultUri

string

Bekleyen verilerinizi şifrelemek için kullanılacak anahtarı içeren DNS adı olarak da adlandırılan Azure Key Vault URI'niz. Örnek bir URI olabilir https://my-keyvault-name.vault.azure.net.

SemanticConfiguration

Anlamsal özellikler bağlamında kullanılacak belirli bir yapılandırmayı tanımlar.

Name Tür Description
name

string

Anlamsal yapılandırmanın adı.

prioritizedFields

PrioritizedFields

Anlam sıralaması, açıklamalı alt yazılar, vurgular ve yanıtlar için kullanılacak başlık, içerik ve anahtar sözcük alanlarını açıklar. Üç alt özellikten en az birinin (titleField, prioritizedKeywordsFields ve prioritizedContentFields) ayarlanması gerekir.

SemanticField

Anlamsal yapılandırmanın bir parçası olarak kullanılan alan.

Name Tür Description
fieldName

string

SemanticSettings

Anlamsal özellikleri etkileyen bir arama dizini için parametreleri tanımlar.

Name Tür Description
configurations

SemanticConfiguration[]

Dizin için anlamsal yapılandırmalar.

defaultConfiguration

string

Dizininizde varsayılan bir semantik yapılandırmanın adını ayarlamanıza olanak tanır ve bunu her seferinde sorgu parametresi olarak geçirmeyi isteğe bağlı hale getirir.

ShingleTokenFilter

Belirteç birleşimlerini tek bir belirteç olarak oluşturur. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır.

Name Tür Varsayılan değer Description
@odata.type string:

#Microsoft.Azure.Search.ShingleTokenFilter

Belirteç filtresinin türünü belirten bir URI parçası.

filterToken

string

_

Belirtecin olmadığı her konum için eklenecek dize. Varsayılan değer bir alt çizgidir ("_").

maxShingleSize

integer

2

Maksimum zona boyutu. Varsayılan ve en düşük değer 2'dir.

minShingleSize

integer

2

En düşük zona boyutu. Varsayılan ve en düşük değer 2'dir. maxShingleSize değerinden küçük olmalıdır.

name

string

Belirteç filtresinin adı. Yalnızca harf, rakam, boşluk, tire veya alt çizgi içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır.

outputUnigrams

boolean

True

Çıkış akışının hem giriş belirteçlerini (tek birimleri) hem de zonaları içerip içermeyeceğini belirten bir değer. Varsayılan değer doğru değeridir.

outputUnigramsIfNoShingles

boolean

False

Zona olmadığında bu zamanlar için tek birimlerin çıkarılıp çıkarılmayacağını belirten bir değer. OutputUnigrams false olarak ayarlandığında bu özellik önceliklidir. Varsayılan değer false’tur.

tokenSeparator

string

Bir shingle oluşturmak için bitişik belirteçleri birleştirirken kullanılacak dize. Varsayılan değer tek bir boşluk (" ") şeklindedir.

SnowballTokenFilter

Snowball tarafından oluşturulan bir kök ayırıcı kullanarak sözcükleri saplayan bir filtre. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır.

Name Tür Description
@odata.type string:

#Microsoft.Azure.Search.SnowballTokenFilter

Belirteç filtresinin türünü belirten bir URI parçası.

language

SnowballTokenFilterLanguage

Kullanılacak dil.

name

string

Belirteç filtresinin adı. Yalnızca harf, rakam, boşluk, tire veya alt çizgi içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır.

SnowballTokenFilterLanguage

Kartopu belirteç filtresi için kullanılacak dil.

Name Tür Description
armenian

string

Ermeni için Lucene Snowball stemming tokenizer'ı seçer.

basque

string

Bask için Lucene Snowball köklendirme belirteçleştiricisini seçer.

catalan

string

Katalan için Lucene Snowball köklendirme belirteçleştiricisini seçer.

danish

string

Danimarkaca için Lucene Snowball köklendirme belirteçleştiricisini seçer.

dutch

string

Felemenkçe için Lucene Snowball köklendirme belirteçleştiricisini seçer.

english

string

İngilizce için Lucene Snowball stemming tokenizer'ı seçer.

finnish

string

Fince için Lucene Snowball köklendirme belirteçleştiricisini seçer.

french

string

Fransızca için Lucene Snowball stemming tokenizer'ı seçer.

german

string

Almanca için Lucene Snowball stemming tokenizer'ı seçer.

german2

string

Alman değişken algoritmasını kullanan Lucene Snowball köklendirme belirteçleştiricisini seçer.

hungarian

string

Macarca için Lucene Snowball köklendirme belirteçleştiricisini seçer.

italian

string

İtalyanca için Lucene Snowball köklendirme belirteçleştiricisini seçer.

kp

string

Felemenkçe için Kraaij-Pohlmann kök oluşturma algoritmasını kullanan Lucene Snowball köklendirme belirteçleştiricisini seçer.

lovins

string

Lovins kök oluşturma algoritmasını kullanan İngilizce için Lucene Snowball saplama belirteçleştiricisini seçer.

norwegian

string

Norveç dili için Lucene Snowball köklendirme belirteçleştiricisini seçer.

porter

string

Porter kök oluşturma algoritmasını kullanan İngilizce için Lucene Snowball köklendirme belirteçleştiricisini seçer.

portuguese

string

Portekizce için Lucene Snowball stemming tokenizer'ı seçer.

romanian

string

Rumence için Lucene Snowball stemming tokenizer'ı seçer.

russian

string

Rusça için Lucene Snowball köklendirme belirteçleştiricisini seçer.

spanish

string

İspanyolca için Lucene Snowball köklendirme belirteçleştiricisini seçer.

swedish

string

İsveççe için Lucene Snowball stemming tokenizer'ı seçer.

turkish

string

Türkçe için Lucene Snowball stemming tokenizer'ı seçer.

StemmerOverrideTokenFilter

Özel sözlük tabanlı kök oluşturma ile diğer kök oluşturma filtrelerini geçersiz kılma olanağı sağlar. Sözlük saplı terimler anahtar sözcük olarak işaretlenir, böylece zincirde kök ayırıcılarla saplanmaz. Herhangi bir kök filtreden önce yerleştirilmelidir. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır.

Name Tür Description
@odata.type string:

#Microsoft.Azure.Search.StemmerOverrideTokenFilter

Belirteç filtresinin türünü belirten bir URI parçası.

name

string

Belirteç filtresinin adı. Yalnızca harf, rakam, boşluk, tire veya alt çizgi içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır.

rules

string[]

Şu biçimdeki kök oluşturma kurallarının listesi: "word => stem", örneğin: "ran => run".

StemmerTokenFilter

Dile özgü köklendirme filtresi. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır.

Name Tür Description
@odata.type string:

#Microsoft.Azure.Search.StemmerTokenFilter

Belirteç filtresinin türünü belirten bir URI parçası.

language

StemmerTokenFilterLanguage

Kullanılacak dil.

name

string

Belirteç filtresinin adı. Yalnızca harf, rakam, boşluk, tire veya alt çizgi içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır.

StemmerTokenFilterLanguage

Kök ayırıcı belirteç filtresi için kullanılacak dil.

Name Tür Description
arabic

string

Arapça için Lucene kök belirteci belirteci'ni seçer.

armenian

string

Ermeni için Lucene kök belirteci belirteci seçer.

basque

string

Bask dili için Lucene kök belirteci belirteci'ni seçer.

brazilian

string

Portekizce (Brezilya) için Lucene kök belirteci belirteci seçer.

bulgarian

string

Bulgarca için Lucene saplama belirteci'ni seçer.

catalan

string

Katala dili için Lucene kök belirteci belirteci'ni seçer.

czech

string

Çekçe için Lucene köklendirme belirteci'ni seçer.

danish

string

Danca için Lucene kök belirteci belirteci'ni seçer.

dutch

string

Felemenkçe için Lucene kök belirteci belirteci'ni seçer.

dutchKp

string

Felemenkçe için, Kraaij-Pohlmann saplama algoritmasını kullanan Lucene köklendirme belirteçleştiricisini seçer.

english

string

İngilizce için Lucene kök belirteci belirteci'ni seçer.

finnish

string

Fince için Lucene köklendirme belirteci'ni seçer.

french

string

Fransızca için Lucene kök belirteci belirteci'ni seçer.

galician

string

Galiçya dili için Lucene kök belirteci belirteci seçer.

german

string

Almanca için Lucene kök belirteci belirteci seçer.

german2

string

Almanca değişken algoritmasını kullanan Lucene kök belirteci belirteci seçer.

greek

string

Yunanca için Lucene köklendirme belirteci'ni seçer.

hindi

string

Hintçe için Lucene kök belirteci belirteci'ni seçer.

hungarian

string

Macarca için Lucene kök ayırma belirteci'ni seçer.

indonesian

string

Endonezya dili için Lucene kök belirteci belirteci seçer.

irish

string

İrlanda dili için Lucene kök belirteci belirteci seçer.

italian

string

İtalyanca için Lucene kök ayırma belirteci'ni seçer.

latvian

string

Letonca için Lucene kök belirteci belirteci seçer.

lightEnglish

string

Işık saplama işlemine sahip İngilizce için Lucene köklendirme belirteçleştiricisini seçer.

lightFinnish

string

Fince için ışık saplama işlemine yönelik Lucene köklendirme belirteci'ni seçer.

lightFrench

string

Fransızca için ışık saplama işlemine sahip Lucene köklendirme belirteçleştiricisini seçer.

lightGerman

string

Almanca için ışık saplama işlemine sahip Lucene köklendirme belirteçleştiricisini seçer.

lightHungarian

string

Macarca için ışık saplama işlemine sahip Lucene köklendirme belirteci'ni seçer.

lightItalian

string

İtalyanca için ışık saplama işlemine sahip Lucene köklendirme belirteci'ni seçer.

lightNorwegian

string

Norveççe (Bokmål) için ışık köklendirmesi kullanan Lucene köklendirme belirteçleştiricisini seçer.

lightNynorsk

string

Norveç dili (Nynorsk) için ışık köklendirme yapan Lucene köklendirme belirteçleştiricisini seçer.

lightPortuguese

string

Portekizce için ışık saplama işlemine yönelik Lucene köklendirme belirteci'ni seçer.

lightRussian

string

Rusça için ışık saplama işlemine sahip Lucene köklendirme belirteçleştiricisini seçer.

lightSpanish

string

İspanyolca için ışık saplama işlemine sahip Lucene köklendirme belirteçleştiricisini seçer.

lightSwedish

string

İsveççe için ışık saplama özelliğine sahip Lucene köklendirme belirteçleştiricisini seçer.

lovins

string

Lovins saplama algoritmasını kullanan İngilizce için Lucene köklendirme belirteci'ni seçer.

minimalEnglish

string

İngilizce için minimum köklendirmeye sahip Lucene köklendirme belirteci'ni seçer.

minimalFrench

string

Fransızca için minimum köklendirme işlemine sahip Lucene köklendirme belirteci'ni seçer.

minimalGalician

string

Galiçya dili için minimum köklendirme işlemine sahip Lucene köklendirme belirteçleştiricisini seçer.

minimalGerman

string

Almanca için minimum köklendirme işlemine sahip Lucene köklendirme belirteci'ni seçer.

minimalNorwegian

string

Norveççe (Bokmål) için minimum köklendirme işlemine sahip Lucene köklendirme belirteçleştiricisini seçer.

minimalNynorsk

string

Norveç dili (Nynorsk) için minimal köklendirme yapan Lucene köklendirme belirtecini seçer.

minimalPortuguese

string

Portekizce için minimum köklendirme işlemine sahip Lucene köklendirme belirteci'ni seçer.

norwegian

string

Norveççe (Bokmål) için Lucene kök belirteci belirteci seçer.

porter2

string

Porter2 kök oluşturma algoritmasını kullanan İngilizce için Lucene köklendirme belirteçleştiricisini seçer.

portuguese

string

Portekizce için Lucene kök belirteci belirteci'ni seçer.

portugueseRslp

string

RSLP kök ayırma algoritmasını kullanan Portekizce için Lucene kök ayırma belirteci'ni seçer.

possessiveEnglish

string

sözcüklerden sondaki sahiplikleri kaldıran İngilizce için Lucene köklendirme belirteci'ni seçer.

romanian

string

Rumence için Lucene köklendirme belirteç oluşturucuyu seçer.

russian

string

Rusça için Lucene kök belirteci belirteci seçer.

sorani

string

Sorani için Lucene kök belirteci belirteci seçer.

spanish

string

İspanyolca için Lucene kök belirteci belirteci'ni seçer.

swedish

string

İsveççe için Lucene kök ayırma belirteci'ni seçer.

turkish

string

Türkçe için Lucene kök belirteci belirteci'ni seçer.

StopAnalyzer

Metni harf olmayana böler; Küçük harf ve stopword belirteç filtrelerini uygular. Bu çözümleyici Apache Lucene kullanılarak uygulanır.

Name Tür Description
@odata.type string:

#Microsoft.Azure.Search.StopAnalyzer

Çözümleyici türünü belirten bir URI parçası.

name

string

Çözümleyicinin adı. Yalnızca harf, rakam, boşluk, tire veya alt çizgi içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır.

stopwords

string[]

Stopwords listesi.

StopwordsList

Dile özgü stopword'lerin önceden tanımlanmış bir listesini tanımlar.

Name Tür Description
arabic

string

Arapça için stopword listesini seçer.

armenian

string

Ermeni için stopword listesini seçer.

basque

string

Bask dili için stopword listesini seçer.

brazilian

string

Portekizce (Brezilya) için stopword listesini seçer.

bulgarian

string

Bulgarca için stopword listesini seçer.

catalan

string

Katala dili için stopword listesini seçer.

czech

string

Çekçe için stopword listesini seçer.

danish

string

Danca için stopword listesini seçer.

dutch

string

Felemenkçe için stopword listesini seçer.

english

string

İngilizce için stopword listesini seçer.

finnish

string

Fince için stopword listesini seçer.

french

string

Fransızca için stopword listesini seçer.

galician

string

Galiçya dili için stopword listesini seçer.

german

string

Almanca için stopword listesini seçer.

greek

string

Yunanca için stopword listesini seçer.

hindi

string

Hintçe için stopword listesini seçer.

hungarian

string

Macarca için stopword listesini seçer.

indonesian

string

Endonezya dili için stopword listesini seçer.

irish

string

İrlanda dili için stopword listesini seçer.

italian

string

İtalyanca için stopword listesini seçer.

latvian

string

Letonca için stopword listesini seçer.

norwegian

string

Norveç dili için stopword listesini seçer.

persian

string

Farsça için stopword listesini seçer.

portuguese

string

Portekizce için stopword listesini seçer.

romanian

string

Rumence için stopword listesini seçer.

russian

string

Rusça için stopword listesini seçer.

sorani

string

Sorani için stopword listesini seçer.

spanish

string

İspanyolca için stopword listesini seçer.

swedish

string

İsveççe için stopword listesini seçer.

thai

string

Tay dili için stopword listesini seçer.

turkish

string

Türkçe için stopword listesini seçer.

StopwordsTokenFilter

Belirteç akışından durdurma sözcüklerini kaldırır. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır.

Name Tür Varsayılan değer Description
@odata.type string:

#Microsoft.Azure.Search.StopwordsTokenFilter

Belirteç filtresinin türünü belirten bir URI parçası.

ignoreCase

boolean

False

Büyük/küçük harf yoksayılıp yoksayılmayacağını belirten bir değer. True ise, önce tüm sözcükler küçük harfe dönüştürülür. Varsayılan değer false’tur.

name

string

Belirteç filtresinin adı. Yalnızca harf, rakam, boşluk, tire veya alt çizgi içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır.

removeTrailing

boolean

True

Son arama terimi bir durdurma sözcüğüyse yoksayılıp yoksayılmayacağını gösteren değer. Varsayılan değer doğru değeridir.

stopwords

string[]

Stopwords listesi. Hem bu özellik hem de stopwords listesi özelliği ayarlanamaz.

stopwordsList

StopwordsList

english

Kullanılacak önceden tanımlanmış bir stopword listesi. Hem bu özellik hem de stopwords özelliği ayarlanamaz. Varsayılan değer İngilizce'dir.

Suggester

Öneri API'sinin dizindeki bir alan grubuna nasıl uygulanacağını tanımlar.

Name Tür Description
name

string

Öneride bulunanın adı.

searchMode

SuggesterSearchMode

Öneride bulunanın özelliklerini gösteren değer.

sourceFields

string[]

Öneride bulunanın uygulandığı alan adlarının listesi. Her alan aranabilir olmalıdır.

SuggesterSearchMode

Öneride bulunanın özelliklerini gösteren değer.

Name Tür Description
analyzingInfixMatching

string

Bir alandaki ardışık tüm terimleri ve ön ekleri eşleştirir. Örneğin, 'En hızlı kahverengi tilki' alanı için 'hızlı' ve 'en hızlı kaş' sorgularının ikisi de eşleşir.

SynonymTokenFilter

Belirteç akışındaki tek veya çok sözcüklü eş anlamlılarla eşleşir. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır.

Name Tür Varsayılan değer Description
@odata.type string:

#Microsoft.Azure.Search.SynonymTokenFilter

Belirteç filtresinin türünü belirten bir URI parçası.

expand

boolean

True

Eş anlamlılar listesindeki tüm sözcüklerin (=> gösterimi kullanılmıyorsa) birbiriyle eşlenip eşlenmediğini gösteren değer. True ise, eş anlamlılar listesindeki tüm sözcükler (=> gösterimi kullanılmıyorsa) birbiriyle eşlenir. Aşağıdaki liste: inanılmaz, inanılmaz, muhteşem, şaşırtıcı ile eşdeğerdir: inanılmaz, inanılmaz, inanılmaz, inanılmaz => inanılmaz, inanılmaz, inanılmaz. False ise, şu liste: inanılmaz, inanılmaz, muhteşem, şaşırtıcı ile eşdeğer olacaktır: inanılmaz, inanılmaz, muhteşem, inanılmaz => inanılmaz. Varsayılan değer doğru değeridir.

ignoreCase

boolean

False

Eşleştirme için büyük/küçük harf katlama girişinin yapılıp yapılmayacağını gösteren değer. Varsayılan değer false’tur.

name

string

Belirteç filtresinin adı. Yalnızca harf, rakam, boşluk, tire veya alt çizgi içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır.

synonyms

string[]

İki biçimden birini izleyen eş anlamlıların listesi: 1. inanılmaz, inanılmaz, muhteşem => şaşırtıcı - => sembolünün sol tarafındaki tüm terimler sağ tarafındaki tüm terimlerle değiştirilecek; 2. inanılmaz, inanılmaz, inanılmaz, şaşırtıcı - eşdeğer sözcüklerin virgülle ayrılmış listesi. Bu listenin yorumlandığı şekli değiştirmek için genişletme seçeneğini ayarlayın.

TagScoringFunction

Belirli bir etiket listesiyle eşleşen dize değerlerine sahip belge puanlarını artıran bir işlev tanımlar.

Name Tür Description
boost

number

Ham puan için çarpan. 1,0'a eşit olmayan pozitif bir sayı olmalıdır.

fieldName

string

Puanlama işlevinin girişi olarak kullanılan alanın adı.

interpolation

ScoringFunctionInterpolation

Artırmanın belge puanları arasında nasıl ilişkilendirilmiş olacağını gösteren bir değer; varsayılan olarak "Doğrusal" olarak adlandırılır.

tag

TagScoringParameters

Etiket puanlama işlevi için parametre değerleri.

type string:

tag

Kullanılacak işlevin türünü gösterir. Geçerli değerler büyüklük, güncellik, uzaklık ve etikettir. İşlev türü küçük harf olmalıdır.

TagScoringParameters

Etiket puanlama işlevine parametre değerleri sağlar.

Name Tür Description
tagsParameter

string

Hedef alanla karşılaştırılacak etiketlerin listesini belirtmek için arama sorgularında geçirilen parametrenin adı.

TextWeights

Eşleşmelerin arama sorgularında puanlama düzeyini artırması gereken dizin alanlarındaki ağırlıkları tanımlar.

Name Tür Description
weights

object

Belge puanlamasını artırmak için alan başına ağırlık sözlüğü. Anahtarlar alan adlarıdır ve değerler her alanın ağırlıklarıdır.

TokenCharacterKind

Belirteç filtresinin üzerinde çalışabileceği karakter sınıflarını temsil eder.

Name Tür Description
digit

string

Basamakları belirteçlerde tutar.

letter

string

Harfleri belirteçte tutar.

punctuation

string

Belirteçlerde noktalama işaretlerini korur.

symbol

string

Sembolleri belirteçlerde tutar.

whitespace

string

Belirteçlerde boşluğu korur.

TokenFilterName

Arama altyapısı tarafından desteklenen tüm belirteç filtrelerinin adlarını tanımlar.

Name Tür Description
apostrophe

string

Kesme işaretinden sonraki tüm karakterleri (kesme işareti de dahil) çıkarır. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/tr/ApostropheFilter.html

arabic_normalization

string

Ortografiyi normalleştirmek için Arapça normalleştiriciyi uygulayan bir belirteç filtresi. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/ar/ArabicNormalizationFilter.html

asciifolding

string

İlk 127 ASCII karakterinde ("Temel Latin" Unicode bloğu) bulunmayan alfabetik, sayısal ve sembolik Unicode karakterlerini, böyle eşdeğerler varsa ASCII eşdeğerlerine dönüştürür. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/ASCIIFoldingFilter.html

cjk_bigram

string

Standart belirteç oluşturucudan oluşturulan CJK terimlerinin büyük simgelerini oluşturur. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/cjk/CJKBigramFilter.html

cjk_width

string

CJK genişlik farklarını normalleştirir. Tam ASCII çeşitlemelerini eşdeğer temel Latinceye ve yarım genişlikte Katakana değişkenlerini eşdeğer Kana'ya katlar. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/cjk/CJKWidthFilter.html

classic

string

İngilizce sahipliklerini ve kısaltmalardan noktaları kaldırır. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/standard/ClassicFilter.html

common_grams

string

Dizin oluştururken sık karşılaşılan terimler için bigrams oluşturun. Tek terimler de dizine eklenir ve bigram'lar yer paylaşımlı olur. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/commongrams/CommonGramsFilter.html

edgeNGram_v2

string

Giriş belirtecinin önünden veya arkasından başlayarak verilen boyutların n gramını oluşturur. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/ngram/EdgeNGramTokenFilter.html

elision

string

elisyonu kaldırır. Örneğin, "l'avion" (düzlem) "avion" (düzlem) olarak dönüştürülür. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/util/ElisionFilter.html

german_normalization

string

Alman karakterlerini German2 kartopu algoritmasının buluşsal yöntemlerine göre normalleştirir. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/de/GermanNormalizationFilter.html

hindi_normalization

string

Yazım varyasyonlarındaki bazı farklılıkları kaldırmak için Hintçedeki metni normalleştirir. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/hi/HindiNormalizationFilter.html

indic_normalization

string

Hint dillerindeki metnin Unicode gösterimini normalleştirir. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/in/IndicNormalizationFilter.html

keyword_repeat

string

Gelen her belirteci bir kez anahtar sözcük, bir kez de anahtar sözcük olmayan belirteç olarak iki kez yayar. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/KeywordRepeatFilter.html

kstem

string

İngilizce için yüksek performanslı bir kstem filtresi. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/en/KStemFilter.html

length

string

Çok uzun veya çok kısa sözcükleri kaldırır. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/LengthFilter.html

limit

string

Dizin oluşturma sırasında belirteç sayısını sınırlar. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/LimitTokenCountFilter.html

lowercase

string

Belirteç metnini küçük harfe normalleştirir. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/LowerCaseFilter.htm

nGram_v2

string

Verilen boyutların n gramını oluşturur. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/ngram/NGramTokenFilter.html

persian_normalization

string

Farsça için normalleştirme uygular. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/fa/PersianNormalizationFilter.html

phonetic

string

Fonetik eşleşmeler için belirteçler oluşturun. Bkz. https://lucene.apache.org/core/4_10_3/analyzers-phonetic/org/apache/lucene/analysis/phonetic/package-tree.html

porter_stem

string

Belirteç akışını dönüştürmek için Porter kök oluşturma algoritmasını kullanır. Bkz. http://tartarus.org/~martin/PorterStemmer

reverse

string

Belirteç dizesini tersine çevirir. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/reverse/ReverseStringFilter.html

scandinavian_folding

string

İskandinav karakterlerini katlar åÅäæÄÆ-a> ve öÖøØ-o>. Ayrıca aa, ae, ao, oe ve oo çift sesli harf kullanımına karşı ayrımcılığa neden olur ve yalnızca ilkini bırakır. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/ScandinavianFoldingFilter.html

scandinavian_normalization

string

Değiştirilebilir İskandinav karakterlerinin kullanımını normalleştirir. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/ScandinavianNormalizationFilter.html

shingle

string

Belirteç birleşimlerini tek bir belirteç olarak oluşturur. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/shingle/ShingleFilter.html

snowball

string

Snowball tarafından oluşturulan bir kök ayırıcı kullanarak sözcükleri saplayan bir filtre. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/snowball/SnowballFilter.html

sorani_normalization

string

Sorani metninin Unicode gösterimini normalleştirir. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/ckb/SoraniNormalizationFilter.html

stemmer

string

Dile özgü köklendirme filtresi. Bkz. https://docs.microsoft.com/rest/api/searchservice/Custom-analyzers-in-Azure-Search#TokenFilters

stopwords

string

Belirteç akışından durdurma sözcüklerini kaldırır. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/StopFilter.html

trim

string

Belirteçlerden baştaki ve sondaki boşluğu keser. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/TrimFilter.html

truncate

string

Terimleri belirli bir uzunlukta kısaltılır. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/TruncateTokenFilter.html

unique

string

Önceki belirteçle aynı metindeki belirteçleri filtreler. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/RemoveDuplicatesTokenFilter.html

uppercase

string

Belirteç metnini büyük harfe göre normalleştirir. Bkz. http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/UpperCaseFilter.html

word_delimiter

string

Sözcükleri alt sözcüklere böler ve alt sözcük gruplarında isteğe bağlı dönüştürmeler gerçekleştirir.

TruncateTokenFilter

Terimleri belirli bir uzunlukta kısaltılır. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır.

Name Tür Varsayılan değer Description
@odata.type string:

#Microsoft.Azure.Search.TruncateTokenFilter

Belirteç filtresinin türünü belirten bir URI parçası.

length

integer

300

Terimlerin kesileceği uzunluk. Varsayılan ve maksimum değer 300'dür.

name

string

Belirteç filtresinin adı. Yalnızca harf, rakam, boşluk, tire veya alt çizgi içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır.

UaxUrlEmailTokenizer

Url'leri ve e-postaları tek bir belirteç olarak belirteç haline döndürür. Bu belirteç oluşturucu Apache Lucene kullanılarak uygulanır.

Name Tür Varsayılan değer Description
@odata.type string:

#Microsoft.Azure.Search.UaxUrlEmailTokenizer

Belirteç oluşturucunun türünü belirten bir URI parçası.

maxTokenLength

integer

255

En fazla belirteç uzunluğu. Varsayılan değer 255'tir. Uzunluk üst sınırından daha uzun olan belirteçler bölünür. Kullanılabilecek en fazla belirteç uzunluğu 300 karakterdir.

name

string

Belirteç oluşturucunun adı. Yalnızca harf, rakam, boşluk, kısa çizgi veya alt çizgi içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır.

UniqueTokenFilter

Önceki belirteçle aynı metindeki belirteçleri filtreler. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır.

Name Tür Varsayılan değer Description
@odata.type string:

#Microsoft.Azure.Search.UniqueTokenFilter

Belirteç filtresinin türünü belirten bir URI parçası.

name

string

Belirteç filtresinin adı. Yalnızca harf, rakam, boşluk, tire veya alt çizgi içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır.

onlyOnSamePosition

boolean

False

Yinelenenlerin yalnızca aynı konumda kaldırılıp kaldırılmayacağını gösteren değer. Varsayılan değer false’tur.

VectorSearch

Vektör araması ile ilgili yapılandırma seçeneklerini içerir.

Name Tür Description
algorithms VectorSearchAlgorithmConfiguration[]:

Dizin oluşturma veya sorgulama sırasında kullanılan algoritmaya özgü yapılandırma seçeneklerini içerir.

profiles

VectorSearchProfile[]

Vektör araması ile kullanılacak yapılandırma birleşimlerini tanımlar.

VectorSearchAlgorithmKind

Dizin oluşturma ve sorgulama için kullanılan algoritma.

Name Tür Description
exhaustiveKnn

string

Deneme yanılma araması yapacak kapsamlı KNN algoritması.

hnsw

string

HNSW (Hiyerarşik Gezinilebilir Küçük Dünya), yaklaşık en yakın komşu algoritması türüdür.

VectorSearchAlgorithmMetric

Vektör karşılaştırmaları için kullanılacak benzerlik ölçümü.

Name Tür Description
cosine

string

dotProduct

string

euclidean

string

VectorSearchProfile

Vektör araması ile kullanılacak yapılandırmaların bir bileşimini tanımlar.

Name Tür Description
algorithm

string

Algoritmayı ve isteğe bağlı parametreleri belirten vektör arama algoritması yapılandırmasının adı.

name

string

Bu özel vektör arama profiliyle ilişkilendirilecek ad.

WordDelimiterTokenFilter

Sözcükleri alt sözcüklere böler ve alt sözcük gruplarında isteğe bağlı dönüştürmeler gerçekleştirir. Bu belirteç filtresi Apache Lucene kullanılarak uygulanır.

Name Tür Varsayılan değer Description
@odata.type string:

#Microsoft.Azure.Search.WordDelimiterTokenFilter

Belirteç filtresinin türünü belirten bir URI parçası.

catenateAll

boolean

False

Tüm alt parçaların kataliz edilip edilmeyeceğini gösteren değer. Örneğin, bu true olarak ayarlanırsa, "Azure-Search-1" "AzureSearch1" olur. Varsayılan değer false’tur.

catenateNumbers

boolean

False

Sayı parçalarının en fazla çalıştırılıp çalıştırılmayacağını gösteren değer. Örneğin, bu true olarak ayarlanırsa, "1-2" "12" olur. Varsayılan değer false’tur.

catenateWords

boolean

False

Sözcük bölümlerinin en fazla çalıştırılıp çalıştırılmayacağını gösteren değer. Örneğin, bu true olarak ayarlanırsa, "Azure-Search" "AzureSearch" olur. Varsayılan değer false’tur.

generateNumberParts

boolean

True

Sayı alt kelimelerinin oluşturulup oluşturulmayacağını gösteren değer. Varsayılan değer doğru değeridir.

generateWordParts

boolean

True

Parça sözcüklerinin oluşturulup oluşturulmayacağını gösteren değer. Ayarlanırsa, sözcüklerin parçalarının oluşturulmasına neden olur; Örneğin, "AzureSearch" "Azure" "Search" olur. Varsayılan değer doğru değeridir.

name

string

Belirteç filtresinin adı. Yalnızca harf, rakam, boşluk, tire veya alt çizgi içermelidir, yalnızca alfasayısal karakterlerle başlayıp bitebilir ve 128 karakterle sınırlıdır.

preserveOriginal

boolean

False

Özgün sözcüklerin korunup alt sözcük listesine eklenip eklenmeyeceğini gösteren değer. Varsayılan değer false’tur.

protectedWords

string[]

Sınırlandırılmaya karşı korunacak belirteçlerin listesi.

splitOnCaseChange

boolean

True

caseChange üzerinde sözcüklerin bölünerek bölünmeyeceğini belirten değer. Örneğin, bu true olarak ayarlanırsa, "AzureSearch" "Azure" "Search" olur. Varsayılan değer doğru değeridir.

splitOnNumerics

boolean

True

Sayılarla bölünip bölünmeyeceğini belirten bir değer. Örneğin, bu true olarak ayarlanırsa, "Azure1Search" "Azure" "1" "Search" olur. Varsayılan değer doğru değeridir.

stemEnglishPossessive

boolean

True

Her alt kelime için sondaki "'ların" kaldırılıp kaldırılmayacağını belirten bir değer. Varsayılan değer doğru değeridir.