Megosztás a következőn keresztül:


Indexes - Create Or Update

Létrehoz egy új keresési indexet, vagy frissíti az indexet, ha már létezik.

PUT {endpoint}/indexes('{indexName}')?api-version=2024-03-01-Preview
PUT {endpoint}/indexes('{indexName}')?allowIndexDowntime={allowIndexDowntime}&api-version=2024-03-01-Preview

URI-paraméterek

Name In Kötelező Típus Description
endpoint
path True

string

A keresési szolgáltatás végponti URL-címe.

indexName
path True

string

A létrehozandó vagy frissíteni kívánt index definíciója.

api-version
query True

string

Ügyfél API-verziója.

allowIndexDowntime
query

boolean

Lehetővé teszi, hogy az új elemzők, jogkivonat-elemzők, jogkivonatszűrők vagy karakterszűrők legalább néhány másodpercre offline állapotba kerülnek az indexhez. Ez ideiglenesen az indexelés és a lekérdezési kérések sikertelenségéhez vezet. Az index teljesítménye és írási rendelkezésre állása az index frissítése után néhány percig, illetve a nagyon nagy indexek esetében hosszabb ideig is romlhat.

Kérelem fejléce

Name Kötelező Típus Description
x-ms-client-request-id

string

uuid

A kéréssel együtt küldött nyomkövetési azonosító, amely segít a hibakeresésben.

If-Match

string

Meghatározza a If-Match feltételt. A művelet csak akkor lesz végrehajtva, ha a kiszolgálón lévő ETag megfelel ennek az értéknek.

If-None-Match

string

Meghatározza az If-None-Match feltételt. A műveletet csak akkor hajtja végre a rendszer, ha a kiszolgálón lévő ETag nem egyezik meg ezzel az értékkel.

Prefer True

string

HTTP PUT-kérések esetén a szolgáltatás utasítja a létrehozott/frissített erőforrás sikeres visszaadására.

Kérelem törzse

Name Kötelező Típus Description
fields True

SearchField[]

Az index mezői.

name True

string

Az index neve.

@odata.etag

string

Az index ETagje.

analyzers LexicalAnalyzer[]:
  • CustomAnalyzer[]
  • PatternAnalyzer[]
  • LuceneStandardAnalyzer[]
  • StopAnalyzer[]

Az index elemzői.

charFilters CharFilter[]:
  • MappingCharFilter[]
  • PatternReplaceCharFilter[]

Az index karakterszűrői.

corsOptions

CorsOptions

Az index forrásközi erőforrás-megosztásának (CORS) szabályozására szolgáló beállítások.

defaultScoringProfile

string

A használni kívánt pontozási profil neve, ha nincs megadva a lekérdezésben. Ha ez a tulajdonság nincs beállítva, és nincs megadva pontozási profil a lekérdezésben, akkor az alapértelmezett pontozás (tf-idf) lesz használva.

encryptionKey

SearchResourceEncryptionKey

Az Azure Key Vault-ben létrehozott titkosítási kulcs leírása. Ez a kulcs további titkosítási szintet biztosít az adatok számára, ha teljes körű biztosítékot szeretne kapni arról, hogy senki, még a Microsoft sem tudja visszafejteni az adatokat. Miután titkosította az adatokat, az mindig titkosítva marad. A keresési szolgáltatás figyelmen kívül hagyja a tulajdonság null értékűre történő beállítására tett kísérleteket. Szükség szerint módosíthatja ezt a tulajdonságot, ha el szeretné forgatni a titkosítási kulcsot; Az adatok nem lesznek hatással. Az ügyfél által felügyelt kulcsokkal történő titkosítás nem érhető el az ingyenes keresési szolgáltatásokhoz, és csak a 2019. január 1-jén vagy azt követően létrehozott fizetős szolgáltatásokhoz érhető el.

normalizers LexicalNormalizer[]:

CustomNormalizer[]

Az index normalizálói.

scoringProfiles

ScoringProfile[]

Az index pontozási profiljai.

semantic

SemanticSettings

Olyan keresési index paramétereit határozza meg, amelyek befolyásolják a szemantikai képességeket.

similarity Similarity:

A keresési lekérdezésnek megfelelő dokumentumok pontozásához és rangsorolásához használandó hasonlósági algoritmus típusa. A hasonlósági algoritmus csak az indexlétrehozáskor definiálható, és nem módosítható a meglévő indexeken. Null érték esetén a ClassicSimilarity algoritmust használja a rendszer.

suggesters

Suggester[]

Az index javaslattevői.

tokenFilters TokenFilter[]:
  • AsciiFoldingTokenFilter[]
  • CjkBigramTokenFilter[]
  • CommonGramTokenFilter[]
  • DictionaryDecompounderTokenFilter[]
  • EdgeNGramTokenFilter[]
  • EdgeNGramTokenFilterV2[]
  • ElisionTokenFilter[]
  • KeepTokenFilter[]
  • KeywordMarkerTokenFilter[]
  • LengthTokenFilter[]
  • LimitTokenFilter[]
  • NGramTokenFilter[]
  • NGramTokenFilterV2[]
  • PatternCaptureTokenFilter[]
  • PatternReplaceTokenFilter[]
  • PhoneticTokenFilter[]
  • ShingleTokenFilter[]
  • SnowballTokenFilter[]
  • StemmerTokenFilter[]
  • StemmerOverrideTokenFilter[]
  • StopwordsTokenFilter[]
  • SynonymTokenFilter[]
  • TruncateTokenFilter[]
  • UniqueTokenFilter[]
  • WordDelimiterTokenFilter[]

Az index jogkivonat-szűrői.

tokenizers LexicalTokenizer[]:
  • ClassicTokenizer[]
  • EdgeNGramTokenizer[]
  • KeywordTokenizer[]
  • KeywordTokenizerV2[]
  • MicrosoftLanguageTokenizer[]
  • MicrosoftLanguageStemmingTokenizer[]
  • NGramTokenizer[]
  • PathHierarchyTokenizerV2[]
  • PatternTokenizer[]
  • LuceneStandardTokenizer[]
  • LuceneStandardTokenizerV2[]
  • UaxUrlEmailTokenizer[]

Az index jogkivonat-szabályzói.

vectorSearch

VectorSearch

A vektorkereséshez kapcsolódó konfigurációs beállításokat tartalmazza.

Válaszok

Name Típus Description
200 OK

SearchIndex

201 Created

SearchIndex

Other Status Codes

ErrorResponse

Hibaválasz.

Példák

SearchServiceCreateOrUpdateIndex

Sample Request

PUT https://myservice.search.windows.net/indexes('hotels')?allowIndexDowntime=False&api-version=2024-03-01-Preview


{
  "name": "hotels",
  "fields": [
    {
      "name": "hotelId",
      "type": "Edm.String",
      "key": true,
      "searchable": false
    },
    {
      "name": "baseRate",
      "type": "Edm.Double"
    },
    {
      "name": "description",
      "type": "Edm.String",
      "filterable": false,
      "sortable": false,
      "facetable": false
    },
    {
      "name": "descriptionEmbedding",
      "type": "Collection(Edm.Single)",
      "searchable": true,
      "filterable": false,
      "retrievable": true,
      "sortable": false,
      "facetable": false,
      "key": false,
      "indexAnalyzer": null,
      "searchAnalyzer": null,
      "analyzer": null,
      "synonymMaps": [],
      "dimensions": 1536,
      "vectorSearchProfile": "myHnswProfile"
    },
    {
      "name": "descriptionEmbedding_notstored",
      "type": "Collection(Edm.Single)",
      "searchable": true,
      "filterable": false,
      "retrievable": false,
      "stored": false,
      "sortable": false,
      "facetable": false,
      "key": false,
      "indexAnalyzer": null,
      "searchAnalyzer": null,
      "analyzer": null,
      "synonymMaps": [],
      "dimensions": 1536,
      "vectorSearchProfile": "myCompressedHnswProfile"
    },
    {
      "name": "description_fr",
      "type": "Edm.String",
      "filterable": false,
      "sortable": false,
      "facetable": false,
      "analyzer": "fr.lucene"
    },
    {
      "name": "hotelName",
      "type": "Edm.String"
    },
    {
      "name": "category",
      "type": "Edm.String"
    },
    {
      "name": "tags",
      "type": "Collection(Edm.String)",
      "analyzer": "tagsAnalyzer"
    },
    {
      "name": "parkingIncluded",
      "type": "Edm.Boolean"
    },
    {
      "name": "smokingAllowed",
      "type": "Edm.Boolean"
    },
    {
      "name": "lastRenovationDate",
      "type": "Edm.DateTimeOffset"
    },
    {
      "name": "rating",
      "type": "Edm.Int32"
    },
    {
      "name": "location",
      "type": "Edm.GeographyPoint"
    }
  ],
  "scoringProfiles": [
    {
      "name": "geo",
      "text": {
        "weights": {
          "hotelName": 5
        }
      },
      "functions": [
        {
          "type": "distance",
          "boost": 5,
          "fieldName": "location",
          "interpolation": "logarithmic",
          "distance": {
            "referencePointParameter": "currentLocation",
            "boostingDistance": 10
          }
        }
      ]
    }
  ],
  "defaultScoringProfile": "geo",
  "suggesters": [
    {
      "name": "sg",
      "searchMode": "analyzingInfixMatching",
      "sourceFields": [
        "hotelName"
      ]
    }
  ],
  "analyzers": [
    {
      "name": "tagsAnalyzer",
      "@odata.type": "#Microsoft.Azure.Search.CustomAnalyzer",
      "charFilters": [
        "html_strip"
      ],
      "tokenizer": "standard_v2"
    }
  ],
  "corsOptions": {
    "allowedOrigins": [
      "tempuri.org"
    ],
    "maxAgeInSeconds": 60
  },
  "encryptionKey": {
    "keyVaultKeyName": "myUserManagedEncryptionKey-createdinAzureKeyVault",
    "keyVaultKeyVersion": "myKeyVersion-32charAlphaNumericString",
    "keyVaultUri": "https://myKeyVault.vault.azure.net",
    "accessCredentials": null
  },
  "similarity": {
    "@odata.type": "#Microsoft.Azure.Search.ClassicSimilarity"
  },
  "semantic": {
    "configurations": [
      {
        "name": "semanticHotels",
        "prioritizedFields": {
          "titleField": {
            "fieldName": "hotelName"
          },
          "prioritizedContentFields": [
            {
              "fieldName": "description"
            },
            {
              "fieldName": "description_fr"
            }
          ],
          "prioritizedKeywordsFields": [
            {
              "fieldName": "tags"
            },
            {
              "fieldName": "category"
            }
          ]
        }
      }
    ]
  },
  "vectorSearch": {
    "profiles": [
      {
        "name": "myHnswProfile",
        "algorithm": "myHnsw",
        "vectorizer": "myOpenAi"
      },
      {
        "name": "myCompressedHnswProfile",
        "algorithm": "myHnsw",
        "vectorizer": "myOpenAi",
        "compression": "mySQ8"
      },
      {
        "name": "myAlgorithm",
        "algorithm": "myHnsw"
      }
    ],
    "algorithms": [
      {
        "name": "myHnsw",
        "kind": "hnsw",
        "hnswParameters": {
          "m": 4,
          "metric": "cosine",
          "efConstruction": 400,
          "efSearch": 500
        }
      },
      {
        "name": "myExhaustiveKnn",
        "kind": "exhaustiveKnn",
        "exhaustiveKnnParameters": {
          "metric": "cosine"
        }
      }
    ],
    "compressions": [
      {
        "name": "mySQ8",
        "kind": "scalarQuantization",
        "scalarQuantizationParameters": {
          "quantizedDataType": "int8"
        },
        "rerankWithOriginalVectors": true,
        "defaultOversampling": 10
      }
    ],
    "vectorizers": [
      {
        "name": "myOpenAi",
        "kind": "azureOpenAI",
        "azureOpenAIParameters": {
          "resourceUri": "https://url.openai.azure.com",
          "deploymentId": "text-embedding-ada-002",
          "apiKey": "topsecretkey"
        }
      }
    ]
  }
}

Sample Response

{
  "name": "hotels",
  "fields": [
    {
      "name": "hotelId",
      "type": "Edm.String",
      "searchable": false,
      "filterable": true,
      "retrievable": true,
      "sortable": true,
      "facetable": true,
      "key": true,
      "indexAnalyzer": null,
      "searchAnalyzer": null,
      "analyzer": null,
      "normalizer": null,
      "dimensions": null,
      "vectorSearchProfile": null,
      "synonymMaps": []
    },
    {
      "name": "baseRate",
      "type": "Edm.Double",
      "searchable": false,
      "filterable": true,
      "retrievable": true,
      "sortable": true,
      "facetable": true,
      "key": false,
      "indexAnalyzer": null,
      "searchAnalyzer": null,
      "analyzer": null,
      "normalizer": null,
      "dimensions": null,
      "vectorSearchProfile": null,
      "synonymMaps": []
    },
    {
      "name": "description",
      "type": "Edm.String",
      "searchable": true,
      "filterable": false,
      "retrievable": true,
      "sortable": false,
      "facetable": false,
      "key": false,
      "indexAnalyzer": null,
      "searchAnalyzer": null,
      "analyzer": null,
      "normalizer": null,
      "dimensions": null,
      "vectorSearchProfile": null,
      "synonymMaps": []
    },
    {
      "name": "descriptionEmbedding",
      "type": "Collection(Edm.Single)",
      "searchable": true,
      "filterable": false,
      "retrievable": true,
      "sortable": false,
      "facetable": false,
      "key": false,
      "indexAnalyzer": null,
      "searchAnalyzer": null,
      "analyzer": null,
      "normalizer": null,
      "dimensions": 1536,
      "vectorSearchProfile": "myHnswProfile",
      "synonymMaps": []
    },
    {
      "name": "descriptionEmbedding_notstored",
      "type": "Collection(Edm.Single)",
      "searchable": true,
      "filterable": false,
      "retrievable": false,
      "stored": false,
      "sortable": false,
      "facetable": false,
      "key": false,
      "indexAnalyzer": null,
      "searchAnalyzer": null,
      "analyzer": null,
      "synonymMaps": [],
      "dimensions": 1536,
      "vectorSearchProfile": "myCompressedHnswProfile"
    },
    {
      "name": "description_fr",
      "type": "Edm.String",
      "searchable": true,
      "filterable": false,
      "retrievable": true,
      "sortable": false,
      "facetable": false,
      "key": false,
      "indexAnalyzer": null,
      "searchAnalyzer": null,
      "analyzer": "fr.lucene",
      "normalizer": null,
      "dimensions": null,
      "vectorSearchProfile": null,
      "synonymMaps": []
    },
    {
      "name": "hotelName",
      "type": "Edm.String",
      "searchable": true,
      "filterable": true,
      "retrievable": true,
      "sortable": true,
      "facetable": true,
      "key": false,
      "indexAnalyzer": null,
      "searchAnalyzer": null,
      "analyzer": null,
      "normalizer": null,
      "dimensions": null,
      "vectorSearchProfile": null,
      "synonymMaps": []
    },
    {
      "name": "category",
      "type": "Edm.String",
      "searchable": true,
      "filterable": true,
      "retrievable": true,
      "sortable": true,
      "facetable": true,
      "key": false,
      "indexAnalyzer": null,
      "searchAnalyzer": null,
      "analyzer": null,
      "normalizer": null,
      "dimensions": null,
      "vectorSearchProfile": null,
      "synonymMaps": []
    },
    {
      "name": "tags",
      "type": "Collection(Edm.String)",
      "searchable": true,
      "filterable": true,
      "retrievable": true,
      "sortable": false,
      "facetable": true,
      "key": false,
      "indexAnalyzer": null,
      "searchAnalyzer": null,
      "analyzer": "tagsAnalyzer",
      "normalizer": null,
      "dimensions": null,
      "vectorSearchProfile": null,
      "synonymMaps": []
    },
    {
      "name": "parkingIncluded",
      "type": "Edm.Boolean",
      "searchable": false,
      "filterable": true,
      "retrievable": true,
      "sortable": true,
      "facetable": true,
      "key": false,
      "indexAnalyzer": null,
      "searchAnalyzer": null,
      "analyzer": null,
      "normalizer": null,
      "dimensions": null,
      "vectorSearchProfile": null,
      "synonymMaps": []
    },
    {
      "name": "smokingAllowed",
      "type": "Edm.Boolean",
      "searchable": false,
      "filterable": true,
      "retrievable": true,
      "sortable": true,
      "facetable": true,
      "key": false,
      "indexAnalyzer": null,
      "searchAnalyzer": null,
      "analyzer": null,
      "normalizer": null,
      "dimensions": null,
      "vectorSearchProfile": null,
      "synonymMaps": []
    },
    {
      "name": "lastRenovationDate",
      "type": "Edm.DateTimeOffset",
      "searchable": false,
      "filterable": true,
      "retrievable": true,
      "sortable": true,
      "facetable": true,
      "key": false,
      "indexAnalyzer": null,
      "searchAnalyzer": null,
      "analyzer": null,
      "normalizer": null,
      "dimensions": null,
      "vectorSearchProfile": null,
      "synonymMaps": []
    },
    {
      "name": "rating",
      "type": "Edm.Int32",
      "searchable": false,
      "filterable": true,
      "retrievable": true,
      "sortable": true,
      "facetable": true,
      "key": false,
      "indexAnalyzer": null,
      "searchAnalyzer": null,
      "analyzer": null,
      "normalizer": null,
      "dimensions": null,
      "vectorSearchProfile": null,
      "synonymMaps": []
    },
    {
      "name": "location",
      "type": "Edm.GeographyPoint",
      "searchable": false,
      "filterable": true,
      "retrievable": true,
      "sortable": true,
      "facetable": false,
      "key": false,
      "indexAnalyzer": null,
      "searchAnalyzer": null,
      "analyzer": null,
      "normalizer": null,
      "dimensions": null,
      "vectorSearchProfile": null,
      "synonymMaps": []
    }
  ],
  "scoringProfiles": [
    {
      "name": "geo",
      "functionAggregation": "sum",
      "text": {
        "weights": {
          "hotelName": 5
        }
      },
      "functions": [
        {
          "fieldName": "location",
          "interpolation": "logarithmic",
          "type": "distance",
          "boost": 5,
          "distance": {
            "referencePointParameter": "currentLocation",
            "boostingDistance": 10
          }
        }
      ]
    }
  ],
  "defaultScoringProfile": "geo",
  "similarity": {
    "@odata.type": "#Microsoft.Azure.Search.BM25Similarity",
    "k1": null,
    "b": null
  },
  "suggesters": [
    {
      "name": "sg",
      "searchMode": "analyzingInfixMatching",
      "sourceFields": [
        "hotelName"
      ]
    }
  ],
  "analyzers": [
    {
      "@odata.type": "#Microsoft.Azure.Search.CustomAnalyzer",
      "name": "tagsAnalyzer",
      "tokenizer": "standard_v2",
      "tokenFilters": [],
      "charFilters": [
        "html_strip"
      ]
    }
  ],
  "normalizers": [],
  "tokenizers": [],
  "tokenFilters": [],
  "charFilters": [],
  "corsOptions": {
    "allowedOrigins": [
      "tempuri.org"
    ],
    "maxAgeInSeconds": 60
  },
  "encryptionKey": {
    "keyVaultKeyName": "myKeyName",
    "keyVaultKeyVersion": "myKeyVersion",
    "keyVaultUri": "https://myKeyVault.vault.azure.net",
    "accessCredentials": {
      "applicationId": "00000000-0000-0000-0000-000000000000",
      "applicationSecret": null
    }
  },
  "semantic": {
    "defaultConfiguration": null,
    "configurations": [
      {
        "name": "semanticHotels",
        "prioritizedFields": {
          "titleField": {
            "fieldName": "hotelName"
          },
          "prioritizedContentFields": [
            {
              "fieldName": "description"
            },
            {
              "fieldName": "description_fr"
            }
          ],
          "prioritizedKeywordsFields": [
            {
              "fieldName": "tags"
            },
            {
              "fieldName": "category"
            }
          ]
        }
      }
    ]
  },
  "vectorSearch": {
    "algorithms": [
      {
        "name": "myHnsw",
        "kind": "hnsw",
        "hnswParameters": {
          "metric": "cosine",
          "m": 4,
          "efConstruction": 400,
          "efSearch": 500
        }
      },
      {
        "name": "myExhaustiveKnn",
        "kind": "exhaustiveKnn",
        "exhaustiveKnnParameters": {
          "metric": "cosine"
        }
      }
    ],
    "compressions": [
      {
        "name": "mySQ8",
        "kind": "scalarQuantization",
        "scalarQuantizationParameters": {
          "quantizedDataType": "int8"
        },
        "rerankWithOriginalVectors": true,
        "defaultOversampling": 10
      }
    ],
    "profiles": [
      {
        "name": "myHnswProfile",
        "algorithm": "myHnsw",
        "vectorizer": "myOpenAi"
      },
      {
        "name": "myCompressedHnswProfile",
        "algorithm": "myHnsw",
        "vectorizer": "myOpenAi",
        "compression": "mySQ8"
      },
      {
        "name": "myAlgorithm",
        "algorithm": "myHnsw"
      }
    ],
    "vectorizers": [
      {
        "name": "myOpenAi",
        "kind": "azureOpenAI",
        "azureOpenAIParameters": {
          "resourceUri": "https://url.openai.azure.com",
          "deploymentId": "text-embedding-ada-002",
          "apiKey": "topsecretkey",
          "authIdentity": null
        }
      }
    ]
  }
}
{
  "name": "hotels",
  "fields": [
    {
      "name": "hotelId",
      "type": "Edm.String",
      "searchable": false,
      "filterable": true,
      "retrievable": true,
      "sortable": true,
      "facetable": true,
      "key": true,
      "indexAnalyzer": null,
      "searchAnalyzer": null,
      "analyzer": null,
      "normalizer": null,
      "dimensions": null,
      "vectorSearchProfile": null,
      "synonymMaps": []
    },
    {
      "name": "baseRate",
      "type": "Edm.Double",
      "searchable": false,
      "filterable": true,
      "retrievable": true,
      "sortable": true,
      "facetable": true,
      "key": false,
      "indexAnalyzer": null,
      "searchAnalyzer": null,
      "analyzer": null,
      "normalizer": null,
      "dimensions": null,
      "vectorSearchProfile": null,
      "synonymMaps": []
    },
    {
      "name": "description",
      "type": "Edm.String",
      "searchable": true,
      "filterable": false,
      "retrievable": true,
      "sortable": false,
      "facetable": false,
      "key": false,
      "indexAnalyzer": null,
      "searchAnalyzer": null,
      "analyzer": null,
      "normalizer": null,
      "dimensions": null,
      "vectorSearchProfile": null,
      "synonymMaps": []
    },
    {
      "name": "descriptionEmbedding",
      "type": "Collection(Edm.Single)",
      "searchable": true,
      "filterable": false,
      "retrievable": true,
      "sortable": false,
      "facetable": false,
      "key": false,
      "indexAnalyzer": null,
      "searchAnalyzer": null,
      "analyzer": null,
      "normalizer": null,
      "dimensions": 1536,
      "vectorSearchProfile": "myHnswProfile",
      "synonymMaps": []
    },
    {
      "name": "descriptionEmbedding_notstored",
      "type": "Collection(Edm.Single)",
      "searchable": true,
      "filterable": false,
      "retrievable": false,
      "stored": false,
      "sortable": false,
      "facetable": false,
      "key": false,
      "indexAnalyzer": null,
      "searchAnalyzer": null,
      "analyzer": null,
      "synonymMaps": [],
      "dimensions": 1536,
      "vectorSearchProfile": "myCompressedHnswProfile"
    },
    {
      "name": "description_fr",
      "type": "Edm.String",
      "searchable": true,
      "filterable": false,
      "retrievable": true,
      "sortable": false,
      "facetable": false,
      "key": false,
      "indexAnalyzer": null,
      "searchAnalyzer": null,
      "analyzer": "fr.lucene",
      "normalizer": null,
      "dimensions": null,
      "vectorSearchProfile": null,
      "synonymMaps": []
    },
    {
      "name": "hotelName",
      "type": "Edm.String",
      "searchable": true,
      "filterable": true,
      "retrievable": true,
      "sortable": true,
      "facetable": true,
      "key": false,
      "indexAnalyzer": null,
      "searchAnalyzer": null,
      "analyzer": null,
      "normalizer": null,
      "dimensions": null,
      "vectorSearchProfile": null,
      "synonymMaps": []
    },
    {
      "name": "category",
      "type": "Edm.String",
      "searchable": true,
      "filterable": true,
      "retrievable": true,
      "sortable": true,
      "facetable": true,
      "key": false,
      "indexAnalyzer": null,
      "searchAnalyzer": null,
      "analyzer": null,
      "normalizer": null,
      "dimensions": null,
      "vectorSearchProfile": null,
      "synonymMaps": []
    },
    {
      "name": "tags",
      "type": "Collection(Edm.String)",
      "searchable": true,
      "filterable": true,
      "retrievable": true,
      "sortable": false,
      "facetable": true,
      "key": false,
      "indexAnalyzer": null,
      "searchAnalyzer": null,
      "analyzer": "tagsAnalyzer",
      "normalizer": null,
      "dimensions": null,
      "vectorSearchProfile": null,
      "synonymMaps": []
    },
    {
      "name": "parkingIncluded",
      "type": "Edm.Boolean",
      "searchable": false,
      "filterable": true,
      "retrievable": true,
      "sortable": true,
      "facetable": true,
      "key": false,
      "indexAnalyzer": null,
      "searchAnalyzer": null,
      "analyzer": null,
      "normalizer": null,
      "dimensions": null,
      "vectorSearchProfile": null,
      "synonymMaps": []
    },
    {
      "name": "smokingAllowed",
      "type": "Edm.Boolean",
      "searchable": false,
      "filterable": true,
      "retrievable": true,
      "sortable": true,
      "facetable": true,
      "key": false,
      "indexAnalyzer": null,
      "searchAnalyzer": null,
      "analyzer": null,
      "normalizer": null,
      "dimensions": null,
      "vectorSearchProfile": null,
      "synonymMaps": []
    },
    {
      "name": "lastRenovationDate",
      "type": "Edm.DateTimeOffset",
      "searchable": false,
      "filterable": true,
      "retrievable": true,
      "sortable": true,
      "facetable": true,
      "key": false,
      "indexAnalyzer": null,
      "searchAnalyzer": null,
      "analyzer": null,
      "normalizer": null,
      "dimensions": null,
      "vectorSearchProfile": null,
      "synonymMaps": []
    },
    {
      "name": "rating",
      "type": "Edm.Int32",
      "searchable": false,
      "filterable": true,
      "retrievable": true,
      "sortable": true,
      "facetable": true,
      "key": false,
      "indexAnalyzer": null,
      "searchAnalyzer": null,
      "analyzer": null,
      "normalizer": null,
      "dimensions": null,
      "vectorSearchProfile": null,
      "synonymMaps": []
    },
    {
      "name": "location",
      "type": "Edm.GeographyPoint",
      "searchable": false,
      "filterable": true,
      "retrievable": true,
      "sortable": true,
      "facetable": false,
      "key": false,
      "indexAnalyzer": null,
      "searchAnalyzer": null,
      "analyzer": null,
      "normalizer": null,
      "dimensions": null,
      "vectorSearchProfile": null,
      "synonymMaps": []
    }
  ],
  "scoringProfiles": [
    {
      "name": "geo",
      "functionAggregation": "sum",
      "text": {
        "weights": {
          "hotelName": 5
        }
      },
      "functions": [
        {
          "fieldName": "location",
          "interpolation": "logarithmic",
          "type": "distance",
          "boost": 5,
          "distance": {
            "referencePointParameter": "currentLocation",
            "boostingDistance": 10
          }
        }
      ]
    }
  ],
  "defaultScoringProfile": "geo",
  "suggesters": [
    {
      "name": "sg",
      "searchMode": "analyzingInfixMatching",
      "sourceFields": [
        "hotelName"
      ]
    }
  ],
  "analyzers": [
    {
      "name": "tagsAnalyzer",
      "@odata.type": "#Microsoft.Azure.Search.CustomAnalyzer",
      "charFilters": [
        "html_strip"
      ],
      "tokenizer": "standard_v2",
      "tokenFilters": []
    }
  ],
  "normalizers": [],
  "tokenizers": [],
  "tokenFilters": [],
  "charFilters": [],
  "corsOptions": {
    "allowedOrigins": [
      "tempuri.org"
    ],
    "maxAgeInSeconds": 60
  },
  "encryptionKey": {
    "keyVaultKeyName": "myUserManagedEncryptionKey-createdinAzureKeyVault",
    "keyVaultKeyVersion": "myKeyVersion-32charAlphaNumericString",
    "keyVaultUri": "https://myKeyVault.vault.azure.net",
    "accessCredentials": null
  },
  "semantic": {
    "defaultConfiguration": null,
    "configurations": [
      {
        "name": "semanticHotels",
        "prioritizedFields": {
          "titleField": {
            "fieldName": "hotelName"
          },
          "prioritizedContentFields": [
            {
              "fieldName": "description"
            },
            {
              "fieldName": "description_fr"
            }
          ],
          "prioritizedKeywordsFields": [
            {
              "fieldName": "tags"
            },
            {
              "fieldName": "category"
            }
          ]
        }
      }
    ]
  },
  "vectorSearch": {
    "algorithms": [
      {
        "name": "myHnsw",
        "kind": "hnsw",
        "hnswParameters": {
          "metric": "cosine",
          "m": 4,
          "efConstruction": 400,
          "efSearch": 500
        }
      },
      {
        "name": "myExhaustiveKnn",
        "kind": "exhaustiveKnn",
        "exhaustiveKnnParameters": {
          "metric": "cosine"
        }
      }
    ],
    "compressions": [
      {
        "name": "mySQ8",
        "kind": "scalarQuantization",
        "scalarQuantizationParameters": {
          "quantizedDataType": "int8"
        },
        "rerankWithOriginalVectors": true,
        "defaultOversampling": 10
      }
    ],
    "profiles": [
      {
        "name": "myHnswProfile",
        "algorithm": "myHnsw",
        "vectorizer": "myOpenAi"
      },
      {
        "name": "myCompressedHnswProfile",
        "algorithm": "myHnsw",
        "vectorizer": "myOpenAi",
        "compression": "mySQ8"
      },
      {
        "name": "myAlgorithm",
        "algorithm": "myHnsw"
      }
    ],
    "vectorizers": [
      {
        "name": "myOpenAi",
        "kind": "azureOpenAI",
        "azureOpenAIParameters": {
          "resourceUri": "https://url.openai.azure.com",
          "deploymentId": "text-embedding-ada-002",
          "apiKey": "topsecretkey",
          "authIdentity": null
        }
      }
    ]
  }
}

Definíciók

Name Description
AsciiFoldingTokenFilter

Az első 127 ASCII-karakterben nem szereplő unicode-karaktereket (az "Egyszerű latin" Unicode-blokkot) ASCII-ekvivalenssé alakítja át, ha léteznek ilyen megfelelők. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.

AzureActiveDirectoryApplicationCredentials

A keresési szolgáltatáshoz létrehozott regisztrált alkalmazás hitelesítő adatai, amelyet az Azure Key Vault tárolt titkosítási kulcsokhoz való hitelesített hozzáféréshez használnak.

AzureOpenAIParameters

Meghatározza az Azure OpenAI-erőforráshoz való csatlakozás paramétereit.

AzureOpenAIVectorizer

Megadja a lekérdezési sztringek vektorizálásához használt Azure OpenAI-erőforrást.

BM25Similarity

Az Okapi BM25 hasonlósági algoritmuson alapuló rangsorolási függvény. A BM25 egy TF-IDF-szerű algoritmus, amely magában foglalja a hossz normalizálását (amelyet a "b" paraméter szabályoz), valamint a kifejezés frekvenciatelítettségét (amelyet a "k1" paraméter szabályoz).

CharFilterName

Meghatározza a keresőmotor által támogatott összes karakterszűrő nevét.

CjkBigramTokenFilter

Forms standard tokenizerből létrehozott CJK-kifejezések bigramját. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.

CjkBigramTokenFilterScripts

A CjkBigramTokenFilter által figyelmen kívül hagyható szkriptek.

ClassicSimilarity

Örökölt hasonlósági algoritmus, amely a TF-IDF Lucene TFIDFSimilarity implementációját használja. A TF-IDF ezen változata statikus dokumentumhossz normalizálást vezet be, valamint koordinálja azokat a tényezőket, amelyek csak részben egyeznek a keresett lekérdezésekkel.

ClassicTokenizer

Nyelvtanalapú tokenizer, amely alkalmas a legtöbb európai nyelvű dokumentum feldolgozására. Ez a tokenizer az Apache Lucene használatával van implementálva.

CommonGramTokenFilter

Bigramokat hozhat létre az indexelés során gyakran előforduló kifejezésekhez. Az egyes kifejezések továbbra is indexelve vannak, és a bigramok túl vannak osztva. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.

CorsOptions

Meghatározza az indexek eltérő eredetű erőforrás-megosztásának (CORS) szabályozására szolgáló beállításokat.

CustomAnalyzer

Lehetővé teszi, hogy átvegye az irányítást a szöveg indexelhető/kereshető tokenekké alakításának folyamata felett. Ez egy felhasználó által definiált konfiguráció, amely egyetlen előre definiált tokenizerből és egy vagy több szűrőből áll. A jogkivonat-készítő felelős azért, hogy a szöveget jogkivonatokká bontsa, és a jogkivonat-készítő által kibocsátott jogkivonatok módosítására szolgáló szűrőket.

CustomNormalizer

Lehetővé teszi a normalizálás konfigurálását szűrhető, rendezhető és táblázatos mezőkhöz, amelyek alapértelmezés szerint szigorú egyezéssel működnek. Ez egy felhasználó által definiált konfiguráció, amely legalább egy szűrőből áll, és módosítja a tárolt jogkivonatot.

CustomVectorizer

Felhasználó által definiált vektorizálót ad meg egy lekérdezési sztring vektorbeágyazásának létrehozásához. A külső vektorizáló integrációja egy képességcsoport egyéni webes API-felületével valósítható meg.

CustomWebApiParameters

Megadja a felhasználó által definiált vektorizálóhoz való csatlakozás tulajdonságait.

DictionaryDecompounderTokenFilter

Felbontja a sok germán nyelven található összetett szavakat. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.

DistanceScoringFunction

Olyan függvényt definiál, amely a földrajzi helytől való távolság alapján növeli a pontszámokat.

DistanceScoringParameters

Paraméterértékeket biztosít egy távolsági pontozási függvénynek.

EdgeNGramTokenFilter

A megadott méret(ek) n grammját generálja egy bemeneti jogkivonat elejétől vagy hátuljától kezdve. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.

EdgeNGramTokenFilterSide

Meghatározza, hogy a bemenet melyik oldaláról kell n-gramot létrehozni.

EdgeNGramTokenFilterV2

A megadott méret(ek) n grammját generálja egy bemeneti jogkivonat elejétől vagy hátuljától kezdve. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.

EdgeNGramTokenizer

Tokenizálja a bemenetet egy élről az adott méret(ek) n-grammjára. Ez a tokenizer az Apache Lucene használatával van implementálva.

ElisionTokenFilter

Eltávolítja az elisions elemet. A "l'avion" (a sík) például "avion" (sík) lesz átalakítva. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.

ErrorAdditionalInfo

Az erőforrás-kezelési hiba további információi.

ErrorDetail

A hiba részletei.

ErrorResponse

Hibaválasz

ExhaustiveKnnParameters

A teljes KNN-algoritmusra jellemző paramétereket tartalmazza.

ExhaustiveKnnVectorSearchAlgorithmConfiguration

A lekérdezés során használt teljes KNN-algoritmusra vonatkozó konfigurációs beállításokat tartalmaz, amelyek találgatásos keresést hajtanak végre a teljes vektorindexben.

FreshnessScoringFunction

Olyan függvényt definiál, amely egy dátum-idő mező értéke alapján növeli a pontszámokat.

FreshnessScoringParameters

Paraméterértékeket biztosít egy frissesség-pontozási függvénynek.

HnswParameters

A HNSW algoritmusra jellemző paramétereket tartalmazza.

HnswVectorSearchAlgorithmConfiguration

Az indexelés és a lekérdezés során használt HNSW közelítő szomszéd algoritmusra vonatkozó konfigurációs beállításokat tartalmaz. A HNSW algoritmus a keresési sebesség és a pontosság közötti kompromisszumot kínálja.

KeepTokenFilter

Egy jogkivonatszűrő, amely csak a megadott szavak listájában lévő szöveget tartalmazó jogkivonatokat tárolja. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.

KeywordMarkerTokenFilter

Kulcsszavakként jelöli meg a kifejezéseket. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.

KeywordTokenizer

A teljes bemenetet egyetlen tokenként bocsátja ki. Ez a tokenizer az Apache Lucene használatával van implementálva.

KeywordTokenizerV2

A teljes bemenetet egyetlen tokenként bocsátja ki. Ez a tokenizer az Apache Lucene használatával van implementálva.

LengthTokenFilter

Eltávolítja a túl hosszú vagy túl rövid szavakat. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.

LexicalAnalyzerName

Meghatározza a keresőmotor által támogatott összes szövegelemző nevét.

LexicalNormalizerName

Meghatározza a keresőmotor által támogatott összes szövegnormalizáló nevét.

LexicalTokenizerName

Meghatározza a keresőmotor által támogatott összes tokenizer nevét.

LimitTokenFilter

Korlátozza a tokenek számát az indexelés során. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.

LuceneStandardAnalyzer

Standard Apache Lucene-elemző; A standard tokenizerből, kisbetűs szűrőből és leállítási szűrőből áll.

LuceneStandardTokenizer

A Unicode-szöveg szegmentálási szabályai szerint töri a szöveget. Ez a jogkivonat-szabályzó az Apache Lucene használatával van implementálva.

LuceneStandardTokenizerV2

A Unicode-szöveg szegmentálási szabályai szerint töri a szöveget. Ez a jogkivonat-szabályzó az Apache Lucene használatával van implementálva.

MagnitudeScoringFunction

Olyan függvényt definiál, amely egy numerikus mező nagysága alapján növeli a pontszámokat.

MagnitudeScoringParameters

Paraméterértékeket ad meg egy nagyságrendi pontozási függvénynek.

MappingCharFilter

Karakterszűrő, amely a leképezési beállítással definiált leképezéseket alkalmazza. A megfeleltetés kapzsi (a leghosszabb mintaegyeztetés egy adott ponton nyer). A csere lehet üres sztring. Ez a karakterszűrő az Apache Lucene használatával van implementálva.

MicrosoftLanguageStemmingTokenizer

Nyelvspecifikus szabályokkal osztja el a szöveget, és a szavakat az alapűrlapokra csökkenti.

MicrosoftLanguageTokenizer

Nyelvspecifikus szabályokkal osztja el a szöveget.

MicrosoftStemmingTokenizerLanguage

Listák a Microsoft nyelvi jogkivonat-kezelője által támogatott nyelveket.

MicrosoftTokenizerLanguage

Listák a Microsoft nyelvi tokenizer által támogatott nyelveket.

NGramTokenFilter

A megadott méret(ek) n-grammját hozza létre. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.

NGramTokenFilterV2

A megadott méret(ek) n-grammját hozza létre. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.

NGramTokenizer

Tokenizálja a bemenetet az adott méret(ek) n-grammjára. Ez a tokenizer az Apache Lucene használatával van implementálva.

PathHierarchyTokenizerV2

Tokenizer elérésiút-szerű hierarchiákhoz. Ez a jogkivonat-szabályzó az Apache Lucene használatával van implementálva.

PatternAnalyzer

A szöveget rugalmasan elválasztja kifejezésekké egy reguláris kifejezésmintával. Ez az elemző az Apache Lucene használatával van implementálva.

PatternCaptureTokenFilter

Java-regexek használatával több tokent bocsát ki – egyet minden rögzítési csoporthoz egy vagy több mintában. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.

PatternReplaceCharFilter

Karakterszűrő, amely lecseréli a bemeneti sztringben szereplő karaktereket. Egy reguláris kifejezéssel azonosítja a megőrizni kívánt karaktersorozatokat, a lecserélendő karaktereket pedig helyettesítő mintával azonosítja. Ha például az "aa bb aa bb", a "(aa)\s+(bb)" minta és az "$1#$2" helyettesítő szöveg szerepel, az eredmény "aa#bb aa#bb". Ez a karakterszűrő az Apache Lucene használatával van implementálva.

PatternReplaceTokenFilter

Karakterszűrő, amely a bemeneti sztringben szereplő karaktereket helyettesíti. Egy reguláris kifejezéssel azonosítja a megőrizendő karaktersorozatokat, a cseremintát pedig a lecserélendő karakterek azonosításához. Például az "aa bb aa bb", "(aa)\s+(bb)" minta és az "$1#$2" helyettesítő szöveg miatt az eredmény "aa#bb aa#bb". Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.

PatternTokenizer

Tokenizer, amely regex mintaegyeztetést használ a különböző tokenek létrehozásához. Ez a jogkivonat-szabályzó az Apache Lucene használatával van implementálva.

PhoneticEncoder

A PhoneticTokenFilterrel használandó fonetikus kódoló típusát azonosítja.

PhoneticTokenFilter

Jogkivonatok létrehozása fonetikus egyezésekhez. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.

PrioritizedFields

A szemantikai rangsoroláshoz, a feliratokhoz, a kiemelésekhez és a válaszokhoz használandó cím-, tartalom- és kulcsszavakmezőket ismerteti.

RegexFlags

Olyan jelzőket definiál, amelyek kombinálhatók annak szabályozására, hogy a reguláris kifejezések hogyan legyenek használva a mintaelemzőben és a mintajogkivonat-jelölőben.

ScalarQuantizationParameters

A skaláris kvantálásra jellemző paramétereket tartalmazza.

ScalarQuantizationVectorSearchCompressionConfiguration

Az indexelés és lekérdezés során használt skaláris kvantálási tömörítési módszerre vonatkozó konfigurációs beállításokat tartalmazza.

ScoringFunctionAggregation

Meghatározza azt az aggregációs függvényt, amely a pontozási profil összes pontozási függvényének eredményeit egyesíti.

ScoringFunctionInterpolation

Meghatározza azt a függvényt, amely a pontszámok több dokumentumra kiterjedő interpolálására szolgál.

ScoringProfile

Olyan keresési index paramétereit határozza meg, amelyek befolyásolják a keresési lekérdezések pontozását.

SearchField

Egy indexdefinícióban lévő mezőt jelöl, amely leírja egy mező nevét, adattípusát és keresési viselkedését.

SearchFieldDataType

Meghatározza egy mező adattípusát egy keresési indexben.

SearchIndex

A keresési index definícióját jelöli, amely egy index mezőit és keresési viselkedését ismerteti.

SearchIndexerDataNoneIdentity

Törli egy adatforrás identitástulajdonságát.

SearchIndexerDataUserAssignedIdentity

Megadja a használni kívánt adatforrás identitását.

SearchResourceEncryptionKey

Ügyfél által felügyelt titkosítási kulcs az Azure Key Vault. A létrehozott és kezelt kulcsok az inaktív adatok, például indexek és szinonimák titkosítására vagy visszafejtésére használhatók.

SemanticConfiguration

Egy adott konfigurációt határoz meg, amelyet a szemantikai képességek kontextusában kell használni.

SemanticField

A szemantikai konfiguráció részeként használt mező.

SemanticSettings

Olyan keresési index paramétereit határozza meg, amelyek befolyásolják a szemantikai képességeket.

ShingleTokenFilter

A jogkivonatok kombinációit egyetlen tokenként hozza létre. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.

SnowballTokenFilter

Egy szűrő, amely a szavakat egy Snowball által generált ősmer használatával szárja. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.

SnowballTokenFilterLanguage

A Snowball-tokenszűrőhöz használandó nyelv.

StemmerOverrideTokenFilter

Lehetővé teszi, hogy felülbírálja a többi szárító szűrőt a saját szótáron alapuló szárítással. A szótárból származó kifejezések kulcsszavakként lesznek megjelölve, így nem lesznek a láncban lévő szárak. A szárító szűrők elé kell helyezni. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.

StemmerTokenFilter

Nyelvspecifikus eredetszűrő. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.

StemmerTokenFilterLanguage

A stemmer token szűrőhöz használandó nyelv.

StopAnalyzer

A szöveget nem betűkkel osztja el; Alkalmazza a kisbetűs és a stopword jogkivonat szűrőit. Ez az elemző az Apache Lucene használatával van implementálva.

StopwordsList

A nyelvspecifikus stopszavak előre definiált listáját azonosítja.

StopwordsTokenFilter

Eltávolítja a leállító szavakat egy jogkivonatfolyamból. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.

Suggester

Meghatározza, hogyan kell alkalmazni a Suggest API-t az index egy mezőcsoportjára.

SuggesterSearchMode

A javaslattevő képességeit jelző érték.

SynonymTokenFilter

Egy vagy többszavas szinonimák egy jogkivonatfolyamban. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.

TagScoringFunction

Olyan függvényt definiál, amely egy adott címkelistának megfelelő sztringértékekkel növeli a dokumentumok pontszámait.

TagScoringParameters

Paraméterértékeket biztosít egy címkepontozási függvénynek.

TextWeights

Olyan indexmezők súlyozását határozza meg, amelyek esetében a találatok növelik a keresési lekérdezések pontozását.

TokenCharacterKind

Olyan karakterosztályokat jelöl, amelyeken a jogkivonatszűrők működhetnek.

TokenFilterName

Meghatározza a keresőmotor által támogatott összes jogkivonatszűrő nevét.

TruncateTokenFilter

Csonkítja a kifejezéseket egy adott hosszúságúra. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.

UaxUrlEmailTokenizer

Tokenizálja az URL-címeket és az e-maileket egy jogkivonatként. Ez a jogkivonat-szabályzó az Apache Lucene használatával van implementálva.

UniqueTokenFilter

Kiszűri az előző jogkivonattal megegyező szövegű jogkivonatokat. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.

VectorSearch

A vektorkereséshez kapcsolódó konfigurációs beállításokat tartalmaz.

VectorSearchAlgorithmKind

Az indexeléshez és lekérdezéshez használt algoritmus.

VectorSearchAlgorithmMetric

A vektorok összehasonlításához használandó hasonlósági metrika.

VectorSearchCompressionKind

Az indexeléshez és lekérdezéshez használt tömörítési módszer.

VectorSearchCompressionTargetDataType

A tömörített vektorértékek kvantált adattípusa.

VectorSearchProfile

A vektorkereséssel használható konfigurációk kombinációját határozza meg.

VectorSearchVectorizerKind

A lekérdezési idő alatt használandó vektorizálási módszer.

WordDelimiterTokenFilter

A szavakat alszavakra osztja, és opcionális átalakításokat hajt végre az alszócsoportokon. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.

AsciiFoldingTokenFilter

Az első 127 ASCII-karakterben nem szereplő unicode-karaktereket (az "Egyszerű latin" Unicode-blokkot) ASCII-ekvivalenssé alakítja át, ha léteznek ilyen megfelelők. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.

Name Típus Alapértelmezett érték Description
@odata.type string:

#Microsoft.Azure.Search.AsciiFoldingTokenFilter

Egy URI-töredék, amely megadja a tokenszűrő típusát.

name

string

A jogkivonatszűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet.

preserveOriginal

boolean

False

Egy érték, amely azt jelzi, hogy az eredeti jogkivonat megmarad-e. Az alapértelmezett érték a false (hamis).

AzureActiveDirectoryApplicationCredentials

A keresési szolgáltatáshoz létrehozott regisztrált alkalmazás hitelesítő adatai, amelyet az Azure Key Vault tárolt titkosítási kulcsokhoz való hitelesített hozzáféréshez használnak.

Name Típus Description
applicationId

string

Egy AAD-alkalmazásazonosító, amely megkapta a szükséges hozzáférési engedélyeket az Azure Key Vault, amelyet az inaktív adatok titkosításához kell használni. Az alkalmazásazonosító nem tévesztendő össze az AAD-alkalmazás objektumazonosítójával.

applicationSecret

string

A megadott AAD-alkalmazás hitelesítési kulcsa.

AzureOpenAIParameters

Meghatározza az Azure OpenAI-erőforráshoz való csatlakozás paramétereit.

Name Típus Description
apiKey

string

A kijelölt Azure OpenAI-erőforrás API-kulcsa.

authIdentity SearchIndexerDataIdentity:
  • SearchIndexerDataNoneIdentity
  • SearchIndexerDataUserAssignedIdentity

A kimenő kapcsolatokhoz használt, felhasználó által hozzárendelt felügyelt identitás.

deploymentId

string

Az Azure OpenAI-modell üzembe helyezésének azonosítója a kijelölt erőforráson.

resourceUri

string

Az Azure OpenAI-erőforrás erőforrás-URI-ja.

AzureOpenAIVectorizer

Megadja a lekérdezési sztringek vektorizálásához használt Azure OpenAI-erőforrást.

Name Típus Description
azureOpenAIParameters

AzureOpenAIParameters

Az Azure OpenAI beágyazási vektorizálására jellemző paramétereket tartalmazza.

kind string:

azureOpenAI

A vektoros kereséshez konfigurált vektorizálási módszer neve.

name

string

Az adott vektorizációs metódushoz társítandó név.

BM25Similarity

Az Okapi BM25 hasonlósági algoritmuson alapuló rangsorolási függvény. A BM25 egy TF-IDF-szerű algoritmus, amely magában foglalja a hossz normalizálását (amelyet a "b" paraméter szabályoz), valamint a kifejezés frekvenciatelítettségét (amelyet a "k1" paraméter szabályoz).

Name Típus Description
@odata.type string:

#Microsoft.Azure.Search.BM25Similarity

b

number

Ez a tulajdonság határozza meg, hogy a dokumentum hossza hogyan befolyásolja a relevanciapontszámot. Alapértelmezés szerint a rendszer 0,75 értéket használ. A 0,0 érték azt jelenti, hogy nincs hossz normalizálás alkalmazva, míg az 1,0 érték azt jelenti, hogy a pontszám teljesen normalizálódik a dokumentum hosszával.

k1

number

Ez a tulajdonság szabályozza a skálázási függvényt az egyes egyező kifejezések kifejezési gyakorisága és a dokumentum-lekérdezés párok végső relevanciapontszáma között. Alapértelmezés szerint a rendszer 1,2 értéket használ. A 0,0 érték azt jelenti, hogy a pontszám nem skálázható a kifejezés gyakoriságának növekedésével.

CharFilterName

Meghatározza a keresőmotor által támogatott összes karakterszűrő nevét.

Name Típus Description
html_strip

string

Karakterszűrő, amely HTML-szerkezeteket próbál szétszedni. Lásd: https://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/charfilter/HTMLStripCharFilter.html

CjkBigramTokenFilter

Forms standard tokenizerből létrehozott CJK-kifejezések bigramját. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.

Name Típus Alapértelmezett érték Description
@odata.type string:

#Microsoft.Azure.Search.CjkBigramTokenFilter

Egy URI-töredék, amely megadja a tokenszűrő típusát.

ignoreScripts

CjkBigramTokenFilterScripts[]

A figyelmen kívül hagyandó szkriptek.

name

string

A jogkivonatszűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet.

outputUnigrams

boolean

False

Egy érték, amely azt jelzi, hogy az egygrammot és a bigramot is ki kell-e adni (ha igaz), vagy csak bigramot (ha hamis). Az alapértelmezett érték a false (hamis).

CjkBigramTokenFilterScripts

A CjkBigramTokenFilter által figyelmen kívül hagyható szkriptek.

Name Típus Description
han

string

CJK-kifejezések bigramjainak létrehozásakor hagyja figyelmen kívül a Han-szkriptet.

hangul

string

Hagyja figyelmen kívül a Hangul-szkriptet a CJK-kifejezések bigramjainak létrehozásakor.

hiragana

string

Hagyja figyelmen kívül a Hiragana-szkriptet a CJK-kifejezések bigramjainak létrehozásakor.

katakana

string

Hagyja figyelmen kívül a Katakana-szkriptet a CJK-kifejezések bigramjainak létrehozásakor.

ClassicSimilarity

Örökölt hasonlósági algoritmus, amely a TF-IDF Lucene TFIDFSimilarity implementációját használja. A TF-IDF ezen változata statikus dokumentumhossz normalizálást vezet be, valamint koordinálja azokat a tényezőket, amelyek csak részben egyeznek a keresett lekérdezésekkel.

Name Típus Description
@odata.type string:

#Microsoft.Azure.Search.ClassicSimilarity

ClassicTokenizer

Nyelvtanalapú tokenizer, amely alkalmas a legtöbb európai nyelvű dokumentum feldolgozására. Ez a tokenizer az Apache Lucene használatával van implementálva.

Name Típus Alapértelmezett érték Description
@odata.type string:

#Microsoft.Azure.Search.ClassicTokenizer

A tokenizer típusát meghatározó URI-töredék.

maxTokenLength

integer

255

A jogkivonat maximális hossza. Az alapértelmezett érték 255. A maximális hossznál hosszabb jogkivonatok fel vannak osztva. A maximálisan használható tokenhossz 300 karakter.

name

string

A tokenizer neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet.

CommonGramTokenFilter

Bigramokat hozhat létre az indexelés során gyakran előforduló kifejezésekhez. Az egyes kifejezések továbbra is indexelve vannak, és a bigramok túl vannak osztva. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.

Name Típus Alapértelmezett érték Description
@odata.type string:

#Microsoft.Azure.Search.CommonGramTokenFilter

Egy URI-töredék, amely megadja a tokenszűrő típusát.

commonWords

string[]

A közös szavak halmaza.

ignoreCase

boolean

False

Egy érték, amely azt jelzi, hogy a közös szavak egyeztetése érzéketlen lesz-e a kis- és nagybetűk között. Az alapértelmezett érték a false (hamis).

name

string

A jogkivonatszűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet.

queryMode

boolean

False

Egy érték, amely azt jelzi, hogy a jogkivonatszűrő lekérdezési módban van-e. Lekérdezési módban a jogkivonatszűrő bigramokat hoz létre, majd eltávolítja a közös szavakat és az egyszeres kifejezéseket, majd egy közös szót. Az alapértelmezett érték a false (hamis).

CorsOptions

Meghatározza az indexek eltérő eredetű erőforrás-megosztásának (CORS) szabályozására szolgáló beállításokat.

Name Típus Description
allowedOrigins

string[]

Azoknak a forrásoknak a listája, amelyekből a JavaScript-kód hozzáférést kap az indexhez. A(z) {protocol}://{teljesen minősített-tartománynév}[:{port#}], illetve egyetlen "*" formátumú gazdagéplistát tartalmazhat az összes forrás engedélyezéséhez (nem ajánlott).

maxAgeInSeconds

integer

Az az időtartam, amelyre a böngészőknek gyorsítótáraznia kell a CORS elővizsgálati válaszait. Alapértelmezés szerint 5 perc.

CustomAnalyzer

Lehetővé teszi, hogy átvegye az irányítást a szöveg indexelhető/kereshető tokenekké alakításának folyamata felett. Ez egy felhasználó által definiált konfiguráció, amely egyetlen előre definiált tokenizerből és egy vagy több szűrőből áll. A jogkivonat-készítő felelős azért, hogy a szöveget jogkivonatokká bontsa, és a jogkivonat-készítő által kibocsátott jogkivonatok módosítására szolgáló szűrőket.

Name Típus Description
@odata.type string:

#Microsoft.Azure.Search.CustomAnalyzer

Az elemző típusát meghatározó URI-töredék.

charFilters

CharFilterName[]

A bemeneti szövegnek a tokenizer általi feldolgozása előtti előkészítéséhez használt karakterszűrők listája. Lecserélhetnek például bizonyos karaktereket vagy szimbólumokat. A szűrők a lista sorrendjében futnak.

name

string

Az elemző neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet.

tokenFilters

TokenFilterName[]

A tokenizáló által létrehozott jogkivonatok kiszűrésére vagy módosítására használt jogkivonatszűrők listája. Megadhat például egy kisbetűs szűrőt, amely az összes karaktert kisbetűssé alakítja. A szűrők a lista sorrendjében futnak.

tokenizer

LexicalTokenizerName

A jogkivonat-megosztó neve, amelyet a folyamatos szöveg jogkivonatok sorozatára való felosztásához használ, például egy mondat szavakra törése.

CustomNormalizer

Lehetővé teszi a normalizálás konfigurálását szűrhető, rendezhető és táblázatos mezőkhöz, amelyek alapértelmezés szerint szigorú egyezéssel működnek. Ez egy felhasználó által definiált konfiguráció, amely legalább egy szűrőből áll, és módosítja a tárolt jogkivonatot.

Name Típus Description
@odata.type string:

#Microsoft.Azure.Search.CustomNormalizer

A normalizáló típusát meghatározó URI-töredék.

charFilters

CharFilterName[]

A bemeneti szöveg feldolgozását megelőző előkészítéséhez használt karakterszűrők listája. Lecserélhetnek például bizonyos karaktereket vagy szimbólumokat. A szűrők a lista sorrendjében futnak.

name

string

A normalizáló neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet. Nem végződhet ".microsoft" vagy ".lucene" végződéssel, és nem nevezhető "asciifolding", "standard", "kisbetűs", "nagybetűs" vagy "elision" névvel.

tokenFilters

TokenFilterName[]

A bemeneti jogkivonat szűréséhez vagy módosításához használt jogkivonatszűrők listája. Megadhat például egy kisbetűs szűrőt, amely az összes karaktert kisbetűssé alakítja. A szűrők a lista sorrendjében futnak.

CustomVectorizer

Felhasználó által definiált vektorizálót ad meg egy lekérdezési sztring vektorbeágyazásának létrehozásához. A külső vektorizáló integrációja egy képességcsoport egyéni webes API-felületével valósítható meg.

Name Típus Description
customWebApiParameters

CustomWebApiParameters

A felhasználó által definiált vektorizáló tulajdonságait adja meg.

kind string:

customWebApi

A vektoros kereséshez konfigurált vektorizálási módszer neve.

name

string

Az adott vektorizációs metódushoz társítandó név.

CustomWebApiParameters

Megadja a felhasználó által definiált vektorizálóhoz való csatlakozás tulajdonságait.

Name Típus Description
authIdentity SearchIndexerDataIdentity:
  • SearchIndexerDataNoneIdentity
  • SearchIndexerDataUserAssignedIdentity

A kimenő kapcsolatokhoz használt, felhasználó által hozzárendelt felügyelt identitás. Ha authResourceId van megadva, és nincs megadva, a rendszer a rendszer által hozzárendelt felügyelt identitást használja. Az indexelő frissítéseinél, ha az identitás nincs meghatározva, az érték változatlan marad. Ha a "nincs" értékre van állítva, a tulajdonság értéke törlődik.

authResourceId

string

Olyan egyéni végpontokra vonatkozik, amelyek külső kódhoz csatlakoznak egy Azure-függvényben vagy más, az átalakításokat biztosító alkalmazásban. Ennek az értéknek a függvényhez vagy alkalmazáshoz az Azure Active Directoryban való regisztráláskor létrehozott alkalmazásazonosítónak kell lennie. Ha meg van adva, a vektorizálás a keresési szolgáltatás felügyelt azonosítójával (rendszer vagy felhasználó által hozzárendelt) és a függvény vagy alkalmazás hozzáférési jogkivonatával csatlakozik a függvényhez vagy alkalmazáshoz, és ezt az értéket használja erőforrás-azonosítóként a hozzáférési jogkivonat hatókörének létrehozásához.

httpHeaders

object

A HTTP-kérés végrehajtásához szükséges fejlécek.

httpMethod

string

A HTTP-kérelem metódusa.

timeout

string

A kérés kívánt időtúllépése. Az alapértelmezett érték 30 másodperc.

uri

string

A vektorizálót biztosító webes API URI-ja.

DictionaryDecompounderTokenFilter

Felbontja a sok germán nyelven található összetett szavakat. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.

Name Típus Alapértelmezett érték Description
@odata.type string:

#Microsoft.Azure.Search.DictionaryDecompounderTokenFilter

Egy URI-töredék, amely megadja a tokenszűrő típusát.

maxSubwordSize

integer

15

A maximális alszóméret. Csak az ennél rövidebb alszavak lesznek kimenetben. Az alapértelmezett érték 15. A maximális érték 300.

minSubwordSize

integer

2

A minimális alszóméret. Csak az ennél hosszabb alszavak lesznek kimenetben. Az alapértelmezett érték 2. A maximális érték 300.

minWordSize

integer

5

A szavak minimális mérete. Csak az ennél hosszabb szavak lesznek feldolgozva. Az alapértelmezett érték 5. A maximális érték 300.

name

string

A jogkivonatszűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet.

onlyLongestMatch

boolean

False

Egy érték, amely azt jelzi, hogy csak a leghosszabb egyező alszót szeretné-e hozzáadni a kimenethez. Az alapértelmezett érték a false (hamis).

wordList

string[]

Azoknak a szavaknak a listája,

DistanceScoringFunction

Olyan függvényt definiál, amely a földrajzi helytől való távolság alapján növeli a pontszámokat.

Name Típus Description
boost

number

A nyers pontszám szorzója. Pozitív számnak kell lennie, amely nem lehet 1,0.

distance

DistanceScoringParameters

A távolságpontozási függvény paraméterértékei.

fieldName

string

A pontozófüggvény bemeneteként használt mező neve.

interpolation

ScoringFunctionInterpolation

Egy érték, amely azt jelzi, hogy a kiemelés hogyan lesz interpolálva a dokumentum pontszámai között; alapértelmezés szerint "Lineáris".

type string:

distance

A használni kívánt függvény típusát jelzi. Az érvényes értékek közé tartozik a mennyiség, a frissesség, a távolság és a címke. A függvénytípusnak kisbetűsnek kell lennie.

DistanceScoringParameters

Paraméterértékeket biztosít egy távolsági pontozási függvénynek.

Name Típus Description
boostingDistance

number

Az a távolság, amely kilométerben van attól a referenciahelytől, ahol a kiemelési tartomány véget ér.

referencePointParameter

string

A keresési lekérdezésekben átadott paraméter neve a referenciahely megadásához.

EdgeNGramTokenFilter

A megadott méret(ek) n grammját generálja egy bemeneti jogkivonat elejétől vagy hátuljától kezdve. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.

Name Típus Alapértelmezett érték Description
@odata.type string:

#Microsoft.Azure.Search.EdgeNGramTokenFilter

A tokenszűrő típusát meghatározó URI-töredék.

maxGram

integer

2

A maximális n-gram hossz. Az alapértelmezett érték 2.

minGram

integer

1

A minimális n-gram hosszúság. Az alapértelmezett érték 1. A maxGram értékénél kisebbnek kell lennie.

name

string

A jogkivonatszűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet.

side

EdgeNGramTokenFilterSide

front

Meghatározza, hogy az n-gram bemenetének melyik oldaláról kell generálni. Az alapértelmezett érték az "előtér".

EdgeNGramTokenFilterSide

Meghatározza, hogy a bemenet melyik oldaláról kell n-gramot létrehozni.

Name Típus Description
back

string

Megadja, hogy az n-gramot a bemenet hátoldaláról kell létrehozni.

front

string

Azt adja meg, hogy az n-gramot a bemenet elejéről kell létrehozni.

EdgeNGramTokenFilterV2

A megadott méret(ek) n grammját generálja egy bemeneti jogkivonat elejétől vagy hátuljától kezdve. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.

Name Típus Alapértelmezett érték Description
@odata.type string:

#Microsoft.Azure.Search.EdgeNGramTokenFilterV2

A tokenszűrő típusát meghatározó URI-töredék.

maxGram

integer

2

A maximális n-gram hossz. Az alapértelmezett érték 2. A maximális érték 300.

minGram

integer

1

A minimális n-gram hosszúság. Az alapértelmezett érték 1. A maximális érték 300. A maxGram értékénél kisebbnek kell lennie.

name

string

A jogkivonatszűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet.

side

EdgeNGramTokenFilterSide

front

Meghatározza, hogy az n-gram bemenetének melyik oldaláról kell generálni. Az alapértelmezett érték az "előtér".

EdgeNGramTokenizer

Tokenizálja a bemenetet egy élről az adott méret(ek) n-grammjára. Ez a tokenizer az Apache Lucene használatával van implementálva.

Name Típus Alapértelmezett érték Description
@odata.type string:

#Microsoft.Azure.Search.EdgeNGramTokenizer

A tokenizer típusát meghatározó URI-töredék.

maxGram

integer

2

A maximális n-gram hossz. Az alapértelmezett érték 2. A maximális érték 300.

minGram

integer

1

A minimális n-gram hosszúság. Az alapértelmezett érték 1. A maximális érték 300. A maxGram értékénél kisebbnek kell lennie.

name

string

A tokenizer neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet.

tokenChars

TokenCharacterKind[]

A tokenekben megtartandó karakterosztályok.

ElisionTokenFilter

Eltávolítja az elisions elemet. A "l'avion" (a sík) például "avion" (sík) lesz átalakítva. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.

Name Típus Description
@odata.type string:

#Microsoft.Azure.Search.ElisionTokenFilter

A tokenszűrő típusát meghatározó URI-töredék.

articles

string[]

Az eltávolítandó cikkek halmaza.

name

string

A jogkivonatszűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet.

ErrorAdditionalInfo

Az erőforrás-kezelési hiba további információi.

Name Típus Description
info

object

A további információk.

type

string

A további információtípus.

ErrorDetail

A hiba részletei.

Name Típus Description
additionalInfo

ErrorAdditionalInfo[]

A hiba további információi.

code

string

A hibakód.

details

ErrorDetail[]

A hiba részletei.

message

string

A hibaüzenet.

target

string

A hiba célja.

ErrorResponse

Hibaválasz

Name Típus Description
error

ErrorDetail

A hibaobjektum.

ExhaustiveKnnParameters

A teljes KNN-algoritmusra jellemző paramétereket tartalmazza.

Name Típus Description
metric

VectorSearchAlgorithmMetric

A vektorok összehasonlításához használandó hasonlósági metrika.

ExhaustiveKnnVectorSearchAlgorithmConfiguration

A lekérdezés során használt teljes KNN-algoritmusra vonatkozó konfigurációs beállításokat tartalmaz, amelyek találgatásos keresést hajtanak végre a teljes vektorindexben.

Name Típus Description
exhaustiveKnnParameters

ExhaustiveKnnParameters

A teljes KNN-algoritmusra jellemző paramétereket tartalmazza.

kind string:

exhaustiveKnn

A vektorkereséshez konfigurált algoritmus neve.

name

string

Az adott konfigurációhoz társítandó név.

FreshnessScoringFunction

Olyan függvényt definiál, amely egy dátum-idő mező értéke alapján növeli a pontszámokat.

Name Típus Description
boost

number

A nyers pontszám szorzója. Pozitív számnak kell lennie, amely nem lehet 1,0.

fieldName

string

A pontozási függvény bemeneteként használt mező neve.

freshness

FreshnessScoringParameters

A frissesség-pontozási függvény paraméterértékei.

interpolation

ScoringFunctionInterpolation

Egy érték, amely azt jelzi, hogy a kiemelés hogyan lesz interpolálva a dokumentum pontszámai között; alapértelmezés szerint "Lineáris".

type string:

freshness

A használni kívánt függvény típusát jelzi. Az érvényes értékek közé tartozik a magnitúdó, a frissesség, a távolság és a címke. A függvénytípusnak kisbetűsnek kell lennie.

FreshnessScoringParameters

Paraméterértékeket biztosít egy frissesség-pontozási függvénynek.

Name Típus Description
boostingDuration

string

Az a lejárati időszak, amely után a kiemelés leáll egy adott dokumentum esetében.

HnswParameters

A HNSW algoritmusra jellemző paramétereket tartalmazza.

Name Típus Alapértelmezett érték Description
efConstruction

integer

400

A legközelebbi szomszédokat tartalmazó dinamikus lista mérete, amelyet az indexidő alatt használnak. A paraméter növelése javíthatja az index minőségét a megnövekedett indexelési idő rovására. Egy bizonyos ponton ennek a paraméternek a növelése a visszatérés csökkenéséhez vezet.

efSearch

integer

500

A keresési idő alatt használt legközelebbi szomszédokat tartalmazó dinamikus lista mérete. A paraméter növelése javíthatja a keresési eredményeket, a lassabb keresés rovására. Egy bizonyos ponton ennek a paraméternek a növelése a visszatérés csökkenéséhez vezet.

m

integer

4

Az összes új elemhez létrehozott kétirányú kapcsolatok száma az építés során. A paraméterérték növelése javíthatja a nagy belső dimenziójú adathalmazok visszahívási és lekérési idejét a megnövekedett memóriahasználat és a hosszabb indexelési idő rovására.

metric

VectorSearchAlgorithmMetric

A vektorok összehasonlításához használandó hasonlósági metrika.

HnswVectorSearchAlgorithmConfiguration

Az indexelés és a lekérdezés során használt HNSW közelítő szomszéd algoritmusra vonatkozó konfigurációs beállításokat tartalmaz. A HNSW algoritmus a keresési sebesség és a pontosság közötti kompromisszumot kínálja.

Name Típus Description
hnswParameters

HnswParameters

A HNSW-algoritmusra jellemző paramétereket tartalmazza.

kind string:

hnsw

A vektorkereséshez konfigurált algoritmus neve.

name

string

Az adott konfigurációhoz társítandó név.

KeepTokenFilter

Egy jogkivonatszűrő, amely csak a megadott szavak listájában lévő szöveget tartalmazó jogkivonatokat tárolja. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.

Name Típus Alapértelmezett érték Description
@odata.type string:

#Microsoft.Azure.Search.KeepTokenFilter

A tokenszűrő típusát meghatározó URI-töredék.

keepWords

string[]

A megtartandó szavak listája.

keepWordsCase

boolean

False

Egy érték, amely azt jelzi, hogy az összes szót kisbetűvel kell-e kisbetűsíteni. Az alapértelmezett érték a false (hamis).

name

string

A jogkivonatszűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet.

KeywordMarkerTokenFilter

Kulcsszavakként jelöli meg a kifejezéseket. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.

Name Típus Alapértelmezett érték Description
@odata.type string:

#Microsoft.Azure.Search.KeywordMarkerTokenFilter

A tokenszűrő típusát meghatározó URI-töredék.

ignoreCase

boolean

False

A kis- és nagybetűk figyelmen kívül hagyását jelző érték. Ha igaz, a program először az összes szót kisbetűssé alakítja. Az alapértelmezett érték a false (hamis).

keywords

string[]

Kulcsszavakként megjelölendő szavak listája.

name

string

A jogkivonatszűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet.

KeywordTokenizer

A teljes bemenetet egyetlen tokenként bocsátja ki. Ez a tokenizer az Apache Lucene használatával van implementálva.

Name Típus Alapértelmezett érték Description
@odata.type string:

#Microsoft.Azure.Search.KeywordTokenizer

A tokenizer típusát meghatározó URI-töredék.

bufferSize

integer

256

Az olvasási puffer mérete bájtban. Az alapértelmezett érték 256.

name

string

A tokenizer neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet.

KeywordTokenizerV2

A teljes bemenetet egyetlen tokenként bocsátja ki. Ez a tokenizer az Apache Lucene használatával van implementálva.

Name Típus Alapértelmezett érték Description
@odata.type string:

#Microsoft.Azure.Search.KeywordTokenizerV2

A tokenizer típusát meghatározó URI-töredék.

maxTokenLength

integer

256

A jogkivonat maximális hossza. Az alapértelmezett érték 256. A maximális hossznál hosszabb jogkivonatok fel vannak osztva. A maximálisan használható tokenhossz 300 karakter.

name

string

A tokenizer neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet.

LengthTokenFilter

Eltávolítja a túl hosszú vagy túl rövid szavakat. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.

Name Típus Alapértelmezett érték Description
@odata.type string:

#Microsoft.Azure.Search.LengthTokenFilter

A tokenszűrő típusát meghatározó URI-töredék.

max

integer

300

A karakterek maximális hossza. Az alapértelmezett és a maximális érték 300.

min

integer

0

A karakterek minimális hossza. Az alapértelmezett érték 0. A maximális érték 300. A maximális értéknél kisebbnek kell lennie.

name

string

A jogkivonatszűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet.

LexicalAnalyzerName

Meghatározza a keresőmotor által támogatott összes szövegelemző nevét.

Name Típus Description
ar.lucene

string

Lucene elemző arabra.

ar.microsoft

string

Microsoft analyzer for Arab.

bg.lucene

string

Lucene elemző bolgárnak.

bg.microsoft

string

Microsoft analyzer for Bolgár.

bn.microsoft

string

Microsoft-elemző Banglához.

ca.lucene

string

Lucene elemző katalánnak.

ca.microsoft

string

A Katalán Microsoft elemzője.

cs.lucene

string

Lucene elemző csehhez.

cs.microsoft

string

Microsoft analyzer for Czech.

da.lucene

string

Lucene elemző dánhoz.

da.microsoft

string

Microsoft Analyzer dán nyelven.

de.lucene

string

Lucene elemző némethez.

de.microsoft

string

Microsoft analyzer for German.

el.lucene

string

Lucene elemző göröghöz.

el.microsoft

string

A Microsoft görög elemzője.

en.lucene

string

Lucene elemző angolra.

en.microsoft

string

Microsoft Analyzer angol nyelven.

es.lucene

string

Lucene elemző spanyolra.

es.microsoft

string

Microsoft Analyzer spanyol nyelven.

et.microsoft

string

Észt Microsoft-elemző.

eu.lucene

string

Lucene elemző Baszknak.

fa.lucene

string

Lucene elemző perzsa.

fi.lucene

string

Lucene-elemző finnhez.

fi.microsoft

string

Microsoft analyzer for Finn.

fr.lucene

string

Lucene elemző francia nyelven.

fr.microsoft

string

Microsoft Analyzer francia nyelven.

ga.lucene

string

Lucene elemző írnek.

gl.lucene

string

Lucene elemző galíciaiaknak.

gu.microsoft

string

Microsoft-elemző a Gujaratihoz.

he.microsoft

string

Microsoft analyzer for Héber.

hi.lucene

string

Lucene elemző hindihez.

hi.microsoft

string

Microsoft analyzer for Hindi.

hr.microsoft

string

Microsoft analyzer for Horvát.

hu.lucene

string

Lucene-elemző magyarra.

hu.microsoft

string

Microsoft-elemző magyarra.

hy.lucene

string

Lucene elemző örménynek.

id.lucene

string

Lucene elemző indonézekhez.

id.microsoft

string

Microsoft Analyzer indonéz (Bahasa).

is.microsoft

string

A Microsoft izlandi elemzője.

it.lucene

string

Lucene elemző olasznak.

it.microsoft

string

Microsoft analyzer for Italian.

ja.lucene

string

Lucene elemző japánhoz.

ja.microsoft

string

Microsoft Analyzer japánhoz.

keyword

string

A mező teljes tartalmát egyetlen jogkivonatként kezeli. Ez olyan adatok esetében hasznos, mint az irányítószámok, az azonosítók és néhány terméknév. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/KeywordAnalyzer.html

kn.microsoft

string

A Kannada Microsoft-elemzője.

ko.lucene

string

Lucene elemző koreaihoz.

ko.microsoft

string

Microsoft analyzer koreaihoz.

lt.microsoft

string

Microsoft analyzer for Litván.

lv.lucene

string

Lucene elemző lettnek.

lv.microsoft

string

Lett Microsoft-elemző.

ml.microsoft

string

Microsoft analyzer for Malayalam.

mr.microsoft

string

A Marathihoz készült Microsoft-elemző.

ms.microsoft

string

Microsoft-elemző malájhoz (latin betűs).

nb.microsoft

string

Microsoft analyzer for Norvég (Bokmål).

nl.lucene

string

Lucene elemző hollandnak.

nl.microsoft

string

Microsoft analyzer for Holland.

no.lucene

string

Lucene elemző norvégnak.

pa.microsoft

string

Microsoft-elemző Punjabihoz.

pattern

string

A szöveget rugalmasan elválasztja kifejezésekké egy reguláris kifejezésmintával. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/PatternAnalyzer.html

pl.lucene

string

Lucene elemző lengyelhez.

pl.microsoft

string

Microsoft analyzer for Lengyel.

pt-BR.lucene

string

Lucene analyzer for Portugál (Brazília).

pt-BR.microsoft

string

Microsoft analyzer for Portugál (Brazília).

pt-PT.lucene

string

Lucene analyzer for Portugál (Portugália).

pt-PT.microsoft

string

Microsoft analyzer for Portuguese (Portugália).

ro.lucene

string

Lucene elemző románhoz.

ro.microsoft

string

Microsoft analyzer for Román.

ru.lucene

string

Lucene elemző orosznak.

ru.microsoft

string

Microsoft-elemző oroszhoz.

simple

string

Nem betűkre osztja a szöveget, és kisbetűssé alakítja őket. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/SimpleAnalyzer.html

sk.microsoft

string

Microsoft analyzer for Szlovák.

sl.microsoft

string

Microsoft-elemző szlovén nyelvhez.

sr-cyrillic.microsoft

string

Szerb (cirill betűs) Microsoft-elemző.

sr-latin.microsoft

string

Microsoft-elemző szerb (latin betűs) nyelven.

standard.lucene

string

Standard Lucene-elemző.

standardasciifolding.lucene

string

Standard ASCII összecsukható Lucene-elemző. Lásd: https://docs.microsoft.com/rest/api/searchservice/Custom-analyzers-in-Azure-Search#Analyzers

stop

string

A szöveget nem betűkkel osztja el; Alkalmazza a kisbetűs és a stopword jogkivonat szűrőit. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/StopAnalyzer.html

sv.lucene

string

Lucene elemző svédnek.

sv.microsoft

string

Microsoft analyzer for Svéd.

ta.microsoft

string

Microsoft analyzer for Tamil.

te.microsoft

string

Microsoft analyzer for Telugu.

th.lucene

string

Lucene elemző thaihoz.

th.microsoft

string

Microsoft Analyzer thai nyelven.

tr.lucene

string

Lucene elemző törökhöz.

tr.microsoft

string

Microsoft analyzer for Török.

uk.microsoft

string

Microsoft analyzer for Ukrán.

ur.microsoft

string

Microsoft analyzer for Urdu.

vi.microsoft

string

A Vietnami Microsoft elemzője.

whitespace

string

Egy elemző, amely a térbeli jogkivonat-jelölőt használja. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/WhitespaceAnalyzer.html

zh-Hans.lucene

string

Lucene analyzer kínaihoz (egyszerűsített).

zh-Hans.microsoft

string

Microsoft Analyzer kínaihoz (egyszerűsített).

zh-Hant.lucene

string

Lucene analyzer kínaihoz (hagyományos).

zh-Hant.microsoft

string

Microsoft Analyzer kínaihoz (hagyományos).

LexicalNormalizerName

Meghatározza a keresőmotor által támogatott összes szövegnormalizáló nevét.

Name Típus Description
asciifolding

string

Az első 127 ASCII-karakterben (az "Egyszerű latin" Unicode-blokkban) nem szereplő alfabetikus, numerikus és szimbolikus Unicode-karaktereket ASCII-megfelelőjükké alakítja, ha léteznek ilyenek. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/ASCIIFoldingFilter.html

elision

string

Eltávolítja az elisions elemet. A "l'avion" (a sík) például "avion" (sík) lesz átalakítva. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/util/ElisionFilter.html

lowercase

string

Normalizálja a jogkivonat szövegét kisbetűssé. Lásd: https://lucene.apache.org/core/6_6_1/analyzers-common/org/apache/lucene/analysis/core/LowerCaseFilter.html

standard

string

Standard normalizáló, amely kisbetűkből és asciifoldingból áll. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/reverse/ReverseStringFilter.html

uppercase

string

A token szövegének normalizálása nagybetűsre. Lásd: https://lucene.apache.org/core/6_6_1/analyzers-common/org/apache/lucene/analysis/core/UpperCaseFilter.html

LexicalTokenizerName

Meghatározza a keresőmotor által támogatott összes tokenizer nevét.

Name Típus Description
classic

string

Nyelvhelyességi alapú jogkivonat-szabályzó, amely alkalmas a legtöbb európai nyelvű dokumentum feldolgozására. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/standard/ClassicTokenizer.html

edgeNGram

string

Tokenizálja a bemenetet egy élről az adott méret(ek) n-grammjára. Lásd: https://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/ngram/EdgeNGramTokenizer.html

keyword_v2

string

A teljes bemenetet egyetlen jogkivonatként bocsátja ki. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/KeywordTokenizer.html

letter

string

A szöveget nem betűkkel osztja el. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/LetterTokenizer.html

lowercase

string

Nem betűkre osztja a szöveget, és kisbetűssé alakítja őket. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/LowerCaseTokenizer.html

microsoft_language_stemming_tokenizer

string

Nyelvspecifikus szabályokkal osztja el a szöveget, és csökkenti a szavak alapformáit.

microsoft_language_tokenizer

string

Nyelvspecifikus szabályokkal osztja el a szöveget.

nGram

string

Tokenizálja a bemenetet az adott méret(ek) n-grammjára. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/ngram/NGramTokenizer.html

path_hierarchy_v2

string

Tokenizer elérésiút-szerű hierarchiákhoz. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/path/PathHierarchyTokenizer.html

pattern

string

Tokenizer, amely regex mintaegyeztetést használ a különböző tokenek létrehozásához. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/pattern/PatternTokenizer.html

standard_v2

string

Standard Lucene-elemző; A standard tokenizerből, kisbetűs szűrőből és leállításszűrőből áll. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/standard/StandardTokenizer.html

uax_url_email

string

Tokenizálja az URL-címeket és az e-maileket egy jogkivonatként. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/standard/UAX29URLEmailTokenizer.html

whitespace

string

Elosztja a szöveget a szóközök között. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/WhitespaceTokenizer.html

LimitTokenFilter

Korlátozza a tokenek számát az indexelés során. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.

Name Típus Alapértelmezett érték Description
@odata.type string:

#Microsoft.Azure.Search.LimitTokenFilter

A tokenszűrő típusát meghatározó URI-töredék.

consumeAllTokens

boolean

False

Egy érték, amely azt jelzi, hogy a bemenet összes jogkivonatát akkor is fel kell-e használni, ha eléri a maxTokenCount értéket. Az alapértelmezett érték a false (hamis).

maxTokenCount

integer

1

A létrehozandó tokenek maximális száma. Az alapértelmezett érték 1.

name

string

A jogkivonatszűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet.

LuceneStandardAnalyzer

Standard Apache Lucene-elemző; A standard tokenizerből, kisbetűs szűrőből és leállítási szűrőből áll.

Name Típus Alapértelmezett érték Description
@odata.type string:

#Microsoft.Azure.Search.StandardAnalyzer

Az elemző típusát meghatározó URI-töredék.

maxTokenLength

integer

255

A jogkivonat maximális hossza. Az alapértelmezett érték 255. A maximális hossznál hosszabb jogkivonatok fel vannak osztva. A maximálisan használható tokenhossz 300 karakter.

name

string

Az elemző neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet.

stopwords

string[]

A stopszavak listája.

LuceneStandardTokenizer

A Unicode-szöveg szegmentálási szabályai szerint töri a szöveget. Ez a jogkivonat-szabályzó az Apache Lucene használatával van implementálva.

Name Típus Alapértelmezett érték Description
@odata.type string:

#Microsoft.Azure.Search.StandardTokenizer

Egy URI-töredék, amely a tokenizer típusát határozza meg.

maxTokenLength

integer

255

A jogkivonat maximális hossza. Az alapértelmezett érték 255. A maximális hossznál hosszabb jogkivonatok fel vannak osztva.

name

string

A tokenizer neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet.

LuceneStandardTokenizerV2

A Unicode-szöveg szegmentálási szabályai szerint töri a szöveget. Ez a jogkivonat-szabályzó az Apache Lucene használatával van implementálva.

Name Típus Alapértelmezett érték Description
@odata.type string:

#Microsoft.Azure.Search.StandardTokenizerV2

Egy URI-töredék, amely a tokenizer típusát határozza meg.

maxTokenLength

integer

255

A jogkivonat maximális hossza. Az alapértelmezett érték 255. A maximális hossznál hosszabb jogkivonatok fel vannak osztva. A maximálisan használható tokenhossz 300 karakter.

name

string

A tokenizer neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet.

MagnitudeScoringFunction

Olyan függvényt definiál, amely egy numerikus mező nagysága alapján növeli a pontszámokat.

Name Típus Description
boost

number

A nyers pontszám szorzója. Pozitív számnak kell lennie, amely nem lehet 1,0.

fieldName

string

A pontozási függvény bemeneteként használt mező neve.

interpolation

ScoringFunctionInterpolation

Egy érték, amely azt jelzi, hogy a kiemelés hogyan lesz interpolálva a dokumentum pontszámai között; alapértelmezés szerint "Lineáris".

magnitude

MagnitudeScoringParameters

A magnitúdópontozási függvény paraméterértékei.

type string:

magnitude

A használni kívánt függvény típusát jelzi. Az érvényes értékek közé tartozik a magnitúdó, a frissesség, a távolság és a címke. A függvénytípusnak kisbetűsnek kell lennie.

MagnitudeScoringParameters

Paraméterértékeket ad meg egy nagyságrendi pontozási függvénynek.

Name Típus Description
boostingRangeEnd

number

Az a mezőérték, amelynél a kiemelés véget ér.

boostingRangeStart

number

Az a mezőérték, amelynél a kiemelés elindul.

constantBoostBeyondRange

boolean

Érték, amely azt jelzi, hogy a tartományvégértéken túli mezőértékek esetében állandó lökést kell-e alkalmazni; alapértelmezett értéke hamis.

MappingCharFilter

Karakterszűrő, amely a leképezési beállítással definiált leképezéseket alkalmazza. A megfeleltetés kapzsi (a leghosszabb mintaegyeztetés egy adott ponton nyer). A csere lehet üres sztring. Ez a karakterszűrő az Apache Lucene használatával van implementálva.

Name Típus Description
@odata.type string:

#Microsoft.Azure.Search.MappingCharFilter

A karakterszűrő típusát meghatározó URI-töredék.

mappings

string[]

A következő formátumú leképezések listája: "a=>b" (az "a" karakter minden előfordulása a "b" karakterrel lesz helyettesítve).

name

string

A karakterszűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet.

MicrosoftLanguageStemmingTokenizer

Nyelvspecifikus szabályokkal osztja el a szöveget, és a szavakat az alapűrlapokra csökkenti.

Name Típus Alapértelmezett érték Description
@odata.type string:

#Microsoft.Azure.Search.MicrosoftLanguageStemmingTokenizer

A tokenizer típusát meghatározó URI-töredék.

isSearchTokenizer

boolean

False

A tokenizer használatát jelző érték. Állítsa true (igaz) értékre, ha keresési tokenizerként használják, és állítsa false (hamis) értékre, ha indexelő tokenizerként használják. Az alapértelmezett érték a false (hamis).

language

MicrosoftStemmingTokenizerLanguage

A használni kívánt nyelv. Az alapértelmezett érték az angol.

maxTokenLength

integer

255

A jogkivonat maximális hossza. A maximális hossznál hosszabb jogkivonatok fel vannak osztva. A használható jogkivonatok maximális hossza 300 karakter. A 300 karakternél hosszabb jogkivonatok először 300 hosszúságú jogkivonatokra vannak felosztva, majd az egyes tokenek felosztása a jogkivonatok maximális hosszának beállítása alapján történik. Az alapértelmezett érték 255.

name

string

A tokenizer neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet.

MicrosoftLanguageTokenizer

Nyelvspecifikus szabályokkal osztja el a szöveget.

Name Típus Alapértelmezett érték Description
@odata.type string:

#Microsoft.Azure.Search.MicrosoftLanguageTokenizer

A tokenizer típusát meghatározó URI-töredék.

isSearchTokenizer

boolean

False

A tokenizer használatát jelző érték. Állítsa true (igaz) értékre, ha keresési tokenizerként használják, és állítsa false (hamis) értékre, ha indexelő tokenizerként használják. Az alapértelmezett érték a false (hamis).

language

MicrosoftTokenizerLanguage

A használni kívánt nyelv. Az alapértelmezett érték az angol.

maxTokenLength

integer

255

A jogkivonat maximális hossza. A maximális hossznál hosszabb jogkivonatok fel vannak osztva. A használható jogkivonatok maximális hossza 300 karakter. A 300 karakternél hosszabb jogkivonatok először 300 hosszúságú jogkivonatokra vannak felosztva, majd az egyes tokenek felosztása a jogkivonatok maximális hosszának beállítása alapján történik. Az alapértelmezett érték 255.

name

string

A tokenizer neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet.

MicrosoftStemmingTokenizerLanguage

Listák a Microsoft nyelvi jogkivonat-kezelője által támogatott nyelveket.

Name Típus Description
arabic

string

Kiválasztja a Microsoft stemming tokenizert arab nyelven.

bangla

string

A Bangla microsoftos jogkivonat-jelölőjének kiválasztása.

bulgarian

string

Kiválasztja a microsoftos jogkivonat-kezelőt bolgár nyelven.

catalan

string

Kiválasztja a KatalánHoz tartozó Microsoft-jogkivonat-kezelőt.

croatian

string

Kiválasztja a Microsoft stemming tokenizert horvát nyelvhez.

czech

string

Kiválasztja a Microsoft stemming tokenizert csehhez.

danish

string

Kiválasztja a Microsoft stemming tokenizert dánul.

dutch

string

Kiválasztja a Microsoft stemming tokenizer for Dutch (Microsoft stemming tokenizer for Dutch) lehetőséget.

english

string

Kiválasztja az angol nyelvű Microsoft stemming tokenizert.

estonian

string

Kiválasztja a Microsoft stemming tokenizert az észthez.

finnish

string

Kiválasztja a Microsoft stemming tokenizer for Finn (Microsoft stemming tokenizer for Finn) lehetőséget.

french

string

Kiválasztja a Microsoft stemming tokenizert francia nyelven.

german

string

Kiválasztja a Microsoft stemming tokenizert a német nyelvhez.

greek

string

Kiválasztja a microsoftos jogkivonat-kezelőt a göröghöz.

gujarati

string

A Gujaratihoz tartozó Microsoft stemming tokenizer kiválasztása.

hebrew

string

Kiválasztja a Héber nyelvhez tartozó Microsoft stemming tokenizert.

hindi

string

Kiválasztja a Hindihez tartozó Microsoft stemming tokenizert.

hungarian

string

Kiválasztja a Microsoft stemming tokenizert magyarra.

icelandic

string

Kiválasztja az izlandi Microsoft stemming tokenizert.

indonesian

string

Kiválasztja az indonéz microsoftos jogkivonat-kezelőt.

italian

string

Kiválasztja a Microsoft stemming tokenizer for Italian (Microsoft stemming tokenizer for Italian) lehetőséget.

kannada

string

A Kannada microsoftos jogkivonat-kezelőjének kiválasztása.

latvian

string

A Lett nyelvhez tartozó Microsoft stemming tokenizer kiválasztása.

lithuanian

string

Kiválasztja a Microsoft stemming tokenizert litvánhoz.

malay

string

Kiválasztja a Maláj microsoftos jogkivonat-jelölőt.

malayalam

string

Kiválasztja a Malayalamhoz tartozó Microsoft-jogkivonat-jelölőt.

marathi

string

Kiválasztja a Marathihoz tartozó Microsoft stemming tokenizert.

norwegianBokmaal

string

Kiválasztja a Microsoft stemming tokenizert norvég (Bokmål) nyelvhez.

polish

string

Kiválasztja a Microsoft stemming tokenizer for Polish (Microsoft stemming tokenizer for Lengyel) lehetőséget.

portuguese

string

Kiválasztja a Portugál nyelvhez tartozó Microsoft stemming tokenizert.

portugueseBrazilian

string

Kiválasztja a Portugál (Brazília) microsoftos jogkivonat-jelölőt.

punjabi

string

Kiválasztja a Punjabihoz tartozó Microsoft-jogkivonat-kezelőt.

romanian

string

Kiválasztja a Microsoft stemming tokenizert a román nyelvhez.

russian

string

Kiválasztja az orosz nyelvű Microsoft stemming tokenizert.

serbianCyrillic

string

A Szerb (cirill betűs) Microsoft stemming tokenizert választja ki.

serbianLatin

string

A Szerb (latin betűs) Microsoft stemming tokenizert választja.

slovak

string

Kiválasztja a Microsoft stemming tokenizert a szlovák nyelvhez.

slovenian

string

Kiválasztja a Microsoft stemming tokenizert szlovén nyelvhez.

spanish

string

Kiválasztja a microsoftos jogkivonat-kezelőt a spanyol nyelvhez.

swedish

string

Kiválasztja a Microsoft stemming tokenizert svéd nyelven.

tamil

string

Kiválasztja a Microsoft stemming tokenizert a Tamilhez.

telugu

string

Kiválasztja a Teluguhoz készült Microsoft stemming tokenizert.

turkish

string

Kiválasztja a Törökhöz készült Microsoft stemming tokenizert.

ukrainian

string

Kiválasztja az ukrán microsoftos jogkivonat-kezelőt.

urdu

string

Kiválasztja az Urduhoz tartozó Microsoft stemming tokenizert.

MicrosoftTokenizerLanguage

Listák a Microsoft nyelvi tokenizer által támogatott nyelveket.

Name Típus Description
bangla

string

A Bangla Microsoft tokenizer elemét választja ki.

bulgarian

string

Kiválasztja a Bolgár Microsoft tokenizert.

catalan

string

Kiválasztja a Katalánhoz készült Microsoft tokenizert.

chineseSimplified

string

Kiválasztja a Microsoft tokenizer kínai (egyszerűsített) beállítását.

chineseTraditional

string

Kiválasztja a Kínai (hagyományos) Microsoft tokenizert.

croatian

string

Kiválasztja a Horvát Microsoft tokenizert.

czech

string

Kiválasztja a Microsoft tokenizert csehhez.

danish

string

Kiválasztja a Microsoft tokenizert dánul.

dutch

string

Kiválasztja a Microsoft tokenizert hollandra.

english

string

A Microsoft angol jogkivonat-jelölőjének kiválasztása.

french

string

Kiválasztja a Microsoft tokenizert francia nyelven.

german

string

A Microsoft tokenizer (német) lehetőséget választja.

greek

string

Kiválasztja a Microsoft tokenizert a göröghöz.

gujarati

string

Kiválasztja a Microsoft-jogkivonat-jelölőt Gujaratihoz.

hindi

string

Kiválasztja a Hindihez készült Microsoft tokenizert.

icelandic

string

Kiválasztja az izlandi Microsoft tokenizert.

indonesian

string

Kiválasztja az indonéz Microsoft tokenizert.

italian

string

Kiválasztja az olasz microsoft jogkivonat-jelölőt.

japanese

string

Kiválasztja a Japánhoz készült Microsoft tokenizert.

kannada

string

A Kannada Microsoft-jogkivonat-jelölőjének kiválasztása.

korean

string

Kiválasztja a Koreaihoz készült Microsoft tokenizert.

malay

string

Kiválasztja a Microsoft tokenizert malájhoz.

malayalam

string

Kiválasztja a Microsoft tokenizert a malajalamhoz.

marathi

string

Kiválasztja a Marathihoz készült Microsoft tokenizert.

norwegianBokmaal

string

Kiválasztja a Microsoft tokenizert norvég (Bokmål) számára.

polish

string

Kiválasztja a Microsoft tokenizert a lengyelhez.

portuguese

string

Kiválasztja a Microsoft portugál jogkivonat-jelölőt.

portugueseBrazilian

string

Kiválasztja a Microsoft tokenizert portugál (Brazília) nyelvhez.

punjabi

string

Kiválasztja a Punjabihoz tartozó Microsoft tokenizert.

romanian

string

Kiválasztja a Microsoft tokenizert a román nyelvhez.

russian

string

Kiválasztja a Microsoft tokenizert oroszra.

serbianCyrillic

string

Kiválasztja a Szerb (cirill betűs) Microsoft tokenizert.

serbianLatin

string

Kiválasztja a Microsoft tokenizert szerb (latin betűs) nyelvhez.

slovenian

string

Kiválasztja a Szlovén microsoft tokenizert.

spanish

string

Kiválasztja a Microsoft tokenizert spanyolul.

swedish

string

Kiválasztja a Microsoft tokenizert svéd nyelven.

tamil

string

Kiválasztja a Microsoft tokenizert a Tamilhez.

telugu

string

Kiválasztja a Teluguhoz készült Microsoft tokenizert.

thai

string

Kiválasztja a Thai microsoft tokenizert.

ukrainian

string

Kiválasztja az ukrán Microsoft tokenizert.

urdu

string

Kiválasztja a Microsoft tokenizert az Urduhoz.

vietnamese

string

Kiválasztja a vietnami Microsoft tokenizert.

NGramTokenFilter

A megadott méret(ek) n-grammját hozza létre. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.

Name Típus Alapértelmezett érték Description
@odata.type string:

#Microsoft.Azure.Search.NGramTokenFilter

A tokenszűrő típusát meghatározó URI-töredék.

maxGram

integer

2

A maximális n-gram hossz. Az alapértelmezett érték 2.

minGram

integer

1

A minimális n-gram hosszúság. Az alapértelmezett érték 1. A maxGram értékénél kisebbnek kell lennie.

name

string

A jogkivonatszűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet.

NGramTokenFilterV2

A megadott méret(ek) n-grammját hozza létre. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.

Name Típus Alapértelmezett érték Description
@odata.type string:

#Microsoft.Azure.Search.NGramTokenFilterV2

A tokenszűrő típusát meghatározó URI-töredék.

maxGram

integer

2

A maximális n-gram hossz. Az alapértelmezett érték 2. A maximális érték 300.

minGram

integer

1

A minimális n-gram hosszúság. Az alapértelmezett érték 1. A maximális érték 300. A maxGram értékénél kisebbnek kell lennie.

name

string

A jogkivonatszűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet.

NGramTokenizer

Tokenizálja a bemenetet az adott méret(ek) n-grammjára. Ez a tokenizer az Apache Lucene használatával van implementálva.

Name Típus Alapértelmezett érték Description
@odata.type string:

#Microsoft.Azure.Search.NGramTokenizer

Egy URI-töredék, amely a tokenizer típusát határozza meg.

maxGram

integer

2

A maximális n-gram hossz. Az alapértelmezett érték 2. A maximális érték 300.

minGram

integer

1

A minimális n-gram hosszúság. Az alapértelmezett érték 1. A maximális érték 300. A maxGram értékénél kisebbnek kell lennie.

name

string

A tokenizer neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet.

tokenChars

TokenCharacterKind[]

A tokenekben megtartandó karakterosztályok.

PathHierarchyTokenizerV2

Tokenizer elérésiút-szerű hierarchiákhoz. Ez a jogkivonat-szabályzó az Apache Lucene használatával van implementálva.

Name Típus Alapértelmezett érték Description
@odata.type string:

#Microsoft.Azure.Search.PathHierarchyTokenizerV2

Egy URI-töredék, amely a tokenizer típusát határozza meg.

delimiter

string

/

A használni kívánt elválasztó karakter. Az alapértelmezett érték a "/".

maxTokenLength

integer

300

A jogkivonat maximális hossza. Az alapértelmezett és a maximális érték 300.

name

string

A tokenizer neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet.

replacement

string

/

Egy érték, amely ha be van állítva, lecseréli a határoló karaktert. Az alapértelmezett érték a "/".

reverse

boolean

False

Egy érték, amely azt jelzi, hogy fordított sorrendben kell-e létrehozni a jogkivonatokat. Az alapértelmezett érték a false (hamis).

skip

integer

0

A kihagyandó kezdeti tokenek száma. Az alapértelmezett érték a 0.

PatternAnalyzer

A szöveget rugalmasan elválasztja kifejezésekké egy reguláris kifejezésmintával. Ez az elemző az Apache Lucene használatával van implementálva.

Name Típus Alapértelmezett érték Description
@odata.type string:

#Microsoft.Azure.Search.PatternAnalyzer

Az elemző típusát meghatározó URI-töredék.

flags

RegexFlags

Reguláris kifejezésjelölők.

lowercase

boolean

True

Egy érték, amely azt jelzi, hogy a kifejezések kisbetűsek-e. Alapértelmezett érték: true (igaz).

name

string

Az elemző neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet.

pattern

string

\W+

Egy reguláris kifejezésminta a tokenelválasztók egyeztetéséhez. Az alapértelmezett egy olyan kifejezés, amely egy vagy több nem szó karakternek felel meg.

stopwords

string[]

A stopszavak listája.

PatternCaptureTokenFilter

Java-regexek használatával több tokent bocsát ki – egyet minden rögzítési csoporthoz egy vagy több mintában. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.

Name Típus Alapértelmezett érték Description
@odata.type string:

#Microsoft.Azure.Search.PatternCaptureTokenFilter

A tokenszűrő típusát meghatározó URI-töredék.

name

string

A jogkivonatszűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet.

patterns

string[]

Az egyes tokenekhez illeszkedő minták listája.

preserveOriginal

boolean

True

Egy érték, amely azt jelzi, hogy az eredeti jogkivonatot akkor is vissza kell-e adni, ha az egyik minta megegyezik. Alapértelmezett érték: true (igaz).

PatternReplaceCharFilter

Karakterszűrő, amely lecseréli a bemeneti sztringben szereplő karaktereket. Egy reguláris kifejezéssel azonosítja a megőrizni kívánt karaktersorozatokat, a lecserélendő karaktereket pedig helyettesítő mintával azonosítja. Ha például az "aa bb aa bb", a "(aa)\s+(bb)" minta és az "$1#$2" helyettesítő szöveg szerepel, az eredmény "aa#bb aa#bb". Ez a karakterszűrő az Apache Lucene használatával van implementálva.

Name Típus Description
@odata.type string:

#Microsoft.Azure.Search.PatternReplaceCharFilter

A karakterszűrő típusát meghatározó URI-töredék.

name

string

A karakterszűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet.

pattern

string

Egy reguláris kifejezésminta.

replacement

string

A helyettesítő szöveg.

PatternReplaceTokenFilter

Karakterszűrő, amely a bemeneti sztringben szereplő karaktereket helyettesíti. Egy reguláris kifejezéssel azonosítja a megőrizendő karaktersorozatokat, a cseremintát pedig a lecserélendő karakterek azonosításához. Például az "aa bb aa bb", "(aa)\s+(bb)" minta és az "$1#$2" helyettesítő szöveg miatt az eredmény "aa#bb aa#bb". Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.

Name Típus Description
@odata.type string:

#Microsoft.Azure.Search.PatternReplaceTokenFilter

Egy URI-töredék, amely megadja a tokenszűrő típusát.

name

string

A jogkivonatszűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet.

pattern

string

Egy reguláris kifejezésminta.

replacement

string

A helyettesítő szöveg.

PatternTokenizer

Tokenizer, amely regex mintaegyeztetést használ a különböző tokenek létrehozásához. Ez a jogkivonat-szabályzó az Apache Lucene használatával van implementálva.

Name Típus Alapértelmezett érték Description
@odata.type string:

#Microsoft.Azure.Search.PatternTokenizer

Egy URI-töredék, amely a tokenizer típusát határozza meg.

flags

RegexFlags

Reguláris kifejezésjelölők.

group

integer

-1

Az egyező csoport nulla alapú sorszáma a reguláris kifejezésmintában, amely tokenekké nyerhető ki. Használja a -1 értéket, ha a teljes mintát szeretné használni a bemenet jogkivonatokra való felosztásához, függetlenül az egyező csoportoktól. Az alapértelmezett érték -1.

name

string

A tokenizer neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet.

pattern

string

\W+

Normál kifejezésminta a tokenelválasztókhoz. Az alapértelmezett kifejezés egy vagy több nem szó karakternek megfelelő kifejezés.

PhoneticEncoder

A PhoneticTokenFilterrel használandó fonetikus kódoló típusát azonosítja.

Name Típus Description
beiderMorse

string

Kódol egy jogkivonatot egy Beider-Morse értékre.

caverphone1

string

Kódol egy tokent egy Caverphone 1.0 értékre.

caverphone2

string

Kódol egy tokent egy Caverphone 2.0 értékre.

cologne

string

Kódol egy jogkivonatot egy kölni fonetikus értékre.

doubleMetaphone

string

Egy tokent dupla metafonértékké kódol.

haasePhonetik

string

Kódol egy jogkivonatot a Kölner Phonetik algoritmus Haase-finomításával.

koelnerPhonetik

string

Kódol egy jogkivonatot a Kölner Phonetik algoritmussal.

metaphone

string

Kódol egy tokent egy Metaphone-értékbe.

nysiis

string

Kódol egy jogkivonatot EGY NYSIIS-értékbe.

refinedSoundex

string

Egy jogkivonatot pontosított Soundex-értékké kódol.

soundex

string

Egy jogkivonatot Soundex-értékké kódol.

PhoneticTokenFilter

Jogkivonatok létrehozása fonetikus egyezésekhez. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.

Name Típus Alapértelmezett érték Description
@odata.type string:

#Microsoft.Azure.Search.PhoneticTokenFilter

Egy URI-töredék, amely megadja a tokenszűrő típusát.

encoder

PhoneticEncoder

metaphone

A használni kívánt fonetikus kódoló. Az alapértelmezett érték a "metaphone".

name

string

A jogkivonatszűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet.

replace

boolean

True

Érték, amely azt jelzi, hogy a kódolt jogkivonatok lecserélik-e az eredeti jogkivonatokat. Ha hamis, a kódolt jogkivonatok szinonimákként lesznek hozzáadva. Alapértelmezett érték: true (igaz).

PrioritizedFields

A szemantikai rangsoroláshoz, a feliratokhoz, a kiemelésekhez és a válaszokhoz használandó cím-, tartalom- és kulcsszavakmezőket ismerteti.

Name Típus Description
prioritizedContentFields

SemanticField[]

Meghatározza a szemantikai rangsoroláshoz, a feliratokhoz, a kiemelésekhez és a válaszokhoz használandó tartalommezőket. A legjobb eredmény érdekében a kijelölt mezőknek természetes nyelvű szöveget kell tartalmazniuk. A tömb mezőinek sorrendje a prioritásukat jelöli. Az alacsonyabb prioritású mezők csonkulhatnak, ha a tartalom hosszú.

prioritizedKeywordsFields

SemanticField[]

Meghatározza a szemantikai rangsoroláshoz, a feliratokhoz, a kiemelésekhez és a válaszokhoz használandó kulcsszómezőket. A legjobb eredmény érdekében a kijelölt mezőknek tartalmazniuk kell a kulcsszavak listáját. A tömb mezőinek sorrendje a prioritásukat jelöli. Az alacsonyabb prioritású mezők csonkulhatnak, ha a tartalom hosszú.

titleField

SemanticField

Meghatározza a szemantikai rangsoroláshoz, a feliratokhoz, a kiemelésekhez és a válaszokhoz használandó címmezőt. Ha nincs címmező az indexben, hagyja üresen ezt a mezőt.

RegexFlags

Olyan jelzőket definiál, amelyek kombinálhatók annak szabályozására, hogy a reguláris kifejezések hogyan legyenek használva a mintaelemzőben és a mintajogkivonat-jelölőben.

Name Típus Description
CANON_EQ

string

Engedélyezi a canonikus egyenértékűséget.

CASE_INSENSITIVE

string

Engedélyezi a kis- és nagybetűk megkülönböztetése nélküli egyeztetést.

COMMENTS

string

Engedélyezi a térközt és a megjegyzéseket a mintában.

DOTALL

string

Engedélyezi a dotall módot.

LITERAL

string

Lehetővé teszi a minta literális elemzését.

MULTILINE

string

Engedélyezi a többsoros módot.

UNICODE_CASE

string

Lehetővé teszi a Unicode-ra képes kis- és nagybetűk összecsukását.

UNIX_LINES

string

Engedélyezi a Unix-vonalak üzemmódot.

ScalarQuantizationParameters

A skaláris kvantálásra jellemző paramétereket tartalmazza.

Name Típus Description
quantizedDataType

VectorSearchCompressionTargetDataType

A tömörített vektorértékek kvantált adattípusa.

ScalarQuantizationVectorSearchCompressionConfiguration

Az indexelés és lekérdezés során használt skaláris kvantálási tömörítési módszerre vonatkozó konfigurációs beállításokat tartalmazza.

Name Típus Alapértelmezett érték Description
defaultOversampling

number

Alapértelmezett túlméretezési tényező. A túlbélyegző belsőleg több dokumentumot kér (ezt a szorzót határozza meg) a kezdeti keresésben. Ez növeli a teljes pontosságú vektorok újrafordított hasonlósági pontszámai alapján újrafordított eredmények készletét. A minimális érték 1, ami azt jelenti, hogy nincs túlampling (1x). Ez a paraméter csak akkor állítható be, ha a rerankWithOriginalVectors igaz. A magasabb értékek a késés rovására javítják a visszahívást.

kind string:

scalarQuantization

A vektorkereséshez konfigurált tömörítési módszer neve.

name

string

Az adott konfigurációhoz társítandó név.

rerankWithOriginalVectors

boolean

True

Ha igaz értékre van állítva, a tömörített vektorokkal kiszámított rendezett eredménykészlet lekérése után a rendszer újraszámítja őket a teljes pontosságú hasonlósági pontszámok újraszámításával. Ez a késés rovására javítja a visszahívást.

scalarQuantizationParameters

ScalarQuantizationParameters

A skaláris kvantálásra jellemző paramétereket tartalmazza.

ScoringFunctionAggregation

Meghatározza azt az aggregációs függvényt, amely a pontozási profil összes pontozási függvényének eredményeit egyesíti.

Name Típus Description
average

string

A pontszámok növelése az összes pontozófüggvény eredményének átlagával.

firstMatching

string

Pontszámok növelése a pontozási profil első alkalmazható pontozási függvényével.

maximum

string

A pontszámok növelése az összes pontozófüggvény eredményének maximális értékével.

minimum

string

A pontszámok növelése az összes pontozófüggvény eredményének minimumával.

sum

string

A pontszámok növelése az összes pontozófüggvény eredményének összegével.

ScoringFunctionInterpolation

Meghatározza azt a függvényt, amely a pontszámok több dokumentumra kiterjedő interpolálására szolgál.

Name Típus Description
constant

string

Állandó tényezővel növeli a pontszámokat.

linear

string

Lineárisan csökkenő mennyiséggel növeli a pontszámokat. Ez a pontozási függvények alapértelmezett interpolációja.

logarithmic

string

A pontszámokat olyan mennyiséggel növeli, amely logaritmikusan csökken. A magasabb pontszámok esetén a kiemelések gyorsan csökkennek, és lassabban, ahogy a pontszámok csökkennek. Ez az interpolációs beállítás nem engedélyezett a címke pontozási függvényeiben.

quadratic

string

A pontszámokat egy olyan összeggel növeli, amely kvadráns módon csökken. A kiemelések lassabban csökkennek a magasabb pontszámok esetén, és gyorsabban, ahogy a pontszámok csökkennek. Ez az interpolációs beállítás nem engedélyezett a címke pontozási függvényeiben.

ScoringProfile

Olyan keresési index paramétereit határozza meg, amelyek befolyásolják a keresési lekérdezések pontozását.

Name Típus Description
functionAggregation

ScoringFunctionAggregation

Az egyes pontozófüggvények eredményeinek kombinálását jelző érték. Alapértelmezés szerint a "Sum" (Összeg) értékre van kapcsolva. Figyelmen kívül hagyja, ha nincsenek pontozófüggvények.

functions ScoringFunction[]:
  • DistanceScoringFunction[]
  • FreshnessScoringFunction[]
  • MagnitudeScoringFunction[]
  • TagScoringFunction[]

A dokumentumok pontozását befolyásoló függvények gyűjteménye.

name

string

A pontozási profil neve.

text

TextWeights

Olyan paraméterek, amelyek bizonyos indexmezők szöveges egyezései alapján növelik a pontozást.

SearchField

Egy indexdefinícióban lévő mezőt jelöl, amely leírja egy mező nevét, adattípusát és keresési viselkedését.

Name Típus Description
analyzer

LexicalAnalyzerName

A mezőhöz használandó elemző neve. Ez a beállítás csak kereshető mezőkkel használható, és nem állítható be a searchAnalyzer vagy az indexAnalyzer paraméterrel együtt. Az elemző kiválasztása után nem módosítható a mezőhöz. Komplex mezők esetén null értékűnek kell lennie.

dimensions

integer

A vektormező dimenziója.

facetable

boolean

Egy érték, amely azt jelzi, hogy engedélyezi-e a mező hivatkozását az aspektusos lekérdezésekben. Általában a találatok kategória szerinti számát (például digitális kamerák keresését és a találatok márka, megapixelek, ár stb. szerinti megtekintését) tartalmazó keresési eredmények bemutatójában használatos. Ennek a tulajdonságnak null értékűnek kell lennie az összetett mezők esetében. Az Edm.GeographyPoint vagy a Collection(Edm.GeographyPoint) típusú mezők nem lehetnek facetablek. Az alapértelmezett érték az összes többi egyszerű mezőre igaz.

fields

SearchField[]

Almezők listája, ha ez egy Edm.ComplexType vagy Collection(Edm.ComplexType) típusú mező. Egyszerű mezők esetén null értékűnek vagy üresnek kell lennie.

filterable

boolean

Egy érték, amely azt jelzi, hogy engedélyezi-e a mező hivatkozását $filter lekérdezésekben. a szűrhető a sztringek kezelésének módjában különbözik a kereshetőtől. A szűrhető Edm.String vagy Collection(Edm.String) típusú mezők nem esnek szótörésbe, így az összehasonlítások csak pontos egyezésekre használhatók. Ha például egy ilyen f mezőt "napos nap" értékre állít be, $filter=f eq "sunny" nem talál egyezést, de $filter=f eq "napos nap" lesz. Ennek a tulajdonságnak null értékűnek kell lennie az összetett mezők esetében. Az alapértelmezett érték az egyszerű mezőkre, az összetett mezőkre pedig a null értékre vonatkozik.

indexAnalyzer

LexicalAnalyzerName

A mező indexelésekor használt elemző neve. Ez a beállítás csak kereshető mezőkkel használható. A searchAnalyzerrel együtt kell beállítani, és nem állítható be az elemző beállítással együtt. Ez a tulajdonság nem állítható be nyelvelemző nevére; használja inkább az analyzer tulajdonságot, ha nyelvelemzőre van szüksége. Az elemző kiválasztása után nem módosítható a mezőhöz. Komplex mezők esetén null értékűnek kell lennie.

key

boolean

Egy érték, amely azt jelzi, hogy a mező egyedileg azonosítja-e az indexben lévő dokumentumokat. Minden indexben pontosan egy legfelső szintű mezőt kell kiválasztani kulcsmezőként, és Edm.String típusúnak kell lennie. A kulcsmezők a dokumentumok közvetlen keresésére és adott dokumentumok frissítésére vagy törlésére használhatók. Az alapértelmezett érték az egyszerű mezők esetében hamis, az összetett mezők esetében pedig null.

name

string

A mező neve, amelynek egyedinek kell lennie az index vagy szülőmező mezőgyűjteményében.

normalizer

LexicalNormalizerName

A mezőhöz használandó normalizáló neve. Ez a beállítás csak szűrhető, rendezhető vagy táblázatos mezőkkel használható. A normalizáló kiválasztása után nem módosítható a mezőhöz. Komplex mezők esetén null értékűnek kell lennie.

retrievable

boolean

Egy érték, amely azt jelzi, hogy a mező visszaadható-e egy keresési eredményben. Ezt a beállítást letilthatja, ha egy mezőt (például margót) szeretne szűrőként, rendezési vagy pontozási mechanizmusként használni, de nem szeretné, hogy a mező látható legyen a végfelhasználó számára. Ennek a tulajdonságnak igaznak kell lennie a kulcsmezők esetében, és az összetett mezők esetében null értékűnek kell lennie. Ez a tulajdonság meglévő mezőkön módosítható. A tulajdonság engedélyezése nem okozza az indextárolási követelmények növekedését. Az alapértelmezett érték igaz az egyszerű mezőkre, a hamis a vektormezőkre, a null érték pedig az összetett mezőkre.

searchAnalyzer

LexicalAnalyzerName

A mező keresési idején használt elemző neve. Ez a beállítás csak kereshető mezőkkel használható. Az indexAnalyzerrel együtt kell beállítani, és nem állítható be az elemző beállítással együtt. Ez a tulajdonság nem állítható be nyelvelemző nevére; használja inkább az analyzer tulajdonságot, ha nyelvelemzőre van szüksége. Ez az elemző frissíthető egy meglévő mezőn. Komplex mezők esetén null értékűnek kell lennie.

searchable

boolean

Egy érték, amely azt jelzi, hogy a mező kereshető-e. Ez azt jelenti, hogy az indexelés során olyan elemzések mennek végbe, mint a szótörés. Ha egy kereshető mező értékének például a „sunny day” szöveget adja meg, akkor az két különálló tokenre lesz bontva: „sunny” és „day”. Ez lehetővé teszi a kifejezések teljes szöveges keresését. Az Edm.String vagy Collection(Edm.String) típusú mezők alapértelmezés szerint kereshetők. Ennek a tulajdonságnak hamisnak kell lennie más nem sztring típusú egyszerű mezők esetében, és az összetett mezők esetében null értékűnek kell lennie. Megjegyzés: A kereshető mezők extra helyet foglalnak el az indexben, hogy a teljes szöveges keresésekhez a mezőérték további jogkivonatos verzióit is elférjenek. Ha helyet szeretne menteni az indexben, és nincs szükség arra, hogy egy mező szerepeljen a keresésekben, állítsa a kereshető értéket false (hamis) értékre.

sortable

boolean

Egy érték, amely azt jelzi, hogy engedélyezi-e a mező hivatkozását $orderby kifejezésekben. Alapértelmezés szerint a keresőmotor pontszám szerint rendezi az eredményeket, de sok esetben a felhasználók a dokumentumok mezői szerint szeretnének rendezni. Az egyszerű mezők csak akkor rendezhetők, ha egyértékűek (egyetlen értékkel rendelkezik a szülődokumentum hatókörében). Az egyszerű gyűjteménymezők nem rendezhetők, mivel többértékűek. Az összetett gyűjtemények egyszerű almezői szintén többértékűek, ezért nem rendezhetők. Ez akkor is igaz, ha egy közvetlen szülőmezőről vagy egy elődmezőről van szó, ez az összetett gyűjtemény. Az összetett mezők nem rendezhetők, és a rendezhető tulajdonságnak null értékűnek kell lennie az ilyen mezők esetében. A rendezhető alapértelmezett értéke igaz az egyértékű egyszerű mezőkre, a többértékű egyszerű mezőkre hamis, az összetett mezők esetében pedig null értékre.

stored

boolean

Nem módosítható érték, amely azt jelzi, hogy a mező külön marad-e a lemezen, hogy a keresési eredményben megjelenjen. Ezt a beállítást letilthatja, ha nem tervezi visszaadni a mező tartalmát egy keresési válaszban, hogy a tárterület többletterhelését mentse. Ez csak az index létrehozásakor állítható be, és csak vektormezők esetén. Ez a tulajdonság nem módosítható meglévő mezők esetében, és nem állítható be hamis értékre az új mezők esetében. Ha ez a tulajdonság false (hamis) értékre van állítva, a "retrieveable" tulajdonságot is false (hamis) értékre kell állítani. Ennek a tulajdonságnak igaznak vagy nem halmaznak kell lennie a kulcsmezők, az új mezők és a nem vektoros mezők esetében, és az összetett mezők esetében null értékűnek kell lennie. A tulajdonság letiltása csökkenti az indextárolási követelményeket. Az alapértelmezett érték a vektormezők esetében igaz.

synonymMaps

string[]

A mezőhöz társítandó szinonimatérképek nevének listája. Ez a beállítás csak kereshető mezőkkel használható. Jelenleg mezőnként csak egy szinonimatérkép támogatott. Szinonimatérkép mezőhöz rendelése biztosítja, hogy a mezőt megcélzó lekérdezési kifejezések a szinonimatérkép szabályainak használatával lekérdezéskor ki legyenek bontva. Ez az attribútum a meglévő mezőkön módosítható. Az összetett mezők esetében null értékűnek vagy üres gyűjteménynek kell lennie.

type

SearchFieldDataType

A mező adattípusa.

vectorSearchProfile

string

A vektorkeresési profil neve, amely meghatározza a vektormezőben való kereséshez használni kívánt algoritmust és vektorizálót.

SearchFieldDataType

Meghatározza egy mező adattípusát egy keresési indexben.

Name Típus Description
Edm.Boolean

string

Azt jelzi, hogy egy mező logikai értéket tartalmaz (igaz vagy hamis).

Edm.ComplexType

string

Azt jelzi, hogy egy mező egy vagy több összetett objektumot tartalmaz, amelyek más típusú almezőkkel rendelkeznek.

Edm.DateTimeOffset

string

Azt jelzi, hogy egy mező dátum-/időértéket tartalmaz, beleértve az időzónára vonatkozó információkat is.

Edm.Double

string

Azt jelzi, hogy egy mező IEEE dupla pontosságú lebegőpontos számot tartalmaz.

Edm.GeographyPoint

string

Azt jelzi, hogy egy mező földrajzi helyet tartalmaz a hosszúság és a szélesség szempontjából.

Edm.Half

string

Azt jelzi, hogy egy mező félpontos lebegőpontos számot tartalmaz. Ez csak a Collection(Edm.Half) használatakor érvényes.

Edm.Int16

string

Azt jelzi, hogy egy mező 16 bites aláírt egész számot tartalmaz. Ez csak a Collection(Edm.Int16) használatakor érvényes.

Edm.Int32

string

Azt jelzi, hogy egy mező 32 bites aláírt egész számot tartalmaz.

Edm.Int64

string

Azt jelzi, hogy egy mező 64 bites aláírt egész számot tartalmaz.

Edm.SByte

string

Azt jelzi, hogy egy mező egy 8 bites aláírt egész számot tartalmaz. Ez csak a Collection(Edm.SByte) használatakor érvényes.

Edm.Single

string

Azt jelzi, hogy egy mező egy pontosságú lebegőpontos számot tartalmaz. Ez csak a Collection(Edm.Single) használatakor érvényes.

Edm.String

string

Azt jelzi, hogy egy mező tartalmaz egy sztringet.

SearchIndex

A keresési index definícióját jelöli, amely egy index mezőit és keresési viselkedését ismerteti.

Name Típus Description
@odata.etag

string

Az index ETagje.

analyzers LexicalAnalyzer[]:
  • CustomAnalyzer[]
  • LuceneStandardAnalyzer[]
  • PatternAnalyzer[]
  • StopAnalyzer[]

Az index elemzői.

charFilters CharFilter[]:
  • MappingCharFilter[]
  • PatternReplaceCharFilter[]

Az index karakterszűrői.

corsOptions

CorsOptions

Az index eltérő eredetű erőforrás-megosztásának (CORS) szabályozására szolgáló beállítások.

defaultScoringProfile

string

A használni kívánt pontozási profil neve, ha nincs megadva a lekérdezésben. Ha ez a tulajdonság nincs beállítva, és nincs megadva pontozási profil a lekérdezésben, akkor a rendszer az alapértelmezett pontozást (tf-idf) használja.

encryptionKey

SearchResourceEncryptionKey

Az Azure Key Vault-ben létrehozott titkosítási kulcs leírása. Ez a kulcs további titkosítási szintet biztosít az inaktív adatok számára, ha teljes körű biztosítékot szeretne kapni arról, hogy senki, még a Microsoft sem tudja visszafejteni az adatokat. Miután titkosította az adatokat, az mindig titkosítva marad. A keresési szolgáltatás figyelmen kívül hagyja a tulajdonság null értékre történő beállítására tett kísérleteket. Ezt a tulajdonságot szükség szerint módosíthatja, ha el szeretné forgatni a titkosítási kulcsot; Az adatokra nem lesz hatással. Az ügyfél által felügyelt kulcsokkal történő titkosítás nem érhető el az ingyenes keresési szolgáltatásokhoz, és csak a 2019. január 1-jén vagy azt követően létrehozott fizetős szolgáltatásokhoz érhető el.

fields

SearchField[]

Az index mezői.

name

string

Az index neve.

normalizers LexicalNormalizer[]:

CustomNormalizer[]

Az index normalizálói.

scoringProfiles

ScoringProfile[]

Az index pontozási profiljai.

semantic

SemanticSettings

Olyan keresési index paramétereit határozza meg, amelyek befolyásolják a szemantikai képességeket.

similarity Similarity:

A keresési lekérdezésnek megfelelő dokumentumok pontozásához és rangsorolásához használandó hasonlósági algoritmus típusa. A hasonlósági algoritmus csak az index létrehozásakor határozható meg, és nem módosítható a meglévő indexeken. Ha null, a Rendszer a ClassicSimilarity algoritmust használja.

suggesters

Suggester[]

Az index javaslattevői.

tokenFilters TokenFilter[]:
  • AsciiFoldingTokenFilter[]
  • CjkBigramTokenFilter[]
  • CommonGramTokenFilter[]
  • DictionaryDecompounderTokenFilter[]
  • EdgeNGramTokenFilter[]
  • EdgeNGramTokenFilterV2[]
  • ElisionTokenFilter[]
  • KeepTokenFilter[]
  • KeywordMarkerTokenFilter[]
  • LengthTokenFilter[]
  • LimitTokenFilter[]
  • NGramTokenFilter[]
  • NGramTokenFilterV2[]
  • PatternCaptureTokenFilter[]
  • PatternReplaceTokenFilter[]
  • PhoneticTokenFilter[]
  • ShingleTokenFilter[]
  • SnowballTokenFilter[]
  • StemmerOverrideTokenFilter[]
  • StemmerTokenFilter[]
  • StopwordsTokenFilter[]
  • SynonymTokenFilter[]
  • TruncateTokenFilter[]
  • UniqueTokenFilter[]
  • WordDelimiterTokenFilter[]

Az index jogkivonat-szűrői.

tokenizers LexicalTokenizer[]:
  • ClassicTokenizer[]
  • EdgeNGramTokenizer[]
  • KeywordTokenizer[]
  • KeywordTokenizerV2[]
  • LuceneStandardTokenizer[]
  • LuceneStandardTokenizerV2[]
  • MicrosoftLanguageStemmingTokenizer[]
  • MicrosoftLanguageTokenizer[]
  • NGramTokenizer[]
  • PathHierarchyTokenizerV2[]
  • PatternTokenizer[]
  • UaxUrlEmailTokenizer[]

Az index jogkivonat-szabályzói.

vectorSearch

VectorSearch

A vektorkereséshez kapcsolódó konfigurációs beállításokat tartalmaz.

SearchIndexerDataNoneIdentity

Törli egy adatforrás identitástulajdonságát.

Name Típus Description
@odata.type string:

#Microsoft.Azure.Search.DataNoneIdentity

Az identitás típusát meghatározó URI-töredék.

SearchIndexerDataUserAssignedIdentity

Megadja a használni kívánt adatforrás identitását.

Name Típus Description
@odata.type string:

#Microsoft.Azure.Search.DataUserAssignedIdentity

Az identitás típusát meghatározó URI-töredék.

userAssignedIdentity

string

A felhasználó által hozzárendelt felügyelt identitás teljes Azure-erőforrás-azonosítója általában "/subscriptions/12345678-1234-1234-1234-1234-1234567890ab/resourceGroups/rg/providers/Microsoft.ManagedIdentity/userAssignedIdentities/myId" formában, amelyet hozzá kellett volna rendelni a keresési szolgáltatáshoz.

SearchResourceEncryptionKey

Ügyfél által felügyelt titkosítási kulcs az Azure Key Vault. A létrehozott és kezelt kulcsok az inaktív adatok, például indexek és szinonimák titkosítására vagy visszafejtésére használhatók.

Name Típus Description
accessCredentials

AzureActiveDirectoryApplicationCredentials

Az Azure Key Vault eléréséhez használt opcionális Azure Active Directory-hitelesítő adatok. Nem kötelező, ha felügyelt identitást használ helyette.

identity SearchIndexerDataIdentity:
  • SearchIndexerDataNoneIdentity
  • SearchIndexerDataUserAssignedIdentity

A titkosítási kulcshoz használandó explicit felügyelt identitás. Ha nincs megadva, és a hozzáférési hitelesítő adatok tulajdonság null értékű, a rendszer a rendszer által hozzárendelt felügyelt identitást használja. Ha az erőforrás frissítésekor a explicit identitás nincs meghatározva, az változatlan marad. Ha a "nincs" érték van megadva, a tulajdonság értéke törlődik.

keyVaultKeyName

string

Az Inaktív adatok titkosításához használandó Azure-Key Vault kulcs neve.

keyVaultKeyVersion

string

Az Inaktív adatok titkosításához használandó Azure-Key Vault kulcs verziója.

keyVaultUri

string

Az Azure Key Vault ( más néven DNS-név) URI-ja, amely az inaktív adatok titkosításához használandó kulcsot tartalmazza. Példa URI-ra: https://my-keyvault-name.vault.azure.net.

SemanticConfiguration

Egy adott konfigurációt határoz meg, amelyet a szemantikai képességek kontextusában kell használni.

Name Típus Description
name

string

A szemantikai konfiguráció neve.

prioritizedFields

PrioritizedFields

A szemantikai rangsoroláshoz, feliratokhoz, kiemelésekhez és válaszokhoz használandó cím- és tartalom- és kulcsszómezőket ismerteti. A három altulajdonság közül legalább egyet (titleField, prioritizedKeywordsFields és prioritizedContentFields) be kell állítani.

SemanticField

A szemantikai konfiguráció részeként használt mező.

Name Típus Description
fieldName

string

SemanticSettings

Olyan keresési index paramétereit határozza meg, amelyek befolyásolják a szemantikai képességeket.

Name Típus Description
configurations

SemanticConfiguration[]

Az index szemantikai konfigurációi.

defaultConfiguration

string

Lehetővé teszi egy alapértelmezett szemantikai konfiguráció nevének beállítását az indexben, így nem kötelező minden alkalommal lekérdezési paraméterként átadni.

ShingleTokenFilter

A jogkivonatok kombinációit egyetlen tokenként hozza létre. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.

Name Típus Alapértelmezett érték Description
@odata.type string:

#Microsoft.Azure.Search.ShingleTokenFilter

Egy URI-töredék, amely megadja a tokenszűrő típusát.

filterToken

string

_

A beszúrandó sztring minden olyan pozícióhoz, ahol nincs token. Az alapértelmezett érték egy aláhúzás ("_").

maxShingleSize

integer

2

A zsindely maximális mérete. Az alapértelmezett és minimális érték 2.

minShingleSize

integer

2

A minimális zsindelyméret. Az alapértelmezett és minimális érték 2. A maxShingleSize értékénél kisebbnek kell lennie.

name

string

A jogkivonatszűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet.

outputUnigrams

boolean

True

Egy érték, amely azt jelzi, hogy a kimeneti stream tartalmazza-e a bemeneti jogkivonatokat (unigramokat) és az övsömöröket. Alapértelmezett érték: true (igaz).

outputUnigramsIfNoShingles

boolean

False

Egy érték, amely jelzi, hogy egygrammot kell-e kiadni azokra az időkre, amikor nem áll rendelkezésre zsindely. Ez a tulajdonság elsőbbséget élvez, ha az outputUnigrams értéke hamis. Az alapértelmezett érték a false (hamis).

tokenSeparator

string

A szomszédos tokenek összekapcsolásakor használandó sztring, amely egy zsindelyt alkot. Az alapértelmezett érték egy szóköz (" ").

SnowballTokenFilter

Egy szűrő, amely a szavakat egy Snowball által generált ősmer használatával szárja. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.

Name Típus Description
@odata.type string:

#Microsoft.Azure.Search.SnowballTokenFilter

Egy URI-töredék, amely megadja a tokenszűrő típusát.

language

SnowballTokenFilterLanguage

A használni kívánt nyelv.

name

string

A jogkivonatszűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet.

SnowballTokenFilterLanguage

A Snowball-tokenszűrőhöz használandó nyelv.

Name Típus Description
armenian

string

Kiválasztja a Lucene Snowball stemming tokenizer örmény.

basque

string

Kiválasztja a Lucene Snowball stemming tokenizer baszk.

catalan

string

Kiválasztja a Lucene Snowball stemming tokenizer katalán.

danish

string

Kiválasztja a Lucene Snowball stemming tokenizert dánul.

dutch

string

Kiválasztja a Lucene Snowball stemming tokenizer holland.

english

string

Kiválasztja a Lucene Snowball stemming tokenizer angolul.

finnish

string

Kiválasztja a Lucene Snowball stemming tokenizer finn nyelvhez.

french

string

Kiválasztja a Lucene Snowball stemming tokenizer francia.

german

string

Kiválasztja a Lucene Snowball stemming tokenizer német nyelvhez.

german2

string

Kiválasztja a német változat algoritmust használó Lucene Snowball stemming tokenizert.

hungarian

string

Kiválasztja a Lucene Snowball stemming tokenizert magyarra.

italian

string

Kiválasztja a Lucene Snowball stemming tokenizer olasz.

kp

string

Kiválasztja a Lucene Snowball stemming tokenizert a hollandhoz, amely a Kraaij-Pohlmann stemming algoritmust használja.

lovins

string

Kiválasztja az angol nyelvhez készült Lucene Snowball stemming tokenizert, amely a Lovins stemming algoritmust használja.

norwegian

string

Kiválasztja a Lucene Snowball stemming tokenizert a norvég nyelvhez.

porter

string

Kiválasztja az angol nyelvhez készült Lucene Snowball stemming tokenizert, amely a Porter stemming algoritmust használja.

portuguese

string

Kiválasztja a Lucene Snowball stemming tokenizer portugálul.

romanian

string

Kiválasztja a Lucene Snowball stemming tokenizer román.

russian

string

Kiválasztja a Lucene Snowball stemming tokenizer orosz.

spanish

string

Kiválasztja a Lucene Snowball stemming tokenizer spanyolul.

swedish

string

Kiválasztja a Lucene Snowball stemming tokenizer svéd.

turkish

string

Kiválasztja a Lucene Snowball stemming tokenizer for Török.

StemmerOverrideTokenFilter

Lehetővé teszi, hogy felülbírálja a többi szárító szűrőt a saját szótáron alapuló szárítással. A szótárból származó kifejezések kulcsszavakként lesznek megjelölve, így nem lesznek a láncban lévő szárak. A szárító szűrők elé kell helyezni. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.

Name Típus Description
@odata.type string:

#Microsoft.Azure.Search.StemmerOverrideTokenFilter

Egy URI-töredék, amely megadja a tokenszűrő típusát.

name

string

A jogkivonatszűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet.

rules

string[]

A stemming szabályok listája a következő formátumban: "word => stem", például: "ran => run".

StemmerTokenFilter

Nyelvspecifikus eredetszűrő. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.

Name Típus Description
@odata.type string:

#Microsoft.Azure.Search.StemmerTokenFilter

Egy URI-töredék, amely megadja a tokenszűrő típusát.

language

StemmerTokenFilterLanguage

A használni kívánt nyelv.

name

string

A jogkivonatszűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet.

StemmerTokenFilterLanguage

A stemmer token szűrőhöz használandó nyelv.

Name Típus Description
arabic

string

Kiválasztja a Lucene stemming tokenizert arabra.

armenian

string

Kiválasztja az örmény Lucene-alapú jogkivonat-jelölőt.

basque

string

Kiválasztja a Lucene stemming tokenizert Baszk számára.

brazilian

string

Kiválasztja a Portugál (Brazília) Lucene stemming tokenizer (Lucene stemming tokenizer) elemét.

bulgarian

string

Kiválasztja a Bolgár Lucene-alapú jogkivonat-jelölőt.

catalan

string

Kiválasztja a KatalánHoz tartozó Lucene-jogkivonat-jelölőt.

czech

string

Kiválasztja a Lucene stemming tokenizert csehhez.

danish

string

Kiválasztja a Dán lucene-alapú jogkivonat-jelölőt.

dutch

string

Kiválasztja a Lucene stemming tokenizert a hollandhoz.

dutchKp

string

Kiválasztja a holland Lucene stemming tokenizert, amely a Kraaij-Pohlmann stemming algoritmust használja.

english

string

Kiválasztja a Lucene stemming tokenizert angolul.

finnish

string

Kiválasztja a finn Lucene-alapú jogkivonat-jelölőt.

french

string

Kiválasztja a Francia Lucene-alapú jogkivonat-jelölőt.

galician

string

Kiválasztja a Lucene stemming tokenizert a galíciaihoz.

german

string

Kiválasztja a német lucene-alapú jogkivonat-jelölőt.

german2

string

Kiválasztja a német variáns algoritmust használó Lucene-alapú jogkivonat-készítőt.

greek

string

Kiválasztja a Görög Lucene-alapú jogkivonat-jelölőt.

hindi

string

Kiválasztja a Lucene stemming tokenizert hindihez.

hungarian

string

Kiválasztja a Lucene stemming tokenizert magyarra.

indonesian

string

Kiválasztja az indonéz Lucene-alapú jogkivonat-jelölőt.

irish

string

Kiválasztja az ír Lucene stemming tokenizert.

italian

string

Kiválasztja az olasz Lucene-alapú jogkivonat-jelölőt.

latvian

string

Kiválasztja a lett lucene-alapú jogkivonat-jelölőt.

lightEnglish

string

Kiválasztja az angolhoz készült Lucene stemming tokenizert, amely könnyű leszármaztatást végez.

lightFinnish

string

Kiválasztja a finn lucene-alapú tokenizálót, amely világos szározást végez.

lightFrench

string

Kiválasztja a francia Lucene stemming tokenizert, amely világos szárral rendelkezik.

lightGerman

string

Kiválasztja a német Lucene-ből származó tokenizert, amely világos szározást végez.

lightHungarian

string

Kiválasztja a Lucene stemming tokenizert a magyarhoz, amely világos szárú.

lightItalian

string

Kiválasztja az olasz lucene szárító tokenizert, amely világos szárral rendelkezik.

lightNorwegian

string

Kiválasztja a Lucene stemming tokenizert a norvég (Bokmål) számára, amely könnyű leszármaztatást végez.

lightNynorsk

string

Kiválasztja a Lucene stemming tokenizert a norvég (Nynorsk) számára, amely könnyű leszármaztatást végez.

lightPortuguese

string

Kiválasztja a Lucene-alapú jogkivonat-jelölőt a portugál nyelvhez, amely könnyű leszármaztatást végez.

lightRussian

string

Kiválasztja a Lucene stemming tokenizert az oroszhoz, amely könnyű leszármaztatást végez.

lightSpanish

string

Kiválasztja a Lucene-ből származó tokenizert a spanyolhoz, amely világos szárral rendelkezik.

lightSwedish

string

Kiválasztja a Lucene stemming tokenizer svéd, hogy nem könnyű szárú.

lovins

string

Kiválasztja a Lovins stemming algoritmust használó, angol nyelvhez készült Lucene stemming tokenizert.

minimalEnglish

string

Kiválasztja az angolhoz készült Lucene stemming tokenizert, amely minimális szárítást végez.

minimalFrench

string

Kiválasztja a Francia Lucene-alapú jogkivonat-jelölőt, amely minimális szárítást végez.

minimalGalician

string

Kiválasztja a Lucene-ből származó tokenizert a galíciaihoz, amely minimális szárítást végez.

minimalGerman

string

Kiválasztja a német lucene-alapú jogkivonat-jelölőt, amely minimális szárítást végez.

minimalNorwegian

string

Kiválasztja a Lucene stemming tokenizert a norvég (Bokmål) számára, amely minimális szárítást végez.

minimalNynorsk

string

Kiválasztja a Norvég (Nynorsk) lucene-alapú tokenizálóját, amely minimális szárítást végez.

minimalPortuguese

string

Kiválasztja a portugál lucene-alapú jogkivonat-jelölőt, amely minimális szárítást végez.

norwegian

string

Kiválasztja a Lucene stemming tokenizert a norvég (Bokmål) számára.

porter2

string

Kiválasztja a Porter2 stemming algoritmust használó, angol nyelvhez készült Lucene stemming tokenizert.

portuguese

string

Kiválasztja a portugál Lucene-alapú jogkivonat-jelölőt.

portugueseRslp

string

Kiválasztja az RSLP-alapú stemming algoritmust használó portugál Lucene stemming tokenizert.

possessiveEnglish

string

Kiválasztja az angolhoz készült Lucene-alapú jogkivonat-jelölőt, amely eltávolítja a záró birtokosokat a szavakból.

romanian

string

Kiválasztja a Lucene stemming tokenizert a román nyelvhez.

russian

string

Kiválasztja a Lucene stemming tokenizert oroszul.

sorani

string

Kiválasztja a Soranihoz tartozó Lucene stemming tokenizert.

spanish

string

Kiválasztja a Lucene stemming tokenizert spanyolul.

swedish

string

Kiválasztja a Lucene stemming tokenizert svédhez.

turkish

string

Kiválasztja a Lucene stemming tokenizer for Török lehetőséget.

StopAnalyzer

A szöveget nem betűkkel osztja el; Alkalmazza a kisbetűs és a stopword jogkivonat szűrőit. Ez az elemző az Apache Lucene használatával van implementálva.

Name Típus Description
@odata.type string:

#Microsoft.Azure.Search.StopAnalyzer

Az elemző típusát meghatározó URI-töredék.

name

string

Az elemző neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet.

stopwords

string[]

A stopszavak listája.

StopwordsList

A nyelvspecifikus stopszavak előre definiált listáját azonosítja.

Name Típus Description
arabic

string

Kiválasztja az arabhoz tartozó stopszólistát.

armenian

string

Kiválasztja az örmény stopszólistát.

basque

string

A baszk stopszólista kiválasztása.

brazilian

string

A portugál (Brazília) stopword listájának kiválasztása.

bulgarian

string

Kiválasztja a bolgár stopword listát.

catalan

string

Kiválasztja a katalán stopszólistát.

czech

string

A csehhez tartozó stopszólistát választja ki.

danish

string

Kiválasztja a dán nyelvű stopszólistát.

dutch

string

Kiválasztja a holland stopword listát.

english

string

Kiválasztja az angol nyelvű stopword listát.

finnish

string

Kiválasztja a finn stopword listát.

french

string

Kiválasztja a francia stopword listát.

galician

string

Kiválasztja a galíciaiak stopszólistáját.

german

string

A német nyelvhez tartozó stopword listát választja ki.

greek

string

Kiválasztja a görög stopword listát.

hindi

string

Kiválasztja a hindi stopword listát.

hungarian

string

Kiválasztja a magyar nyelvű stopszólistát.

indonesian

string

Kiválasztja az indonéz stopszólistát.

irish

string

Kiválasztja az írek stopword listáját.

italian

string

Kiválasztja az olasz nyelvhez tartozó stopszólistát.

latvian

string

Kiválasztja a lett nyelvhez tartozó stopszólistát.

norwegian

string

Kiválasztja a norvég nyelvhez tartozó stopszólistát.

persian

string

Kiválasztja a perzsa stopszólistát.

portuguese

string

Kiválasztja a portugál nyelvhez tartozó stopszólistát.

romanian

string

Kiválasztja a román nyelvű stopszólistát.

russian

string

Kiválasztja az orosz nyelvű stopword listát.

sorani

string

A Sorani stopword listájának kiválasztása.

spanish

string

Kiválasztja a spanyol nyelvű stopszólistát.

swedish

string

Kiválasztja a svéd stopword listát.

thai

string

Kiválasztja a thai nyelvhez tartozó stopszólistát.

turkish

string

Kiválasztja a török nyelvhez tartozó stopword listát.

StopwordsTokenFilter

Eltávolítja a leállító szavakat egy jogkivonatfolyamból. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.

Name Típus Alapértelmezett érték Description
@odata.type string:

#Microsoft.Azure.Search.StopwordsTokenFilter

Egy URI-töredék, amely megadja a tokenszűrő típusát.

ignoreCase

boolean

False

A kis- és nagybetűk figyelmen kívül hagyását jelző érték. Ha igaz, a rendszer először az összes szót kisbetűssé alakítja. Az alapértelmezett érték a false (hamis).

name

string

A jogkivonatszűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet.

removeTrailing

boolean

True

Egy érték, amely azt jelzi, hogy figyelmen kívül kell-e hagyni az utolsó keresési kifejezést, ha az egy stop szó. Alapértelmezett érték: true (igaz).

stopwords

string[]

A stopszavak listája. Ez a tulajdonság és a stopwords lista tulajdonság nem állítható be.

stopwordsList

StopwordsList

english

A használni kívánt stopszavak előre definiált listája. Ez a tulajdonság és a stopwords tulajdonság nem állítható be. Az alapértelmezett érték az angol.

Suggester

Meghatározza, hogyan kell alkalmazni a Suggest API-t az index egy mezőcsoportjára.

Name Típus Description
name

string

A javaslattevő neve.

searchMode

SuggesterSearchMode

A javaslattevő képességeit jelző érték.

sourceFields

string[]

Azon mezőnevek listája, amelyekre a javaslattevő vonatkozik. Minden mezőnek kereshetőnek kell lennie.

SuggesterSearchMode

A javaslattevő képességeit jelző érték.

Name Típus Description
analyzingInfixMatching

string

Egy mező egymást követő teljes kifejezéseinek és előtagjainak felel meg. A "Leggyorsabb barna róka" mező esetében például a "fast" és a "leggyorsabb brow" lekérdezések is egyeznek.

SynonymTokenFilter

Egy vagy többszavas szinonimák egy jogkivonatfolyamban. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.

Name Típus Alapértelmezett érték Description
@odata.type string:

#Microsoft.Azure.Search.SynonymTokenFilter

Egy URI-töredék, amely megadja a tokenszűrő típusát.

expand

boolean

True

Egy érték, amely azt jelzi, hogy a szinonimák listájában szereplő összes szó (ha => jelölés nincs használva) megfeleltethető-e egymásnak. Ha igaz, a szinonimák listájában szereplő összes szó (ha => jelölést nem használ) megfelelteti egymásnak. A következő lista: hihetetlen, hihetetlen, mesés, csodálatos egyenértékű: hihetetlen, hihetetlen, mesés, csodálatos => hihetetlen, hihetetlen, mesés, csodálatos. Ha hamis, a következő lista: hihetetlen, hihetetlen, mesés, csodálatos lesz egyenértékű: hihetetlen, hihetetlen, mesés, csodálatos => hihetetlen. Alapértelmezett érték: true (igaz).

ignoreCase

boolean

False

Egy érték, amely azt jelzi, hogy a bemenetet kis- és nagybetűvel kell-e összehajtani az egyeztetéshez. Az alapértelmezett érték a false (hamis).

name

string

A jogkivonatszűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet.

synonyms

string[]

A szinonimák listája a következő két formátum egyikében: 1. hihetetlen, hihetetlen, mesés => csodálatos - a = szimbólum bal oldalán> lévő összes kifejezés helyébe a jobb oldalon lévő összes kifejezés kerül; 2. hihetetlen, hihetetlen, mesés, csodálatos - az egyenértékű szavak vesszővel elválasztott listája. A kibontás beállításával módosíthatja a lista értelmezését.

TagScoringFunction

Olyan függvényt definiál, amely egy adott címkelistának megfelelő sztringértékekkel növeli a dokumentumok pontszámait.

Name Típus Description
boost

number

A nyers pontszám szorzója. Pozitív számnak kell lennie, amely nem lehet 1,0.

fieldName

string

A pontozási függvény bemeneteként használt mező neve.

interpolation

ScoringFunctionInterpolation

Egy érték, amely azt jelzi, hogy a kiemelés hogyan lesz interpolálva a dokumentum pontszámai között; alapértelmezés szerint "Lineáris".

tag

TagScoringParameters

A címke pontozási függvényének paraméterértékei.

type string:

tag

A használni kívánt függvény típusát jelzi. Az érvényes értékek közé tartozik a magnitúdó, a frissesség, a távolság és a címke. A függvénytípusnak kisbetűsnek kell lennie.

TagScoringParameters

Paraméterértékeket biztosít egy címkepontozási függvénynek.

Name Típus Description
tagsParameter

string

A keresési lekérdezésekben átadott paraméter neve, amely megadja a célmezővel összehasonlítandó címkék listáját.

TextWeights

Olyan indexmezők súlyozását határozza meg, amelyek esetében a találatok növelik a keresési lekérdezések pontozását.

Name Típus Description
weights

object

A mezőnkénti súlyozás szótára a dokumentumok pontozásának növeléséhez. A kulcsok mezőnevek, az értékek pedig az egyes mezők súlyozásai.

TokenCharacterKind

Olyan karakterosztályokat jelöl, amelyeken a jogkivonatszűrők működhetnek.

Name Típus Description
digit

string

A számjegyeket tokenekben tárolja.

letter

string

Jogkivonatokban tárolja a leveleket.

punctuation

string

A tokenekben tárolja az írásjeleket.

symbol

string

A szimbólumokat tokenekben tárolja.

whitespace

string

Jogkivonatokban tárolja a térközt.

TokenFilterName

Meghatározza a keresőmotor által támogatott összes jogkivonatszűrő nevét.

Name Típus Description
apostrophe

string

Az aposztróf utáni összes karaktert (beleértve magát az aposztrófot is) csíkoz. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/tr/ApostropheFilter.html

arabic_normalization

string

Egy jogkivonatszűrő, amely az arab normalizálót alkalmazza az ortográfia normalizálására. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/ar/ArabicNormalizationFilter.html

asciifolding

string

Az első 127 ASCII-karakterben nem szereplő unicode-karaktereket (az "Egyszerű latin" Unicode-blokkot) ASCII-ekvivalenssé alakítja át, ha léteznek ilyen megfelelők. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/ASCIIFoldingFilter.html

cjk_bigram

string

Forms standard tokenizerből létrehozott CJK-kifejezések bigramját. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/cjk/CJKBigramFilter.html

cjk_width

string

Normalizálja a CJK szélességi különbségeit. A fullwidth ASCII-variánsokat a megfelelő alap latin, a félszélességű Katakana változatokat pedig a megfelelő Kana-ra hajtja. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/cjk/CJKWidthFilter.html

classic

string

Eltávolítja az angol birtokosokat és a betűket a betűszókból. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/standard/ClassicFilter.html

common_grams

string

Bigramokat hozhat létre az indexelés során gyakran előforduló kifejezésekhez. Az egyes kifejezések továbbra is indexelve vannak, és a bigramok túl vannak osztva. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/commongrams/CommonGramsFilter.html

edgeNGram_v2

string

A megadott méret(ek) n-grammját hozza létre egy bemeneti jogkivonat elejétől vagy hátuljától kezdve. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/ngram/EdgeNGramTokenFilter.html

elision

string

Eltávolítja az elisionokat. A "l'avion" (a sík) például "avion" (sík) lesz. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/util/ElisionFilter.html

german_normalization

string

Normalizálja a német karaktereket a german2 snowball algoritmus heurisztikusai szerint. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/de/GermanNormalizationFilter.html

hindi_normalization

string

Normalizálja a hindi szövegeket, hogy eltávolítson néhány különbséget a helyesírási változatokban. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/hi/HindiNormalizationFilter.html

indic_normalization

string

Normalizálja a szöveg Unicode-ábrázolását indiai nyelveken. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/in/IndicNormalizationFilter.html

keyword_repeat

string

Minden bejövő jogkivonatot kétszer, egyszer kulcsszóként, egyszer pedig nem kulcsszóként bocsát ki. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/KeywordRepeatFilter.html

kstem

string

Nagy teljesítményű kstem szűrő angol nyelven. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/en/KStemFilter.html

length

string

Eltávolítja a túl hosszú vagy túl rövid szavakat. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/LengthFilter.html

limit

string

Korlátozza a tokenek számát az indexelés során. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/LimitTokenCountFilter.html

lowercase

string

A jogkivonat szövegének normalizálása kisbetűsre. Lásd: https://lucene.apache.org/core/6_6_1/analyzers-common/org/apache/lucene/analysis/core/LowerCaseFilter.html

nGram_v2

string

A megadott méret(ek) n-grammját hozza létre. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/ngram/NGramTokenFilter.html

persian_normalization

string

A perzsa normalizálását alkalmazza. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/fa/PersianNormalizationFilter.html

phonetic

string

Jogkivonatok létrehozása fonetikus egyezésekhez. Lásd: https://lucene.apache.org/core/4_10_3/analyzers-phonetic/org/apache/lucene/analysis/phonetic/package-tree.html

porter_stem

string

A Porter-származtatási algoritmust használja a tokenstream átalakításához. Lásd: http://tartarus.org/~martin/PorterStemmer

reverse

string

A jogkivonat sztringjének megfordítása. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/reverse/ReverseStringFilter.html

scandinavian_folding

string

Folds Skandináv karakterek åÅäæÄÆ-a> és öÖøØ-o>. Emellett hátrányosan megkülönbözteti az aa, ae, ao, oe és oo magánhangzók használatát, így csak az első. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/ScandinavianFoldingFilter.html

scandinavian_normalization

string

Normalizálja a felcserélhető skandináv karakterek használatát. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/ScandinavianNormalizationFilter.html

shingle

string

Tokenkombinációkat hoz létre egyetlen tokenként. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/shingle/ShingleFilter.html

snowball

string

Egy szűrő, amely a szavakat egy Snowball által generált őst használ. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/snowball/SnowballFilter.html

sorani_normalization

string

Normalizálja a Sorani-szöveg Unicode-ábrázolását. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/ckb/SoraniNormalizationFilter.html

stemmer

string

Nyelvspecifikus eredetszűrő. Lásd: https://docs.microsoft.com/rest/api/searchservice/Custom-analyzers-in-Azure-Search#TokenFilters

stopwords

string

Eltávolítja a leállító szavakat egy jogkivonat-adatfolyamból. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/StopFilter.html

trim

string

Levágja a kezdő és a záró szóközt a jogkivonatokból. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/TrimFilter.html

truncate

string

A kifejezéseket adott hosszúságúra csonkítja. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/TruncateTokenFilter.html

unique

string

Kiszűri a jogkivonatokat az előző token szövegével megegyező szöveggel. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/RemoveDuplicatesTokenFilter.html

uppercase

string

A token szövegének normalizálása nagybetűsre. Lásd: https://lucene.apache.org/core/6_6_1/analyzers-common/org/apache/lucene/analysis/core/UpperCaseFilter.html

word_delimiter

string

A szavakat alszavakra osztja, és opcionális átalakításokat hajt végre az alszócsoportokon.

TruncateTokenFilter

Csonkítja a kifejezéseket egy adott hosszúságúra. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.

Name Típus Alapértelmezett érték Description
@odata.type string:

#Microsoft.Azure.Search.TruncateTokenFilter

Egy URI-töredék, amely megadja a tokenszűrő típusát.

length

integer

300

A kifejezések csonkításának hossza. Az alapértelmezett és a maximális érték 300.

name

string

A jogkivonatszűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet.

UaxUrlEmailTokenizer

Tokenizálja az URL-címeket és az e-maileket egy jogkivonatként. Ez a jogkivonat-szabályzó az Apache Lucene használatával van implementálva.

Name Típus Alapértelmezett érték Description
@odata.type string:

#Microsoft.Azure.Search.UaxUrlEmailTokenizer

Egy URI-töredék, amely a tokenizer típusát határozza meg.

maxTokenLength

integer

255

A jogkivonat maximális hossza. Az alapértelmezett érték 255. A maximális hossznál hosszabb jogkivonatok fel vannak osztva. A maximálisan használható tokenhossz 300 karakter.

name

string

A tokenizer neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet.

UniqueTokenFilter

Kiszűri az előző jogkivonattal megegyező szövegű jogkivonatokat. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.

Name Típus Alapértelmezett érték Description
@odata.type string:

#Microsoft.Azure.Search.UniqueTokenFilter

A tokenszűrő típusát meghatározó URI-töredék.

name

string

A jogkivonatszűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet.

onlyOnSamePosition

boolean

False

Egy érték, amely azt jelzi, hogy az ismétlődések eltávolítása csak ugyanazon a helyen történik-e. Az alapértelmezett érték a false (hamis).

VectorSearch

A vektorkereséshez kapcsolódó konfigurációs beállításokat tartalmaz.

Name Típus Description
algorithms VectorSearchAlgorithmConfiguration[]:
  • ExhaustiveKnnVectorSearchAlgorithmConfiguration[]
  • HnswVectorSearchAlgorithmConfiguration[]

Az indexelés vagy lekérdezés során használt algoritmusra vonatkozó konfigurációs beállításokat tartalmaz.

compressions VectorSearchCompressionConfiguration[]:

ScalarQuantizationVectorSearchCompressionConfiguration[]

Az indexelés vagy lekérdezés során használt tömörítési módszerre vonatkozó konfigurációs beállításokat tartalmazza.

profiles

VectorSearchProfile[]

A vektorkereséshez használandó konfigurációk kombinációit határozza meg.

vectorizers VectorSearchVectorizer[]:
  • AzureOpenAIVectorizer[]
  • CustomVectorizer[]

A szövegvektor-lekérdezések vektorizálására vonatkozó konfigurációs beállításokat tartalmaz.

VectorSearchAlgorithmKind

Az indexeléshez és lekérdezéshez használt algoritmus.

Name Típus Description
exhaustiveKnn

string

Kimerítő KNN-algoritmus, amely találgatásos keresést hajt végre.

hnsw

string

HNSW (Hierarchikus Navigable Small World), a legközelebbi szomszéd algoritmus típusa.

VectorSearchAlgorithmMetric

A vektorok összehasonlításához használandó hasonlósági metrika.

Name Típus Description
cosine

string

dotProduct

string

euclidean

string

VectorSearchCompressionKind

Az indexeléshez és lekérdezéshez használt tömörítési módszer.

Name Típus Description
scalarQuantization

string

Skaláris kvantálás, a tömörítési módszer típusa. A skaláris kvantálás során az eredeti vektorértékek szűkebb típusba vannak tömörítve a vektorok egyes összetevőinek megkülönböztetésével és ábrázolásával, csökkentve a kvantált értékek készletét, ezáltal csökkentve a teljes adatméretet.

VectorSearchCompressionTargetDataType

A tömörített vektorértékek kvantált adattípusa.

Name Típus Description
int8

string

VectorSearchProfile

A vektorkereséssel használható konfigurációk kombinációját határozza meg.

Name Típus Description
algorithm

string

A vektorkeresési algoritmus konfigurációjának neve, amely meghatározza az algoritmust és az opcionális paramétereket.

compression

string

A tömörítési módszer konfigurációjának neve, amely meghatározza a tömörítési módszert és az opcionális paramétereket.

name

string

Az adott vektoros keresési profilhoz társítandó név.

vectorizer

string

A vektoros kereséshez konfigurált vektorizálási módszer neve.

VectorSearchVectorizerKind

A lekérdezési idő alatt használandó vektorizálási módszer.

Name Típus Description
azureOpenAI

string

Beágyazásokat hozhat létre egy Azure OpenAI-erőforrás használatával lekérdezéskor.

customWebApi

string

Hozzon létre beágyazásokat egy egyéni webvégpont használatával lekérdezéskor.

WordDelimiterTokenFilter

A szavakat alszavakra osztja, és opcionális átalakításokat hajt végre az alszócsoportokon. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.

Name Típus Alapértelmezett érték Description
@odata.type string:

#Microsoft.Azure.Search.WordDelimiterTokenFilter

A tokenszűrő típusát meghatározó URI-töredék.

catenateAll

boolean

False

Egy érték, amely azt jelzi, hogy az összes alszórész fel lesz-e adva. Ha például ez igaz értékre van állítva, az "Azure-Keresés-1" "AzureSearch1" lesz. Az alapértelmezett érték a false (hamis).

catenateNumbers

boolean

False

Egy érték, amely azt jelzi, hogy a rendszer a számrészek maximális futásait fogja-e kiszolgálni. Ha például ez igaz értékre van állítva, az "1-2" "12" lesz. Az alapértelmezett érték a false (hamis).

catenateWords

boolean

False

A szórészek maximális futását jelző érték. Ha például ez igaz értékre van állítva, az "Azure-Keresés" "AzureSearch" lesz. Az alapértelmezett érték a false (hamis).

generateNumberParts

boolean

True

Egy érték, amely azt jelzi, hogy szám alszavak generálására van-e szüksége. Alapértelmezett érték: true (igaz).

generateWordParts

boolean

True

Egy érték, amely jelzi, hogy létre kell-e hozni részszavat. Ha be van állítva, a szavak részeit generálja; Az "AzureSearch" például "Azure" "Keresés" lesz. Alapértelmezett érték: true (igaz).

name

string

A jogkivonatszűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet.

preserveOriginal

boolean

False

Egy érték, amely azt jelzi, hogy az eredeti szavak megmaradnak-e, és hozzá lesznek-e adva az alszólistához. Az alapértelmezett érték a false (hamis).

protectedWords

string[]

A tagolástól védendő jogkivonatok listája.

splitOnCaseChange

boolean

True

Egy érték, amely azt jelzi, hogy fel kell-e osztani a szavakat a caseChange függvényben. Ha például ez igaz értékre van állítva, az "AzureSearch" "Azure" "Keresés" lesz. Alapértelmezett érték: true (igaz).

splitOnNumerics

boolean

True

Egy érték, amely azt jelzi, hogy fel kell-e osztani a számokat. Ha például ez igaz értékre van állítva, az "Azure1Search" "Azure" "1" "Keresés" lesz. Alapértelmezett érték: true (igaz).

stemEnglishPossessive

boolean

True

Egy érték, amely azt jelzi, hogy el szeretné-e távolítani az egyes alszók záró "s" karaktereit. Alapértelmezett érték: true (igaz).