Indexes - Create

Referencia

Szolgáltatás:: Search Service

API-verzió:: 2024-05-01-preview

Új keresési indexet hoz létre.

POST {endpoint}/indexes?api-version=2024-05-01-preview

URI-paraméterek

Name	In	Kötelező	Típus	Description
endpoint	path	True	string	A keresési szolgáltatás végponti URL-címe.
api-version	query	True	string	Ügyfél API-verziója.

Kérelem fejléce

Name	Kötelező	Típus	Description
x-ms-client-request-id		string uuid	A kéréssel együtt küldött nyomkövetési azonosító, amely segít a hibakeresésben.

Kérelem törzse

Name	Kötelező	Típus	Description
fields	True	SearchField[]	Az index mezői.
name	True	string	Az index neve.
@odata.etag		string	Az index ETagje.
analyzers		LexicalAnalyzer[]: CustomAnalyzer[] PatternAnalyzer[] LuceneStandardAnalyzer[] StopAnalyzer[]	Az index elemzői.
charFilters		CharFilter[]: MappingCharFilter[] PatternReplaceCharFilter[]	Az index karakterszűrői.
corsOptions		CorsOptions	Az index forrásközi erőforrás-megosztásának (CORS) szabályozására szolgáló beállítások.
defaultScoringProfile		string	A használni kívánt pontozási profil neve, ha nincs megadva a lekérdezésben. Ha ez a tulajdonság nincs beállítva, és nincs megadva pontozási profil a lekérdezésben, akkor az alapértelmezett pontozás (tf-idf) lesz használva.
encryptionKey		SearchResourceEncryptionKey	Az Azure Key Vault-ben létrehozott titkosítási kulcs leírása. Ez a kulcs további titkosítási szintet biztosít az adatok számára, ha teljes körű biztosítékot szeretne kapni arról, hogy senki, még a Microsoft sem tudja visszafejteni az adatokat. Miután titkosította az adatokat, az mindig titkosítva marad. A keresési szolgáltatás figyelmen kívül hagyja a tulajdonság null értékűre történő beállítására tett kísérleteket. Szükség szerint módosíthatja ezt a tulajdonságot, ha el szeretné forgatni a titkosítási kulcsot; Az adatok nem lesznek hatással. Az ügyfél által felügyelt kulcsokkal történő titkosítás nem érhető el az ingyenes keresési szolgáltatásokhoz, és csak a 2019. január 1-jén vagy azt követően létrehozott fizetős szolgáltatásokhoz érhető el.
normalizers		LexicalNormalizer[]: CustomNormalizer[]	Az index normalizálói.
scoringProfiles		ScoringProfile[]	Az index pontozási profiljai.
semantic		SemanticSettings	Olyan keresési index paramétereit határozza meg, amelyek befolyásolják a szemantikai képességeket.
similarity		Similarity: ClassicSimilarity BM25Similarity	A keresési lekérdezésnek megfelelő dokumentumok pontozásához és rangsorolásához használandó hasonlósági algoritmus típusa. A hasonlósági algoritmus csak az indexlétrehozáskor definiálható, és nem módosítható a meglévő indexeken. Null érték esetén a ClassicSimilarity algoritmust használja a rendszer.
suggesters		Suggester[]	Az index javaslattevői.
tokenFilters		TokenFilter[]: AsciiFoldingTokenFilter[] CjkBigramTokenFilter[] CommonGramTokenFilter[] DictionaryDecompounderTokenFilter[] EdgeNGramTokenFilter[] EdgeNGramTokenFilterV2[] ElisionTokenFilter[] KeepTokenFilter[] KeywordMarkerTokenFilter[] LengthTokenFilter[] LimitTokenFilter[] NGramTokenFilter[] NGramTokenFilterV2[] PatternCaptureTokenFilter[] PatternReplaceTokenFilter[] PhoneticTokenFilter[] ShingleTokenFilter[] SnowballTokenFilter[] StemmerTokenFilter[] StemmerOverrideTokenFilter[] StopwordsTokenFilter[] SynonymTokenFilter[] TruncateTokenFilter[] UniqueTokenFilter[] WordDelimiterTokenFilter[]	Az index jogkivonat-szűrői.
tokenizers		LexicalTokenizer[]: ClassicTokenizer[] EdgeNGramTokenizer[] KeywordTokenizer[] KeywordTokenizerV2[] MicrosoftLanguageTokenizer[] MicrosoftLanguageStemmingTokenizer[] NGramTokenizer[] PathHierarchyTokenizerV2[] PatternTokenizer[] LuceneStandardTokenizer[] LuceneStandardTokenizerV2[] UaxUrlEmailTokenizer[]	Az index jogkivonat-szabályzói.
vectorSearch		VectorSearch	A vektorkereséshez kapcsolódó konfigurációs beállításokat tartalmazza.

Válaszok

Name	Típus	Description
201 Created	SearchIndex
Other Status Codes	ErrorResponse	Hibaválasz.

Példák

SearchServiceCreateIndex

Mintakérelem

HTTP

POST https://myservice.search.windows.net/indexes?api-version=2024-05-01-preview

{
  "name": "hotels",
  "fields": [
    {
      "name": "hotelId",
      "type": "Edm.String",
      "key": true,
      "searchable": false
    },
    {
      "name": "baseRate",
      "type": "Edm.Double"
    },
    {
      "name": "description",
      "type": "Edm.String",
      "filterable": false,
      "sortable": false,
      "facetable": false
    },
    {
      "name": "descriptionEmbedding",
      "type": "Collection(Edm.Single)",
      "searchable": true,
      "filterable": false,
      "retrievable": true,
      "sortable": false,
      "facetable": false,
      "key": false,
      "indexAnalyzer": null,
      "searchAnalyzer": null,
      "analyzer": null,
      "synonymMaps": [],
      "dimensions": 1536,
      "vectorSearchProfile": "myCompressedHnswProfile"
    },
    {
      "name": "descriptionEmbedding_notstored",
      "type": "Collection(Edm.Single)",
      "searchable": true,
      "filterable": false,
      "retrievable": false,
      "stored": false,
      "sortable": false,
      "facetable": false,
      "key": false,
      "indexAnalyzer": null,
      "searchAnalyzer": null,
      "analyzer": null,
      "synonymMaps": [],
      "dimensions": 1536,
      "vectorSearchProfile": "myCompressedHnswProfile"
    },
    {
      "name": "description_fr",
      "type": "Edm.String",
      "filterable": false,
      "sortable": false,
      "facetable": false,
      "analyzer": "fr.lucene"
    },
    {
      "name": "hotelName",
      "type": "Edm.String"
    },
    {
      "name": "nameEmbedding",
      "type": "Collection(Edm.Half)",
      "searchable": true,
      "filterable": false,
      "retrievable": true,
      "sortable": false,
      "facetable": false,
      "key": false,
      "indexAnalyzer": null,
      "searchAnalyzer": null,
      "analyzer": null,
      "synonymMaps": [],
      "dimensions": 1536,
      "vectorSearchProfile": "myHnswProfile"
    },
    {
      "name": "category",
      "type": "Edm.String"
    },
    {
      "name": "tags",
      "type": "Collection(Edm.String)",
      "analyzer": "tagsAnalyzer"
    },
    {
      "name": "parkingIncluded",
      "type": "Edm.Boolean"
    },
    {
      "name": "smokingAllowed",
      "type": "Edm.Boolean"
    },
    {
      "name": "lastRenovationDate",
      "type": "Edm.DateTimeOffset"
    },
    {
      "name": "rating",
      "type": "Edm.Int32"
    },
    {
      "name": "location",
      "type": "Edm.GeographyPoint"
    }
  ],
  "scoringProfiles": [
    {
      "name": "geo",
      "text": {
        "weights": {
          "hotelName": 5
        }
      },
      "functions": [
        {
          "type": "distance",
          "boost": 5,
          "fieldName": "location",
          "interpolation": "logarithmic",
          "distance": {
            "referencePointParameter": "currentLocation",
            "boostingDistance": 10
          }
        }
      ]
    }
  ],
  "defaultScoringProfile": "geo",
  "suggesters": [
    {
      "name": "sg",
      "searchMode": "analyzingInfixMatching",
      "sourceFields": [
        "hotelName"
      ]
    }
  ],
  "analyzers": [
    {
      "name": "tagsAnalyzer",
      "@odata.type": "#Microsoft.Azure.Search.CustomAnalyzer",
      "charFilters": [
        "html_strip"
      ],
      "tokenizer": "standard_v2"
    }
  ],
  "corsOptions": {
    "allowedOrigins": [
      "tempuri.org"
    ],
    "maxAgeInSeconds": 60
  },
  "encryptionKey": {
    "keyVaultKeyName": "myUserManagedEncryptionKey-createdinAzureKeyVault",
    "keyVaultKeyVersion": "myKeyVersion-32charAlphaNumericString",
    "keyVaultUri": "https://myKeyVault.vault.azure.net",
    "accessCredentials": {
      "applicationId": "00000000-0000-0000-0000-000000000000",
      "applicationSecret": "<applicationSecret>"
    }
  },
  "similarity": {
    "@odata.type": "#Microsoft.Azure.Search.BM25Similarity",
    "b": 0.5,
    "k1": 1.3
  },
  "semantic": {
    "configurations": [
      {
        "name": "semanticHotels",
        "prioritizedFields": {
          "titleField": {
            "fieldName": "hotelName"
          },
          "prioritizedContentFields": [
            {
              "fieldName": "description"
            },
            {
              "fieldName": "description_fr"
            }
          ],
          "prioritizedKeywordsFields": [
            {
              "fieldName": "tags"
            },
            {
              "fieldName": "category"
            }
          ]
        }
      }
    ]
  },
  "vectorSearch": {
    "profiles": [
      {
        "name": "myHnswProfile",
        "algorithm": "myHnsw",
        "vectorizer": "myOpenAi"
      },
      {
        "name": "myCompressedHnswProfile",
        "algorithm": "myHnsw",
        "vectorizer": "myOpenAi",
        "compression": "mySQ8"
      },
      {
        "name": "myAlgorithm",
        "algorithm": "myHnsw"
      }
    ],
    "algorithms": [
      {
        "name": "myHnsw",
        "kind": "hnsw",
        "hnswParameters": {
          "m": 4,
          "metric": "cosine",
          "efConstruction": 400,
          "efSearch": 500
        }
      },
      {
        "name": "myExhaustiveKnn",
        "kind": "exhaustiveKnn",
        "exhaustiveKnnParameters": {
          "metric": "cosine"
        }
      }
    ],
    "compressions": [
      {
        "name": "mySQ8",
        "kind": "scalarQuantization",
        "scalarQuantizationParameters": {
          "quantizedDataType": "int8"
        },
        "rerankWithOriginalVectors": true,
        "defaultOversampling": 10
      }
    ],
    "vectorizers": [
      {
        "name": "myOpenAi",
        "kind": "azureOpenAI",
        "azureOpenAIParameters": {
          "resourceUri": "https://url.openai.azure.com",
          "deploymentId": "text-embedding-ada-002",
          "apiKey": "topsecretkey"
        }
      }
    ]
  }
}

Mintaválasz

Állapotkód:: 201

{
  "name": "hotels",
  "fields": [
    {
      "name": "hotelId",
      "type": "Edm.String",
      "searchable": false,
      "filterable": true,
      "retrievable": true,
      "sortable": true,
      "facetable": true,
      "key": true,
      "indexAnalyzer": null,
      "searchAnalyzer": null,
      "analyzer": null,
      "normalizer": null,
      "dimensions": null,
      "vectorSearchProfile": null,
      "synonymMaps": []
    },
    {
      "name": "baseRate",
      "type": "Edm.Double",
      "searchable": false,
      "filterable": true,
      "retrievable": true,
      "sortable": true,
      "facetable": true,
      "key": false,
      "indexAnalyzer": null,
      "searchAnalyzer": null,
      "analyzer": null,
      "normalizer": null,
      "dimensions": null,
      "vectorSearchProfile": null,
      "synonymMaps": []
    },
    {
      "name": "description",
      "type": "Edm.String",
      "searchable": true,
      "filterable": false,
      "retrievable": true,
      "sortable": false,
      "facetable": false,
      "key": false,
      "indexAnalyzer": null,
      "searchAnalyzer": null,
      "analyzer": null,
      "normalizer": null,
      "dimensions": null,
      "vectorSearchProfile": null,
      "synonymMaps": []
    },
    {
      "name": "descriptionEmbedding",
      "type": "Collection(Edm.Single)",
      "searchable": true,
      "filterable": false,
      "retrievable": true,
      "sortable": false,
      "facetable": false,
      "key": false,
      "indexAnalyzer": null,
      "searchAnalyzer": null,
      "analyzer": null,
      "normalizer": null,
      "dimensions": 1536,
      "vectorSearchProfile": "myCompressedHnswProfile",
      "synonymMaps": []
    },
    {
      "name": "descriptionEmbedding_notstored",
      "type": "Collection(Edm.Single)",
      "searchable": true,
      "filterable": false,
      "retrievable": false,
      "stored": false,
      "sortable": false,
      "facetable": false,
      "key": false,
      "indexAnalyzer": null,
      "searchAnalyzer": null,
      "analyzer": null,
      "synonymMaps": [],
      "dimensions": 1536,
      "vectorSearchProfile": "myCompressedHnswProfile"
    },
    {
      "name": "description_fr",
      "type": "Edm.String",
      "searchable": true,
      "filterable": false,
      "retrievable": true,
      "sortable": false,
      "facetable": false,
      "key": false,
      "indexAnalyzer": null,
      "searchAnalyzer": null,
      "analyzer": "fr.lucene",
      "normalizer": null,
      "dimensions": null,
      "vectorSearchProfile": null,
      "synonymMaps": []
    },
    {
      "name": "hotelName",
      "type": "Edm.String",
      "searchable": true,
      "filterable": true,
      "retrievable": true,
      "sortable": true,
      "facetable": true,
      "key": false,
      "indexAnalyzer": null,
      "searchAnalyzer": null,
      "analyzer": null,
      "normalizer": null,
      "dimensions": null,
      "vectorSearchProfile": null,
      "synonymMaps": []
    },
    {
      "name": "nameEmbedding",
      "type": "Collection(Edm.Half)",
      "searchable": true,
      "filterable": false,
      "retrievable": true,
      "sortable": false,
      "facetable": false,
      "key": false,
      "indexAnalyzer": null,
      "searchAnalyzer": null,
      "analyzer": null,
      "normalizer": null,
      "dimensions": 1536,
      "vectorSearchProfile": "myHnswProfile",
      "synonymMaps": []
    },
    {
      "name": "category",
      "type": "Edm.String",
      "searchable": true,
      "filterable": true,
      "retrievable": true,
      "sortable": true,
      "facetable": true,
      "key": false,
      "indexAnalyzer": null,
      "searchAnalyzer": null,
      "analyzer": null,
      "normalizer": null,
      "dimensions": null,
      "vectorSearchProfile": null,
      "synonymMaps": []
    },
    {
      "name": "tags",
      "type": "Collection(Edm.String)",
      "searchable": true,
      "filterable": true,
      "retrievable": true,
      "sortable": false,
      "facetable": true,
      "key": false,
      "indexAnalyzer": null,
      "searchAnalyzer": null,
      "analyzer": "tagsAnalyzer",
      "normalizer": null,
      "dimensions": null,
      "vectorSearchProfile": null,
      "synonymMaps": []
    },
    {
      "name": "parkingIncluded",
      "type": "Edm.Boolean",
      "searchable": false,
      "filterable": true,
      "retrievable": true,
      "sortable": true,
      "facetable": true,
      "key": false,
      "indexAnalyzer": null,
      "searchAnalyzer": null,
      "analyzer": null,
      "normalizer": null,
      "dimensions": null,
      "vectorSearchProfile": null,
      "synonymMaps": []
    },
    {
      "name": "smokingAllowed",
      "type": "Edm.Boolean",
      "searchable": false,
      "filterable": true,
      "retrievable": true,
      "sortable": true,
      "facetable": true,
      "key": false,
      "indexAnalyzer": null,
      "searchAnalyzer": null,
      "analyzer": null,
      "normalizer": null,
      "dimensions": null,
      "vectorSearchProfile": null,
      "synonymMaps": []
    },
    {
      "name": "lastRenovationDate",
      "type": "Edm.DateTimeOffset",
      "searchable": false,
      "filterable": true,
      "retrievable": true,
      "sortable": true,
      "facetable": true,
      "key": false,
      "indexAnalyzer": null,
      "searchAnalyzer": null,
      "analyzer": null,
      "normalizer": null,
      "dimensions": null,
      "vectorSearchProfile": null,
      "synonymMaps": []
    },
    {
      "name": "rating",
      "type": "Edm.Int32",
      "searchable": false,
      "filterable": true,
      "retrievable": true,
      "sortable": true,
      "facetable": true,
      "key": false,
      "indexAnalyzer": null,
      "searchAnalyzer": null,
      "analyzer": null,
      "normalizer": null,
      "dimensions": null,
      "vectorSearchProfile": null,
      "synonymMaps": []
    },
    {
      "name": "location",
      "type": "Edm.GeographyPoint",
      "searchable": false,
      "filterable": true,
      "retrievable": true,
      "sortable": true,
      "facetable": false,
      "key": false,
      "indexAnalyzer": null,
      "searchAnalyzer": null,
      "analyzer": null,
      "normalizer": null,
      "dimensions": null,
      "vectorSearchProfile": null,
      "synonymMaps": []
    }
  ],
  "scoringProfiles": [
    {
      "name": "geo",
      "functionAggregation": "sum",
      "text": {
        "weights": {
          "hotelName": 5
        }
      },
      "functions": [
        {
          "fieldName": "location",
          "interpolation": "logarithmic",
          "type": "distance",
          "boost": 5,
          "distance": {
            "referencePointParameter": "currentLocation",
            "boostingDistance": 10
          }
        }
      ]
    }
  ],
  "defaultScoringProfile": "geo",
  "suggesters": [
    {
      "name": "sg",
      "searchMode": "analyzingInfixMatching",
      "sourceFields": [
        "hotelName"
      ]
    }
  ],
  "analyzers": [
    {
      "name": "tagsAnalyzer",
      "@odata.type": "#Microsoft.Azure.Search.CustomAnalyzer",
      "charFilters": [
        "html_strip"
      ],
      "tokenizer": "standard_v2",
      "tokenFilters": []
    }
  ],
  "tokenizers": [],
  "normalizers": [],
  "tokenFilters": [],
  "charFilters": [],
  "corsOptions": {
    "allowedOrigins": [
      "tempuri.org"
    ],
    "maxAgeInSeconds": 60
  },
  "encryptionKey": {
    "keyVaultKeyName": "myUserManagedEncryptionKey-createdinAzureKeyVault",
    "keyVaultKeyVersion": "myKeyVersion-32charAlphaNumericString",
    "keyVaultUri": "https://myKeyVault.vault.azure.net",
    "accessCredentials": {
      "applicationId": "00000000-0000-0000-0000-000000000000",
      "applicationSecret": null
    }
  },
  "similarity": {
    "@odata.type": "#Microsoft.Azure.Search.BM25Similarity",
    "b": 0.5,
    "k1": 1.3
  },
  "semantic": {
    "defaultConfiguration": null,
    "configurations": [
      {
        "name": "semanticHotels",
        "prioritizedFields": {
          "titleField": {
            "fieldName": "hotelName"
          },
          "prioritizedContentFields": [
            {
              "fieldName": "description"
            },
            {
              "fieldName": "description_fr"
            }
          ],
          "prioritizedKeywordsFields": [
            {
              "fieldName": "tags"
            },
            {
              "fieldName": "category"
            }
          ]
        }
      }
    ]
  },
  "vectorSearch": {
    "algorithms": [
      {
        "name": "myHnsw",
        "kind": "hnsw",
        "hnswParameters": {
          "metric": "cosine",
          "m": 4,
          "efConstruction": 400,
          "efSearch": 500
        }
      },
      {
        "name": "myExhaustiveKnn",
        "kind": "exhaustiveKnn",
        "exhaustiveKnnParameters": {
          "metric": "cosine"
        }
      }
    ],
    "profiles": [
      {
        "name": "myHnswProfile",
        "algorithm": "myHnsw",
        "vectorizer": "myOpenAi"
      },
      {
        "name": "myCompressedHnswProfile",
        "algorithm": "myHnsw",
        "vectorizer": "myOpenAi",
        "compression": "mySQ8"
      },
      {
        "name": "myAlgorithm",
        "algorithm": "myHnsw"
      }
    ],
    "compressions": [
      {
        "name": "mySQ8",
        "kind": "scalarQuantization",
        "scalarQuantizationParameters": {
          "quantizedDataType": "int8"
        },
        "rerankWithOriginalVectors": true,
        "defaultOversampling": 10
      }
    ],
    "vectorizers": [
      {
        "name": "myOpenAi",
        "kind": "azureOpenAI",
        "azureOpenAIParameters": {
          "resourceUri": "https://url.openai.azure.com",
          "deploymentId": "text-embedding-ada-002",
          "apiKey": "topsecretkey",
          "authIdentity": null
        }
      }
    ]
  }
}

Definíciók

Name	Description
AIServicesVisionParameters	Megadja az AI Services Vision paramétereit egy lekérdezési kép vagy szöveg vektorizálásához.
AIServicesVisionVectorizer	Megadja az AI Services Vision paramétereit egy lekérdezési kép vagy szöveg vektorizálásához.
AIStudioModelCatalogName	A meghívandó Azure AI Studio-katalógusból származó beágyazási modell neve.
AMLParameters	Megadja az AML-vektorizálóhoz való csatlakozás tulajdonságait.
AMLVectorizer	A Azure AI Studio modellkatalóguson keresztül üzembe helyezett Azure Machine Learning-végpontot adja meg a lekérdezési sztring vektoros beágyazásának létrehozásához.
AsciiFoldingTokenFilter	Az első 127 ASCII-karakterben nem szereplő unicode-karaktereket (az "Egyszerű latin" Unicode-blokkot) ASCII-ekvivalenssé alakítja át, ha léteznek ilyen megfelelők. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.
AzureActiveDirectoryApplicationCredentials	A keresési szolgáltatáshoz létrehozott regisztrált alkalmazás hitelesítő adatai, amelyet az Azure Key Vault tárolt titkosítási kulcsokhoz való hitelesített hozzáféréshez használnak.
AzureOpenAIEmbeddingSkill	Lehetővé teszi, hogy vektoros beágyazást hozzon létre egy adott szöveges bemenethez az Azure OpenAI-erőforrás használatával.
AzureOpenAIModelName	A meghívandó Azure Open AI-modell neve.
AzureOpenAIParameters	Megadja az Azure OpenAI-erőforráshoz való csatlakozás paramétereit.
AzureOpenAIVectorizer	Meghatározza a lekérdezési sztringek vektorizálásához használt Azure OpenAI-erőforrást.
BM25Similarity	Az Okapi BM25 hasonlósági algoritmuson alapuló rangsorolási függvény. A BM25 egy TF-IDF-szerű algoritmus, amely magában foglalja a hossz normalizálását (amelyet a "b" paraméter szabályoz), valamint a kifejezés frekvenciatelítettségét (amelyet a "k1" paraméter szabályoz).
CharFilterName	Meghatározza a keresőmotor által támogatott összes karakterszűrő nevét.
CjkBigramTokenFilter	Forms standard tokenizerből létrehozott CJK-kifejezések bigramját. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.
CjkBigramTokenFilterScripts	A CjkBigramTokenFilter által figyelmen kívül hagyható szkriptek.
ClassicSimilarity	Örökölt hasonlósági algoritmus, amely a TF-IDF Lucene TFIDFSimilarity implementációját használja. A TF-IDF ezen változata statikus dokumentumhossz normalizálást vezet be, valamint koordinálja azokat a tényezőket, amelyek csak részben egyeznek a keresett lekérdezésekkel.
ClassicTokenizer	Nyelvhelyességi alapú jogkivonat-szabályzó, amely alkalmas a legtöbb európai nyelvű dokumentum feldolgozására. Ez a jogkivonat-szabályzó az Apache Lucene használatával van implementálva.
CommonGramTokenFilter	Bigramokat hozhat létre az indexelés során gyakran előforduló kifejezésekhez. Az egyes kifejezések továbbra is indexelve vannak, és a bigramok túl vannak osztva. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.
CorsOptions	Meghatározza az indexek eltérő eredetű erőforrás-megosztásának (CORS) szabályozására szolgáló beállításokat.
CustomAnalyzer	Lehetővé teszi a szöveg indexelhető/kereshető jogkivonattá alakításának folyamatát. Ez egy felhasználó által definiált konfiguráció, amely egyetlen előre definiált tokenizerből és egy vagy több szűrőből áll. A jogkivonat-szabályzó feladata a szöveg jogkivonatokra törése, valamint a jogkivonat-szabályzó által kibocsátott jogkivonatok módosítására szolgáló szűrők.
CustomNormalizer	Lehetővé teszi a normalizálás konfigurálását szűrhető, rendezhető és táblázatos mezőkhöz, amelyek alapértelmezés szerint szigorú egyezéssel működnek. Ez egy felhasználó által definiált konfiguráció, amely legalább egy szűrőből áll, és módosítja a tárolt jogkivonatot.
CustomVectorizer	Felhasználó által definiált vektorizálót ad meg a lekérdezési sztringek vektorbeágyazásának létrehozásához. A külső vektorizáló integrálása egy képességcsoport egyéni webes API-felületével érhető el.
CustomWebApiParameters	Megadja a felhasználó által definiált vektorizálóhoz való csatlakozás tulajdonságait.
DictionaryDecompounderTokenFilter	Felbontja a sok germán nyelven található összetett szavakat. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.
DistanceScoringFunction	Olyan függvényt definiál, amely a földrajzi helytől való távolság alapján növeli a pontszámokat.
DistanceScoringParameters	Paraméterértékeket biztosít egy távolsági pontozási függvénynek.
EdgeNGramTokenFilter	A megadott méret(ek) n-grammját hozza létre egy bemeneti jogkivonat elejétől vagy hátuljától kezdve. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.
EdgeNGramTokenFilterSide	Megadja, hogy a bemenet melyik oldaláról kell n-gramot létrehozni.
EdgeNGramTokenFilterV2	A megadott méret(ek) n-grammját hozza létre egy bemeneti jogkivonat elejétől vagy hátuljától kezdve. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.
EdgeNGramTokenizer	Tokenizálja a bemenetet egy élről az adott méret(ek) n-grammjára. Ez a jogkivonat-szabályzó az Apache Lucene használatával van implementálva.
ElisionTokenFilter	Eltávolítja az elisionokat. A "l'avion" (a sík) például "avion" (sík) lesz. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.
ErrorAdditionalInfo	Az erőforrás-kezelési hiba további információi.
ErrorDetail	A hiba részletei.
ErrorResponse	Hibaválasz
ExhaustiveKnnParameters	A teljes KNN-algoritmusra jellemző paramétereket tartalmazza.
ExhaustiveKnnVectorSearchAlgorithmConfiguration	A lekérdezés során használt teljes KNN-algoritmusra vonatkozó konfigurációs beállításokat tartalmaz, amelyek találgatásos keresést hajtanak végre a teljes vektorindexben.
FreshnessScoringFunction	Olyan függvényt definiál, amely egy dátum-idő mező értéke alapján növeli a pontszámokat.
FreshnessScoringParameters	Paraméterértékeket biztosít egy frissesség-pontozási függvénynek.
HnswParameters	A HNSW algoritmusra jellemző paramétereket tartalmazza.
HnswVectorSearchAlgorithmConfiguration	Az indexelés és lekérdezés során használt HNSW közelítő szomszéd algoritmusra vonatkozó konfigurációs beállításokat tartalmaz. A HNSW algoritmus a keresési sebesség és a pontosság közötti kompromisszumot kínálja.
InputFieldMappingEntry	Egy képesség bemeneti mezőleképezése.
KeepTokenFilter	Egy jogkivonatszűrő, amely csak a megadott szavak listájában lévő szöveggel rendelkező jogkivonatokat tárolja. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.
KeywordMarkerTokenFilter	Kulcsszavakként jelöli meg a kifejezéseket. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.
KeywordTokenizer	A teljes bemenetet egyetlen jogkivonatként bocsátja ki. Ez a jogkivonat-szabályzó az Apache Lucene használatával van implementálva.
KeywordTokenizerV2	A teljes bemenetet egyetlen jogkivonatként bocsátja ki. Ez a jogkivonat-szabályzó az Apache Lucene használatával van implementálva.
LengthTokenFilter	Eltávolítja a túl hosszú vagy túl rövid szavakat. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.
LexicalAnalyzerName	Meghatározza a keresőmotor által támogatott összes szövegelemző nevét.
LexicalNormalizerName	Meghatározza a keresőmotor által támogatott összes szöveg normalizálójának nevét.
LexicalTokenizerName	Meghatározza a keresőmotor által támogatott összes tokenizer nevét.
LimitTokenFilter	Korlátozza a tokenek számát az indexelés során. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.
LuceneStandardAnalyzer	Standard Apache Lucene-elemző; A standard tokenizerből, kisbetűs szűrőből és leállításszűrőből áll.
LuceneStandardTokenizer	A Unicode-szöveg szegmentálási szabályai szerint töri a szöveget. Ez a jogkivonat-szabályzó az Apache Lucene használatával van implementálva.
LuceneStandardTokenizerV2	A Unicode-szöveg szegmentálási szabályai szerint töri a szöveget. Ez a jogkivonat-szabályzó az Apache Lucene használatával van implementálva.
MagnitudeScoringFunction	Olyan függvényt definiál, amely egy numerikus mező nagysága alapján növeli a pontszámokat.
MagnitudeScoringParameters	Paraméterértékeket biztosít egy nagyságrendi pontozó függvénynek.
MappingCharFilter	Karakterszűrő, amely a leképezési beállítással definiált leképezéseket alkalmazza. A megfeleltetés kapzsi (a leghosszabb mintaegyeztetés egy adott ponton nyer). A csere lehet üres sztring. Ez a karakterszűrő az Apache Lucene használatával van implementálva.
MicrosoftLanguageStemmingTokenizer	Nyelvspecifikus szabályokkal osztja el a szöveget, és csökkenti a szavak alapformáit.
MicrosoftLanguageTokenizer	Nyelvspecifikus szabályokkal osztja el a szöveget.
MicrosoftStemmingTokenizerLanguage	Listák a Microsoft-nyelv által támogatott nyelveket, amely a jogkivonat-szabályzóból származik.
MicrosoftTokenizerLanguage	Listák a Microsoft nyelvi tokenizer által támogatott nyelveket.
NGramTokenFilter	A megadott méret(ek) n-grammját hozza létre. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.
NGramTokenFilterV2	A megadott méret(ek) n-grammját hozza létre. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.
NGramTokenizer	Tokenizálja a bemenetet az adott méret(ek) n-grammjára. Ez a jogkivonat-szabályzó az Apache Lucene használatával van implementálva.
OutputFieldMappingEntry	Egy képesség kimeneti mezőleképezése.
PathHierarchyTokenizerV2	Tokenizer elérésiút-szerű hierarchiákhoz. Ez a jogkivonat-szabályzó az Apache Lucene használatával van implementálva.
PatternAnalyzer	A szöveget rugalmasan elválasztja a kifejezések között egy reguláris kifejezésmintán keresztül. Ez az elemző az Apache Lucene használatával van implementálva.
PatternCaptureTokenFilter	Java-regexek használatával több jogkivonatot bocsát ki – egyet minden rögzítési csoporthoz egy vagy több mintában. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.
PatternReplaceCharFilter	Karakterszűrő, amely lecseréli a bemeneti sztringben szereplő karaktereket. Egy reguláris kifejezéssel azonosítja a megőrizni kívánt karaktersorozatokat, a lecserélendő karaktereket pedig helyettesítő mintával azonosítja. Ha például az "aa bb aa bb", a "(aa)\s+(bb)" minta és az "$1#$2" helyettesítő szöveg szerepel, az eredmény "aa#bb aa#bb". Ez a karakterszűrő az Apache Lucene használatával van implementálva.
PatternReplaceTokenFilter	Karakterszűrő, amely lecseréli a bemeneti sztringben szereplő karaktereket. Egy reguláris kifejezéssel azonosítja a megőrizni kívánt karaktersorozatokat, a lecserélendő karaktereket pedig helyettesítő mintával azonosítja. Ha például az "aa bb aa bb", a "(aa)\s+(bb)" minta és az "$1#$2" helyettesítő szöveg szerepel, az eredmény "aa#bb aa#bb". Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.
PatternTokenizer	Tokenizer, amely regex mintaegyeztetést használ a különböző tokenek létrehozásához. Ez a jogkivonat-szabályzó az Apache Lucene használatával van implementálva.
PhoneticEncoder	A fonetikus kódoló fonetikus kódoló típusát azonosítja a PhoneticTokenFilterrel való használathoz.
PhoneticTokenFilter	Létrehozás fonetikus egyezések tokenjei. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.
PrioritizedFields	A szemantikai rangsoroláshoz, feliratokhoz, kiemelésekhez és válaszokhoz használandó cím-, tartalom- és kulcsszavak mezőit ismerteti.
RegexFlags	Definiálja azokat a jelzőket, amelyek kombinálhatók annak szabályozásához, hogy a rendszer hogyan használja a reguláris kifejezéseket a mintaelemzőben és a minta jogkivonat-jelölőjében.
ScalarQuantizationParameters	A skaláris kvantálásra jellemző paramétereket tartalmazza.
ScalarQuantizationVectorSearchCompressionConfiguration	Az indexelés és lekérdezés során használt skaláris kvantálási tömörítési módszerre vonatkozó konfigurációs beállításokat tartalmazza.
ScoringFunctionAggregation	Meghatározza az összesítési függvényt, amely a pontozási profil összes pontozási függvényének eredményeit egyesíti.
ScoringFunctionInterpolation	Meghatározza azt a függvényt, amellyel a pontszámok felpörgethetőek egy dokumentumtartományban.
ScoringProfile	Olyan keresési index paramétereit határozza meg, amelyek befolyásolják a keresési lekérdezések pontozását.
SearchField	Egy indexdefinícióban lévő mezőt jelöl, amely leírja egy mező nevét, adattípusát és keresési viselkedését.
SearchFieldDataType	Meghatározza egy mező adattípusát egy keresési indexben.
SearchIndex	A keresési index definícióját jelöli, amely egy index mezőit és keresési viselkedését ismerteti.
SearchIndexerDataNoneIdentity	Törli az adatforrás identitástulajdonságát.
SearchIndexerDataUserAssignedIdentity	Megadja a használni kívánt adatforrás identitását.
SearchResourceEncryptionKey	Ügyfél által felügyelt titkosítási kulcs az Azure Key Vault. A létrehozott és kezelt kulcsok az inaktív adatok, például indexek és szinonimák titkosítására vagy visszafejtésére használhatók.
SemanticConfiguration	Egy adott konfigurációt határoz meg, amelyet a szemantikai képességek kontextusában kell használni.
SemanticField	A szemantikai konfiguráció részeként használt mező.
SemanticSettings	Olyan keresési index paramétereit határozza meg, amelyek befolyásolják a szemantikai képességeket.
ShingleTokenFilter	Tokenkombinációkat hoz létre egyetlen tokenként. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.
SnowballTokenFilter	Egy szűrő, amely a szavakat egy Snowball által generált őst használ. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.
SnowballTokenFilterLanguage	A Snowball-jogkivonat-szűrőhöz használandó nyelv.
StemmerOverrideTokenFilter	Lehetővé teszi, hogy felülbírálja a többi stemming szűrőt a saját szótáralapú szárítással. A szótárból származó kifejezések kulcsszavakként lesznek megjelölve, így nem lesznek a láncban lévő stemmerek. A törzsszűrők elé kell helyezni. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.
StemmerTokenFilter	Nyelvspecifikus eredetszűrő. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.
StemmerTokenFilterLanguage	A stemmer token szűrőhöz használandó nyelv.
StopAnalyzer	A szöveget nem betűkkel osztja el; Alkalmazza a kisbetűs és a stopword jogkivonat szűrőit. Ez az elemző az Apache Lucene használatával van implementálva.
StopwordsList	A nyelvspecifikus stopszók előre definiált listáját azonosítja.
StopwordsTokenFilter	Eltávolítja a leállító szavakat egy jogkivonat-adatfolyamból. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.
Suggester	Meghatározza, hogyan kell alkalmazni a Suggest API-t az index egy mezőcsoportjára.
SuggesterSearchMode	A javaslattevő képességeit jelző érték.
SynonymTokenFilter	Egy- vagy többszavas szinonimák egy jogkivonatfolyamban. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.
TagScoringFunction	Olyan függvényt definiál, amely egy adott címkelistának megfelelő sztringértékekkel növeli a dokumentumok pontszámait.
TagScoringParameters	Paraméterértékeket biztosít egy címkepontozási függvénynek.
TextWeights	Olyan indexmezők súlyozását határozza meg, amelyek esetében a találatok növelik a keresési lekérdezések pontozását.
TokenCharacterKind	Olyan karakterosztályokat jelöl, amelyeken a jogkivonatszűrők működhetnek.
TokenFilterName	Meghatározza a keresőmotor által támogatott összes jogkivonatszűrő nevét.
TruncateTokenFilter	A kifejezéseket adott hosszúságúra csonkítja. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.
UaxUrlEmailTokenizer	Tokenizálja az URL-címeket és az e-maileket egy jogkivonatként. Ez a jogkivonat-szabályzó az Apache Lucene használatával van implementálva.
UniqueTokenFilter	Kiszűri a jogkivonatokat az előző token szövegével megegyező szöveggel. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.
VectorEncodingFormat	A vektormező tartalmának értelmezésére szolgáló kódolási formátum.
VectorSearch	A vektorkereséshez kapcsolódó konfigurációs beállításokat tartalmazza.
VectorSearchAlgorithmKind	Az indexeléshez és lekérdezéshez használt algoritmus.
VectorSearchAlgorithmMetric	A vektorok összehasonlításához használandó hasonlósági metrika. Javasoljuk, hogy ugyanazt a hasonlósági metrikát válassza, amelyre a beágyazási modellt betanította.
VectorSearchCompressionKind	Az indexeléshez és lekérdezéshez használt tömörítési módszer.
VectorSearchCompressionTargetDataType	A tömörített vektorértékek kvantált adattípusa.
VectorSearchProfile	A vektorkereséssel használható konfigurációk kombinációját határozza meg.
VectorSearchVectorizerKind	A lekérdezési idő alatt használandó vektorizálási módszer.
WordDelimiterTokenFilter	A szavakat alszavakra osztja, és opcionális átalakításokat hajt végre az alszócsoportokon. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.

AIServicesVisionParameters

Megadja az AI Services Vision paramétereit egy lekérdezési kép vagy szöveg vektorizálásához.

Name	Típus	Description
apiKey	string	A kijelölt AI Services-erőforrás API-kulcsa.
authIdentity	SearchIndexerDataIdentity: SearchIndexerDataNoneIdentity SearchIndexerDataUserAssignedIdentity	A kimenő kapcsolatokhoz használt, felhasználó által hozzárendelt felügyelt identitás. Ha authResourceId van megadva, és nincs megadva, a rendszer a rendszer által hozzárendelt felügyelt identitást használja. Ha az index frissítésekor az identitás nincs meghatározva, az érték változatlan marad. Ha a "nincs" értékre van állítva, a tulajdonság értéke törlődik.
modelVersion	string	Az AI Services Vision szolgáltatás meghívásakor használni kívánt modell verziója. Alapértelmezés szerint a legújabb elérhető lesz, ha nincs megadva.
resourceUri	string	Az AI Services-erőforrás erőforrás-URI-ja.

AIServicesVisionVectorizer

Megadja az AI Services Vision paramétereit egy lekérdezési kép vagy szöveg vektorizálásához.

Name	Típus	Description
aiServicesVisionParameters	AIServicesVisionParameters	Az AI Services Vision beágyazási vektorizációjára jellemző paramétereket tartalmazza.
kind	string: aiServicesVision	A vektoros kereséshez konfigurált vektorizálási módszer neve.
name	string	Az adott vektorizációs metódushoz társítandó név.

AIStudioModelCatalogName

A meghívandó Azure AI Studio-katalógusból származó beágyazási modell neve.

Name	Típus	Description
Cohere-embed-v3-english	string
Cohere-embed-v3-multilingual	string
Facebook-DinoV2-Image-Embeddings-ViT-Base	string
Facebook-DinoV2-Image-Embeddings-ViT-Giant	string
OpenAI-CLIP-Image-Text-Embeddings-ViT-Large-Patch14-336	string
OpenAI-CLIP-Image-Text-Embeddings-vit-base-patch32	string

AMLParameters

Megadja az AML-vektorizálóhoz való csatlakozás tulajdonságait.

Name	Típus	Description
key	string	(Kulcshitelesítéshez szükséges) Az AML szolgáltatás kulcsa.
modelName	AIStudioModelCatalogName	A megadott végponton üzembe helyezett Azure AI Studio-katalógusból származó beágyazási modell neve.
region	string	(Nem kötelező a jogkivonat-hitelesítéshez). Az a régió, amelyben az AML-szolgáltatás üzembe van helyezve.
resourceId	string	(Jogkivonat-hitelesítéshez szükséges). Az AML szolgáltatás Azure Resource Manager erőforrás-azonosítója. Ennek előfizetések/{guid}/resourceGroups/{resource-group-name}/Microsoft.MachineLearningServices/workspaces/{workspace-name}/services/{service_name} formátumban kell lennie.
timeout	string	(Nem kötelező) Ha meg van adva, az API-hívást kezdeményező HTTP-ügyfél időtúllépését jelzi.
uri	string	(Hitelesítés vagy kulcshitelesítés nélkül szükséges) Annak az AML-szolgáltatásnak a pontozási URI-ja, amelyre a JSON hasznos adatokat elküldi. Csak a https URI-séma engedélyezett.

AMLVectorizer

A Azure AI Studio modellkatalóguson keresztül üzembe helyezett Azure Machine Learning-végpontot adja meg a lekérdezési sztring vektoros beágyazásának létrehozásához.

Name	Típus	Description
amlParameters	AMLParameters	Az AML-vektorizáló tulajdonságait adja meg.
kind	string: aml	A vektoros kereséshez konfigurált vektorizálási módszer neve.
name	string	Az adott vektorizációs metódushoz társítandó név.

AsciiFoldingTokenFilter

Az első 127 ASCII-karakterben nem szereplő unicode-karaktereket (az "Egyszerű latin" Unicode-blokkot) ASCII-ekvivalenssé alakítja át, ha léteznek ilyen megfelelők. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.

Name	Típus	Alapértelmezett érték	Description
@odata.type	string: #Microsoft.Azure.Search.AsciiFoldingTokenFilter		Egy URI-töredék, amely megadja a tokenszűrő típusát.
name	string		A jogkivonatszűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet.
preserveOriginal	boolean	False	Egy érték, amely azt jelzi, hogy az eredeti jogkivonat megmarad-e. Az alapértelmezett érték a false (hamis).

AzureActiveDirectoryApplicationCredentials

A keresési szolgáltatáshoz létrehozott regisztrált alkalmazás hitelesítő adatai, amelyet az Azure Key Vault tárolt titkosítási kulcsokhoz való hitelesített hozzáféréshez használnak.

Name	Típus	Description
applicationId	string	Egy AAD-alkalmazásazonosító, amely megkapta a szükséges hozzáférési engedélyeket az Azure Key Vault, amelyet az inaktív adatok titkosításához kell használni. Az alkalmazásazonosító nem tévesztendő össze az AAD-alkalmazás objektumazonosítójával.
applicationSecret	string	A megadott AAD-alkalmazás hitelesítési kulcsa.

AzureOpenAIEmbeddingSkill

Lehetővé teszi, hogy vektoros beágyazást hozzon létre egy adott szöveges bemenethez az Azure OpenAI-erőforrás használatával.

Name	Típus	Description
@odata.type	string: #Microsoft.Skills.Text.AzureOpenAIEmbeddingSkill	Egy URI-töredék, amely a képesség típusát határozza meg.
apiKey	string	A kijelölt Azure OpenAI-erőforrás API-kulcsa.
authIdentity	SearchIndexerDataIdentity: SearchIndexerDataNoneIdentity SearchIndexerDataUserAssignedIdentity	A kimenő kapcsolatokhoz használt, felhasználó által hozzárendelt felügyelt identitás.
context	string	A műveletek végrehajtásának szintjét jelöli, például a dokumentum gyökerét vagy a dokumentum tartalmát (például /document vagy /document/content). Az alapértelmezett érték a /document.
deploymentId	string	Az Azure OpenAI-modell üzembe helyezésének azonosítója a kijelölt erőforráson.
description	string	A képesség leírása, amely a képesség bemeneteit, kimeneteit és használatát ismerteti.
dimensions	integer	Az eredményként kapott kimeneti beágyazások dimenzióinak száma. Csak a text-embedding-3 és újabb modellekben támogatott.
inputs	InputFieldMappingEntry[]	A képességek bemenetei lehetnek egy oszlop a forrásadatkészletben, vagy egy felsőbb rétegbeli képesség kimenete.
modelName	AzureOpenAIModelName	A megadott deploymentId elérési úton üzembe helyezett beágyazási modell neve.
name	string	Annak a képességnek a neve, amely egyedileg azonosítja azt a képességkészleten belül. A névvel nem rendelkező képességek a képességtömb 1-alapú indexének alapértelmezett nevét kapják, amelynek előtagja a "#" karakter.
outputs	OutputFieldMappingEntry[]	A képesség kimenete vagy egy keresési index mezője, vagy egy másik képesség bemeneteként felhasználható érték.
resourceUri	string	Az Azure OpenAI-erőforrás erőforrás-URI-ja.

AzureOpenAIModelName

A meghívandó Azure Open AI-modell neve.

Name	Típus	Description
experimental	string
text-embedding-3-large	string
text-embedding-3-small	string
text-embedding-ada-002	string

AzureOpenAIParameters

Megadja az Azure OpenAI-erőforráshoz való csatlakozás paramétereit.

Name	Típus	Description
apiKey	string	A kijelölt Azure OpenAI-erőforrás API-kulcsa.
authIdentity	SearchIndexerDataIdentity: SearchIndexerDataNoneIdentity SearchIndexerDataUserAssignedIdentity	A kimenő kapcsolatokhoz használt, felhasználó által hozzárendelt felügyelt identitás.
deploymentId	string	Az Azure OpenAI-modell üzembe helyezésének azonosítója a kijelölt erőforráson.
modelName	AzureOpenAIModelName	A megadott deploymentId elérési úton üzembe helyezett beágyazási modell neve.
resourceUri	string	Az Azure OpenAI-erőforrás erőforrás-URI-ja.

AzureOpenAIVectorizer

Meghatározza a lekérdezési sztringek vektorizálásához használt Azure OpenAI-erőforrást.

Name	Típus	Description
azureOpenAIParameters	AzureOpenAIParameters: AzureOpenAIEmbeddingSkill	Az Azure OpenAI beágyazási vektorizálására jellemző paramétereket tartalmazza.
kind	string: azureOpenAI	A vektoros kereséshez konfigurált vektorizálási módszer neve.
name	string	Az adott vektorizációs metódushoz társítandó név.

BM25Similarity

Az Okapi BM25 hasonlósági algoritmuson alapuló rangsorolási függvény. A BM25 egy TF-IDF-szerű algoritmus, amely magában foglalja a hossz normalizálását (amelyet a "b" paraméter szabályoz), valamint a kifejezés frekvenciatelítettségét (amelyet a "k1" paraméter szabályoz).

Name	Típus	Description
@odata.type	string: #Microsoft.Azure.Search.BM25Similarity
b	number	Ez a tulajdonság határozza meg, hogy a dokumentum hossza hogyan befolyásolja a relevanciapontszámot. Alapértelmezés szerint a rendszer 0,75 értéket használ. A 0,0 érték azt jelenti, hogy nincs hossz normalizálás alkalmazva, míg az 1,0 érték azt jelenti, hogy a pontszám teljesen normalizálódik a dokumentum hosszával.
k1	number	Ez a tulajdonság szabályozza a skálázási függvényt az egyes egyező kifejezések kifejezési gyakorisága és a dokumentum-lekérdezés párok végső relevanciapontszáma között. Alapértelmezés szerint a rendszer 1,2 értéket használ. A 0,0 érték azt jelenti, hogy a pontszám nem skálázható a kifejezés gyakoriságának növekedésével.

CharFilterName

Meghatározza a keresőmotor által támogatott összes karakterszűrő nevét.

Name	Típus	Description
html_strip	string	Egy karakterszűrő, amely HTML-szerkezeteket próbál szétszedni. Lásd: https://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/charfilter/HTMLStripCharFilter.html

CjkBigramTokenFilter

Forms standard tokenizerből létrehozott CJK-kifejezések bigramját. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.

Name	Típus	Alapértelmezett érték	Description
@odata.type	string: #Microsoft.Azure.Search.CjkBigramTokenFilter		Egy URI-töredék, amely megadja a tokenszűrő típusát.
ignoreScripts	CjkBigramTokenFilterScripts[]		A figyelmen kívül hagyandó szkriptek.
name	string		A jogkivonatszűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet.
outputUnigrams	boolean	False	Egy érték, amely azt jelzi, hogy az egygrammot és a bigramot is ki kell-e adni (ha igaz), vagy csak bigramot (ha hamis). Az alapértelmezett érték a false (hamis).

CjkBigramTokenFilterScripts

A CjkBigramTokenFilter által figyelmen kívül hagyható szkriptek.

Name	Típus	Description
han	string	A CJK-kifejezések bigramjainak létrehozásakor hagyja figyelmen kívül a Han-szkriptet.
hangul	string	Hagyja figyelmen kívül a Hangul-szkriptet a CJK-kifejezések bigramjainak létrehozásakor.
hiragana	string	Hagyja figyelmen kívül a Hiragana-szkriptet a CJK-kifejezések bigramjainak létrehozásakor.
katakana	string	CJK-kifejezések bigramjainak létrehozásakor hagyja figyelmen kívül a Katakana-szkriptet.

ClassicSimilarity

Örökölt hasonlósági algoritmus, amely a TF-IDF Lucene TFIDFSimilarity implementációját használja. A TF-IDF ezen változata statikus dokumentumhossz normalizálást vezet be, valamint koordinálja azokat a tényezőket, amelyek csak részben egyeznek a keresett lekérdezésekkel.

Name	Típus	Description
@odata.type	string: #Microsoft.Azure.Search.ClassicSimilarity

ClassicTokenizer

Nyelvhelyességi alapú jogkivonat-szabályzó, amely alkalmas a legtöbb európai nyelvű dokumentum feldolgozására. Ez a jogkivonat-szabályzó az Apache Lucene használatával van implementálva.

Name	Típus	Alapértelmezett érték	Description
@odata.type	string: #Microsoft.Azure.Search.ClassicTokenizer		Egy URI-töredék, amely a tokenizer típusát határozza meg.
maxTokenLength	integer	255	A jogkivonat maximális hossza. Az alapértelmezett érték 255. A maximális hossznál hosszabb jogkivonatok fel vannak osztva. A maximálisan használható tokenhossz 300 karakter.
name	string		A tokenizer neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet.

CommonGramTokenFilter

Bigramokat hozhat létre az indexelés során gyakran előforduló kifejezésekhez. Az egyes kifejezések továbbra is indexelve vannak, és a bigramok túl vannak osztva. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.

Name	Típus	Alapértelmezett érték	Description
@odata.type	string: #Microsoft.Azure.Search.CommonGramTokenFilter		Egy URI-töredék, amely megadja a tokenszűrő típusát.
commonWords	string[]		A közös szavak halmaza.
ignoreCase	boolean	False	Egy érték, amely azt jelzi, hogy a közös szavak egyeztetése érzéketlen lesz-e a kis- és nagybetűk között. Az alapértelmezett érték a false (hamis).
name	string		A jogkivonatszűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet.
queryMode	boolean	False	Egy érték, amely azt jelzi, hogy a jogkivonatszűrő lekérdezési módban van-e. Lekérdezési módban a jogkivonatszűrő bigramokat hoz létre, majd eltávolítja a közös szavakat és az egyszeres kifejezéseket, majd egy közös szót. Az alapértelmezett érték a false (hamis).

CorsOptions

Meghatározza az indexek eltérő eredetű erőforrás-megosztásának (CORS) szabályozására szolgáló beállításokat.

Name	Típus	Description
allowedOrigins	string[]	Azoknak a forrásoknak a listája, amelyekből a JavaScript-kód hozzáférést kap az indexhez. A(z) {protocol}://{teljesen minősített-tartománynév}[:{port#}], illetve egyetlen "*" formátumú gazdagéplistát tartalmazhat az összes forrás engedélyezéséhez (nem ajánlott).
maxAgeInSeconds	integer	Az az időtartam, amelyre a böngészőknek gyorsítótáraznia kell a CORS elővizsgálati válaszait. Alapértelmezés szerint 5 perc.

CustomAnalyzer

Lehetővé teszi a szöveg indexelhető/kereshető jogkivonattá alakításának folyamatát. Ez egy felhasználó által definiált konfiguráció, amely egyetlen előre definiált tokenizerből és egy vagy több szűrőből áll. A jogkivonat-szabályzó feladata a szöveg jogkivonatokra törése, valamint a jogkivonat-szabályzó által kibocsátott jogkivonatok módosítására szolgáló szűrők.

Name	Típus	Description
@odata.type	string: #Microsoft.Azure.Search.CustomAnalyzer	Az elemző típusát meghatározó URI-töredék.
charFilters	CharFilterName[]	A bemeneti szöveg előkészítéséhez használt karakterszűrők listája, mielőtt a tokenizer feldolgozta volna. Lecserélhetnek például bizonyos karaktereket vagy szimbólumokat. A szűrők a lista sorrendjében futnak.
name	string	Az elemző neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet.
tokenFilters	TokenFilterName[]	A tokenizáló által létrehozott jogkivonatok szűréséhez vagy módosításához használt jogkivonatszűrők listája. Megadhat például egy kisbetűs szűrőt, amely az összes karaktert kisbetűvé alakítja. A szűrők a lista sorrendjében futnak.
tokenizer	LexicalTokenizerName	A jogkivonat-megosztó neve a folyamatos szöveg jogkivonatok sorozatára való felosztásához, például egy mondat szavakra töréséhez.

CustomNormalizer

Lehetővé teszi a normalizálás konfigurálását szűrhető, rendezhető és táblázatos mezőkhöz, amelyek alapértelmezés szerint szigorú egyezéssel működnek. Ez egy felhasználó által definiált konfiguráció, amely legalább egy szűrőből áll, és módosítja a tárolt jogkivonatot.

Name	Típus	Description
@odata.type	string: #Microsoft.Azure.Search.CustomNormalizer	A normalizáló típusát meghatározó URI-töredék.
charFilters	CharFilterName[]	A bemeneti szöveg feldolgozását megelőző előkészítéséhez használt karakterszűrők listája. Lecserélhetnek például bizonyos karaktereket vagy szimbólumokat. A szűrők a lista sorrendjében futnak.
name	string	A normalizáló neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet. Nem végződhet ".microsoft" vagy ".lucene" végződéssel, és nem nevezhető "asciifolding", "standard", "kisbetűs", "nagybetűs" vagy "elision" névvel.
tokenFilters	TokenFilterName[]	A bemeneti jogkivonat szűréséhez vagy módosításához használt jogkivonatszűrők listája. Megadhat például egy kisbetűs szűrőt, amely az összes karaktert kisbetűssé alakítja. A szűrők a lista sorrendjében futnak.

CustomVectorizer

Felhasználó által definiált vektorizálót ad meg a lekérdezési sztringek vektorbeágyazásának létrehozásához. A külső vektorizáló integrálása egy képességcsoport egyéni webes API-felületével érhető el.

Name	Típus	Description
customWebApiParameters	CustomWebApiParameters	A felhasználó által definiált vektorizáló tulajdonságait adja meg.
kind	string: customWebApi	A vektoros kereséshez konfigurált vektorizálási módszer neve.
name	string	Az adott vektorizációs metódushoz társítandó név.

CustomWebApiParameters

Megadja a felhasználó által definiált vektorizálóhoz való csatlakozás tulajdonságait.

Name	Típus	Description
authIdentity	SearchIndexerDataIdentity: SearchIndexerDataNoneIdentity SearchIndexerDataUserAssignedIdentity	A kimenő kapcsolatokhoz használt, felhasználó által hozzárendelt felügyelt identitás. Ha authResourceId van megadva, és nincs megadva, a rendszer a rendszer által hozzárendelt felügyelt identitást használja. Ha az indexelő frissítései során az identitás nincs meghatározva, az érték változatlan marad. Ha a "nincs" értékre van állítva, a tulajdonság értéke törlődik.
authResourceId	string	Olyan egyéni végpontokra vonatkozik, amelyek külső kódhoz csatlakoznak egy Azure-függvényben vagy más, átalakításokat biztosító alkalmazásban. Ennek az értéknek a függvényhez vagy alkalmazáshoz az Azure Active Directoryban való regisztrálásakor létrehozott alkalmazásazonosítónak kell lennie. Ha meg van adva, a vektorizáció a keresési szolgáltatás felügyelt azonosítójával (rendszer vagy felhasználó által hozzárendelt) és a függvény vagy alkalmazás hozzáférési jogkivonatával csatlakozik a függvényhez vagy alkalmazáshoz, és ezt az értéket használja erőforrás-azonosítóként a hozzáférési jogkivonat hatókörének létrehozásához.
httpHeaders	object	A HTTP-kérés létrehozásához szükséges fejlécek.
httpMethod	string	A HTTP-kérés metódusa.
timeout	string	A kérés kívánt időtúllépése. Az alapértelmezett érték 30 másodperc.
uri	string	A vektorizálót biztosító webes API URI-ja.

DictionaryDecompounderTokenFilter

Felbontja a sok germán nyelven található összetett szavakat. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.

Name	Típus	Alapértelmezett érték	Description
@odata.type	string: #Microsoft.Azure.Search.DictionaryDecompounderTokenFilter		Egy URI-töredék, amely megadja a tokenszűrő típusát.
maxSubwordSize	integer	15	A maximális alszóméret. Csak az ennél rövidebb alszavak lesznek kimenetben. Az alapértelmezett érték 15. A maximális érték 300.
minSubwordSize	integer	2	A minimális alszóméret. Csak az ennél hosszabb alszavak lesznek kimenetben. Az alapértelmezett érték 2. A maximális érték 300.
minWordSize	integer	5	A szavak minimális mérete. Csak az ennél hosszabb szavak lesznek feldolgozva. Az alapértelmezett érték 5. A maximális érték 300.
name	string		A jogkivonatszűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet.
onlyLongestMatch	boolean	False	Egy érték, amely azt jelzi, hogy csak a leghosszabb egyező alszót szeretné-e hozzáadni a kimenethez. Az alapértelmezett érték a false (hamis).
wordList	string[]		Azoknak a szavaknak a listája,

DistanceScoringFunction

Olyan függvényt definiál, amely a földrajzi helytől való távolság alapján növeli a pontszámokat.

Name	Típus	Description
boost	number	A nyers pontszám szorzója. Pozitív számnak kell lennie, amely nem lehet 1,0.
distance	DistanceScoringParameters	A távolságpontozási függvény paraméterértékei.
fieldName	string	A pontozási függvény bemeneteként használt mező neve.
interpolation	ScoringFunctionInterpolation	Egy érték, amely azt jelzi, hogy a kiemelés hogyan lesz interpolálva a dokumentum pontszámai között; alapértelmezés szerint "Lineáris".
type	string: distance	A használni kívánt függvény típusát jelzi. Az érvényes értékek közé tartozik a magnitúdó, a frissesség, a távolság és a címke. A függvénytípusnak kisbetűsnek kell lennie.

DistanceScoringParameters

Paraméterértékeket biztosít egy távolsági pontozási függvénynek.

Name	Típus	Description
boostingDistance	number	A távolság kilométerben attól a referenciahelytől, ahol a kiemelési tartomány véget ér.
referencePointParameter	string	A keresési lekérdezésekben átadott paraméter neve a referenciahely megadásához.

EdgeNGramTokenFilter

A megadott méret(ek) n-grammját hozza létre egy bemeneti jogkivonat elejétől vagy hátuljától kezdve. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.

Name	Típus	Alapértelmezett érték	Description
@odata.type	string: #Microsoft.Azure.Search.EdgeNGramTokenFilter		Egy URI-töredék, amely megadja a tokenszűrő típusát.
maxGram	integer	2	A maximális n-gram hossz. Az alapértelmezett érték 2.
minGram	integer	1	Az n-gramm minimális hossza. Az alapértelmezett érték 1. A maxGram értékénél kisebbnek kell lennie.
name	string		A jogkivonatszűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet.
side	EdgeNGramTokenFilterSide	front	Meghatározza, hogy az n-gram melyik oldaláról kell létrehozni az n-gramot. Az alapértelmezett érték az "előtér".

EdgeNGramTokenFilterSide

Megadja, hogy a bemenet melyik oldaláról kell n-gramot létrehozni.

Name	Típus	Description
back	string	Megadja, hogy az n-gramot a bemenet hátoldaláról kell létrehozni.
front	string	Megadja, hogy az n-gramot a bemenet elejéről kell létrehozni.

EdgeNGramTokenFilterV2

A megadott méret(ek) n-grammját hozza létre egy bemeneti jogkivonat elejétől vagy hátuljától kezdve. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.

Name	Típus	Alapértelmezett érték	Description
@odata.type	string: #Microsoft.Azure.Search.EdgeNGramTokenFilterV2		Egy URI-töredék, amely megadja a tokenszűrő típusát.
maxGram	integer	2	A maximális n-gram hossz. Az alapértelmezett érték 2. A maximális érték 300.
minGram	integer	1	Az n-gramm minimális hossza. Az alapértelmezett érték 1. A maximális érték 300. A maxGram értékénél kisebbnek kell lennie.
name	string		A jogkivonatszűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet.
side	EdgeNGramTokenFilterSide	front	Meghatározza, hogy az n-gram melyik oldaláról kell létrehozni az n-gramot. Az alapértelmezett érték az "előtér".

EdgeNGramTokenizer

Tokenizálja a bemenetet egy élről az adott méret(ek) n-grammjára. Ez a jogkivonat-szabályzó az Apache Lucene használatával van implementálva.

Name	Típus	Alapértelmezett érték	Description
@odata.type	string: #Microsoft.Azure.Search.EdgeNGramTokenizer		Egy URI-töredék, amely a tokenizer típusát határozza meg.
maxGram	integer	2	A maximális n-gram hossz. Az alapértelmezett érték 2. A maximális érték 300.
minGram	integer	1	Az n-gramm minimális hossza. Az alapértelmezett érték 1. A maximális érték 300. A maxGram értékénél kisebbnek kell lennie.
name	string		A tokenizer neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet.
tokenChars	TokenCharacterKind[]		A tokenekben megtartandó karakterosztályok.

ElisionTokenFilter

Eltávolítja az elisionokat. A "l'avion" (a sík) például "avion" (sík) lesz. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.

Name	Típus	Description
@odata.type	string: #Microsoft.Azure.Search.ElisionTokenFilter	Egy URI-töredék, amely megadja a tokenszűrő típusát.
articles	string[]	Az eltávolítandó cikkek halmaza.
name	string	A jogkivonatszűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet.

ErrorAdditionalInfo

Az erőforrás-kezelési hiba további információi.

Name	Típus	Description
info	object	A további információk.
type	string	A további adattípus.

ErrorDetail

A hiba részletei.

Name	Típus	Description
additionalInfo	ErrorAdditionalInfo[]	A hiba további információi.
code	string	A hibakód.
details	ErrorDetail[]	A hiba részletei.
message	string	A hibaüzenet.
target	string	A hiba célja.

ErrorResponse

Hibaválasz

Name	Típus	Description
error	ErrorDetail	A hibaobjektum.

ExhaustiveKnnParameters

A teljes KNN-algoritmusra jellemző paramétereket tartalmazza.

Name	Típus	Description
metric	VectorSearchAlgorithmMetric	A vektorok összehasonlításához használandó hasonlósági metrika.

ExhaustiveKnnVectorSearchAlgorithmConfiguration

A lekérdezés során használt teljes KNN-algoritmusra vonatkozó konfigurációs beállításokat tartalmaz, amelyek találgatásos keresést hajtanak végre a teljes vektorindexben.

Name	Típus	Description
exhaustiveKnnParameters	ExhaustiveKnnParameters	A teljes KNN-algoritmusra jellemző paramétereket tartalmazza.
kind	string: exhaustiveKnn	A vektorkereséshez konfigurált algoritmus neve.
name	string	Az adott konfigurációhoz társítandó név.

FreshnessScoringFunction

Olyan függvényt definiál, amely egy dátum-idő mező értéke alapján növeli a pontszámokat.

Name	Típus	Description
boost	number	A nyers pontszám szorzója. Pozitív számnak kell lennie, amely nem lehet 1,0.
fieldName	string	A pontozási függvény bemeneteként használt mező neve.
freshness	FreshnessScoringParameters	A frissesség-pontozási függvény paraméterértékei.
interpolation	ScoringFunctionInterpolation	Egy érték, amely azt jelzi, hogy a kiemelés hogyan lesz interpolálva a dokumentum pontszámai között; alapértelmezés szerint "Lineáris".
type	string: freshness	A használni kívánt függvény típusát jelzi. Az érvényes értékek közé tartozik a magnitúdó, a frissesség, a távolság és a címke. A függvénytípusnak kisbetűsnek kell lennie.

FreshnessScoringParameters

Paraméterértékeket biztosít egy frissesség-pontozási függvénynek.

Name	Típus	Description
boostingDuration	string	Az a lejárati idő, amely után a kiemelés leáll egy adott dokumentum esetében.

HnswParameters

A HNSW algoritmusra jellemző paramétereket tartalmazza.

Name	Típus	Alapértelmezett érték	Description
efConstruction	integer	400	A legközelebbi szomszédokat tartalmazó dinamikus lista mérete, amelyet az indexidő során használnak. A paraméter növelése javíthatja az index minőségét a megnövekedett indexelési idő rovására. Egy bizonyos ponton ennek a paraméternek a növelése csökkenő visszatéréshez vezet.
efSearch	integer	500	A legközelebbi szomszédokat tartalmazó dinamikus lista mérete, amelyet a keresési idő során használnak. A paraméter növelése javíthatja a keresési eredményeket a lassabb keresés rovására. Egy bizonyos ponton ennek a paraméternek a növelése csökkenő visszatéréshez vezet.
m	integer	4	Az összes új elemhez létrehozott kétirányú kapcsolatok száma az építés során. A paraméter értékének növelése javíthatja a visszahívási időt, és csökkentheti a nagy belső dimenziójú adathalmazok lekérési idejét a megnövekedett memóriahasználat és a hosszabb indexelési idő rovására.
metric	VectorSearchAlgorithmMetric		A vektorok összehasonlításához használandó hasonlósági metrika.

HnswVectorSearchAlgorithmConfiguration

Az indexelés és lekérdezés során használt HNSW közelítő szomszéd algoritmusra vonatkozó konfigurációs beállításokat tartalmaz. A HNSW algoritmus a keresési sebesség és a pontosság közötti kompromisszumot kínálja.

Name	Típus	Description
hnswParameters	HnswParameters	A HNSW-algoritmusra jellemző paramétereket tartalmazza.
kind	string: hnsw	A vektorkereséshez konfigurált algoritmus neve.
name	string	Az adott konfigurációhoz társítandó név.

InputFieldMappingEntry

Egy képesség bemeneti mezőleképezése.

Name	Típus	Description
inputs	InputFieldMappingEntry[]	Az összetett típus létrehozásakor használt rekurzív bemenetek.
name	string	A bemenet neve.
source	string	A bemenet forrása.
sourceContext	string	A rekurzív bemenetek kiválasztásához használt forráskörnyezet.

KeepTokenFilter

Egy jogkivonatszűrő, amely csak a megadott szavak listájában lévő szöveggel rendelkező jogkivonatokat tárolja. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.

Name	Típus	Alapértelmezett érték	Description
@odata.type	string: #Microsoft.Azure.Search.KeepTokenFilter		Egy URI-töredék, amely megadja a tokenszűrő típusát.
keepWords	string[]		A megtartandó szavak listája.
keepWordsCase	boolean	False	Egy érték, amely azt jelzi, hogy az összes szót először kisbetűsre kell-e csökkenteni. Az alapértelmezett érték a false (hamis).
name	string		A jogkivonatszűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet.

KeywordMarkerTokenFilter

Kulcsszavakként jelöli meg a kifejezéseket. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.

Name	Típus	Alapértelmezett érték	Description
@odata.type	string: #Microsoft.Azure.Search.KeywordMarkerTokenFilter		Egy URI-töredék, amely megadja a tokenszűrő típusát.
ignoreCase	boolean	False	A kis- és nagybetűk figyelmen kívül hagyását jelző érték. Ha igaz, a rendszer először az összes szót kisbetűssé alakítja. Az alapértelmezett érték a false (hamis).
keywords	string[]		Kulcsszavakként megjelölendő szavak listája.
name	string		A jogkivonatszűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet.

KeywordTokenizer

A teljes bemenetet egyetlen jogkivonatként bocsátja ki. Ez a jogkivonat-szabályzó az Apache Lucene használatával van implementálva.

Name	Típus	Alapértelmezett érték	Description
@odata.type	string: #Microsoft.Azure.Search.KeywordTokenizer		Egy URI-töredék, amely a tokenizer típusát határozza meg.
bufferSize	integer	256	Az olvasási puffer mérete bájtban. Az alapértelmezett érték 256.
name	string		A tokenizer neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet.

KeywordTokenizerV2

A teljes bemenetet egyetlen jogkivonatként bocsátja ki. Ez a jogkivonat-szabályzó az Apache Lucene használatával van implementálva.

Name	Típus	Alapértelmezett érték	Description
@odata.type	string: #Microsoft.Azure.Search.KeywordTokenizerV2		Egy URI-töredék, amely a tokenizer típusát határozza meg.
maxTokenLength	integer	256	A jogkivonat maximális hossza. Az alapértelmezett érték 256. A maximális hossznál hosszabb jogkivonatok fel vannak osztva. A maximálisan használható tokenhossz 300 karakter.
name	string		A tokenizer neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet.

LengthTokenFilter

Eltávolítja a túl hosszú vagy túl rövid szavakat. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.

Name	Típus	Alapértelmezett érték	Description
@odata.type	string: #Microsoft.Azure.Search.LengthTokenFilter		Egy URI-töredék, amely megadja a tokenszűrő típusát.
max	integer	300	A karakterek maximális hossza. Az alapértelmezett és a maximális érték 300.
min	integer	0	A karakterek minimális hossza. Az alapértelmezett érték a 0. A maximális érték 300. A maximális értéknél kisebbnek kell lennie.
name	string		A jogkivonatszűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet.

LexicalAnalyzerName

Meghatározza a keresőmotor által támogatott összes szövegelemző nevét.

Name	Típus	Description
ar.lucene	string	Lucene analyzer arab nyelven.
ar.microsoft	string	Microsoft Analyzer arab nyelven.
bg.lucene	string	Lucene-elemző bolgárnak.
bg.microsoft	string	Microsoft analyzer for Bolgár.
bn.microsoft	string	A Bangla Microsoft-elemzője.
ca.lucene	string	Lucene elemző katalánnak.
ca.microsoft	string	A Microsoft elemzője katalán nyelven.
cs.lucene	string	Lucene elemző csehnek.
cs.microsoft	string	A Microsoft elemzője csehül.
da.lucene	string	Lucene analyzer dánnak.
da.microsoft	string	Microsoft analyzer dán nyelven.
de.lucene	string	Lucene-elemző németül.
de.microsoft	string	Microsoft analyzer német nyelven.
el.lucene	string	Lucene elemző göröghöz.
el.microsoft	string	Microsoft Analyzer görög nyelven.
en.lucene	string	Lucene analyzer angol nyelven.
en.microsoft	string	Microsoft Analyzer angol nyelven.
es.lucene	string	Lucene elemző spanyolul.
es.microsoft	string	Microsoft Analyzer spanyol nyelven.
et.microsoft	string	Microsoft analyzer az észtekhez.
eu.lucene	string	Lucene-elemző Baszknak.
fa.lucene	string	Lucene elemző perzsa.
fi.lucene	string	Lucene analyzer finnhez.
fi.microsoft	string	Microsoft analyzer for Finn.
fr.lucene	string	Lucene elemző francia nyelvre.
fr.microsoft	string	Microsoft analyzer francia nyelven.
ga.lucene	string	Lucene-elemző írnek.
gl.lucene	string	Lucene-elemző a galíciaiaknak.
gu.microsoft	string	Microsoft analyzer for Gujarati.
he.microsoft	string	Microsoft Analyzer héber nyelven.
hi.lucene	string	Lucene elemző hindinek.
hi.microsoft	string	Microsoft analyzer for Hindi.
hr.microsoft	string	Microsoft analyzer for Horvát.
hu.lucene	string	Lucene-elemző magyarra.
hu.microsoft	string	Microsoft-elemző magyar nyelven.
hy.lucene	string	Lucene-elemző örménynek.
id.lucene	string	Lucene analyzer indonéz.
id.microsoft	string	Indonéz Microsoft-elemző (Bahasa).
is.microsoft	string	Izlandi Microsoft-elemző.
it.lucene	string	Lucene elemző olasznak.
it.microsoft	string	Microsoft Analyzer olasz nyelven.
ja.lucene	string	Lucene-elemző japánhoz.
ja.microsoft	string	Microsoft analyzer japán nyelven.
keyword	string	A mező teljes tartalmát egyetlen jogkivonatként kezeli. Ez olyan adatok esetében hasznos, mint az irányítószámok, az azonosítók és egyes terméknevek. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/KeywordAnalyzer.html
kn.microsoft	string	A Kannada Microsoft-elemzője.
ko.lucene	string	Lucene elemző koreaihoz.
ko.microsoft	string	Microsoft-elemző koreaihoz.
lt.microsoft	string	Microsoft-elemző litvánhoz.
lv.lucene	string	Lucene-elemző lettnek.
lv.microsoft	string	Microsoft Analyzer lett nyelvhez.
ml.microsoft	string	Microsoft analyzer for Malayalam.
mr.microsoft	string	Microsoft analyzer for Marathi.
ms.microsoft	string	Microsoft-elemző malájhoz (latin betűs).
nb.microsoft	string	Microsoft analyzer for Norwegian (Bokmål).
nl.lucene	string	Lucene analyzer hollandra.
nl.microsoft	string	Microsoft Analyzer holland nyelven.
no.lucene	string	Lucene-elemző norvégra.
pa.microsoft	string	Microsoft analyzer for Punjabi.
pattern	string	A szöveget rugalmasan elválasztja a kifejezések között egy reguláris kifejezésmintán keresztül. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/PatternAnalyzer.html
pl.lucene	string	Lucene-elemző a lengyelhez.
pl.microsoft	string	Microsoft Analyzer lengyel nyelven.
pt-BR.lucene	string	Lucene analyzer portugál (Brazília).
pt-BR.microsoft	string	Microsoft analyzer for Portuguese (Brazília).
pt-PT.lucene	string	Lucene analyzer portugál (Portugália) számára.
pt-PT.microsoft	string	Microsoft analyzer for Portuguese (Portugália).
ro.lucene	string	Lucene analyzer románra.
ro.microsoft	string	Microsoft Analyzer román nyelven.
ru.lucene	string	Lucene elemző orosznak.
ru.microsoft	string	Microsoft analyzer orosz nyelven.
simple	string	Nem betűkre osztja a szöveget, és kisbetűssé alakítja őket. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/SimpleAnalyzer.html
sk.microsoft	string	Microsoft analyzer for Szlovák.
sl.microsoft	string	Microsoft analyzer szlovén nyelven.
sr-cyrillic.microsoft	string	Microsoft analyzer for Szerb (cirill betűs).
sr-latin.microsoft	string	Microsoft Analyzer szerb (latin betűs) nyelven.
standard.lucene	string	Standard Lucene-elemző.
standardasciifolding.lucene	string	Standard ASCII folding Lucene analyzer. Lásd: https://docs.microsoft.com/rest/api/searchservice/Custom-analyzers-in-Azure-Search#Analyzers
stop	string	A szöveget nem betűkkel osztja el; Alkalmazza a kisbetűs és a stopword jogkivonat szűrőit. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/StopAnalyzer.html
sv.lucene	string	Lucene-elemző svédnek.
sv.microsoft	string	Microsoft analyzer for Svéd.
ta.microsoft	string	Microsoft analyzer for Tamil.
te.microsoft	string	Microsoft analyzer for Telugu.
th.lucene	string	Lucene elemző thai nyelvhez.
th.microsoft	string	Microsoft Analyzer thai nyelven.
tr.lucene	string	Lucene-elemző töröknek.
tr.microsoft	string	Microsoft analyzer for Török.
uk.microsoft	string	Microsoft Analyzer ukrán nyelven.
ur.microsoft	string	Microsoft analyzer for Urdu.
vi.microsoft	string	A Vietnami Microsoft-elemző.
whitespace	string	A whitespace tokenizert használó elemző. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/WhitespaceAnalyzer.html
zh-Hans.lucene	string	Lucene analyzer kínaihoz (egyszerűsített).
zh-Hans.microsoft	string	Microsoft Analyzer kínaihoz (egyszerűsített).
zh-Hant.lucene	string	Lucene analyzer kínaihoz (hagyományos).
zh-Hant.microsoft	string	Microsoft Analyzer kínaihoz (hagyományos).

LexicalNormalizerName

Meghatározza a keresőmotor által támogatott összes szöveg normalizálójának nevét.

Name	Típus	Description
asciifolding	string	Az első 127 ASCII-karakterben nem szereplő unicode-karaktereket (az "Egyszerű latin" Unicode-blokkot) ASCII-ekvivalenssé alakítja át, ha léteznek ilyen megfelelők. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/ASCIIFoldingFilter.html
elision	string	Eltávolítja az elisionokat. A "l'avion" (a sík) például "avion" (sík) lesz. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/util/ElisionFilter.html
lowercase	string	A jogkivonat szövegének normalizálása kisbetűssé. Lásd: https://lucene.apache.org/core/6_6_1/analyzers-common/org/apache/lucene/analysis/core/LowerCaseFilter.html
standard	string	Standard normalizáló, amely kisbetűkből és asciifoldingból áll. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/reverse/ReverseStringFilter.html
uppercase	string	A jogkivonat szövegének nagybetűsre normalizálása. Lásd: https://lucene.apache.org/core/6_6_1/analyzers-common/org/apache/lucene/analysis/core/UpperCaseFilter.html

LexicalTokenizerName

Meghatározza a keresőmotor által támogatott összes tokenizer nevét.

Name	Típus	Description
classic	string	Nyelvhelyességi alapú jogkivonat-szabályzó, amely alkalmas a legtöbb európai nyelvű dokumentum feldolgozására. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/standard/ClassicTokenizer.html
edgeNGram	string	Tokenizálja a bemenetet egy élről az adott méret(ek) n-grammjára. Lásd: https://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/ngram/EdgeNGramTokenizer.html
keyword_v2	string	A teljes bemenetet egyetlen jogkivonatként bocsátja ki. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/KeywordTokenizer.html
letter	string	A szöveget nem betűkkel osztja el. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/LetterTokenizer.html
lowercase	string	Nem betűkre osztja a szöveget, és kisbetűssé alakítja őket. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/LowerCaseTokenizer.html
microsoft_language_stemming_tokenizer	string	Nyelvspecifikus szabályokkal osztja el a szöveget, és csökkenti a szavak alapformáit.
microsoft_language_tokenizer	string	Nyelvspecifikus szabályokkal osztja el a szöveget.
nGram	string	Tokenizálja a bemenetet az adott méret(ek) n-grammjára. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/ngram/NGramTokenizer.html
path_hierarchy_v2	string	Tokenizer elérésiút-szerű hierarchiákhoz. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/path/PathHierarchyTokenizer.html
pattern	string	Tokenizer, amely regex mintaegyeztetést használ a különböző tokenek létrehozásához. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/pattern/PatternTokenizer.html
standard_v2	string	Standard Lucene-elemző; A standard tokenizerből, kisbetűs szűrőből és leállításszűrőből áll. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/standard/StandardTokenizer.html
uax_url_email	string	Tokenizálja az URL-címeket és az e-maileket egy jogkivonatként. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/standard/UAX29URLEmailTokenizer.html
whitespace	string	Elosztja a szöveget a szóközök között. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/WhitespaceTokenizer.html

LimitTokenFilter

Korlátozza a tokenek számát az indexelés során. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.

Name	Típus	Alapértelmezett érték	Description
@odata.type	string: #Microsoft.Azure.Search.LimitTokenFilter		Egy URI-töredék, amely megadja a tokenszűrő típusát.
consumeAllTokens	boolean	False	Egy érték, amely azt jelzi, hogy a bemenetből származó összes jogkivonatot fel kell-e használni akkor is, ha eléri a maxTokenCount értéket. Az alapértelmezett érték a false (hamis).
maxTokenCount	integer	1	A létrehozandó jogkivonatok maximális száma. Az alapértelmezett érték 1.
name	string		A jogkivonatszűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet.

LuceneStandardAnalyzer

Standard Apache Lucene-elemző; A standard tokenizerből, kisbetűs szűrőből és leállításszűrőből áll.

Name	Típus	Alapértelmezett érték	Description
@odata.type	string: #Microsoft.Azure.Search.StandardAnalyzer		Az elemző típusát meghatározó URI-töredék.
maxTokenLength	integer	255	A jogkivonat maximális hossza. Az alapértelmezett érték 255. A maximális hossznál hosszabb jogkivonatok fel vannak osztva. A maximálisan használható tokenhossz 300 karakter.
name	string		Az elemző neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet.
stopwords	string[]		A stopszavak listája.

LuceneStandardTokenizer

A Unicode-szöveg szegmentálási szabályai szerint töri a szöveget. Ez a jogkivonat-szabályzó az Apache Lucene használatával van implementálva.

Name	Típus	Alapértelmezett érték	Description
@odata.type	string: #Microsoft.Azure.Search.StandardTokenizer		Egy URI-töredék, amely a tokenizer típusát határozza meg.
maxTokenLength	integer	255	A jogkivonat maximális hossza. Az alapértelmezett érték 255. A maximális hossznál hosszabb jogkivonatok fel vannak osztva.
name	string		A tokenizer neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet.

LuceneStandardTokenizerV2

A Unicode-szöveg szegmentálási szabályai szerint töri a szöveget. Ez a jogkivonat-szabályzó az Apache Lucene használatával van implementálva.

Name	Típus	Alapértelmezett érték	Description
@odata.type	string: #Microsoft.Azure.Search.StandardTokenizerV2		Egy URI-töredék, amely a tokenizer típusát határozza meg.
maxTokenLength	integer	255	A jogkivonat maximális hossza. Az alapértelmezett érték 255. A maximális hossznál hosszabb jogkivonatok fel vannak osztva. A maximálisan használható tokenhossz 300 karakter.
name	string		A tokenizer neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet.

MagnitudeScoringFunction

Olyan függvényt definiál, amely egy numerikus mező nagysága alapján növeli a pontszámokat.

Name	Típus	Description
boost	number	A nyers pontszám szorzója. Pozitív számnak kell lennie, amely nem lehet 1,0.
fieldName	string	A pontozási függvény bemeneteként használt mező neve.
interpolation	ScoringFunctionInterpolation	Egy érték, amely azt jelzi, hogy a kiemelés hogyan lesz interpolálva a dokumentum pontszámai között; alapértelmezés szerint "Lineáris".
magnitude	MagnitudeScoringParameters	A magnitúdópontozási függvény paraméterértékei.
type	string: magnitude	A használni kívánt függvény típusát jelzi. Az érvényes értékek közé tartozik a magnitúdó, a frissesség, a távolság és a címke. A függvénytípusnak kisbetűsnek kell lennie.

MagnitudeScoringParameters

Paraméterértékeket biztosít egy nagyságrendi pontozó függvénynek.

Name	Típus	Description
boostingRangeEnd	number	Az a mezőérték, amelynél a kiemelés véget ér.
boostingRangeStart	number	Az a mezőérték, amelynél a kiemelés kezdődik.
constantBoostBeyondRange	boolean	Egy érték, amely azt jelzi, hogy a tartomány végértékét meghaladó mezőértékek esetében állandó lökést kell-e alkalmazni; az alapértelmezett érték hamis.

MappingCharFilter

Karakterszűrő, amely a leképezési beállítással definiált leképezéseket alkalmazza. A megfeleltetés kapzsi (a leghosszabb mintaegyeztetés egy adott ponton nyer). A csere lehet üres sztring. Ez a karakterszűrő az Apache Lucene használatával van implementálva.

Name	Típus	Description
@odata.type	string: #Microsoft.Azure.Search.MappingCharFilter	A karakterszűrő típusát meghatározó URI-töredék.
mappings	string[]	A következő formátumú leképezések listája: "a=>b" (az "a" karakter minden előfordulása a "b" karakterrel lesz helyettesítve).
name	string	A karakterszűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet.

MicrosoftLanguageStemmingTokenizer

Nyelvspecifikus szabályokkal osztja el a szöveget, és csökkenti a szavak alapformáit.

Name	Típus	Alapértelmezett érték	Description
@odata.type	string: #Microsoft.Azure.Search.MicrosoftLanguageStemmingTokenizer		Egy URI-töredék, amely a tokenizer típusát határozza meg.
isSearchTokenizer	boolean	False	A tokenizer használatát jelző érték. Állítsa igaz értékre, ha keresési jogkivonat-szabályzóként használják, állítsa hamis értékre, ha indexelő jogkivonat-szabályzóként használják. Az alapértelmezett érték a false (hamis).
language	MicrosoftStemmingTokenizerLanguage		A használni kívánt nyelv. Az alapértelmezett érték az angol.
maxTokenLength	integer	255	A jogkivonat maximális hossza. A maximális hossznál hosszabb jogkivonatok fel vannak osztva. A használható jogkivonatok maximális hossza 300 karakter. A 300 karakternél hosszabb jogkivonatok először 300 hosszúságú jogkivonatokra lesznek felosztva, majd az egyes jogkivonatok felosztása a jogkivonatok maximális hosszának beállítása alapján történik. Az alapértelmezett érték 255.
name	string		A tokenizer neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet.

MicrosoftLanguageTokenizer

Nyelvspecifikus szabályokkal osztja el a szöveget.

Name	Típus	Alapértelmezett érték	Description
@odata.type	string: #Microsoft.Azure.Search.MicrosoftLanguageTokenizer		Egy URI-töredék, amely a tokenizer típusát határozza meg.
isSearchTokenizer	boolean	False	A tokenizer használatát jelző érték. Állítsa igaz értékre, ha keresési jogkivonat-szabályzóként használják, állítsa hamis értékre, ha indexelő jogkivonat-szabályzóként használják. Az alapértelmezett érték a false (hamis).
language	MicrosoftTokenizerLanguage		A használni kívánt nyelv. Az alapértelmezett érték az angol.
maxTokenLength	integer	255	A jogkivonat maximális hossza. A maximális hossznál hosszabb jogkivonatok fel vannak osztva. A használható jogkivonatok maximális hossza 300 karakter. A 300 karakternél hosszabb jogkivonatok először 300 hosszúságú jogkivonatokra lesznek felosztva, majd az egyes jogkivonatok felosztása a jogkivonatok maximális hosszának beállítása alapján történik. Az alapértelmezett érték 255.
name	string		A tokenizer neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet.

MicrosoftStemmingTokenizerLanguage

Listák a Microsoft-nyelv által támogatott nyelveket, amely a jogkivonat-szabályzóból származik.

Name	Típus	Description
arabic	string	Kiválasztja a Microsoft-alapú jogkivonat-jelölőt arab nyelven.
bangla	string	A Bangla microsoftos jogkivonat-jelölőjének kiválasztása.
bulgarian	string	Kiválasztja a microsoftos jogkivonat-jelölőt a bolgár nyelvhez.
catalan	string	Kiválasztja a Microsoft-alapú jogkivonat-jelölőt katalán nyelven.
croatian	string	Kiválasztja a Microsoft-alapú jogkivonat-jelölőt a horvát nyelvhez.
czech	string	Kiválasztja a Microsoft-alapú jogkivonat-kezelőt a csehhez.
danish	string	Kiválasztja a Microsoft-alapú jogkivonat-jelölőt dán nyelven.
dutch	string	Kiválasztja a Microsoft-alapú jogkivonat-kezelőt a holland nyelvhez.
english	string	Kiválasztja a Microsoft-alapú jogkivonat-kezelőt angol nyelven.
estonian	string	Kiválasztja az észt microsoftos jogkivonat-kezelőt.
finnish	string	Kiválasztja a microsoftos jogkivonat-kezelőt a finn nyelvhez.
french	string	Kiválasztja a Microsoft-alapú jogkivonat-jelölőt francia nyelven.
german	string	A microsoftos jogkivonat-jelölőt választja a német nyelvhez.
greek	string	Kiválasztja a Microsoft-alapú jogkivonat-kezelőt a göröghöz.
gujarati	string	A Gujarati microsoftos jogkivonat-kezelőjének kiválasztása.
hebrew	string	Kiválasztja a Microsoft-alapú jogkivonat-jelölőt héberül.
hindi	string	Kiválasztja a Hindihez tartozó Microsoft-jogkivonat-jelölőt.
hungarian	string	Kiválasztja a Microsoft-alapú jogkivonat-kezelőt magyar nyelven.
icelandic	string	Kiválasztja az izlandi Microsoft-jogkivonat-jelölőt.
indonesian	string	Kiválasztja az indonéz Microsoft-alapú jogkivonat-kezelőt.
italian	string	Kiválasztja az olasz microsoftos jogkivonat-kezelőt.
kannada	string	A Kannada microsoftos jogkivonat-jelölőjének kiválasztása.
latvian	string	A Letthöz tartozó Microsoft-jogkivonat-jelölő kiválasztása.
lithuanian	string	Kiválasztja a microsoftos jogkivonat-jelölőt a litvánhoz.
malay	string	Kiválasztja a Malájhoz tartozó Microsoft-jogkivonat-kezelőt.
malayalam	string	Kiválasztja a Malayalamhoz tartozó Microsoft-jogkivonat-jelölőt.
marathi	string	Kiválasztja a Marathihoz tartozó Microsoft-jogkivonat-jelölőt.
norwegianBokmaal	string	Kiválasztja a Microsoft stemming tokenizer for Norwegian (Bokmål) elemét.
polish	string	Kiválasztja a Microsoft-alapú jogkivonat-jelölőt a lengyelhez.
portuguese	string	Kiválasztja a microsoftos jogkivonat-jelölőt portugálul.
portugueseBrazilian	string	Kiválasztja a Portugál (Brazília) microsoftos jogkivonat-jelölőt.
punjabi	string	Kiválasztja a Punjabihoz tartozó Microsoft-jogkivonat-jelölőt.
romanian	string	Kiválasztja a Microsoft-alapú jogkivonat-jelölőt a román nyelvhez.
russian	string	Kiválasztja a Microsoft által létrehozott jogkivonat-jelölőt orosz nyelven.
serbianCyrillic	string	A Szerb (cirill betűs) microsoftos jogkivonat-jelölőt választja ki.
serbianLatin	string	Kiválasztja a Microsoft-alapú jogkivonat-jelölőt szerb (latin) nyelven.
slovak	string	Kiválasztja a Microsoft-alapú jogkivonat-jelölőt a szlovák nyelvhez.
slovenian	string	Kiválasztja a microsoftos jogkivonat-jelölőt a szlovénhez.
spanish	string	Kiválasztja a Microsoft-alapú jogkivonat-kezelőt spanyol nyelven.
swedish	string	Kiválasztja a microsoftos jogkivonat-kezelőt svéd nyelven.
tamil	string	Kiválasztja a Microsoft által létrehozott jogkivonat-jelölőt a Tamilhez.
telugu	string	Kiválasztja a TeluguHoz tartozó Microsoft-jogkivonat-jelölőt.
turkish	string	Kiválasztja a Törökhöz tartozó Microsoft-jogkivonat-jelölőt.
ukrainian	string	Kiválasztja az ukrán microsoftos jogkivonat-kezelőt.
urdu	string	Kiválasztja a Microsoft-alapú jogkivonat-jelölőt az Urduhoz.

MicrosoftTokenizerLanguage

Listák a Microsoft nyelvi tokenizer által támogatott nyelveket.

Name	Típus	Description
bangla	string	A Bangla Microsoft-jogkivonat-jelölőjének kiválasztása.
bulgarian	string	Kiválasztja a Bolgár Microsoft-jogkivonat-jelölőt.
catalan	string	Kiválasztja a Microsoft-jogkivonat-jelölőt a katalánhoz.
chineseSimplified	string	Kiválasztja a Microsoft-jogkivonat-készítőt a kínaihoz (egyszerűsített).
chineseTraditional	string	Kiválasztja a Kínai (hagyományos) Microsoft-jogkivonat-jelölőt.
croatian	string	Kiválasztja a Microsoft-jogkivonat-jelölőt a horváthoz.
czech	string	Kiválasztja a Microsoft-jogkivonat-jelölőt a csehhez.
danish	string	Kiválasztja a Microsoft-jogkivonat-jelölőt dán nyelven.
dutch	string	Kiválasztja a Microsoft holland jogkivonat-jelölőt.
english	string	A Microsoft angol jogkivonat-jelölőjének kiválasztása.
french	string	Kiválasztja a Microsoft-jogkivonat-jelölőt francia nyelven.
german	string	Kiválasztja a Microsoft-jogkivonat-jelölőt a német nyelvhez.
greek	string	Kiválasztja a Microsoft-jogkivonat-jelölőt a göröghöz.
gujarati	string	Kiválasztja a Microsoft-jogkivonat-jelölőt Gujaratihoz.
hindi	string	Kiválasztja a Hindihez készült Microsoft-jogkivonat-jelölőt.
icelandic	string	Kiválasztja az izlandi Microsoft-jogkivonat-jelölőt.
indonesian	string	Kiválasztja az indonéz Microsoft-jogkivonat-jelölőt.
italian	string	Kiválasztja az olasz Microsoft-jogkivonat-jelölőt.
japanese	string	Kiválasztja a Japánhoz készült Microsoft-jogkivonat-jelölőt.
kannada	string	A Kannada Microsoft-jogkivonat-jelölőjének kiválasztása.
korean	string	Kiválasztja a Koreai Microsoft-jogkivonat-jelölőt.
malay	string	Kiválasztja a Microsoft-jogkivonat-jelölőt malájhoz.
malayalam	string	Kiválasztja a Microsoft-jogkivonat-jelölőt a Malayalamhoz.
marathi	string	Kiválasztja a Marathihoz készült Microsoft-jogkivonat-jelölőt.
norwegianBokmaal	string	Kiválasztja a Microsoft tokenizert a norvég (Bokmål) számára.
polish	string	Kiválasztja a Microsoft-jogkivonat-jelölőt a lengyelhez.
portuguese	string	Kiválasztja a Microsoft-jogkivonat-jelölőt portugálul.
portugueseBrazilian	string	Kiválasztja a Microsoft-jogkivonat-jelölőt portugál (Brazília) nyelvhez.
punjabi	string	Kiválasztja a Punjabihoz tartozó Microsoft-jogkivonat-jelölőt.
romanian	string	Kiválasztja a Microsoft-jogkivonat-jelölőt a román nyelvhez.
russian	string	Kiválasztja a Microsoft-jogkivonat-jelölőt orosz nyelven.
serbianCyrillic	string	A Szerb (cirill betűs) Microsoft-jogkivonat-jelölőt választja ki.
serbianLatin	string	Kiválasztja a Microsoft tokenizert szerb (latin) nyelven.
slovenian	string	Kiválasztja a szlovén Microsoft-jogkivonat-jelölőt.
spanish	string	Kiválasztja a Microsoft-jogkivonat-jelölőt spanyolul.
swedish	string	Kiválasztja a Svéd Microsoft-jogkivonat-jelölőt.
tamil	string	Kiválasztja a Microsoft-jogkivonat-jelölőt a Tamilhez.
telugu	string	Kiválasztja a Teluguhoz készült Microsoft-jogkivonat-jelölőt.
thai	string	Kiválasztja a Microsoft-jogkivonat-kezelőt thai nyelven.
ukrainian	string	Kiválasztja az ukrán Microsoft-jogkivonat-jelölőt.
urdu	string	Kiválasztja az Urduhoz tartozó Microsoft-jogkivonat-jelölőt.
vietnamese	string	Kiválasztja a Vietnami Microsoft-jogkivonat-jelölőt.

NGramTokenFilter

A megadott méret(ek) n-grammját hozza létre. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.

Name	Típus	Alapértelmezett érték	Description
@odata.type	string: #Microsoft.Azure.Search.NGramTokenFilter		Egy URI-töredék, amely megadja a tokenszűrő típusát.
maxGram	integer	2	A maximális n-gram hossz. Az alapértelmezett érték 2.
minGram	integer	1	Az n-gramm minimális hossza. Az alapértelmezett érték 1. A maxGram értékénél kisebbnek kell lennie.
name	string		A jogkivonatszűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet.

NGramTokenFilterV2

A megadott méret(ek) n-grammját hozza létre. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.

Name	Típus	Alapértelmezett érték	Description
@odata.type	string: #Microsoft.Azure.Search.NGramTokenFilterV2		Egy URI-töredék, amely megadja a tokenszűrő típusát.
maxGram	integer	2	A maximális n-gram hossz. Az alapértelmezett érték 2. A maximális érték 300.
minGram	integer	1	Az n-gramm minimális hossza. Az alapértelmezett érték 1. A maximális érték 300. A maxGram értékénél kisebbnek kell lennie.
name	string		A jogkivonatszűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet.

NGramTokenizer

Tokenizálja a bemenetet az adott méret(ek) n-grammjára. Ez a jogkivonat-szabályzó az Apache Lucene használatával van implementálva.

Name	Típus	Alapértelmezett érték	Description
@odata.type	string: #Microsoft.Azure.Search.NGramTokenizer		Egy URI-töredék, amely a tokenizer típusát határozza meg.
maxGram	integer	2	A maximális n-gram hossz. Az alapértelmezett érték 2. A maximális érték 300.
minGram	integer	1	Az n-gramm minimális hossza. Az alapértelmezett érték 1. A maximális érték 300. A maxGram értékénél kisebbnek kell lennie.
name	string		A tokenizer neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet.
tokenChars	TokenCharacterKind[]		A tokenekben megtartandó karakterosztályok.

OutputFieldMappingEntry

Egy képesség kimeneti mezőleképezése.

Name	Típus	Description
name	string	A képesség által definiált kimenet neve.
targetName	string	A kimenet célneve. A név megadása nem kötelező, és alapértelmezés szerint a név megadása kötelező.

PathHierarchyTokenizerV2

Tokenizer elérésiút-szerű hierarchiákhoz. Ez a jogkivonat-szabályzó az Apache Lucene használatával van implementálva.

Name	Típus	Alapértelmezett érték	Description
@odata.type	string: #Microsoft.Azure.Search.PathHierarchyTokenizerV2		Egy URI-töredék, amely a tokenizer típusát határozza meg.
delimiter	string	/	A használni kívánt elválasztó karakter. Az alapértelmezett érték a "/".
maxTokenLength	integer	300	A jogkivonat maximális hossza. Az alapértelmezett és a maximális érték 300.
name	string		A tokenizer neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet.
replacement	string	/	Egy érték, amely ha be van állítva, lecseréli a határoló karaktert. Az alapértelmezett érték a "/".
reverse	boolean	False	Egy érték, amely azt jelzi, hogy fordított sorrendben kell-e létrehozni a jogkivonatokat. Az alapértelmezett érték a false (hamis).
skip	integer	0	A kihagyandó kezdeti tokenek száma. Az alapértelmezett érték a 0.

PatternAnalyzer

A szöveget rugalmasan elválasztja a kifejezések között egy reguláris kifejezésmintán keresztül. Ez az elemző az Apache Lucene használatával van implementálva.

Name	Típus	Alapértelmezett érték	Description
@odata.type	string: #Microsoft.Azure.Search.PatternAnalyzer		Az elemző típusát meghatározó URI-töredék.
flags	RegexFlags		Reguláris kifejezésjelölők.
lowercase	boolean	True	Érték, amely azt jelzi, hogy a kifejezések kisbetűsek-e. Alapértelmezett érték: true (igaz).
name	string		Az elemző neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet.
pattern	string	\W+	Normál kifejezésminta a tokenelválasztókhoz. Az alapértelmezett kifejezés egy vagy több nem szó karakternek megfelelő kifejezés.
stopwords	string[]		A stopszavak listája.

PatternCaptureTokenFilter

Java-regexek használatával több jogkivonatot bocsát ki – egyet minden rögzítési csoporthoz egy vagy több mintában. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.

Name	Típus	Alapértelmezett érték	Description
@odata.type	string: #Microsoft.Azure.Search.PatternCaptureTokenFilter		A tokenszűrő típusát meghatározó URI-töredék.
name	string		A jogkivonatszűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet.
patterns	string[]		Az egyes tokenekhez illeszkedő minták listája.
preserveOriginal	boolean	True	Egy érték, amely azt jelzi, hogy az eredeti jogkivonatot akkor is vissza kell-e adni, ha az egyik minta megegyezik. Alapértelmezett érték: true (igaz).

PatternReplaceCharFilter

Karakterszűrő, amely lecseréli a bemeneti sztringben szereplő karaktereket. Egy reguláris kifejezéssel azonosítja a megőrizni kívánt karaktersorozatokat, a lecserélendő karaktereket pedig helyettesítő mintával azonosítja. Ha például az "aa bb aa bb", a "(aa)\s+(bb)" minta és az "$1#$2" helyettesítő szöveg szerepel, az eredmény "aa#bb aa#bb". Ez a karakterszűrő az Apache Lucene használatával van implementálva.

Name	Típus	Description
@odata.type	string: #Microsoft.Azure.Search.PatternReplaceCharFilter	A karakterszűrő típusát meghatározó URI-töredék.
name	string	A karakterszűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet.
pattern	string	Egy reguláris kifejezésminta.
replacement	string	A helyettesítő szöveg.

PatternReplaceTokenFilter

Karakterszűrő, amely lecseréli a bemeneti sztringben szereplő karaktereket. Egy reguláris kifejezéssel azonosítja a megőrizni kívánt karaktersorozatokat, a lecserélendő karaktereket pedig helyettesítő mintával azonosítja. Ha például az "aa bb aa bb", a "(aa)\s+(bb)" minta és az "$1#$2" helyettesítő szöveg szerepel, az eredmény "aa#bb aa#bb". Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.

Name	Típus	Description
@odata.type	string: #Microsoft.Azure.Search.PatternReplaceTokenFilter	A tokenszűrő típusát meghatározó URI-töredék.
name	string	A jogkivonatszűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet.
pattern	string	Egy reguláris kifejezésminta.
replacement	string	A helyettesítő szöveg.

PatternTokenizer

Tokenizer, amely regex mintaegyeztetést használ a különböző tokenek létrehozásához. Ez a jogkivonat-szabályzó az Apache Lucene használatával van implementálva.

Name	Típus	Alapértelmezett érték	Description
@odata.type	string: #Microsoft.Azure.Search.PatternTokenizer		Egy URI-töredék, amely a tokenizer típusát határozza meg.
flags	RegexFlags		Reguláris kifejezésjelölők.
group	integer	-1	Az egyező csoport nulla alapú sorszáma a reguláris kifejezésmintában, amely tokenekké nyerhető ki. Használja a -1 értéket, ha a teljes mintát szeretné használni a bemenet jogkivonatokra való felosztásához, függetlenül az egyező csoportoktól. Az alapértelmezett érték -1.
name	string		A tokenizer neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet.
pattern	string	\W+	Normál kifejezésminta a tokenelválasztókhoz. Az alapértelmezett kifejezés egy vagy több nem szó karakternek megfelelő kifejezés.

PhoneticEncoder

A fonetikus kódoló fonetikus kódoló típusát azonosítja a PhoneticTokenFilterrel való használathoz.

Name	Típus	Description
beiderMorse	string	Kódol egy jogkivonatot egy Beider-Morse értékre.
caverphone1	string	Kódol egy tokent egy Caverphone 1.0 értékre.
caverphone2	string	Kódol egy tokent egy Caverphone 2.0 értékre.
cologne	string	Kódol egy jogkivonatot egy kölni fonetikus értékre.
doubleMetaphone	string	Egy jogkivonatot dupla metafonértékké kódol.
haasePhonetik	string	Kódol egy jogkivonatot a Kölner Phonetik algoritmus Haase finomításával.
koelnerPhonetik	string	Kódol egy jogkivonatot a Kölner Phonetik algoritmussal.
metaphone	string	Kódol egy tokent metafonértékké.
nysiis	string	Kódol egy jogkivonatot EGY NYSIIS-értékbe.
refinedSoundex	string	Egy jogkivonatot pontosított Soundex-értékké kódol.
soundex	string	Egy jogkivonatot Soundex-értékké kódol.

PhoneticTokenFilter

Létrehozás fonetikus egyezések tokenjei. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.

Name	Típus	Alapértelmezett érték	Description
@odata.type	string: #Microsoft.Azure.Search.PhoneticTokenFilter		A tokenszűrő típusát meghatározó URI-töredék.
encoder	PhoneticEncoder	metaphone	A használni kívánt fonetikus kódoló. Az alapértelmezett érték a "metaphone".
name	string		A jogkivonatszűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet.
replace	boolean	True	Egy érték, amely azt jelzi, hogy a kódolt jogkivonatok lecserélik-e az eredeti jogkivonatokat. Ha hamis, a kódolt jogkivonatok szinonimákként lesznek hozzáadva. Alapértelmezett érték: true (igaz).

PrioritizedFields

A szemantikai rangsoroláshoz, feliratokhoz, kiemelésekhez és válaszokhoz használandó cím-, tartalom- és kulcsszavak mezőit ismerteti.

Name	Típus	Description
prioritizedContentFields	SemanticField[]	Meghatározza a szemantikai rangsoroláshoz, feliratokhoz, kiemelésekhez és válaszokhoz használandó tartalommezőket. A legjobb eredmény érdekében a kijelölt mezőknek természetes nyelvű szöveget kell tartalmazniuk. A tömb mezőinek sorrendje a prioritásukat jelöli. Az alacsonyabb prioritású mezők csonkulhatnak, ha a tartalom hosszú.
prioritizedKeywordsFields	SemanticField[]	Meghatározza a szemantikai rangsoroláshoz, feliratokhoz, kiemelésekhez és válaszokhoz használandó kulcsszómezőket. A legjobb eredmény érdekében a kijelölt mezőknek tartalmazniuk kell a kulcsszavak listáját. A tömb mezőinek sorrendje a prioritásukat jelöli. Az alacsonyabb prioritású mezők csonkulhatnak, ha a tartalom hosszú.
titleField	SemanticField	Meghatározza a szemantikai rangsoroláshoz, feliratokhoz, kiemelésekhez és válaszokhoz használandó címmezőt. Ha nincs címmező az indexben, hagyja üresen ezt a mezőt.

RegexFlags

Definiálja azokat a jelzőket, amelyek kombinálhatók annak szabályozásához, hogy a rendszer hogyan használja a reguláris kifejezéseket a mintaelemzőben és a minta jogkivonat-jelölőjében.

Name	Típus	Description
CANON_EQ	string	Engedélyezi a canonikus egyenértékűséget.
CASE_INSENSITIVE	string	Engedélyezi a kis- és nagybetűk érzéketlen egyeztetését.
COMMENTS	string	Engedélyezi a térközt és a megjegyzéseket a mintában.
DOTALL	string	Engedélyezi a dotall módot.
LITERAL	string	Lehetővé teszi a minta literális elemzését.
MULTILINE	string	Engedélyezi a többsoros módot.
UNICODE_CASE	string	Engedélyezi a Unicode-ra képes kis- és nagybetűk összecsukását.
UNIX_LINES	string	Engedélyezi a Unix-vonalak üzemmódot.

ScalarQuantizationParameters

A skaláris kvantálásra jellemző paramétereket tartalmazza.

Name	Típus	Description
quantizedDataType	VectorSearchCompressionTargetDataType	A tömörített vektorértékek kvantált adattípusa.

ScalarQuantizationVectorSearchCompressionConfiguration

Az indexelés és lekérdezés során használt skaláris kvantálási tömörítési módszerre vonatkozó konfigurációs beállításokat tartalmazza.

Name	Típus	Alapértelmezett érték	Description
defaultOversampling	number		Alapértelmezett túlméretezési tényező. A túlbélyegző belsőleg több dokumentumot kér (ezt a szorzót határozza meg) a kezdeti keresésben. Ez növeli a teljes pontosságú vektorok újrafordított hasonlósági pontszámával újrafordított eredmények készletét. A minimális érték 1, ami azt jelenti, hogy nincs túlampling (1x). Ez a paraméter csak akkor állítható be, ha a rerankWithOriginalVectors értéke igaz. A magasabb értékek a késés rovására javítják a visszahívást.
kind	string: scalarQuantization		A vektorkereséshez konfigurált tömörítési módszer neve.
name	string		Az adott konfigurációhoz társítandó név.
rerankWithOriginalVectors	boolean	True	Ha igaz értékre van állítva, a tömörített vektorokkal kiszámított rendezett eredményhalmaz lekérése után a rendszer újraszámítja őket a teljes pontosságú hasonlósági pontszámok újraszámításával. Ez a késés rovására javítja a visszahívást.
scalarQuantizationParameters	ScalarQuantizationParameters		A skaláris kvantálásra jellemző paramétereket tartalmazza.

ScoringFunctionAggregation

Meghatározza az összesítési függvényt, amely a pontozási profil összes pontozási függvényének eredményeit egyesíti.

Name	Típus	Description
average	string	A pontszámok növelése az összes pontozási függvény eredményeinek átlagával.
firstMatching	string	Pontszámok növelése a pontozási profil első alkalmazható pontozási függvényével.
maximum	string	A pontszámok növelése az összes pontozási függvény eredményének maximális értékével.
minimum	string	A pontszámok növelése a pontozási függvények eredményeinek minimális értékével.
sum	string	A pontszámok növelése az összes pontozófüggvény eredményének összegével.

ScoringFunctionInterpolation

Meghatározza azt a függvényt, amellyel a pontszámok felpörgethetőek egy dokumentumtartományban.

Name	Típus	Description
constant	string	Állandó tényezővel növeli a pontszámokat.
linear	string	Lineárisan csökkenő mennyiséggel növeli a pontszámokat. Ez a pontozófüggvények alapértelmezett interpolációja.
logarithmic	string	A pontszámokat a logaritmikusan csökkenő mennyiséggel növeli. A magasabb pontszámok esetében a kiemelések gyorsan csökkennek, és lassabban, ahogy a pontszámok csökkennek. Ez az interpolációs beállítás nem engedélyezett a címkepontozási függvényekben.
quadratic	string	A pontszámokat kvadratikusan csökkenő összeggel növeli. A magasabb pontszámok esetében az lökések lassan csökkennek, és gyorsabban, ahogy a pontszámok csökkennek. Ez az interpolációs beállítás nem engedélyezett a címkepontozási függvényekben.

ScoringProfile

Olyan keresési index paramétereit határozza meg, amelyek befolyásolják a keresési lekérdezések pontozását.

Name	Típus	Description
functionAggregation	ScoringFunctionAggregation	Az egyes pontozófüggvények eredményeinek kombinálását jelző érték. Alapértelmezés szerint a "Sum" (Összeg) értékre van kapcsolva. Figyelmen kívül hagyja, ha nincsenek pontozófüggvények.
functions	ScoringFunction[]: DistanceScoringFunction[] FreshnessScoringFunction[] MagnitudeScoringFunction[] TagScoringFunction[]	A dokumentumok pontozását befolyásoló függvények gyűjteménye.
name	string	A pontozási profil neve.
text	TextWeights	Olyan paraméterek, amelyek bizonyos indexmezők szöveges egyezései alapján növelik a pontozást.

SearchField

Egy indexdefinícióban lévő mezőt jelöl, amely leírja egy mező nevét, adattípusát és keresési viselkedését.

Name	Típus	Description
analyzer	LexicalAnalyzerName	A mezőhöz használandó elemző neve. Ez a beállítás csak kereshető mezőkkel használható, és nem állítható be a searchAnalyzer vagy az indexAnalyzer paraméterrel együtt. Az elemző kiválasztása után nem módosítható a mezőhöz. Komplex mezők esetén null értékűnek kell lennie.
dimensions	integer	A vektormező dimenziója.
facetable	boolean	Egy érték, amely azt jelzi, hogy engedélyezi-e a mező hivatkozását az aspektusos lekérdezésekben. Általában a találatok kategória szerinti számát (például digitális kamerák keresését és a találatok márka, megapixelek, ár stb. szerinti megtekintését) tartalmazó keresési eredmények bemutatójában használatos. Ennek a tulajdonságnak null értékűnek kell lennie az összetett mezők esetében. Az Edm.GeographyPoint vagy a Collection(Edm.GeographyPoint) típusú mezők nem lehetnek facetablek. Az alapértelmezett érték az összes többi egyszerű mezőre igaz.
fields	SearchField[]	Almezők listája, ha ez egy Edm.ComplexType vagy Collection(Edm.ComplexType) típusú mező. Egyszerű mezők esetén null értékűnek vagy üresnek kell lennie.
filterable	boolean	Egy érték, amely azt jelzi, hogy engedélyezi-e a mező hivatkozását $filter lekérdezésekben. a szűrhető a sztringek kezelésének módjában különbözik a kereshetőtől. A szűrhető Edm.String vagy Collection(Edm.String) típusú mezők nem esnek szótörésbe, így az összehasonlítások csak pontos egyezésekre használhatók. Ha például egy ilyen f mezőt "napos nap" értékre állít be, $filter=f eq "sunny" nem talál egyezést, de $filter=f eq "napos nap" lesz. Ennek a tulajdonságnak null értékűnek kell lennie az összetett mezők esetében. Az alapértelmezett érték az egyszerű mezőkre, az összetett mezőkre pedig a null értékre vonatkozik.
indexAnalyzer	LexicalAnalyzerName	A mező indexelésekor használt elemző neve. Ez a beállítás csak kereshető mezőkkel használható. A searchAnalyzerrel együtt kell beállítani, és nem állítható be az elemző beállítással együtt. Ez a tulajdonság nem állítható be nyelvelemző nevére; használja inkább az analyzer tulajdonságot, ha nyelvelemzőre van szüksége. Az elemző kiválasztása után nem módosítható a mezőhöz. Komplex mezők esetén null értékűnek kell lennie.
key	boolean	Egy érték, amely azt jelzi, hogy a mező egyedileg azonosítja-e az indexben lévő dokumentumokat. Minden indexben pontosan egy legfelső szintű mezőt kell kiválasztani kulcsmezőként, és Edm.String típusúnak kell lennie. A kulcsmezők a dokumentumok közvetlen keresésére és adott dokumentumok frissítésére vagy törlésére használhatók. Az alapértelmezett érték az egyszerű mezők esetében hamis, az összetett mezők esetében pedig null.
name	string	A mező neve, amelynek egyedinek kell lennie az index vagy szülőmező mezőgyűjteményében.
normalizer	LexicalNormalizerName	A mezőhöz használandó normalizáló neve. Ez a beállítás csak szűrhető, rendezhető vagy táblázatos mezőkkel használható. A normalizáló kiválasztása után nem módosítható a mezőhöz. Komplex mezők esetén null értékűnek kell lennie.
retrievable	boolean	Egy érték, amely azt jelzi, hogy a mező visszaadható-e egy keresési eredményben. Ezt a beállítást letilthatja, ha egy mezőt (például margót) szeretne szűrőként, rendezési vagy pontozási mechanizmusként használni, de nem szeretné, hogy a mező látható legyen a végfelhasználó számára. Ennek a tulajdonságnak igaznak kell lennie a kulcsmezők esetében, és az összetett mezők esetében null értékűnek kell lennie. Ez a tulajdonság meglévő mezőkön módosítható. A tulajdonság engedélyezése nem okozza az indextárolási követelmények növekedését. Az alapértelmezett érték igaz az egyszerű mezőkre, a hamis a vektormezőkre, a null érték pedig az összetett mezőkre.
searchAnalyzer	LexicalAnalyzerName	A mező keresési idején használt elemző neve. Ez a beállítás csak kereshető mezőkkel használható. Az indexAnalyzerrel együtt kell beállítani, és nem állítható be az elemző beállítással együtt. Ez a tulajdonság nem állítható be nyelvelemző nevére; használja inkább az analyzer tulajdonságot, ha nyelvelemzőre van szüksége. Ez az elemző frissíthető egy meglévő mezőn. Komplex mezők esetén null értékűnek kell lennie.
searchable	boolean	Egy érték, amely azt jelzi, hogy a mező kereshető-e. Ez azt jelenti, hogy az indexelés során olyan elemzések mennek végbe, mint a szótörés. Ha egy kereshető mező értékének például a „sunny day” szöveget adja meg, akkor az két különálló tokenre lesz bontva: „sunny” és „day”. Ez lehetővé teszi a kifejezések teljes szöveges keresését. Az Edm.String vagy Collection(Edm.String) típusú mezők alapértelmezés szerint kereshetők. Ennek a tulajdonságnak hamisnak kell lennie más nem sztring típusú egyszerű mezők esetében, és az összetett mezők esetében null értékűnek kell lennie. Megjegyzés: A kereshető mezők extra helyet foglalnak el az indexben, hogy a teljes szöveges keresésekhez a mezőérték további jogkivonatos verzióit is elférjenek. Ha helyet szeretne menteni az indexben, és nincs szükség arra, hogy egy mező szerepeljen a keresésekben, állítsa a kereshető értéket false (hamis) értékre.
sortable	boolean	Egy érték, amely azt jelzi, hogy engedélyezi-e a mező hivatkozását $orderby kifejezésekben. Alapértelmezés szerint a keresőmotor pontszám szerint rendezi az eredményeket, de sok esetben a felhasználók a dokumentumok mezői szerint szeretnének rendezni. Az egyszerű mezők csak akkor rendezhetők, ha egyértékűek (egyetlen értékkel rendelkezik a szülődokumentum hatókörében). Az egyszerű gyűjteménymezők nem rendezhetők, mivel többértékűek. Az összetett gyűjtemények egyszerű almezői szintén többértékűek, ezért nem rendezhetők. Ez akkor is igaz, ha egy közvetlen szülőmezőről vagy egy elődmezőről van szó, ez az összetett gyűjtemény. Az összetett mezők nem rendezhetők, és a rendezhető tulajdonságnak null értékűnek kell lennie az ilyen mezők esetében. A rendezhető alapértelmezett értéke igaz az egyértékű egyszerű mezőkre, a többértékű egyszerű mezőkre hamis, az összetett mezők esetében pedig null értékre.
stored	boolean	Nem módosítható érték, amely azt jelzi, hogy a mező külön marad-e a lemezen, hogy a keresési eredményben megjelenjen. Ezt a beállítást letilthatja, ha nem tervezi visszaadni a mező tartalmát egy keresési válaszban, hogy a tárterület többletterhelését mentse. Ez csak az index létrehozásakor állítható be, és csak vektormezők esetén. Ez a tulajdonság nem módosítható meglévő mezők esetében, és nem állítható be hamis értékre az új mezők esetében. Ha ez a tulajdonság false (hamis) értékre van állítva, a "retrieveable" tulajdonságot is false (hamis) értékre kell állítani. Ennek a tulajdonságnak igaznak vagy nem halmaznak kell lennie a kulcsmezők, az új mezők és a nem vektoros mezők esetében, és az összetett mezők esetében null értékűnek kell lennie. A tulajdonság letiltása csökkenti az indextárolási követelményeket. Az alapértelmezett érték a vektormezők esetében igaz.
synonymMaps	string[]	A mezőhöz társítandó szinonimatérképek nevének listája. Ez a beállítás csak kereshető mezőkkel használható. Jelenleg mezőnként csak egy szinonimatérkép támogatott. Szinonimatérkép mezőhöz rendelése biztosítja, hogy a mezőt megcélzó lekérdezési kifejezések a szinonimatérkép szabályainak használatával lekérdezéskor ki legyenek bontva. Ez az attribútum a meglévő mezőkön módosítható. Az összetett mezők esetében null értékűnek vagy üres gyűjteménynek kell lennie.
type	SearchFieldDataType	A mező adattípusa.
vectorEncoding	VectorEncodingFormat	A mező tartalmának értelmezésére használt kódolási formátum.
vectorSearchProfile	string	A vektorkeresési profil neve, amely meghatározza a vektormezőben való kereséshez használni kívánt algoritmust és vektorizálót.

SearchFieldDataType

Meghatározza egy mező adattípusát egy keresési indexben.

Name	Típus	Description
Edm.Boolean	string	Azt jelzi, hogy egy mező logikai értéket (igaz vagy hamis) tartalmaz.
Edm.Byte	string	Azt jelzi, hogy egy mező 8 bites, aláíratlan egész számot tartalmaz. Ez csak a Collection(Edm.Byte) használatakor érvényes.
Edm.ComplexType	string	Azt jelzi, hogy egy mező egy vagy több összetett objektumot tartalmaz, amelyek más típusú almezőkkel rendelkeznek.
Edm.DateTimeOffset	string	Azt jelzi, hogy egy mező dátum-/időértéket tartalmaz, beleértve az időzónával kapcsolatos információkat is.
Edm.Double	string	Azt jelzi, hogy egy mező IEEE kettős pontosságú lebegőpontos számot tartalmaz.
Edm.GeographyPoint	string	Azt jelzi, hogy egy mező földrajzi helyet tartalmaz a hosszúság és a szélesség szempontjából.
Edm.Half	string	Azt jelzi, hogy egy mező félpontos lebegőpontos számot tartalmaz. Ez csak a Collection(Edm.Half) esetében érvényes.
Edm.Int16	string	Azt jelzi, hogy egy mező 16 bites aláírt egész számot tartalmaz. Ez csak a Collection(Edm.Int16) használatakor érvényes.
Edm.Int32	string	Azt jelzi, hogy egy mező 32 bites aláírt egész számot tartalmaz.
Edm.Int64	string	Azt jelzi, hogy egy mező 64 bites aláírt egész számot tartalmaz.
Edm.SByte	string	Azt jelzi, hogy egy mező egy 8 bites aláírt egész számot tartalmaz. Ez csak a Gyűjtemény (Edm.SByte) használatakor érvényes.
Edm.Single	string	Azt jelzi, hogy egy mező egy pontosságú lebegőpontos számot tartalmaz. Ez csak a Gyűjtemény (Edm.Single) használatakor érvényes.
Edm.String	string	Azt jelzi, hogy egy mező tartalmaz egy sztringet.

SearchIndex

A keresési index definícióját jelöli, amely egy index mezőit és keresési viselkedését ismerteti.

Name	Típus	Description
@odata.etag	string	Az index ETagje.
analyzers	LexicalAnalyzer[]: CustomAnalyzer[] LuceneStandardAnalyzer[] PatternAnalyzer[] StopAnalyzer[]	Az index elemzői.
charFilters	CharFilter[]: MappingCharFilter[] PatternReplaceCharFilter[]	Az index karakterszűrői.
corsOptions	CorsOptions	Az index forrásközi erőforrás-megosztásának (CORS) szabályozására szolgáló beállítások.
defaultScoringProfile	string	A használni kívánt pontozási profil neve, ha nincs megadva a lekérdezésben. Ha ez a tulajdonság nincs beállítva, és nincs megadva pontozási profil a lekérdezésben, akkor az alapértelmezett pontozás (tf-idf) lesz használva.
encryptionKey	SearchResourceEncryptionKey	Az Azure Key Vault-ben létrehozott titkosítási kulcs leírása. Ez a kulcs további titkosítási szintet biztosít az adatok számára, ha teljes körű biztosítékot szeretne kapni arról, hogy senki, még a Microsoft sem tudja visszafejteni az adatokat. Miután titkosította az adatokat, az mindig titkosítva marad. A keresési szolgáltatás figyelmen kívül hagyja a tulajdonság null értékűre történő beállítására tett kísérleteket. Szükség szerint módosíthatja ezt a tulajdonságot, ha el szeretné forgatni a titkosítási kulcsot; Az adatok nem lesznek hatással. Az ügyfél által felügyelt kulcsokkal történő titkosítás nem érhető el az ingyenes keresési szolgáltatásokhoz, és csak a 2019. január 1-jén vagy azt követően létrehozott fizetős szolgáltatásokhoz érhető el.
fields	SearchField[]	Az index mezői.
name	string	Az index neve.
normalizers	LexicalNormalizer[]: CustomNormalizer[]	Az index normalizálói.
scoringProfiles	ScoringProfile[]	Az index pontozási profiljai.
semantic	SemanticSettings	Olyan keresési index paramétereit határozza meg, amelyek befolyásolják a szemantikai képességeket.
similarity	Similarity: BM25Similarity ClassicSimilarity	A keresési lekérdezésnek megfelelő dokumentumok pontozásához és rangsorolásához használandó hasonlósági algoritmus típusa. A hasonlósági algoritmus csak az indexlétrehozáskor definiálható, és nem módosítható a meglévő indexeken. Null érték esetén a ClassicSimilarity algoritmust használja a rendszer.
suggesters	Suggester[]	Az index javaslattevői.
tokenFilters	TokenFilter[]: AsciiFoldingTokenFilter[] CjkBigramTokenFilter[] CommonGramTokenFilter[] DictionaryDecompounderTokenFilter[] EdgeNGramTokenFilter[] EdgeNGramTokenFilterV2[] ElisionTokenFilter[] KeepTokenFilter[] KeywordMarkerTokenFilter[] LengthTokenFilter[] LimitTokenFilter[] NGramTokenFilter[] NGramTokenFilterV2[] PatternCaptureTokenFilter[] PatternReplaceTokenFilter[] PhoneticTokenFilter[] ShingleTokenFilter[] SnowballTokenFilter[] StemmerOverrideTokenFilter[] StemmerTokenFilter[] StopwordsTokenFilter[] SynonymTokenFilter[] TruncateTokenFilter[] UniqueTokenFilter[] WordDelimiterTokenFilter[]	Az index jogkivonat-szűrői.
tokenizers	LexicalTokenizer[]: ClassicTokenizer[] EdgeNGramTokenizer[] KeywordTokenizer[] KeywordTokenizerV2[] LuceneStandardTokenizer[] LuceneStandardTokenizerV2[] MicrosoftLanguageStemmingTokenizer[] MicrosoftLanguageTokenizer[] NGramTokenizer[] PathHierarchyTokenizerV2[] PatternTokenizer[] UaxUrlEmailTokenizer[]	Az index jogkivonat-szabályzói.
vectorSearch	VectorSearch	A vektorkereséshez kapcsolódó konfigurációs beállításokat tartalmazza.

SearchIndexerDataNoneIdentity

Törli az adatforrás identitástulajdonságát.

Name	Típus	Description
@odata.type	string: #Microsoft.Azure.Search.DataNoneIdentity	Az identitás típusát meghatározó URI-töredék.

SearchIndexerDataUserAssignedIdentity

Megadja a használni kívánt adatforrás identitását.

Name	Típus	Description
@odata.type	string: #Microsoft.Azure.Search.DataUserAssignedIdentity	Az identitás típusát meghatározó URI-töredék.
userAssignedIdentity	string	A felhasználó által hozzárendelt felügyelt identitás teljes Azure-erőforrás-azonosítója általában a keresési szolgáltatáshoz hozzárendelt "/subscriptions/12345678-1234-1234-1234-1234567890ab/resourceGroups/rg/providers/Microsoft.ManagedIdentity/userAssignedIdentities/myId" formában található.

SearchResourceEncryptionKey

Ügyfél által felügyelt titkosítási kulcs az Azure Key Vault. A létrehozott és kezelt kulcsok az inaktív adatok, például indexek és szinonimák titkosítására vagy visszafejtésére használhatók.

Name	Típus	Description
accessCredentials	AzureActiveDirectoryApplicationCredentials	Az Azure Key Vault eléréséhez használt opcionális Azure Active Directory-hitelesítő adatok. Nem szükséges, ha felügyelt identitást használ helyette.
identity	SearchIndexerDataIdentity: SearchIndexerDataNoneIdentity SearchIndexerDataUserAssignedIdentity	Explicit felügyelt identitás ehhez a titkosítási kulcshoz. Ha nincs megadva, és a hozzáférési hitelesítő adatok tulajdonság null értékű, a rendszer a rendszer által hozzárendelt felügyelt identitást használja. Ha az erőforrás frissítésekor az explicit identitás nincs meghatározva, az változatlan marad. Ha a "nincs" érték van megadva, a tulajdonság értéke törlődik.
keyVaultKeyName	string	Az Inaktív adatok titkosításához használandó Azure-Key Vault kulcs neve.
keyVaultKeyVersion	string	Az Azure Key Vault kulcsának verziója, amellyel titkosíthatja az inaktív adatokat.
keyVaultUri	string	Az Azure Key Vault URI-ja, más néven DNS-név, amely tartalmazza az inaktív adatok titkosításához használandó kulcsot. Példa URI-ra: `https://my-keyvault-name.vault.azure.net`.

SemanticConfiguration

Egy adott konfigurációt határoz meg, amelyet a szemantikai képességek kontextusában kell használni.

Name	Típus	Description
name	string	A szemantikai konfiguráció neve.
prioritizedFields	PrioritizedFields	A szemantikai rangsoroláshoz, feliratokhoz, kiemelésekhez és válaszokhoz használandó cím- és tartalom- és kulcsszómezőket ismerteti. A három altulajdonság közül legalább egyet (titleField, prioritizedKeywordsFields és prioritizedContentFields) be kell állítani.

SemanticField

A szemantikai konfiguráció részeként használt mező.

Name	Típus	Description
fieldName	string

SemanticSettings

Olyan keresési index paramétereit határozza meg, amelyek befolyásolják a szemantikai képességeket.

Name	Típus	Description
configurations	SemanticConfiguration[]	Az index szemantikai konfigurációi.
defaultConfiguration	string	Lehetővé teszi egy alapértelmezett szemantikai konfiguráció nevének beállítását az indexben, így nem kötelező minden alkalommal lekérdezési paraméterként átadni.

ShingleTokenFilter

Tokenkombinációkat hoz létre egyetlen tokenként. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.

Name	Típus	Alapértelmezett érték	Description
@odata.type	string: #Microsoft.Azure.Search.ShingleTokenFilter		A tokenszűrő típusát meghatározó URI-töredék.
filterToken	string	_	A beszúrandó sztring minden olyan pozícióhoz, ahol nincs token. Az alapértelmezett érték egy aláhúzás ("_").
maxShingleSize	integer	2	A maximális zsindelyméret. Az alapértelmezett és minimális érték 2.
minShingleSize	integer	2	A minimális zsindelyméret. Az alapértelmezett és minimális érték 2. A maxShingleSize értékénél kisebbnek kell lennie.
name	string		A jogkivonatszűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet.
outputUnigrams	boolean	True	Egy érték, amely azt jelzi, hogy a kimeneti stream tartalmazza-e a bemeneti jogkivonatokat (unigramokat) és a zsindelyeket. Alapértelmezett érték: true (igaz).
outputUnigramsIfNoShingles	boolean	False	Egy érték, amely azt jelzi, hogy egygrammot kell-e kiadni azokra az időkre, amikor nem áll rendelkezésre zsindely. Ez a tulajdonság elsőbbséget élvez, ha az outputUnigrams értéke hamis. Az alapértelmezett érték a false (hamis).
tokenSeparator	string		A szomszédos tokenek összekapcsolásakor használandó sztring zsindely létrehozásához. Az alapértelmezett érték egyetlen szóköz (" ").

SnowballTokenFilter

Egy szűrő, amely a szavakat egy Snowball által generált őst használ. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.

Name	Típus	Description
@odata.type	string: #Microsoft.Azure.Search.SnowballTokenFilter	A tokenszűrő típusát meghatározó URI-töredék.
language	SnowballTokenFilterLanguage	A használni kívánt nyelv.
name	string	A jogkivonatszűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet.

SnowballTokenFilterLanguage

A Snowball-jogkivonat-szűrőhöz használandó nyelv.

Name	Típus	Description
armenian	string	Kiválasztja a Lucene Snowball stemming tokenizer for örmény.
basque	string	Kiválasztja a Lucene Snowball stemming tokenizert Baszk számára.
catalan	string	Kiválasztja a Lucene Snowball szárító tokenizer katalán.
danish	string	Kiválasztja a Lucene Snowball stemming tokenizert dánul.
dutch	string	Kiválasztja a Lucene Snowball stemming tokenizert hollandul.
english	string	Kiválasztja a Lucene Snowball stemming tokenizert angol nyelven.
finnish	string	Kiválasztja a Lucene Snowball stemming tokenizert a finn nyelvhez.
french	string	Kiválasztja a Francia Lucene Snowball-jogkivonat-jelölőt.
german	string	Kiválasztja a Lucene Snowball stemming tokenizer német nyelven.
german2	string	Kiválasztja a Lucene Snowball-alapú jogkivonat-készítőt, amely a német variáns algoritmust használja.
hungarian	string	Kiválasztja a Lucene Snowball stemming tokenizer for Hungarian (Lucene Snowball stemming tokenizer for Hungarian) lehetőséget.
italian	string	Kiválasztja az olasz Lucene Snowball-jogkivonat-jelölőt.
kp	string	Kiválasztja a Lucene Snowball származtatási jogkivonat-készítőt hollandul, amely a Kraaij-Pohlmann stemming algoritmust használja.
lovins	string	Kiválasztja a Lovins-eredeti algoritmust használó angol nyelvhez készült Lucene Snowball-jogkivonat-készítőt.
norwegian	string	Kiválasztja a Lucene Snowball stemming tokenizert a norvég nyelvhez.
porter	string	Kiválasztja az angol nyelvhez készült Lucene Snowball stemming tokenizert, amely a Porter stemming algoritmust használja.
portuguese	string	Kiválasztja a Lucene Snowball stemming tokenizert portugálul.
romanian	string	Kiválasztja a Lucene Snowball stemming tokenizer a román.
russian	string	Kiválasztja a Lucene Snowball-alapú jogkivonat-jelölőt az oroszhoz.
spanish	string	Kiválasztja a Lucene Snowball szárító tokenizer spanyol.
swedish	string	Kiválasztja a Lucene Snowball stemming tokenizer svéd.
turkish	string	Kiválasztja a Lucene Snowball stemming tokenizer for Török.

StemmerOverrideTokenFilter

Lehetővé teszi, hogy felülbírálja a többi stemming szűrőt a saját szótáralapú szárítással. A szótárból származó kifejezések kulcsszavakként lesznek megjelölve, így nem lesznek a láncban lévő stemmerek. A törzsszűrők elé kell helyezni. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.

Name	Típus	Description
@odata.type	string: #Microsoft.Azure.Search.StemmerOverrideTokenFilter	A tokenszűrő típusát meghatározó URI-töredék.
name	string	A jogkivonatszűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet.
rules	string[]	A következő formátumú stemming szabályok listája: "word => stem", például: "ran => run".

StemmerTokenFilter

Nyelvspecifikus eredetszűrő. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.

Name	Típus	Description
@odata.type	string: #Microsoft.Azure.Search.StemmerTokenFilter	A tokenszűrő típusát meghatározó URI-töredék.
language	StemmerTokenFilterLanguage	A használni kívánt nyelv.
name	string	A jogkivonatszűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet.

StemmerTokenFilterLanguage

A stemmer token szűrőhöz használandó nyelv.

Name	Típus	Description
arabic	string	Kiválasztja a Lucene-alapú jogkivonat-jelölőt arabul.
armenian	string	Kiválasztja az örmény Lucene-alapú jogkivonat-jelölőt.
basque	string	Kiválasztja a Lucene-alapú jogkivonat-jelölőt Baszk számára.
brazilian	string	Kiválasztja a Lucene-ből származó jogkivonat-jelölőt a portugál (Brazília) számára.
bulgarian	string	Kiválasztja a Lucene-alapú jogkivonat-jelölőt a bolgárhoz.
catalan	string	Kiválasztja a Lucene-alapú jogkivonat-jelölőt a katalánhoz.
czech	string	Kiválasztja a Lucene-alapú jogkivonat-jelölőt a csehhez.
danish	string	Kiválasztja a Lucene-alapú jogkivonat-jelölőt a dánhoz.
dutch	string	Kiválasztja a Lucene-alapú jogkivonat-jelölőt a hollandhoz.
dutchKp	string	Kiválasztja a Lucene-alapú jogkivonat-készítőt a holland nyelvhez, amely a Kraaij-Pohlmann származtatási algoritmust használja.
english	string	Kiválasztja a Lucene-alapú jogkivonat-jelölőt az angol nyelvhez.
finnish	string	Kiválasztja a Lucene-alapú jogkivonat-jelölőt a finn nyelvhez.
french	string	Kiválasztja a Francia Lucene-alapú jogkivonat-jelölőt.
galician	string	Kiválasztja a Lucene-alapú jogkivonat-jelölőt a galíciaihoz.
german	string	Kiválasztja a Lucene-alapú jogkivonat-jelölőt a német nyelvhez.
german2	string	Kiválasztja a német variáns algoritmust használó Lucene-alapú jogkivonat-készítőt.
greek	string	Kiválasztja a Lucene-alapú jogkivonat-jelölőt a göröghöz.
hindi	string	Kiválasztja a Lucene-alapú jogkivonat-jelölőt Hindi számára.
hungarian	string	Kiválasztja a Lucene-alapú jogkivonat-jelölőt a magyarhoz.
indonesian	string	Kiválasztja az indonéz Lucene-alapú jogkivonat-jelölőt.
irish	string	Kiválasztja az ír Lucene-alapú jogkivonat-jelölőt.
italian	string	Kiválasztja az olasz Lucene-alapú jogkivonat-jelölőt.
latvian	string	Kiválasztja a Lett lucene-alapú jogkivonat-jelölőt.
lightEnglish	string	Kiválasztja a Lucene-alapú jogkivonat-jelölőt az angol nyelvhez, amely könnyű leszármaztatást végez.
lightFinnish	string	Kiválasztja a Lucene-alapú jogkivonat-jelölőt a finn nyelvhez, amely könnyű leszármaztatást végez.
lightFrench	string	Kiválasztja a Lucene-alapú jogkivonat-jelölőt a francia nyelvhez, amely könnyű leszármaztatást végez.
lightGerman	string	Kiválasztja a Lucene-alapú jogkivonat-jelölőt a német nyelvhez, amely könnyű leszármaztatást végez.
lightHungarian	string	Kiválasztja a Lucene-alapú jogkivonat-jelölőt a magyarhoz, amely könnyű leszármaztatást végez.
lightItalian	string	Kiválasztja a Lucene-alapú jogkivonat-jelölőt az olaszhoz, amely könnyű leszármaztatást végez.
lightNorwegian	string	Kiválasztja a Lucene-alapú jogkivonat-jelölőt a norvég (Bokmål) számára, amely könnyű leszármaztatást végez.
lightNynorsk	string	Kiválasztja a Lucene stemming tokenizert a norvég (Nynorsk) számára, amely könnyű leszármaztatást végez.
lightPortuguese	string	Kiválasztja a Lucene-alapú jogkivonat-jelölőt a portugálhoz, amely könnyű leszármaztatást végez.
lightRussian	string	Kiválasztja a Lucene-alapú jogkivonat-jelölőt az oroszhoz, amely könnyű leszármaztatást végez.
lightSpanish	string	Kiválasztja a Lucene-alapú jogkivonat-jelölőt a spanyolhoz, amely könnyű leszármaztatást végez.
lightSwedish	string	Kiválasztja a Lucene-alapú jogkivonat-jelölőt a svédhez, amely könnyű leszármaztatást végez.
lovins	string	Kiválasztja a Lovins-származtatási algoritmust használó angol nyelvű Lucene-alapú jogkivonat-készítőt.
minimalEnglish	string	Kiválasztja a Lucene-alapú jogkivonat-jelölőt az angol nyelvhez, amely minimálisan száraz.
minimalFrench	string	Kiválasztja a Francia Lucene-alapú jogkivonat-jelölőt, amely minimálisan száraz.
minimalGalician	string	Kiválasztja a Lucene-alapú jogkivonat-jelölőt a galíciaihoz, amely minimálisan száraz.
minimalGerman	string	Kiválasztja a Lucene-alapú jogkivonat-jelölőt a német nyelvhez, amely minimálisan hajtja a szárat.
minimalNorwegian	string	Kiválasztja a Lucene stemming tokenizert norvég (Bokmål) számára, amely minimálisan száraz.
minimalNynorsk	string	Kiválasztja a Lucene-alapú jogkivonat-jelölőt a norvég (Nynorsk) számára, amely minimálisan száraz.
minimalPortuguese	string	Kiválasztja a Lucene-alapú jogkivonat-jelölőt a portugálhoz, amely minimálisan szárít.
norwegian	string	Kiválasztja a Lucene-alapú jogkivonat-jelölőt a norvég (Bokmål) számára.
porter2	string	Kiválasztja a Porter2 stemming algoritmust használó angol nyelvű Lucene-alapú jogkivonat-készítőt.
portuguese	string	Kiválasztja a Lucene-alapú jogkivonat-jelölőt a portugál nyelvhez.
portugueseRslp	string	Kiválasztja a Lucene-alapú jogkivonat-jelölőt portugálul, amely az RSLP-származtatási algoritmust használja.
possessiveEnglish	string	Kiválasztja a Lucene-alapú jogkivonat-jelölőt az angol nyelvhez, amely eltávolítja a záró birtokosokat a szavakból.
romanian	string	Kiválasztja a Lucene-alapú jogkivonat-jelölőt a román nyelvhez.
russian	string	Kiválasztja az orosz Lucene-alapú jogkivonat-jelölőt.
sorani	string	A Sorani lucene-alapú jogkivonat-jelölőjének kiválasztása.
spanish	string	Kiválasztja a Lucene-alapú jogkivonat-jelölőt spanyolul.
swedish	string	Kiválasztja a Lucene-alapú jogkivonat-jelölőt a svéd nyelvhez.
turkish	string	Kiválasztja a Lucene-alapú jogkivonat-jelölőt a törökhöz.

StopAnalyzer

A szöveget nem betűkkel osztja el; Alkalmazza a kisbetűs és a stopword jogkivonat szűrőit. Ez az elemző az Apache Lucene használatával van implementálva.

Name	Típus	Description
@odata.type	string: #Microsoft.Azure.Search.StopAnalyzer	Az elemző típusát meghatározó URI-töredék.
name	string	Az elemző neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet.
stopwords	string[]	A stopszavak listája.

StopwordsList

A nyelvspecifikus stopszók előre definiált listáját azonosítja.

Name	Típus	Description
arabic	string	Kiválasztja az arab nyelvű stopword listát.
armenian	string	Kiválasztja az örmények stopszólistáját.
basque	string	Kiválasztja a baszk stopszólistát.
brazilian	string	Kiválasztja a portugál (Brazília) stopword listáját.
bulgarian	string	Kiválasztja a bolgár stopword listát.
catalan	string	Kiválasztja a katalán stopword listát.
czech	string	Kiválasztja a cseh stopword listát.
danish	string	Kiválasztja a dán stopword listát.
dutch	string	Kiválasztja a holland stopword listát.
english	string	Kiválasztja az angol nyelvű stopword listát.
finnish	string	Kiválasztja a finn stopword listát.
french	string	Kiválasztja a francia stopword listát.
galician	string	Kiválasztja a galíciai stopword listát.
german	string	A német nyelvhez tartozó stopword listát választja ki.
greek	string	Kiválasztja a göröghöz tartozó stopszólistát.
hindi	string	Kiválasztja a hindi stopword listát.
hungarian	string	Kiválasztja a magyar nyelvű stopszólistát.
indonesian	string	Kiválasztja az indonéz stopword listát.
irish	string	Kiválasztja az írek stopword listáját.
italian	string	Kiválasztja az olasz stopword listát.
latvian	string	Kiválasztja a lett stopword listát.
norwegian	string	Kiválasztja a norvég nyelvhez tartozó stopword listát.
persian	string	Kiválasztja a perzsa stopword listát.
portuguese	string	Kiválasztja a portugál stopword listát.
romanian	string	Kiválasztja a román nyelvű stopword listát.
russian	string	Kiválasztja az orosz nyelvű stopword listát.
sorani	string	A Sorani stopword listájának kiválasztása.
spanish	string	Kiválasztja a spanyol nyelvű stopword listát.
swedish	string	Kiválasztja a svéd stopword listát.
thai	string	Kiválasztja a thai nyelvhez tartozó stopword listát.
turkish	string	Kiválasztja a törökhöz tartozó stopword listát.

StopwordsTokenFilter

Eltávolítja a leállító szavakat egy jogkivonat-adatfolyamból. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.

Name	Típus	Alapértelmezett érték	Description
@odata.type	string: #Microsoft.Azure.Search.StopwordsTokenFilter		A tokenszűrő típusát meghatározó URI-töredék.
ignoreCase	boolean	False	A kis- és nagybetűk figyelmen kívül hagyását jelző érték. Ha igaz, a program először az összes szót kisbetűssé alakítja. Az alapértelmezett érték a false (hamis).
name	string		A jogkivonatszűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet.
removeTrailing	boolean	True	Egy érték, amely azt jelzi, hogy figyelmen kívül hagyja-e az utolsó keresési kifejezést, ha az egy stop szó. Alapértelmezett érték: true (igaz).
stopwords	string[]		A stopszavak listája. Ez a tulajdonság és a stopwords lista tulajdonság nem állítható be.
stopwordsList	StopwordsList	english	A használandó stopszavak előre definiált listája. Ez a tulajdonság és a stopwords tulajdonság nem állítható be. Az alapértelmezett érték az angol.

Suggester

Meghatározza, hogyan kell alkalmazni a Suggest API-t az index egy mezőcsoportjára.

Name	Típus	Description
name	string	A javaslattevő neve.
searchMode	SuggesterSearchMode	A javaslattevő képességeit jelző érték.
sourceFields	string[]	Azon mezőnevek listája, amelyekre a javaslattevő vonatkozik. Minden mezőnek kereshetőnek kell lennie.

SuggesterSearchMode

A javaslattevő képességeit jelző érték.

Name	Típus	Description
analyzingInfixMatching	string	Egy mező egymást követő teljes kifejezéseinek és előtagjainak felel meg. A "Leggyorsabb barna róka" mező esetében például a "gyors" és a "leggyorsabb szemöldök" lekérdezések is egyeznek.

SynonymTokenFilter

Egy- vagy többszavas szinonimák egy jogkivonatfolyamban. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.

Name	Típus	Alapértelmezett érték	Description
@odata.type	string: #Microsoft.Azure.Search.SynonymTokenFilter		A tokenszűrő típusát meghatározó URI-töredék.
expand	boolean	True	Egy érték, amely azt jelzi, hogy a szinonimák listájában szereplő összes szó (ha => jelölés nincs használatban) megfeleltethető-e egymásnak. Ha igaz, a szinonimák listájában szereplő összes szó (ha az => jelölés nincs használatban) megfeleltethető egymással. A következő lista: hihetetlen, hihetetlen, mesés, csodálatos egyenértékű: hihetetlen, hihetetlen, mesés, csodálatos => hihetetlen, hihetetlen, mesés, csodálatos. Ha hamis, a következő lista: hihetetlen, hihetetlen, mesés, csodálatos lesz egyenértékű: hihetetlen, hihetetlen, mesés, csodálatos => hihetetlen. Alapértelmezett érték: true (igaz).
ignoreCase	boolean	False	Egy érték, amely azt jelzi, hogy a kis- és nagybetűkre kell-e behajtani a bemenetet az egyeztetéshez. Az alapértelmezett érték a false (hamis).
name	string		A jogkivonatszűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet.
synonyms	string[]		Szinonimák listája a következő két formátum egyikében: 1. hihetetlen, hihetetlen, mesés => csodálatos - az => szimbólum bal oldalán lévő összes kifejezés helyébe a jobb oldalon lévő összes kifejezés kerül; 2. hihetetlen, hihetetlen, mesés, csodálatos - az egyenértékű szavak vesszővel elválasztott listája. A lista értelmezésének módosításához állítsa be a kibontás beállítást.

TagScoringFunction

Olyan függvényt definiál, amely egy adott címkelistának megfelelő sztringértékekkel növeli a dokumentumok pontszámait.

Name	Típus	Description
boost	number	A nyers pontszám szorzója. Pozitív számnak kell lennie, amely nem lehet 1,0.
fieldName	string	A pontozási függvény bemeneteként használt mező neve.
interpolation	ScoringFunctionInterpolation	Egy érték, amely azt jelzi, hogy a kiemelés hogyan lesz interpolálva a dokumentum pontszámai között; alapértelmezés szerint "Lineáris".
tag	TagScoringParameters	A címke pontozási függvényének paraméterértékei.
type	string: tag	A használni kívánt függvény típusát jelzi. Az érvényes értékek közé tartozik a magnitúdó, a frissesség, a távolság és a címke. A függvénytípusnak kisbetűsnek kell lennie.

TagScoringParameters

Paraméterértékeket biztosít egy címkepontozási függvénynek.

Name	Típus	Description
tagsParameter	string	A keresési lekérdezésekben átadott paraméter neve a célmezővel összehasonlítandó címkék listájának megadásához.

TextWeights

Olyan indexmezők súlyozását határozza meg, amelyek esetében a találatok növelik a keresési lekérdezések pontozását.

Name	Típus	Description
weights	object	A mezőenkénti súlyok szótára a dokumentum pontozásának növeléséhez. A kulcsok mezőnevek, az értékek pedig az egyes mezők súlyozásai.

TokenCharacterKind

Olyan karakterosztályokat jelöl, amelyeken a jogkivonatszűrők működhetnek.

Name	Típus	Description
digit	string	A számjegyeket tokenekben tárolja.
letter	string	A betűket tokenekben tárolja.
punctuation	string	A tokenekben tárolja az írásjeleket.
symbol	string	A szimbólumokat tokenekben tárolja.
whitespace	string	Jogkivonatokban tárolja a térközt.

TokenFilterName

Meghatározza a keresőmotor által támogatott összes jogkivonatszűrő nevét.

Name	Típus	Description
apostrophe	string	Az aposztróf utáni összes karaktert (beleértve magát az aposztrófot is) csíkoz. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/tr/ApostropheFilter.html
arabic_normalization	string	Egy jogkivonatszűrő, amely az arab normalizálót alkalmazza az ortográfia normalizálására. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/ar/ArabicNormalizationFilter.html
asciifolding	string	Az első 127 ASCII-karakterben nem szereplő unicode-karaktereket (az "Egyszerű latin" Unicode-blokkot) ASCII-ekvivalenssé alakítja át, ha léteznek ilyen megfelelők. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/ASCIIFoldingFilter.html
cjk_bigram	string	Forms standard tokenizerből létrehozott CJK-kifejezések bigramját. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/cjk/CJKBigramFilter.html
cjk_width	string	Normalizálja a CJK szélességi különbségeit. A fullwidth ASCII-variánsokat a megfelelő alap latin, a félszélességű Katakana változatokat pedig a megfelelő Kana-ra hajtja. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/cjk/CJKWidthFilter.html
classic	string	Eltávolítja az angol birtokosokat és a betűket a betűszókból. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/standard/ClassicFilter.html
common_grams	string	Bigramokat hozhat létre az indexelés során gyakran előforduló kifejezésekhez. Az egyes kifejezések továbbra is indexelve vannak, és a bigramok túl vannak osztva. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/commongrams/CommonGramsFilter.html
edgeNGram_v2	string	A megadott méret(ek) n-grammját hozza létre egy bemeneti jogkivonat elejétől vagy hátuljától kezdve. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/ngram/EdgeNGramTokenFilter.html
elision	string	Eltávolítja az elisionokat. A "l'avion" (a sík) például "avion" (sík) lesz. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/util/ElisionFilter.html
german_normalization	string	Normalizálja a német karaktereket a german2 snowball algoritmus heurisztikusai szerint. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/de/GermanNormalizationFilter.html
hindi_normalization	string	Normalizálja a hindi szövegeket, hogy eltávolítson néhány különbséget a helyesírási változatokban. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/hi/HindiNormalizationFilter.html
indic_normalization	string	Normalizálja a szöveg Unicode-ábrázolását indiai nyelveken. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/in/IndicNormalizationFilter.html
keyword_repeat	string	Minden bejövő jogkivonatot kétszer, egyszer kulcsszóként, egyszer pedig nem kulcsszóként bocsát ki. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/KeywordRepeatFilter.html
kstem	string	Nagy teljesítményű kstem szűrő angol nyelven. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/en/KStemFilter.html
length	string	Eltávolítja a túl hosszú vagy túl rövid szavakat. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/LengthFilter.html
limit	string	Korlátozza a tokenek számát az indexelés során. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/LimitTokenCountFilter.html
lowercase	string	A jogkivonat szövegének normalizálása kisbetűsre. Lásd: https://lucene.apache.org/core/6_6_1/analyzers-common/org/apache/lucene/analysis/core/LowerCaseFilter.html
nGram_v2	string	A megadott méret(ek) n-grammját hozza létre. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/ngram/NGramTokenFilter.html
persian_normalization	string	A perzsa normalizálását alkalmazza. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/fa/PersianNormalizationFilter.html
phonetic	string	Létrehozás fonetikus egyezések jogkivonatai. Lásd: https://lucene.apache.org/core/4_10_3/analyzers-phonetic/org/apache/lucene/analysis/phonetic/package-tree.html
porter_stem	string	A Porter-származtatási algoritmust használja a tokenstream átalakításához. Lásd: http://tartarus.org/~martin/PorterStemmer
reverse	string	Megfordítja a jogkivonat-sztringet. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/reverse/ReverseStringFilter.html
scandinavian_folding	string	Folds skandináv karakterek åÅäæÄÆ-a> és öÖøØ-o>. Emellett megkülönbözteti a dupla magánhangzók aa, ae, ao, oe és oo használatát, így csak az első. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/ScandinavianFoldingFilter.html
scandinavian_normalization	string	Normalizálja a felcserélhető skandináv karakterek használatát. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/ScandinavianNormalizationFilter.html
shingle	string	A jogkivonatok kombinációit egyetlen tokenként hozza létre. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/shingle/ShingleFilter.html
snowball	string	Egy szűrő, amely a szavakat egy Snowball által generált ősmer használatával szárja. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/snowball/SnowballFilter.html
sorani_normalization	string	Normalizálja a Sorani-szöveg Unicode-ábrázolását. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/ckb/SoraniNormalizationFilter.html
stemmer	string	Nyelvspecifikus eredetszűrő. Lásd: https://docs.microsoft.com/rest/api/searchservice/Custom-analyzers-in-Azure-Search#TokenFilters
stopwords	string	Eltávolítja a leállító szavakat egy jogkivonatfolyamból. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/StopFilter.html
trim	string	Levágja a kezdő és záró szóközöket a jogkivonatokból. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/TrimFilter.html
truncate	string	Csonkítja a kifejezéseket egy adott hosszúságúra. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/TruncateTokenFilter.html
unique	string	Kiszűri az előző jogkivonattal megegyező szövegű jogkivonatokat. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/RemoveDuplicatesTokenFilter.html
uppercase	string	A jogkivonat szövegének normalizálása nagybetűsre. Lásd: https://lucene.apache.org/core/6_6_1/analyzers-common/org/apache/lucene/analysis/core/UpperCaseFilter.html
word_delimiter	string	A szavakat alszavakra osztja fel, és opcionális átalakításokat hajt végre az alszavas csoportokon.

TruncateTokenFilter

A kifejezéseket adott hosszúságúra csonkítja. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.

Name	Típus	Alapértelmezett érték	Description
@odata.type	string: #Microsoft.Azure.Search.TruncateTokenFilter		A tokenszűrő típusát meghatározó URI-töredék.
length	integer	300	Az a hossz, amelyen a kifejezések csonkulnak. Az alapértelmezett és a maximális érték 300.
name	string		A jogkivonatszűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet.

UaxUrlEmailTokenizer

Tokenizálja az URL-címeket és az e-maileket egy jogkivonatként. Ez a jogkivonat-szabályzó az Apache Lucene használatával van implementálva.

Name	Típus	Alapértelmezett érték	Description
@odata.type	string: #Microsoft.Azure.Search.UaxUrlEmailTokenizer		Egy URI-töredék, amely a tokenizer típusát határozza meg.
maxTokenLength	integer	255	A jogkivonat maximális hossza. Az alapértelmezett érték 255. A maximális hossznál hosszabb jogkivonatok fel vannak osztva. A maximálisan használható tokenhossz 300 karakter.
name	string		A tokenizer neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet.

UniqueTokenFilter

Kiszűri a jogkivonatokat az előző token szövegével megegyező szöveggel. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.

Name	Típus	Alapértelmezett érték	Description
@odata.type	string: #Microsoft.Azure.Search.UniqueTokenFilter		A tokenszűrő típusát meghatározó URI-töredék.
name	string		A jogkivonatszűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet.
onlyOnSamePosition	boolean	False	Egy érték, amely azt jelzi, hogy az ismétlődések eltávolítása csak ugyanazon a helyen történik-e. Az alapértelmezett érték a false (hamis).

VectorEncodingFormat

A vektormező tartalmának értelmezésére szolgáló kódolási formátum.

Name	Típus	Description
packedBit	string	A szélesebb adattípusba csomagolt biteket ábrázoló kódolási formátum.

VectorSearch

A vektorkereséshez kapcsolódó konfigurációs beállításokat tartalmazza.

Name	Típus	Description
algorithms	VectorSearchAlgorithmConfiguration[]: ExhaustiveKnnVectorSearchAlgorithmConfiguration[] HnswVectorSearchAlgorithmConfiguration[]	Az indexelés vagy lekérdezés során használt algoritmusra vonatkozó konfigurációs beállításokat tartalmaz.
compressions	VectorSearchCompressionConfiguration[]: ScalarQuantizationVectorSearchCompressionConfiguration[]	Az indexelés vagy lekérdezés során használt tömörítési módszerre vonatkozó konfigurációs beállításokat tartalmazza.
profiles	VectorSearchProfile[]	A vektorkereséssel használható konfigurációk kombinációit határozza meg.
vectorizers	VectorSearchVectorizer[]: AIServicesVisionVectorizer[] AMLVectorizer[] AzureOpenAIVectorizer[] CustomVectorizer[]	A szövegvektor-lekérdezések vektorizálására vonatkozó konfigurációs beállításokat tartalmaz.

VectorSearchAlgorithmKind

Az indexeléshez és lekérdezéshez használt algoritmus.

Name	Típus	Description
exhaustiveKnn	string	Kimerítő KNN-algoritmus, amely találgatásos keresést hajt végre.
hnsw	string	HNSW (Hierarchikus Navigable Small World), a közelítő szomszéd algoritmus típusa.

VectorSearchAlgorithmMetric

A vektorok összehasonlításához használandó hasonlósági metrika. Javasoljuk, hogy ugyanazt a hasonlósági metrikát válassza, amelyre a beágyazási modellt betanította.

Name	Típus	Description
cosine	string	A vektorok közötti szöget méri a hasonlóságuk számszerűsítéséhez, figyelmen kívül hagyva a nagyságrendet. Minél kisebb a szög, annál közelebb van a hasonlóság.
dotProduct	string	Kiszámítja az elemalapú termékek összegét az igazítás és a nagyságrendi hasonlóság méréséhez. Minél nagyobb és pozitívabb, annál közelebb van a hasonlóság.
euclidean	string	Kiszámítja a vektorok közötti egyenes távolságot egy többdimenziós térben. Minél kisebb a távolság, annál közelebb van a hasonlóság.
hamming	string	Csak bitcsomagolt bináris adattípusokra alkalmazható. Az eltérőséget a bináris vektorok eltérő pozícióinak megszámolásával határozza meg. Minél kevesebb a különbség, annál közelebb van a hasonlóság.

VectorSearchCompressionKind

Az indexeléshez és lekérdezéshez használt tömörítési módszer.

Name	Típus	Description
scalarQuantization	string	Skaláris kvantálás, a tömörítési módszer típusa. A skaláris kvantálás során az eredeti vektorértékek szűkebb típusba vannak tömörítve a vektorok egyes összetevőinek megkülönböztetésével és ábrázolásával, csökkentve a kvantált értékek készletét, ezáltal csökkentve a teljes adatméretet.

VectorSearchCompressionTargetDataType

A tömörített vektorértékek kvantált adattípusa.

Name	Típus	Description
int8	string

VectorSearchProfile

A vektorkereséssel használható konfigurációk kombinációját határozza meg.

Name	Típus	Description
algorithm	string	A vektorkeresési algoritmus konfigurációjának neve, amely meghatározza az algoritmust és az opcionális paramétereket.
compression	string	A tömörítési módszer konfigurációjának neve, amely meghatározza a tömörítési módszert és az opcionális paramétereket.
name	string	Az adott vektoros keresési profilhoz társítandó név.
vectorizer	string	A vektoros kereséshez konfigurált vektorizálási módszer neve.

VectorSearchVectorizerKind

A lekérdezési idő alatt használandó vektorizálási módszer.

Name	Típus	Description
aiServicesVision	string	Beágyazásokat hozhat létre egy kép- vagy szövegbevitelhez lekérdezéskor az Azure AI Services Vision Vectorize API használatával.
aml	string	Beágyazásokat hozhat létre a Azure AI Studio modellkatalóguson keresztül, lekérdezéskor üzembe helyezett Azure Machine Learning-végpont használatával.
azureOpenAI	string	Beágyazásokat hozhat létre egy Azure OpenAI-erőforrás használatával lekérdezéskor.
customWebApi	string	Beágyazások létrehozása egyéni webes végpont használatával lekérdezéskor.

WordDelimiterTokenFilter

A szavakat alszavakra osztja, és opcionális átalakításokat hajt végre az alszócsoportokon. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.

Name	Típus	Alapértelmezett érték	Description
@odata.type	string: #Microsoft.Azure.Search.WordDelimiterTokenFilter		A tokenszűrő típusát meghatározó URI-töredék.
catenateAll	boolean	False	Egy érték, amely azt jelzi, hogy az összes alszórész fel lesz-e adva. Ha például ez igaz értékre van állítva, az "Azure-Search-1" "AzureSearch1" lesz. Az alapértelmezett érték a false (hamis).
catenateNumbers	boolean	False	Egy érték, amely azt jelzi, hogy a rendszer a számrészek maximális futásait fogja-e kiszolgálni. Ha például ez igaz értékre van állítva, az "1-2" "12" lesz. Az alapértelmezett érték a false (hamis).
catenateWords	boolean	False	A szórészek maximális futását jelző érték. Ha például ez igaz értékre van állítva, az "Azure-Search" "AzureSearch" lesz. Az alapértelmezett érték a false (hamis).
generateNumberParts	boolean	True	Egy érték, amely azt jelzi, hogy szám alszavak generálására van-e szüksége. Alapértelmezett érték: true (igaz).
generateWordParts	boolean	True	Egy érték, amely jelzi, hogy létre kell-e hozni részszavat. Ha be van állítva, a szavak részeit generálja; Például az "AzureSearch" "Azure" "Search" lesz. Alapértelmezett érték: true (igaz).
name	string		A jogkivonatszűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet.
preserveOriginal	boolean	False	Egy érték, amely azt jelzi, hogy az eredeti szavak megmaradnak-e, és hozzá lesznek-e adva az alszólistához. Az alapértelmezett érték a false (hamis).
protectedWords	string[]		A tagolástól védendő jogkivonatok listája.
splitOnCaseChange	boolean	True	Egy érték, amely azt jelzi, hogy fel kell-e osztani a szavakat a caseChange függvényben. Ha például ez igaz értékre van állítva, az "AzureSearch" "Azure" "Search" lesz. Alapértelmezett érték: true (igaz).
splitOnNumerics	boolean	True	Egy érték, amely azt jelzi, hogy fel kell-e osztani a számokat. Ha például ez igaz értékre van állítva, az "Azure1Search" "Azure" "1" "Search" lesz. Alapértelmezett érték: true (igaz).
stemEnglishPossessive	boolean	True	Egy érték, amely azt jelzi, hogy el szeretné-e távolítani az egyes alszók záró "s" karaktereit. Alapértelmezett érték: true (igaz).

Megosztás a következőn keresztül: