Indexes - Get
Lekéri az indexdefiníciót.
GET {endpoint}/indexes('{indexName}')?api-version=2023-11-01
URI-paraméterek
Name | In | Kötelező | Típus | Description |
---|---|---|---|---|
endpoint
|
path | True |
string |
A keresési szolgáltatás végponti URL-címe. |
index
|
path | True |
string |
A lekérendő index neve. |
api-version
|
query | True |
string |
Ügyfél API-verziója. |
Kérelem fejléce
Name | Kötelező | Típus | Description |
---|---|---|---|
x-ms-client-request-id |
string uuid |
A kéréssel együtt küldött nyomkövetési azonosító, amely segít a hibakeresésben. |
Válaszok
Name | Típus | Description |
---|---|---|
200 OK | ||
Other Status Codes |
Hibaválasz. |
Példák
SearchServiceGetIndex
Sample Request
GET https://myservice.search.windows.net/indexes('hotels')?api-version=2023-11-01
Sample Response
{
"name": "hotels",
"fields": [
{
"name": "hotelId",
"type": "Edm.String",
"searchable": false,
"filterable": true,
"retrievable": true,
"sortable": true,
"facetable": true,
"key": true,
"indexAnalyzer": null,
"searchAnalyzer": null,
"analyzer": null,
"dimensions": null,
"vectorSearchProfile": null,
"synonymMaps": []
},
{
"name": "baseRate",
"type": "Edm.Double",
"searchable": false,
"filterable": true,
"retrievable": true,
"sortable": true,
"facetable": true,
"key": false,
"indexAnalyzer": null,
"searchAnalyzer": null,
"analyzer": null,
"dimensions": null,
"vectorSearchProfile": null,
"synonymMaps": []
},
{
"name": "description",
"type": "Edm.String",
"searchable": true,
"filterable": false,
"retrievable": true,
"sortable": false,
"facetable": false,
"key": false,
"indexAnalyzer": null,
"searchAnalyzer": null,
"analyzer": null,
"dimensions": null,
"vectorSearchProfile": null,
"synonymMaps": []
},
{
"name": "descriptionEmbedding",
"type": "Collection(Edm.Single)",
"searchable": true,
"filterable": false,
"retrievable": true,
"sortable": false,
"facetable": false,
"key": false,
"indexAnalyzer": null,
"searchAnalyzer": null,
"analyzer": null,
"dimensions": 1536,
"vectorSearchProfile": "myHnswProfile",
"synonymMaps": []
},
{
"name": "description_fr",
"type": "Edm.String",
"searchable": true,
"filterable": false,
"retrievable": true,
"sortable": false,
"facetable": false,
"key": false,
"indexAnalyzer": null,
"searchAnalyzer": null,
"analyzer": "fr.lucene",
"dimensions": null,
"vectorSearchProfile": null,
"synonymMaps": []
},
{
"name": "hotelName",
"type": "Edm.String",
"searchable": true,
"filterable": true,
"retrievable": true,
"sortable": true,
"facetable": true,
"key": false,
"indexAnalyzer": null,
"searchAnalyzer": null,
"analyzer": null,
"dimensions": null,
"vectorSearchProfile": null,
"synonymMaps": []
},
{
"name": "category",
"type": "Edm.String",
"searchable": true,
"filterable": true,
"retrievable": true,
"sortable": true,
"facetable": true,
"key": false,
"indexAnalyzer": null,
"searchAnalyzer": null,
"analyzer": null,
"dimensions": null,
"vectorSearchProfile": null,
"synonymMaps": []
},
{
"name": "tags",
"type": "Collection(Edm.String)",
"searchable": true,
"filterable": true,
"retrievable": true,
"sortable": false,
"facetable": true,
"key": false,
"indexAnalyzer": null,
"searchAnalyzer": null,
"analyzer": "tagsAnalyzer",
"dimensions": null,
"vectorSearchProfile": null,
"synonymMaps": []
},
{
"name": "parkingIncluded",
"type": "Edm.Boolean",
"searchable": false,
"filterable": true,
"retrievable": true,
"sortable": true,
"facetable": true,
"key": false,
"indexAnalyzer": null,
"searchAnalyzer": null,
"analyzer": null,
"dimensions": null,
"vectorSearchProfile": null,
"synonymMaps": []
},
{
"name": "smokingAllowed",
"type": "Edm.Boolean",
"searchable": false,
"filterable": true,
"retrievable": true,
"sortable": true,
"facetable": true,
"key": false,
"indexAnalyzer": null,
"searchAnalyzer": null,
"analyzer": null,
"dimensions": null,
"vectorSearchProfile": null,
"synonymMaps": []
},
{
"name": "lastRenovationDate",
"type": "Edm.DateTimeOffset",
"searchable": false,
"filterable": true,
"retrievable": true,
"sortable": true,
"facetable": true,
"key": false,
"indexAnalyzer": null,
"searchAnalyzer": null,
"analyzer": null,
"dimensions": null,
"vectorSearchProfile": null,
"synonymMaps": []
},
{
"name": "rating",
"type": "Edm.Int32",
"searchable": false,
"filterable": true,
"retrievable": true,
"sortable": true,
"facetable": true,
"key": false,
"indexAnalyzer": null,
"searchAnalyzer": null,
"analyzer": null,
"dimensions": null,
"vectorSearchProfile": null,
"synonymMaps": []
},
{
"name": "location",
"type": "Edm.GeographyPoint",
"searchable": false,
"filterable": true,
"retrievable": true,
"sortable": true,
"facetable": false,
"key": false,
"indexAnalyzer": null,
"searchAnalyzer": null,
"analyzer": null,
"dimensions": null,
"vectorSearchProfile": null,
"synonymMaps": []
}
],
"scoringProfiles": [
{
"name": "geo",
"functionAggregation": "sum",
"text": {
"weights": {
"hotelName": 5
}
},
"functions": [
{
"type": "distance",
"boost": 5,
"fieldName": "location",
"interpolation": "logarithmic",
"distance": {
"referencePointParameter": "currentLocation",
"boostingDistance": 10
}
}
]
}
],
"defaultScoringProfile": "geo",
"suggesters": [
{
"name": "sg",
"searchMode": "analyzingInfixMatching",
"sourceFields": [
"hotelName"
]
}
],
"analyzers": [
{
"name": "tagsAnalyzer",
"@odata.type": "#Microsoft.Azure.Search.CustomAnalyzer",
"charFilters": [
"html_strip"
],
"tokenizer": "standard_v2"
}
],
"tokenizers": [],
"tokenFilters": [],
"charFilters": [],
"corsOptions": {
"allowedOrigins": [
"tempuri.org"
],
"maxAgeInSeconds": 60
},
"encryptionKey": {
"keyVaultKeyName": "myKeyName",
"keyVaultKeyVersion": "myKeyVersion",
"keyVaultUri": "https://myKeyVault.vault.azure.net",
"accessCredentials": {
"applicationId": "00000000-0000-0000-0000-000000000000",
"applicationSecret": null
}
},
"semantic": {
"configurations": [
{
"name": "semanticHotels",
"prioritizedFields": {
"titleField": {
"fieldName": "hotelName"
},
"prioritizedContentFields": [
{
"fieldName": "description"
},
{
"fieldName": "description_fr"
}
],
"prioritizedKeywordsFields": [
{
"fieldName": "tags"
},
{
"fieldName": "category"
}
]
}
}
]
},
"vectorSearch": {
"algorithms": [
{
"name": "myHnsw",
"kind": "hnsw",
"hnswParameters": {
"metric": "cosine",
"m": 4,
"efConstruction": 400,
"efSearch": 500
}
},
{
"name": "myExhaustive",
"kind": "exhaustiveKnn",
"exhaustiveKnnParameters": {
"metric": "cosine"
}
}
],
"profiles": [
{
"name": "myHnswProfile",
"algorithm": "myHnsw"
},
{
"name": "myAlgorithm",
"algorithm": "myExhaustive"
}
]
}
}
Definíciók
Name | Description |
---|---|
Ascii |
Az első 127 ASCII-karakterben nem szereplő unicode-karaktereket (az "Egyszerű latin" Unicode-blokkot) ASCII-ekvivalenssé alakítja át, ha léteznek ilyen megfelelők. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva. |
Azure |
A keresési szolgáltatáshoz létrehozott regisztrált alkalmazás hitelesítő adatai, amelyet az Azure Key Vault tárolt titkosítási kulcsokhoz való hitelesített hozzáféréshez használnak. |
BM25Similarity |
Az Okapi BM25 hasonlósági algoritmuson alapuló rangsorolási függvény. A BM25 egy TF-IDF-szerű algoritmus, amely magában foglalja a hossz normalizálását (amelyet a "b" paraméter szabályoz), valamint a kifejezés frekvenciatelítettségét (amelyet a "k1" paraméter szabályoz). |
Char |
Meghatározza a keresőmotor által támogatott összes karakterszűrő nevét. |
Cjk |
A standard tokenizerből létrehozott CJK-kifejezések bigramjait alkotja. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva. |
Cjk |
A CjkBigramTokenFilter által figyelmen kívül hagyható szkriptek. |
Classic |
Örökölt hasonlósági algoritmus, amely a TF-IDF Lucene TFIDFSimilarity implementációját használja. A TF-IDF ezen változata statikus dokumentumhossz normalizálást vezet be, valamint koordinálja azokat a tényezőket, amelyek csak részben egyeznek a keresett lekérdezésekkel. |
Classic |
Nyelvtanalapú tokenizer, amely alkalmas a legtöbb európai nyelvű dokumentum feldolgozására. Ez a tokenizer az Apache Lucene használatával van implementálva. |
Common |
Bigramokat hozhat létre az indexelés során gyakran előforduló kifejezésekhez. Az egyes kifejezések továbbra is indexelve vannak, és a bigramok túl vannak osztva. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva. |
Cors |
Meghatározza az indexek forrásközi erőforrás-megosztásának (CORS) szabályozására vonatkozó beállításokat. |
Custom |
Lehetővé teszi, hogy átvegye az irányítást a szöveg indexelhető/kereshető tokenekké alakításának folyamata felett. Ez egy felhasználó által definiált konfiguráció, amely egyetlen előre definiált tokenizerből és egy vagy több szűrőből áll. A jogkivonat-készítő felelős azért, hogy a szöveget jogkivonatokká bontsa, és a jogkivonat-készítő által kibocsátott jogkivonatok módosítására szolgáló szűrőket. |
Dictionary |
Felbontja a sok germán nyelven található összetett szavakat. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva. |
Distance |
Olyan függvényt definiál, amely a földrajzi helytől való távolság alapján növeli a pontszámokat. |
Distance |
Paraméterértékeket biztosít egy távolsági pontozási függvénynek. |
Edge |
A megadott méret(ek) n-grammját hozza létre egy bemeneti jogkivonat elejétől vagy hátuljától kezdve. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva. |
Edge |
Meghatározza, hogy a bemenet melyik oldaláról kell n-gramot létrehozni. |
Edge |
A megadott méret(ek) n-grammját hozza létre egy bemeneti jogkivonat elejétől vagy hátuljától kezdve. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva. |
Edge |
Tokenizálja a bemenetet egy élről az adott méret(ek) n-grammjára. Ez a tokenizer az Apache Lucene használatával van implementálva. |
Elision |
Eltávolítja az elisionokat. A "l'avion" (a sík) például "avion" (sík) lesz. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva. |
Exhaustive |
A teljes KNN-algoritmusra jellemző paramétereket tartalmazza. |
Exhaustive |
A lekérdezés során használt teljes KNN-algoritmusra vonatkozó konfigurációs beállításokat tartalmaz, amelyek találgatásos keresést hajtanak végre a teljes vektorindexben. |
Freshness |
Egy olyan függvényt definiál, amely egy dátum-idő mező értéke alapján növeli a pontszámokat. |
Freshness |
Paraméterértékeket biztosít egy frissesség-pontozási függvénynek. |
Hnsw |
A HNSW algoritmusra jellemző paramétereket tartalmazza. |
Hnsw |
Az indexelés és lekérdezés során használt HNSW közelítő szomszéd algoritmusra vonatkozó konfigurációs beállításokat tartalmaz. A HNSW algoritmus a keresési sebesség és a pontosság közötti kompromisszumot kínálja. |
Keep |
Egy jogkivonatszűrő, amely csak a megadott szavak listájában lévő szöveggel rendelkező jogkivonatokat tárolja. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva. |
Keyword |
Kulcsszavakként jelöli meg a kifejezéseket. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva. |
Keyword |
A teljes bemenetet egyetlen jogkivonatként bocsátja ki. Ez a jogkivonat-szabályzó az Apache Lucene használatával van implementálva. |
Keyword |
A teljes bemenetet egyetlen jogkivonatként bocsátja ki. Ez a jogkivonat-szabályzó az Apache Lucene használatával van implementálva. |
Length |
Eltávolítja a túl hosszú vagy túl rövid szavakat. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva. |
Lexical |
Meghatározza a keresőmotor által támogatott összes szövegelemző nevét. |
Lexical |
Meghatározza a keresőmotor által támogatott összes tokenizer nevét. |
Limit |
Korlátozza a tokenek számát az indexelés során. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva. |
Lucene |
Standard Apache Lucene-elemző; A standard tokenizerből, kisbetűs szűrőből és leállítási szűrőből áll. |
Lucene |
A Unicode-szöveg szegmentálási szabályai szerint töri a szöveget. Ez a jogkivonat-szabályzó az Apache Lucene használatával van implementálva. |
Lucene |
A Unicode-szöveg szegmentálási szabályai szerint töri a szöveget. Ez a jogkivonat-szabályzó az Apache Lucene használatával van implementálva. |
Magnitude |
Olyan függvényt határoz meg, amely egy numerikus mező nagyságrendje alapján növeli a pontszámokat. |
Magnitude |
Paraméterértékeket ad meg egy nagyságrendi pontozási függvénynek. |
Mapping |
Karakterszűrő, amely a leképezési beállítással definiált leképezéseket alkalmazza. A megfeleltetés kapzsi (a leghosszabb mintaegyeztetés egy adott ponton nyer). A csere lehet üres sztring. Ez a karakterszűrő az Apache Lucene használatával van implementálva. |
Microsoft |
Nyelvspecifikus szabályokkal osztja el a szöveget, és csökkenti a szavak alapformáit. |
Microsoft |
Nyelvspecifikus szabályokkal osztja el a szöveget. |
Microsoft |
Listák a Microsoft nyelvi jogkivonat-kezelője által támogatott nyelveket. |
Microsoft |
Listák a Microsoft nyelvi tokenizer által támogatott nyelveket. |
NGram |
A megadott méret(ek) n-grammját hozza létre. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva. |
NGram |
A megadott méret(ek) n-grammját hozza létre. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva. |
NGram |
Tokenizálja a bemenetet az adott méret(ek) n-grammjára. Ez a jogkivonat-szabályzó az Apache Lucene használatával van implementálva. |
Path |
Tokenizer elérésiút-szerű hierarchiákhoz. Ez a jogkivonat-szabályzó az Apache Lucene használatával van implementálva. |
Pattern |
A szöveget rugalmasan elválasztja kifejezésekké egy reguláris kifejezésmintával. Ez az elemző az Apache Lucene használatával van implementálva. |
Pattern |
Java-regexek használatával több jogkivonatot bocsát ki – egyet minden rögzítési csoporthoz egy vagy több mintában. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva. |
Pattern |
Karakterszűrő, amely lecseréli a bemeneti sztringben szereplő karaktereket. Egy reguláris kifejezéssel azonosítja a megőrizni kívánt karaktersorozatokat, a lecserélendő karaktereket pedig helyettesítő mintával azonosítja. Ha például az "aa bb aa bb", a "(aa)\s+(bb)" minta és az "$1#$2" helyettesítő szöveg szerepel, az eredmény "aa#bb aa#bb". Ez a karakterszűrő az Apache Lucene használatával van implementálva. |
Pattern |
Karakterszűrő, amely a bemeneti sztringben szereplő karaktereket helyettesíti. Egy reguláris kifejezéssel azonosítja a megőrizendő karaktersorozatokat, a cseremintát pedig a lecserélendő karakterek azonosításához. Például az "aa bb aa bb", "(aa)\s+(bb)" minta és az "$1#$2" helyettesítő szöveg miatt az eredmény "aa#bb aa#bb". Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva. |
Pattern |
Tokenizer, amely regex mintaegyeztetést használ a különböző tokenek létrehozásához. Ez a jogkivonat-szabályzó az Apache Lucene használatával van implementálva. |
Phonetic |
A PhoneticTokenFilterrel használandó fonetikus kódoló típusát azonosítja. |
Phonetic |
Jogkivonatok létrehozása fonetikus egyezésekhez. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva. |
Prioritized |
A szemantikai rangsoroláshoz, feliratokhoz, kiemelésekhez és válaszokhoz használandó cím-, tartalom- és kulcsszavak mezőit ismerteti. |
Regex |
Olyan jelzőket definiál, amelyek kombinálhatók annak szabályozására, hogy a reguláris kifejezések hogyan legyenek használva a mintaelemzőben és a mintajogkivonat-jelölőben. |
Scoring |
Meghatározza azt az aggregációs függvényt, amely a pontozási profil összes pontozási függvényének eredményeit egyesíti. |
Scoring |
Meghatározza azt a függvényt, amely a pontszámok több dokumentumra kiterjedő interpolálására szolgál. |
Scoring |
Olyan keresési index paramétereit határozza meg, amelyek befolyásolják a keresési lekérdezések pontozását. |
Search |
Az API hibafeltételét ismerteti. |
Search |
Egy indexdefinícióban szereplő mezőt jelöl, amely egy mező nevét, adattípusát és keresési viselkedését írja le. |
Search |
Meghatározza egy mező adattípusát egy keresési indexben. |
Search |
A keresési index definícióját jelöli, amely egy index mezőit és keresési viselkedését ismerteti. |
Search |
Ügyfél által felügyelt titkosítási kulcs az Azure Key Vault-ban. A létrehozott és kezelt kulcsokkal titkosíthatja vagy visszafejtheti az inaktív adatokat a keresési szolgáltatásban, például indexeket és szinonimatérképeket. |
Semantic |
Egy adott konfigurációt határoz meg, amelyet a szemantikai képességek kontextusában kell használni. |
Semantic |
A szemantikai konfiguráció részeként használt mező. |
Semantic |
Olyan keresési index paramétereit határozza meg, amelyek befolyásolják a szemantikai képességeket. |
Shingle |
A jogkivonatok kombinációit egyetlen tokenként hozza létre. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva. |
Snowball |
Egy szűrő, amely a szavakat egy Snowball által generált ősmer használatával szárja. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva. |
Snowball |
A Snowball-tokenszűrőhöz használandó nyelv. |
Stemmer |
Lehetővé teszi, hogy felülbírálja a többi szárító szűrőt a saját szótáron alapuló szárítással. A szótárból származó kifejezések kulcsszavakként lesznek megjelölve, így nem lesznek a láncban lévő szárak. A szárító szűrők elé kell helyezni. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva. |
Stemmer |
Nyelvspecifikus eredetszűrő. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva. |
Stemmer |
A stemmer token szűrőhöz használandó nyelv. |
Stop |
A szöveget nem betűkkel osztja el; Alkalmazza a kisbetűs és a stopword jogkivonat szűrőit. Ez az elemző az Apache Lucene használatával van implementálva. |
Stopwords |
A nyelvspecifikus stopszavak előre definiált listáját azonosítja. |
Stopwords |
Eltávolítja a leállító szavakat egy jogkivonatfolyamból. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva. |
Suggester |
Meghatározza, hogyan kell alkalmazni a Suggest API-t az index mezőinek egy csoportjára. |
Suggester |
A javaslattevő képességeit jelző érték. |
Synonym |
Egy vagy többszavas szinonimák egy jogkivonatfolyamban. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva. |
Tag |
Olyan függvényt definiál, amely egy adott címkelistának megfelelő sztringértékekkel növeli a dokumentumok pontszámait. |
Tag |
Paraméterértékeket biztosít egy címkepontozási függvénynek. |
Text |
Olyan indexmezők súlyozását határozza meg, amelyek esetében a találatok növelik a keresési lekérdezések pontozását. |
Token |
Olyan karakterosztályokat jelöl, amelyeken a jogkivonatszűrők működhetnek. |
Token |
Meghatározza a keresőmotor által támogatott összes jogkivonatszűrő nevét. |
Truncate |
Csonkítja a kifejezéseket egy adott hosszúságúra. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva. |
Uax |
Tokenizálja az URL-címeket és az e-maileket egy jogkivonatként. Ez a jogkivonat-szabályzó az Apache Lucene használatával van implementálva. |
Unique |
Kiszűri az előző jogkivonattal megegyező szövegű jogkivonatokat. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva. |
Vector |
A vektorkereséshez kapcsolódó konfigurációs beállításokat tartalmazza. |
Vector |
Az indexeléshez és lekérdezéshez használt algoritmus. |
Vector |
A vektorok összehasonlításához használandó hasonlósági metrika. |
Vector |
A vektorkereséssel használható konfigurációk kombinációját határozza meg. |
Word |
A szavakat alszavakra osztja fel, és opcionális átalakításokat hajt végre az alszavas csoportokon. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva. |
AsciiFoldingTokenFilter
Az első 127 ASCII-karakterben nem szereplő unicode-karaktereket (az "Egyszerű latin" Unicode-blokkot) ASCII-ekvivalenssé alakítja át, ha léteznek ilyen megfelelők. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.
Name | Típus | Alapértelmezett érték | Description |
---|---|---|---|
@odata.type |
string:
#Microsoft. |
Egy URI-töredék, amely megadja a tokenszűrő típusát. |
|
name |
string |
A jogkivonatszűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet. |
|
preserveOriginal |
boolean |
False |
Egy érték, amely azt jelzi, hogy az eredeti jogkivonat megmarad-e. Az alapértelmezett érték a false (hamis). |
AzureActiveDirectoryApplicationCredentials
A keresési szolgáltatáshoz létrehozott regisztrált alkalmazás hitelesítő adatai, amelyet az Azure Key Vault tárolt titkosítási kulcsokhoz való hitelesített hozzáféréshez használnak.
Name | Típus | Description |
---|---|---|
applicationId |
string |
Egy AAD-alkalmazásazonosító, amely megkapta a szükséges hozzáférési engedélyeket az Azure Key Vault, amelyet az inaktív adatok titkosításához kell használni. Az alkalmazásazonosító nem tévesztendő össze az AAD-alkalmazás objektumazonosítójával. |
applicationSecret |
string |
A megadott AAD-alkalmazás hitelesítési kulcsa. |
BM25Similarity
Az Okapi BM25 hasonlósági algoritmuson alapuló rangsorolási függvény. A BM25 egy TF-IDF-szerű algoritmus, amely magában foglalja a hossz normalizálását (amelyet a "b" paraméter szabályoz), valamint a kifejezés frekvenciatelítettségét (amelyet a "k1" paraméter szabályoz).
Name | Típus | Description |
---|---|---|
@odata.type |
string:
#Microsoft. |
|
b |
number |
Ez a tulajdonság határozza meg, hogy a dokumentum hossza hogyan befolyásolja a relevanciapontszámot. Alapértelmezés szerint a rendszer 0,75 értéket használ. A 0,0 érték azt jelenti, hogy nincs hossz normalizálás alkalmazva, míg az 1,0 érték azt jelenti, hogy a pontszám teljesen normalizálódik a dokumentum hosszával. |
k1 |
number |
Ez a tulajdonság szabályozza a skálázási függvényt az egyes egyező kifejezések kifejezési gyakorisága és a dokumentum-lekérdezés párok végső relevanciapontszáma között. Alapértelmezés szerint a rendszer 1,2 értéket használ. A 0,0 érték azt jelenti, hogy a pontszám nem skálázható a kifejezés gyakoriságának növekedésével. |
CharFilterName
Meghatározza a keresőmotor által támogatott összes karakterszűrő nevét.
Name | Típus | Description |
---|---|---|
html_strip |
string |
Karakterszűrő, amely HTML-szerkezeteket próbál szétszedni. Lásd: https://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/charfilter/HTMLStripCharFilter.html |
CjkBigramTokenFilter
A standard tokenizerből létrehozott CJK-kifejezések bigramjait alkotja. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.
Name | Típus | Alapértelmezett érték | Description |
---|---|---|---|
@odata.type |
string:
#Microsoft. |
Egy URI-töredék, amely megadja a tokenszűrő típusát. |
|
ignoreScripts |
A figyelmen kívül hagyandó szkriptek. |
||
name |
string |
A jogkivonatszűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet. |
|
outputUnigrams |
boolean |
False |
Egy érték, amely azt jelzi, hogy az egygrammot és a bigramot is ki kell-e adni (ha igaz), vagy csak bigramot (ha hamis). Az alapértelmezett érték a false (hamis). |
CjkBigramTokenFilterScripts
A CjkBigramTokenFilter által figyelmen kívül hagyható szkriptek.
Name | Típus | Description |
---|---|---|
han |
string |
CJK-kifejezések bigramjainak létrehozásakor hagyja figyelmen kívül a Han-szkriptet. |
hangul |
string |
Hagyja figyelmen kívül a Hangul-szkriptet a CJK-kifejezések bigramjainak létrehozásakor. |
hiragana |
string |
Hagyja figyelmen kívül a Hiragana-szkriptet a CJK-kifejezések bigramjainak létrehozásakor. |
katakana |
string |
Hagyja figyelmen kívül a Katakana-szkriptet a CJK-kifejezések bigramjainak létrehozásakor. |
ClassicSimilarity
Örökölt hasonlósági algoritmus, amely a TF-IDF Lucene TFIDFSimilarity implementációját használja. A TF-IDF ezen változata statikus dokumentumhossz normalizálást vezet be, valamint koordinálja azokat a tényezőket, amelyek csak részben egyeznek a keresett lekérdezésekkel.
Name | Típus | Description |
---|---|---|
@odata.type |
string:
#Microsoft. |
ClassicTokenizer
Nyelvtanalapú tokenizer, amely alkalmas a legtöbb európai nyelvű dokumentum feldolgozására. Ez a tokenizer az Apache Lucene használatával van implementálva.
Name | Típus | Alapértelmezett érték | Description |
---|---|---|---|
@odata.type |
string:
#Microsoft. |
A tokenizer típusát meghatározó URI-töredék. |
|
maxTokenLength |
integer |
255 |
A jogkivonat maximális hossza. Az alapértelmezett érték 255. A maximális hossznál hosszabb jogkivonatok fel vannak osztva. A maximálisan használható tokenhossz 300 karakter. |
name |
string |
A tokenizer neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet. |
CommonGramTokenFilter
Bigramokat hozhat létre az indexelés során gyakran előforduló kifejezésekhez. Az egyes kifejezések továbbra is indexelve vannak, és a bigramok túl vannak osztva. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.
Name | Típus | Alapértelmezett érték | Description |
---|---|---|---|
@odata.type |
string:
#Microsoft. |
Egy URI-töredék, amely megadja a tokenszűrő típusát. |
|
commonWords |
string[] |
A közös szavak halmaza. |
|
ignoreCase |
boolean |
False |
Egy érték, amely azt jelzi, hogy a közös szavak egyeztetése érzéketlen lesz-e a kis- és nagybetűk között. Az alapértelmezett érték a false (hamis). |
name |
string |
A jogkivonatszűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet. |
|
queryMode |
boolean |
False |
Egy érték, amely azt jelzi, hogy a jogkivonatszűrő lekérdezési módban van-e. Lekérdezési módban a jogkivonatszűrő bigramokat hoz létre, majd eltávolítja a közös szavakat és az egyszeres kifejezéseket, majd egy közös szót. Az alapértelmezett érték a false (hamis). |
CorsOptions
Meghatározza az indexek forrásközi erőforrás-megosztásának (CORS) szabályozására vonatkozó beállításokat.
Name | Típus | Description |
---|---|---|
allowedOrigins |
string[] |
Azoknak a forrásoknak a listája, amelyekből a JavaScript-kód hozzáférést kap az indexhez. Tartalmazhatja a(z) {protocol}://{teljes-qualified-domain-name}[:{port#}] űrlap gazdagépeinek listáját, vagy egyetlenet |
maxAgeInSeconds |
integer |
Az az időtartam, amelyre a böngészőknek gyorsítótáraznia kell a CORS elővizsgálati válaszait. Alapértelmezés szerint 5 perc. |
CustomAnalyzer
Lehetővé teszi, hogy átvegye az irányítást a szöveg indexelhető/kereshető tokenekké alakításának folyamata felett. Ez egy felhasználó által definiált konfiguráció, amely egyetlen előre definiált tokenizerből és egy vagy több szűrőből áll. A jogkivonat-készítő felelős azért, hogy a szöveget jogkivonatokká bontsa, és a jogkivonat-készítő által kibocsátott jogkivonatok módosítására szolgáló szűrőket.
Name | Típus | Description |
---|---|---|
@odata.type |
string:
#Microsoft. |
Az elemző típusát meghatározó URI-töredék. |
charFilters |
A bemeneti szövegnek a tokenizer általi feldolgozása előtti előkészítéséhez használt karakterszűrők listája. Lecserélhetnek például bizonyos karaktereket vagy szimbólumokat. A szűrők a lista sorrendjében futnak. |
|
name |
string |
Az elemző neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet. |
tokenFilters |
A tokenizáló által létrehozott jogkivonatok kiszűrésére vagy módosítására használt jogkivonatszűrők listája. Megadhat például egy kisbetűs szűrőt, amely az összes karaktert kisbetűssé alakítja. A szűrők a lista sorrendjében futnak. |
|
tokenizer |
A jogkivonat-megosztó neve, amelyet a folyamatos szöveg jogkivonatok sorozatára való felosztásához használ, például egy mondat szavakra törése. |
DictionaryDecompounderTokenFilter
Felbontja a sok germán nyelven található összetett szavakat. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.
Name | Típus | Alapértelmezett érték | Description |
---|---|---|---|
@odata.type |
string:
#Microsoft. |
Egy URI-töredék, amely megadja a tokenszűrő típusát. |
|
maxSubwordSize |
integer |
15 |
A maximális alszóméret. Csak az ennél rövidebb alszavak lesznek kimenetben. Az alapértelmezett érték 15. A maximális érték 300. |
minSubwordSize |
integer |
2 |
A minimális alszóméret. Csak az ennél hosszabb alszavak lesznek kimenetben. Az alapértelmezett érték 2. A maximális érték 300. |
minWordSize |
integer |
5 |
A szavak minimális mérete. Csak az ennél hosszabb szavak lesznek feldolgozva. Az alapértelmezett érték 5. A maximális érték 300. |
name |
string |
A jogkivonatszűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet. |
|
onlyLongestMatch |
boolean |
False |
Egy érték, amely azt jelzi, hogy csak a leghosszabb egyező alszót szeretné-e hozzáadni a kimenethez. Az alapértelmezett érték a false (hamis). |
wordList |
string[] |
Azoknak a szavaknak a listája, |
DistanceScoringFunction
Olyan függvényt definiál, amely a földrajzi helytől való távolság alapján növeli a pontszámokat.
Name | Típus | Description |
---|---|---|
boost |
number |
A nyers pontszám szorzója. Pozitív számnak kell lennie, amely nem lehet 1,0. |
distance |
A távolságpontozási függvény paraméterértékei. |
|
fieldName |
string |
A pontozófüggvény bemeneteként használt mező neve. |
interpolation |
Egy érték, amely azt jelzi, hogy a kiemelés hogyan lesz interpolálva a dokumentum pontszámai között; alapértelmezett értéke "Lineáris". |
|
type |
string:
distance |
A használni kívánt függvény típusát jelzi. Az érvényes értékek közé tartozik a mennyiség, a frissesség, a távolság és a címke. A függvénytípusnak kisbetűsnek kell lennie. |
DistanceScoringParameters
Paraméterértékeket biztosít egy távolsági pontozási függvénynek.
Name | Típus | Description |
---|---|---|
boostingDistance |
number |
Az a távolság, amely kilométerben van attól a referenciahelytől, ahol a kiemelési tartomány véget ér. |
referencePointParameter |
string |
A keresési lekérdezésekben átadott paraméter neve a referenciahely megadásához. |
EdgeNGramTokenFilter
A megadott méret(ek) n-grammját hozza létre egy bemeneti jogkivonat elejétől vagy hátuljától kezdve. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.
Name | Típus | Alapértelmezett érték | Description |
---|---|---|---|
@odata.type |
string:
#Microsoft. |
Egy URI-töredék, amely megadja a tokenszűrő típusát. |
|
maxGram |
integer |
2 |
A maximális n-gram hossz. Az alapértelmezett érték 2. |
minGram |
integer |
1 |
Az n-gramm minimális hossza. Az alapértelmezett érték 1. A maxGram értékénél kisebbnek kell lennie. |
name |
string |
A jogkivonatszűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet. |
|
side | front |
Meghatározza, hogy az n-gram melyik oldaláról kell létrehozni az n-gramot. Az alapértelmezett érték az "előtér". |
EdgeNGramTokenFilterSide
Meghatározza, hogy a bemenet melyik oldaláról kell n-gramot létrehozni.
Name | Típus | Description |
---|---|---|
back |
string |
Megadja, hogy az n-gramot a bemenet hátoldaláról kell létrehozni. |
front |
string |
Azt adja meg, hogy az n-gramot a bemenet elejéről kell létrehozni. |
EdgeNGramTokenFilterV2
A megadott méret(ek) n-grammját hozza létre egy bemeneti jogkivonat elejétől vagy hátuljától kezdve. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.
Name | Típus | Alapértelmezett érték | Description |
---|---|---|---|
@odata.type |
string:
#Microsoft. |
Egy URI-töredék, amely megadja a tokenszűrő típusát. |
|
maxGram |
integer |
2 |
A maximális n-gram hossz. Az alapértelmezett érték 2. A maximális érték 300. |
minGram |
integer |
1 |
Az n-gramm minimális hossza. Az alapértelmezett érték 1. A maximális érték 300. A maxGram értékénél kisebbnek kell lennie. |
name |
string |
A jogkivonatszűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet. |
|
side | front |
Meghatározza, hogy az n-gram melyik oldaláról kell létrehozni az n-gramot. Az alapértelmezett érték az "előtér". |
EdgeNGramTokenizer
Tokenizálja a bemenetet egy élről az adott méret(ek) n-grammjára. Ez a tokenizer az Apache Lucene használatával van implementálva.
Name | Típus | Alapértelmezett érték | Description |
---|---|---|---|
@odata.type |
string:
#Microsoft. |
Egy URI-töredék, amely a tokenizer típusát határozza meg. |
|
maxGram |
integer |
2 |
A maximális n-gram hossz. Az alapértelmezett érték 2. A maximális érték 300. |
minGram |
integer |
1 |
Az n-gramm minimális hossza. Az alapértelmezett érték 1. A maximális érték 300. A maxGram értékénél kisebbnek kell lennie. |
name |
string |
A tokenizer neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet. |
|
tokenChars |
A tokenekben megtartandó karakterosztályok. |
ElisionTokenFilter
Eltávolítja az elisionokat. A "l'avion" (a sík) például "avion" (sík) lesz. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.
Name | Típus | Description |
---|---|---|
@odata.type |
string:
#Microsoft. |
Egy URI-töredék, amely megadja a tokenszűrő típusát. |
articles |
string[] |
Az eltávolítandó cikkek halmaza. |
name |
string |
A jogkivonatszűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet. |
ExhaustiveKnnParameters
A teljes KNN-algoritmusra jellemző paramétereket tartalmazza.
Name | Típus | Description |
---|---|---|
metric |
A vektorok összehasonlításához használandó hasonlósági metrika. |
ExhaustiveKnnVectorSearchAlgorithmConfiguration
A lekérdezés során használt teljes KNN-algoritmusra vonatkozó konfigurációs beállításokat tartalmaz, amelyek találgatásos keresést hajtanak végre a teljes vektorindexben.
Name | Típus | Description |
---|---|---|
exhaustiveKnnParameters |
A teljes KNN-algoritmusra jellemző paramétereket tartalmazza. |
|
kind |
string:
exhaustive |
A vektorkereséshez konfigurált algoritmus neve. |
name |
string |
Az adott konfigurációhoz társítandó név. |
FreshnessScoringFunction
Egy olyan függvényt definiál, amely egy dátum-idő mező értéke alapján növeli a pontszámokat.
Name | Típus | Description |
---|---|---|
boost |
number |
A nyers pontszám szorzója. Pozitív számnak kell lennie, amely nem lehet 1,0. |
fieldName |
string |
A pontozófüggvény bemeneteként használt mező neve. |
freshness |
A frissesség-pontozási függvény paraméterértékei. |
|
interpolation |
Egy érték, amely azt jelzi, hogy a kiemelés hogyan lesz interpolálva a dokumentum pontszámai között; alapértelmezett értéke "Lineáris". |
|
type |
string:
freshness |
A használni kívánt függvény típusát jelzi. Az érvényes értékek közé tartozik a mennyiség, a frissesség, a távolság és a címke. A függvénytípusnak kisbetűsnek kell lennie. |
FreshnessScoringParameters
Paraméterértékeket biztosít egy frissesség-pontozási függvénynek.
Name | Típus | Description |
---|---|---|
boostingDuration |
string |
Az a lejárati időszak, amely után a kiemelés leáll egy adott dokumentum esetében. |
HnswParameters
A HNSW algoritmusra jellemző paramétereket tartalmazza.
Name | Típus | Alapértelmezett érték | Description |
---|---|---|---|
efConstruction |
integer |
400 |
A legközelebbi szomszédokat tartalmazó dinamikus lista mérete, amelyet az indexidő alatt használnak. A paraméter növelése javíthatja az index minőségét a megnövekedett indexelési idő rovására. Egy bizonyos ponton ennek a paraméternek a növelése a visszatérés csökkenéséhez vezet. |
efSearch |
integer |
500 |
A keresési idő alatt használt legközelebbi szomszédokat tartalmazó dinamikus lista mérete. A paraméter növelése javíthatja a keresési eredményeket, a lassabb keresés rovására. Egy bizonyos ponton ennek a paraméternek a növelése a visszatérés csökkenéséhez vezet. |
m |
integer |
4 |
Az összes új elemhez létrehozott kétirányú kapcsolatok száma az építés során. A paraméterérték növelése javíthatja a nagy belső dimenziójú adathalmazok visszahívási és lekérési idejét a megnövekedett memóriahasználat és a hosszabb indexelési idő rovására. |
metric |
A vektorok összehasonlításához használandó hasonlósági metrika. |
HnswVectorSearchAlgorithmConfiguration
Az indexelés és lekérdezés során használt HNSW közelítő szomszéd algoritmusra vonatkozó konfigurációs beállításokat tartalmaz. A HNSW algoritmus a keresési sebesség és a pontosság közötti kompromisszumot kínálja.
Name | Típus | Description |
---|---|---|
hnswParameters |
A HNSW-algoritmusra jellemző paramétereket tartalmazza. |
|
kind |
string:
hnsw |
A vektorkereséshez konfigurált algoritmus neve. |
name |
string |
Az adott konfigurációhoz társítandó név. |
KeepTokenFilter
Egy jogkivonatszűrő, amely csak a megadott szavak listájában lévő szöveggel rendelkező jogkivonatokat tárolja. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.
Name | Típus | Alapértelmezett érték | Description |
---|---|---|---|
@odata.type |
string:
#Microsoft. |
Egy URI-töredék, amely megadja a tokenszűrő típusát. |
|
keepWords |
string[] |
A megtartandó szavak listája. |
|
keepWordsCase |
boolean |
False |
Egy érték, amely azt jelzi, hogy az összes szót először kisbetűsre kell-e csökkenteni. Az alapértelmezett érték a false (hamis). |
name |
string |
A jogkivonatszűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet. |
KeywordMarkerTokenFilter
Kulcsszavakként jelöli meg a kifejezéseket. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.
Name | Típus | Alapértelmezett érték | Description |
---|---|---|---|
@odata.type |
string:
#Microsoft. |
Egy URI-töredék, amely megadja a tokenszűrő típusát. |
|
ignoreCase |
boolean |
False |
A kis- és nagybetűk figyelmen kívül hagyását jelző érték. Ha igaz, a rendszer először az összes szót kisbetűssé alakítja. Az alapértelmezett érték a false (hamis). |
keywords |
string[] |
Kulcsszavakként megjelölendő szavak listája. |
|
name |
string |
A jogkivonatszűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet. |
KeywordTokenizer
A teljes bemenetet egyetlen jogkivonatként bocsátja ki. Ez a jogkivonat-szabályzó az Apache Lucene használatával van implementálva.
Name | Típus | Alapértelmezett érték | Description |
---|---|---|---|
@odata.type |
string:
#Microsoft. |
Egy URI-töredék, amely a tokenizer típusát határozza meg. |
|
bufferSize |
integer |
256 |
Az olvasási puffer mérete bájtban. Az alapértelmezett érték 256. |
name |
string |
A tokenizer neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet. |
KeywordTokenizerV2
A teljes bemenetet egyetlen jogkivonatként bocsátja ki. Ez a jogkivonat-szabályzó az Apache Lucene használatával van implementálva.
Name | Típus | Alapértelmezett érték | Description |
---|---|---|---|
@odata.type |
string:
#Microsoft. |
Egy URI-töredék, amely a tokenizer típusát határozza meg. |
|
maxTokenLength |
integer |
256 |
A jogkivonat maximális hossza. Az alapértelmezett érték 256. A maximális hossznál hosszabb jogkivonatok fel vannak osztva. A maximálisan használható tokenhossz 300 karakter. |
name |
string |
A tokenizer neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet. |
LengthTokenFilter
Eltávolítja a túl hosszú vagy túl rövid szavakat. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.
Name | Típus | Alapértelmezett érték | Description |
---|---|---|---|
@odata.type |
string:
#Microsoft. |
Egy URI-töredék, amely megadja a tokenszűrő típusát. |
|
max |
integer |
300 |
A karakterek maximális hossza. Az alapértelmezett és a maximális érték 300. |
min |
integer |
0 |
A karakterek minimális hossza. Az alapértelmezett érték a 0. A maximális érték 300. A maximális értéknél kisebbnek kell lennie. |
name |
string |
A jogkivonatszűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet. |
LexicalAnalyzerName
Meghatározza a keresőmotor által támogatott összes szövegelemző nevét.
Name | Típus | Description |
---|---|---|
ar.lucene |
string |
Lucene analyzer arab nyelven. |
ar.microsoft |
string |
Microsoft Analyzer arab nyelven. |
bg.lucene |
string |
Lucene-elemző bolgárnak. |
bg.microsoft |
string |
Microsoft analyzer for Bolgár. |
bn.microsoft |
string |
A Bangla Microsoft-elemzője. |
ca.lucene |
string |
Lucene elemző katalánnak. |
ca.microsoft |
string |
A Microsoft elemzője katalán nyelven. |
cs.lucene |
string |
Lucene elemző csehnek. |
cs.microsoft |
string |
A Microsoft elemzője csehül. |
da.lucene |
string |
Lucene analyzer dánnak. |
da.microsoft |
string |
Microsoft analyzer dán nyelven. |
de.lucene |
string |
Lucene-elemző németül. |
de.microsoft |
string |
Microsoft analyzer német nyelven. |
el.lucene |
string |
Lucene elemző göröghöz. |
el.microsoft |
string |
Microsoft Analyzer görög nyelven. |
en.lucene |
string |
Lucene analyzer angol nyelven. |
en.microsoft |
string |
Microsoft Analyzer angol nyelven. |
es.lucene |
string |
Lucene elemző spanyolra. |
es.microsoft |
string |
Microsoft Analyzer spanyol nyelven. |
et.microsoft |
string |
Microsoft analyzer az észtekhez. |
eu.lucene |
string |
Lucene-elemző Baszknak. |
fa.lucene |
string |
Lucene elemző perzsa. |
fi.lucene |
string |
Lucene analyzer finnhez. |
fi.microsoft |
string |
Microsoft analyzer for Finn. |
fr.lucene |
string |
Lucene elemző francia nyelvre. |
fr.microsoft |
string |
Microsoft analyzer francia nyelven. |
ga.lucene |
string |
Lucene-elemző írnek. |
gl.lucene |
string |
Lucene-elemző a galíciaiaknak. |
gu.microsoft |
string |
Microsoft analyzer for Gujarati. |
he.microsoft |
string |
Microsoft Analyzer héber nyelven. |
hi.lucene |
string |
Lucene elemző hindinek. |
hi.microsoft |
string |
Microsoft analyzer for Hindi. |
hr.microsoft |
string |
Microsoft analyzer for Horvát. |
hu.lucene |
string |
Lucene-elemző magyarra. |
hu.microsoft |
string |
Microsoft-elemző magyar nyelven. |
hy.lucene |
string |
Lucene-elemző örménynek. |
id.lucene |
string |
Lucene analyzer indonéz. |
id.microsoft |
string |
Indonéz Microsoft-elemző (Bahasa). |
is.microsoft |
string |
Izlandi Microsoft-elemző. |
it.lucene |
string |
Lucene elemző olasznak. |
it.microsoft |
string |
Microsoft Analyzer olasz nyelven. |
ja.lucene |
string |
Lucene-elemző japánhoz. |
ja.microsoft |
string |
Microsoft analyzer japán nyelven. |
keyword |
string |
A mező teljes tartalmát egyetlen jogkivonatként kezeli. Ez olyan adatok esetében hasznos, mint az irányítószámok, az azonosítók és néhány terméknév. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/KeywordAnalyzer.html |
kn.microsoft |
string |
A Kannada Microsoft-elemzője. |
ko.lucene |
string |
Lucene elemző koreaihoz. |
ko.microsoft |
string |
Microsoft-elemző koreaihoz. |
lt.microsoft |
string |
Microsoft-elemző litvánhoz. |
lv.lucene |
string |
Lucene-elemző lettnek. |
lv.microsoft |
string |
Microsoft Analyzer lett nyelvhez. |
ml.microsoft |
string |
Microsoft analyzer for Malayalam. |
mr.microsoft |
string |
Microsoft analyzer for Marathi. |
ms.microsoft |
string |
Microsoft-elemző malájhoz (latin betűs). |
nb.microsoft |
string |
Microsoft analyzer for Norwegian (Bokmål). |
nl.lucene |
string |
Lucene analyzer hollandra. |
nl.microsoft |
string |
Microsoft Analyzer holland nyelven. |
no.lucene |
string |
Lucene-elemző norvégra. |
pa.microsoft |
string |
Microsoft-elemző Punjabihoz. |
pattern |
string |
A szöveget rugalmasan elválasztja kifejezésekké egy reguláris kifejezésmintával. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/PatternAnalyzer.html |
pl.lucene |
string |
Lucene-elemző a lengyelhez. |
pl.microsoft |
string |
Microsoft Analyzer lengyel nyelven. |
pt-BR.lucene |
string |
Lucene analyzer portugál (Brazília). |
pt-BR.microsoft |
string |
Microsoft analyzer for Portuguese (Brazília). |
pt-PT.lucene |
string |
Lucene analyzer for Portugál (Portugália). |
pt-PT.microsoft |
string |
Microsoft analyzer for Portuguese (Portugália). |
ro.lucene |
string |
Lucene elemző románhoz. |
ro.microsoft |
string |
Microsoft analyzer for Román. |
ru.lucene |
string |
Lucene elemző orosznak. |
ru.microsoft |
string |
Microsoft-elemző oroszhoz. |
simple |
string |
Nem betűkre osztja a szöveget, és kisbetűssé alakítja őket. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/SimpleAnalyzer.html |
sk.microsoft |
string |
Microsoft analyzer for Szlovák. |
sl.microsoft |
string |
Microsoft-elemző szlovén nyelvhez. |
sr-cyrillic.microsoft |
string |
Szerb (cirill betűs) Microsoft-elemző. |
sr-latin.microsoft |
string |
Microsoft-elemző szerb (latin betűs) nyelven. |
standard.lucene |
string |
Standard Lucene-elemző. |
standardasciifolding.lucene |
string |
Standard ASCII összecsukható Lucene-elemző. Lásd: https://docs.microsoft.com/rest/api/searchservice/Custom-analyzers-in-Azure-Search#Analyzers |
stop |
string |
A szöveget nem betűkkel osztja el; Alkalmazza a kisbetűs és a stopword jogkivonat szűrőit. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/StopAnalyzer.html |
sv.lucene |
string |
Lucene elemző svédnek. |
sv.microsoft |
string |
Microsoft analyzer for Svéd. |
ta.microsoft |
string |
Microsoft analyzer for Tamil. |
te.microsoft |
string |
Microsoft analyzer for Telugu. |
th.lucene |
string |
Lucene elemző thaihoz. |
th.microsoft |
string |
Microsoft Analyzer thai nyelven. |
tr.lucene |
string |
Lucene elemző törökhöz. |
tr.microsoft |
string |
Microsoft analyzer for Török. |
uk.microsoft |
string |
Microsoft analyzer for Ukrán. |
ur.microsoft |
string |
Microsoft analyzer for Urdu. |
vi.microsoft |
string |
A Vietnami Microsoft elemzője. |
whitespace |
string |
Egy elemző, amely a térbeli jogkivonat-jelölőt használja. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/WhitespaceAnalyzer.html |
zh-Hans.lucene |
string |
Lucene analyzer kínaihoz (egyszerűsített). |
zh-Hans.microsoft |
string |
Microsoft Analyzer kínaihoz (egyszerűsített). |
zh-Hant.lucene |
string |
Lucene analyzer kínaihoz (hagyományos). |
zh-Hant.microsoft |
string |
Microsoft Analyzer kínaihoz (hagyományos). |
LexicalTokenizerName
Meghatározza a keresőmotor által támogatott összes tokenizer nevét.
LimitTokenFilter
Korlátozza a tokenek számát az indexelés során. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.
Name | Típus | Alapértelmezett érték | Description |
---|---|---|---|
@odata.type |
string:
#Microsoft. |
Egy URI-töredék, amely megadja a tokenszűrő típusát. |
|
consumeAllTokens |
boolean |
False |
Egy érték, amely azt jelzi, hogy a bemenetből származó összes jogkivonatot fel kell-e használni akkor is, ha eléri a maxTokenCount értéket. Az alapértelmezett érték a false (hamis). |
maxTokenCount |
integer |
1 |
A létrehozandó jogkivonatok maximális száma. Az alapértelmezett érték 1. |
name |
string |
A jogkivonatszűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet. |
LuceneStandardAnalyzer
Standard Apache Lucene-elemző; A standard tokenizerből, kisbetűs szűrőből és leállítási szűrőből áll.
Name | Típus | Alapértelmezett érték | Description |
---|---|---|---|
@odata.type |
string:
#Microsoft. |
Az elemző típusát meghatározó URI-töredék. |
|
maxTokenLength |
integer |
255 |
A jogkivonat maximális hossza. Az alapértelmezett érték 255. A maximális hossznál hosszabb jogkivonatok fel vannak osztva. A maximálisan használható tokenhossz 300 karakter. |
name |
string |
Az elemző neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet. |
|
stopwords |
string[] |
A stopszavak listája. |
LuceneStandardTokenizer
A Unicode-szöveg szegmentálási szabályai szerint töri a szöveget. Ez a jogkivonat-szabályzó az Apache Lucene használatával van implementálva.
Name | Típus | Alapértelmezett érték | Description |
---|---|---|---|
@odata.type |
string:
#Microsoft. |
Egy URI-töredék, amely a tokenizer típusát határozza meg. |
|
maxTokenLength |
integer |
255 |
A jogkivonat maximális hossza. Az alapértelmezett érték 255. A maximális hossznál hosszabb jogkivonatok fel vannak osztva. |
name |
string |
A tokenizer neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet. |
LuceneStandardTokenizerV2
A Unicode-szöveg szegmentálási szabályai szerint töri a szöveget. Ez a jogkivonat-szabályzó az Apache Lucene használatával van implementálva.
Name | Típus | Alapértelmezett érték | Description |
---|---|---|---|
@odata.type |
string:
#Microsoft. |
Egy URI-töredék, amely a tokenizer típusát határozza meg. |
|
maxTokenLength |
integer |
255 |
A jogkivonat maximális hossza. Az alapértelmezett érték 255. A maximális hossznál hosszabb jogkivonatok fel vannak osztva. A maximálisan használható tokenhossz 300 karakter. |
name |
string |
A tokenizer neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet. |
MagnitudeScoringFunction
Olyan függvényt határoz meg, amely egy numerikus mező nagyságrendje alapján növeli a pontszámokat.
Name | Típus | Description |
---|---|---|
boost |
number |
A nyers pontszám szorzója. Pozitív számnak kell lennie, amely nem lehet 1,0. |
fieldName |
string |
A pontozófüggvény bemeneteként használt mező neve. |
interpolation |
Egy érték, amely azt jelzi, hogy a kiemelés hogyan lesz interpolálva a dokumentum pontszámai között; alapértelmezett értéke "Lineáris". |
|
magnitude |
A nagyságrendi pontozási függvény paraméterértékei. |
|
type |
string:
magnitude |
A használni kívánt függvény típusát jelzi. Az érvényes értékek közé tartozik a mennyiség, a frissesség, a távolság és a címke. A függvénytípusnak kisbetűsnek kell lennie. |
MagnitudeScoringParameters
Paraméterértékeket ad meg egy nagyságrendi pontozási függvénynek.
Name | Típus | Description |
---|---|---|
boostingRangeEnd |
number |
Az a mezőérték, amelynél a kiemelés véget ér. |
boostingRangeStart |
number |
Az a mezőérték, amelynél a kiemelés elindul. |
constantBoostBeyondRange |
boolean |
Érték, amely azt jelzi, hogy a tartományvégértéken túli mezőértékek esetében állandó lökést kell-e alkalmazni; alapértelmezett értéke hamis. |
MappingCharFilter
Karakterszűrő, amely a leképezési beállítással definiált leképezéseket alkalmazza. A megfeleltetés kapzsi (a leghosszabb mintaegyeztetés egy adott ponton nyer). A csere lehet üres sztring. Ez a karakterszűrő az Apache Lucene használatával van implementálva.
Name | Típus | Description |
---|---|---|
@odata.type |
string:
#Microsoft. |
A karakterszűrő típusát meghatározó URI-töredék. |
mappings |
string[] |
A következő formátumú leképezések listája: "a=>b" (az "a" karakter minden előfordulása a "b" karakterrel lesz helyettesítve). |
name |
string |
A karakterszűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet. |
MicrosoftLanguageStemmingTokenizer
Nyelvspecifikus szabályokkal osztja el a szöveget, és csökkenti a szavak alapformáit.
Name | Típus | Alapértelmezett érték | Description |
---|---|---|---|
@odata.type |
string:
#Microsoft. |
Egy URI-töredék, amely a tokenizer típusát határozza meg. |
|
isSearchTokenizer |
boolean |
False |
A tokenizer használatát jelző érték. Állítsa igaz értékre, ha keresési jogkivonat-szabályzóként használják, állítsa hamis értékre, ha indexelő jogkivonat-szabályzóként használják. Az alapértelmezett érték a false (hamis). |
language |
A használni kívánt nyelv. Az alapértelmezett érték az angol. |
||
maxTokenLength |
integer |
255 |
A jogkivonat maximális hossza. A maximális hossznál hosszabb jogkivonatok fel vannak osztva. A használható jogkivonatok maximális hossza 300 karakter. A 300 karakternél hosszabb jogkivonatok először 300 hosszúságú jogkivonatokra lesznek felosztva, majd az egyes jogkivonatok felosztása a jogkivonatok maximális hosszának beállítása alapján történik. Az alapértelmezett érték 255. |
name |
string |
A tokenizer neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet. |
MicrosoftLanguageTokenizer
Nyelvspecifikus szabályokkal osztja el a szöveget.
Name | Típus | Alapértelmezett érték | Description |
---|---|---|---|
@odata.type |
string:
#Microsoft. |
Egy URI-töredék, amely a tokenizer típusát határozza meg. |
|
isSearchTokenizer |
boolean |
False |
A tokenizer használatát jelző érték. Állítsa igaz értékre, ha keresési jogkivonat-szabályzóként használják, állítsa hamis értékre, ha indexelő jogkivonat-szabályzóként használják. Az alapértelmezett érték a false (hamis). |
language |
A használni kívánt nyelv. Az alapértelmezett érték az angol. |
||
maxTokenLength |
integer |
255 |
A jogkivonat maximális hossza. A maximális hossznál hosszabb jogkivonatok fel vannak osztva. A használható jogkivonatok maximális hossza 300 karakter. A 300 karakternél hosszabb jogkivonatok először 300 hosszúságú jogkivonatokra lesznek felosztva, majd az egyes jogkivonatok felosztása a jogkivonatok maximális hosszának beállítása alapján történik. Az alapértelmezett érték 255. |
name |
string |
A tokenizer neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet. |
MicrosoftStemmingTokenizerLanguage
Listák a Microsoft nyelvi jogkivonat-kezelője által támogatott nyelveket.
Name | Típus | Description |
---|---|---|
arabic |
string |
Kiválasztja a Microsoft stemming tokenizert arab nyelven. |
bangla |
string |
A Bangla microsoftos jogkivonat-jelölőjének kiválasztása. |
bulgarian |
string |
Kiválasztja a microsoftos jogkivonat-kezelőt bolgár nyelven. |
catalan |
string |
Kiválasztja a KatalánHoz tartozó Microsoft-jogkivonat-kezelőt. |
croatian |
string |
Kiválasztja a Microsoft stemming tokenizert horvát nyelvhez. |
czech |
string |
Kiválasztja a Microsoft stemming tokenizert csehhez. |
danish |
string |
Kiválasztja a Microsoft stemming tokenizert dánul. |
dutch |
string |
Kiválasztja a Microsoft stemming tokenizer for Dutch (Microsoft stemming tokenizer for Dutch) lehetőséget. |
english |
string |
Kiválasztja az angol nyelvű Microsoft stemming tokenizert. |
estonian |
string |
Kiválasztja a Microsoft stemming tokenizert az észthez. |
finnish |
string |
Kiválasztja a Microsoft stemming tokenizer for Finn (Microsoft stemming tokenizer for Finn) lehetőséget. |
french |
string |
Kiválasztja a Microsoft stemming tokenizert francia nyelven. |
german |
string |
Kiválasztja a Microsoft stemming tokenizert a német nyelvhez. |
greek |
string |
Kiválasztja a microsoftos jogkivonat-kezelőt a göröghöz. |
gujarati |
string |
A Gujaratihoz tartozó Microsoft stemming tokenizer kiválasztása. |
hebrew |
string |
Kiválasztja a Héber nyelvhez tartozó Microsoft stemming tokenizert. |
hindi |
string |
Kiválasztja a Hindihez tartozó Microsoft stemming tokenizert. |
hungarian |
string |
Kiválasztja a Microsoft stemming tokenizert magyarra. |
icelandic |
string |
Kiválasztja az izlandi Microsoft stemming tokenizert. |
indonesian |
string |
Kiválasztja az indonéz microsoftos jogkivonat-kezelőt. |
italian |
string |
Kiválasztja a Microsoft stemming tokenizer for Italian (Microsoft stemming tokenizer for Italian) lehetőséget. |
kannada |
string |
A Kannada microsoftos jogkivonat-kezelőjének kiválasztása. |
latvian |
string |
A Lett nyelvhez tartozó Microsoft stemming tokenizer kiválasztása. |
lithuanian |
string |
Kiválasztja a Microsoft stemming tokenizert litvánhoz. |
malay |
string |
Kiválasztja a Maláj microsoftos jogkivonat-jelölőt. |
malayalam |
string |
Kiválasztja a Malayalamhoz tartozó Microsoft-jogkivonat-jelölőt. |
marathi |
string |
Kiválasztja a Marathihoz tartozó Microsoft stemming tokenizert. |
norwegianBokmaal |
string |
Kiválasztja a Microsoft stemming tokenizert norvég (Bokmål) nyelvhez. |
polish |
string |
Kiválasztja a Microsoft stemming tokenizer for Polish (Microsoft stemming tokenizer for Lengyel) lehetőséget. |
portuguese |
string |
Kiválasztja a Portugál nyelvhez tartozó Microsoft stemming tokenizert. |
portugueseBrazilian |
string |
Kiválasztja a Portugál (Brazília) microsoftos jogkivonat-jelölőt. |
punjabi |
string |
Kiválasztja a Punjabihoz tartozó Microsoft-jogkivonat-kezelőt. |
romanian |
string |
Kiválasztja a Microsoft stemming tokenizert a román nyelvhez. |
russian |
string |
Kiválasztja az orosz nyelvű Microsoft stemming tokenizert. |
serbianCyrillic |
string |
A Szerb (cirill betűs) Microsoft stemming tokenizert választja ki. |
serbianLatin |
string |
A Szerb (latin betűs) Microsoft stemming tokenizert választja. |
slovak |
string |
Kiválasztja a Microsoft stemming tokenizert a szlovák nyelvhez. |
slovenian |
string |
Kiválasztja a Microsoft stemming tokenizert szlovén nyelvhez. |
spanish |
string |
Kiválasztja a microsoftos jogkivonat-kezelőt a spanyol nyelvhez. |
swedish |
string |
Kiválasztja a Microsoft stemming tokenizert svéd nyelven. |
tamil |
string |
Kiválasztja a Microsoft stemming tokenizert a Tamilhez. |
telugu |
string |
Kiválasztja a Teluguhoz készült Microsoft stemming tokenizert. |
turkish |
string |
Kiválasztja a Törökhöz készült Microsoft stemming tokenizert. |
ukrainian |
string |
Kiválasztja az ukrán microsoftos jogkivonat-kezelőt. |
urdu |
string |
Kiválasztja az Urduhoz tartozó Microsoft stemming tokenizert. |
MicrosoftTokenizerLanguage
Listák a Microsoft nyelvi tokenizer által támogatott nyelveket.
Name | Típus | Description |
---|---|---|
bangla |
string |
A Bangla Microsoft tokenizer elemét választja ki. |
bulgarian |
string |
Kiválasztja a Bolgár Microsoft tokenizert. |
catalan |
string |
Kiválasztja a Katalánhoz készült Microsoft tokenizert. |
chineseSimplified |
string |
Kiválasztja a Microsoft tokenizer kínai (egyszerűsített) beállítását. |
chineseTraditional |
string |
Kiválasztja a Kínai (hagyományos) Microsoft tokenizert. |
croatian |
string |
Kiválasztja a Horvát Microsoft tokenizert. |
czech |
string |
Kiválasztja a Microsoft tokenizert csehhez. |
danish |
string |
Kiválasztja a Microsoft tokenizert dánul. |
dutch |
string |
Kiválasztja a Microsoft tokenizert hollandra. |
english |
string |
A Microsoft angol jogkivonat-jelölőjének kiválasztása. |
french |
string |
Kiválasztja a Microsoft tokenizert francia nyelven. |
german |
string |
A Microsoft tokenizer (német) lehetőséget választja. |
greek |
string |
Kiválasztja a Microsoft tokenizert a göröghöz. |
gujarati |
string |
Kiválasztja a Microsoft-jogkivonat-jelölőt Gujaratihoz. |
hindi |
string |
Kiválasztja a Hindihez készült Microsoft tokenizert. |
icelandic |
string |
Kiválasztja az izlandi Microsoft tokenizert. |
indonesian |
string |
Kiválasztja az indonéz Microsoft tokenizert. |
italian |
string |
Kiválasztja az olasz microsoft jogkivonat-jelölőt. |
japanese |
string |
Kiválasztja a Japánhoz készült Microsoft tokenizert. |
kannada |
string |
A Kannada Microsoft-jogkivonat-jelölőjének kiválasztása. |
korean |
string |
Kiválasztja a Koreaihoz készült Microsoft tokenizert. |
malay |
string |
Kiválasztja a Microsoft tokenizert malájhoz. |
malayalam |
string |
Kiválasztja a Microsoft tokenizert a malajalamhoz. |
marathi |
string |
Kiválasztja a Marathihoz készült Microsoft tokenizert. |
norwegianBokmaal |
string |
Kiválasztja a Microsoft tokenizert norvég (Bokmål) számára. |
polish |
string |
Kiválasztja a Microsoft tokenizert a lengyelhez. |
portuguese |
string |
Kiválasztja a Microsoft portugál jogkivonat-jelölőt. |
portugueseBrazilian |
string |
Kiválasztja a Microsoft tokenizert portugál (Brazília) nyelvhez. |
punjabi |
string |
Kiválasztja a Punjabihoz tartozó Microsoft tokenizert. |
romanian |
string |
Kiválasztja a Microsoft tokenizert a román nyelvhez. |
russian |
string |
Kiválasztja a Microsoft tokenizert oroszra. |
serbianCyrillic |
string |
Kiválasztja a Szerb (cirill betűs) Microsoft tokenizert. |
serbianLatin |
string |
Kiválasztja a Microsoft tokenizert szerb (latin betűs) nyelvhez. |
slovenian |
string |
Kiválasztja a Szlovén microsoft tokenizert. |
spanish |
string |
Kiválasztja a Microsoft tokenizert spanyolul. |
swedish |
string |
Kiválasztja a Microsoft tokenizert svéd nyelven. |
tamil |
string |
Kiválasztja a Microsoft tokenizert a Tamilhez. |
telugu |
string |
Kiválasztja a Teluguhoz készült Microsoft tokenizert. |
thai |
string |
Kiválasztja a Thai microsoft tokenizert. |
ukrainian |
string |
Kiválasztja az ukrán Microsoft tokenizert. |
urdu |
string |
Kiválasztja a Microsoft tokenizert az Urduhoz. |
vietnamese |
string |
Kiválasztja a vietnami Microsoft tokenizert. |
NGramTokenFilter
A megadott méret(ek) n-grammját hozza létre. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.
Name | Típus | Alapértelmezett érték | Description |
---|---|---|---|
@odata.type |
string:
#Microsoft. |
Egy URI-töredék, amely megadja a tokenszűrő típusát. |
|
maxGram |
integer |
2 |
A maximális n-gram hossz. Az alapértelmezett érték 2. |
minGram |
integer |
1 |
Az n-gramm minimális hossza. Az alapértelmezett érték 1. A maxGram értékénél kisebbnek kell lennie. |
name |
string |
A jogkivonatszűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet. |
NGramTokenFilterV2
A megadott méret(ek) n-grammját hozza létre. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.
Name | Típus | Alapértelmezett érték | Description |
---|---|---|---|
@odata.type |
string:
#Microsoft. |
Egy URI-töredék, amely megadja a tokenszűrő típusát. |
|
maxGram |
integer |
2 |
A maximális n-gram hossz. Az alapértelmezett érték 2. A maximális érték 300. |
minGram |
integer |
1 |
Az n-gramm minimális hossza. Az alapértelmezett érték 1. A maximális érték 300. A maxGram értékénél kisebbnek kell lennie. |
name |
string |
A jogkivonatszűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet. |
NGramTokenizer
Tokenizálja a bemenetet az adott méret(ek) n-grammjára. Ez a jogkivonat-szabályzó az Apache Lucene használatával van implementálva.
Name | Típus | Alapértelmezett érték | Description |
---|---|---|---|
@odata.type |
string:
#Microsoft. |
Egy URI-töredék, amely a tokenizer típusát határozza meg. |
|
maxGram |
integer |
2 |
A maximális n-gram hossz. Az alapértelmezett érték 2. A maximális érték 300. |
minGram |
integer |
1 |
Az n-gramm minimális hossza. Az alapértelmezett érték 1. A maximális érték 300. A maxGram értékénél kisebbnek kell lennie. |
name |
string |
A tokenizer neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet. |
|
tokenChars |
A tokenekben megtartandó karakterosztályok. |
PathHierarchyTokenizerV2
Tokenizer elérésiút-szerű hierarchiákhoz. Ez a jogkivonat-szabályzó az Apache Lucene használatával van implementálva.
Name | Típus | Alapértelmezett érték | Description |
---|---|---|---|
@odata.type |
string:
#Microsoft. |
Egy URI-töredék, amely a tokenizer típusát határozza meg. |
|
delimiter |
string |
/ |
A használni kívánt elválasztó karakter. Az alapértelmezett érték a "/". |
maxTokenLength |
integer |
300 |
A jogkivonat maximális hossza. Az alapértelmezett és a maximális érték 300. |
name |
string |
A tokenizer neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet. |
|
replacement |
string |
/ |
Egy érték, amely ha be van állítva, lecseréli a határoló karaktert. Az alapértelmezett érték a "/". |
reverse |
boolean |
False |
Egy érték, amely azt jelzi, hogy fordított sorrendben kell-e létrehozni a jogkivonatokat. Az alapértelmezett érték a false (hamis). |
skip |
integer |
0 |
A kihagyandó kezdeti tokenek száma. Az alapértelmezett érték a 0. |
PatternAnalyzer
A szöveget rugalmasan elválasztja kifejezésekké egy reguláris kifejezésmintával. Ez az elemző az Apache Lucene használatával van implementálva.
Name | Típus | Alapértelmezett érték | Description |
---|---|---|---|
@odata.type |
string:
#Microsoft. |
Az elemző típusát meghatározó URI-töredék. |
|
flags |
Reguláris kifejezésjelölők. |
||
lowercase |
boolean |
True |
Egy érték, amely azt jelzi, hogy a kifejezések kisbetűsek-e. Alapértelmezett érték: true (igaz). |
name |
string |
Az elemző neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet. |
|
pattern |
string |
\W+ |
Egy reguláris kifejezésminta a tokenelválasztók egyeztetéséhez. Az alapértelmezett egy olyan kifejezés, amely egy vagy több nem szó karakternek felel meg. |
stopwords |
string[] |
A stopszavak listája. |
PatternCaptureTokenFilter
Java-regexek használatával több jogkivonatot bocsát ki – egyet minden rögzítési csoporthoz egy vagy több mintában. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.
Name | Típus | Alapértelmezett érték | Description |
---|---|---|---|
@odata.type |
string:
#Microsoft. |
Egy URI-töredék, amely megadja a tokenszűrő típusát. |
|
name |
string |
A jogkivonatszűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet. |
|
patterns |
string[] |
Az egyes tokenekhez illeszkedő minták listája. |
|
preserveOriginal |
boolean |
True |
Egy érték, amely azt jelzi, hogy az eredeti jogkivonatot akkor is vissza kell-e adni, ha az egyik minta megegyezik. Alapértelmezett érték: true (igaz). |
PatternReplaceCharFilter
Karakterszűrő, amely lecseréli a bemeneti sztringben szereplő karaktereket. Egy reguláris kifejezéssel azonosítja a megőrizni kívánt karaktersorozatokat, a lecserélendő karaktereket pedig helyettesítő mintával azonosítja. Ha például az "aa bb aa bb", a "(aa)\s+(bb)" minta és az "$1#$2" helyettesítő szöveg szerepel, az eredmény "aa#bb aa#bb". Ez a karakterszűrő az Apache Lucene használatával van implementálva.
Name | Típus | Description |
---|---|---|
@odata.type |
string:
#Microsoft. |
A karakterszűrő típusát meghatározó URI-töredék. |
name |
string |
A karakterszűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet. |
pattern |
string |
Egy reguláris kifejezésminta. |
replacement |
string |
A helyettesítő szöveg. |
PatternReplaceTokenFilter
Karakterszűrő, amely a bemeneti sztringben szereplő karaktereket helyettesíti. Egy reguláris kifejezéssel azonosítja a megőrizendő karaktersorozatokat, a cseremintát pedig a lecserélendő karakterek azonosításához. Például az "aa bb aa bb", "(aa)\s+(bb)" minta és az "$1#$2" helyettesítő szöveg miatt az eredmény "aa#bb aa#bb". Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.
Name | Típus | Description |
---|---|---|
@odata.type |
string:
#Microsoft. |
Egy URI-töredék, amely megadja a tokenszűrő típusát. |
name |
string |
A jogkivonatszűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet. |
pattern |
string |
Egy reguláris kifejezésminta. |
replacement |
string |
A helyettesítő szöveg. |
PatternTokenizer
Tokenizer, amely regex mintaegyeztetést használ a különböző tokenek létrehozásához. Ez a jogkivonat-szabályzó az Apache Lucene használatával van implementálva.
Name | Típus | Alapértelmezett érték | Description |
---|---|---|---|
@odata.type |
string:
#Microsoft. |
Egy URI-töredék, amely a tokenizer típusát határozza meg. |
|
flags |
Reguláris kifejezésjelölők. |
||
group |
integer |
-1 |
Az egyező csoport nulla alapú sorszáma a reguláris kifejezésmintában, amely tokenekké nyerhető ki. Használja a -1 értéket, ha a teljes mintát szeretné használni a bemenet jogkivonatokra való felosztásához, függetlenül az egyező csoportoktól. Az alapértelmezett érték -1. |
name |
string |
A tokenizer neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet. |
|
pattern |
string |
\W+ |
Normál kifejezésminta a tokenelválasztókhoz. Az alapértelmezett kifejezés egy vagy több nem szó karakternek megfelelő kifejezés. |
PhoneticEncoder
A PhoneticTokenFilterrel használandó fonetikus kódoló típusát azonosítja.
Name | Típus | Description |
---|---|---|
beiderMorse |
string |
Kódol egy jogkivonatot egy Beider-Morse értékre. |
caverphone1 |
string |
Kódol egy tokent egy Caverphone 1.0 értékre. |
caverphone2 |
string |
Kódol egy tokent egy Caverphone 2.0 értékre. |
cologne |
string |
Kódol egy jogkivonatot egy kölni fonetikus értékre. |
doubleMetaphone |
string |
Egy tokent dupla metafonértékké kódol. |
haasePhonetik |
string |
Kódol egy jogkivonatot a Kölner Phonetik algoritmus Haase-finomításával. |
koelnerPhonetik |
string |
Kódol egy jogkivonatot a Kölner Phonetik algoritmussal. |
metaphone |
string |
Kódol egy tokent egy Metaphone-értékbe. |
nysiis |
string |
Kódol egy jogkivonatot EGY NYSIIS-értékbe. |
refinedSoundex |
string |
Egy jogkivonatot pontosított Soundex-értékké kódol. |
soundex |
string |
Egy jogkivonatot Soundex-értékké kódol. |
PhoneticTokenFilter
Jogkivonatok létrehozása fonetikus egyezésekhez. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.
Name | Típus | Alapértelmezett érték | Description |
---|---|---|---|
@odata.type |
string:
#Microsoft. |
Egy URI-töredék, amely megadja a tokenszűrő típusát. |
|
encoder | metaphone |
A használni kívánt fonetikus kódoló. Az alapértelmezett érték a "metaphone". |
|
name |
string |
A jogkivonatszűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet. |
|
replace |
boolean |
True |
Érték, amely azt jelzi, hogy a kódolt jogkivonatok lecserélik-e az eredeti jogkivonatokat. Ha hamis, a kódolt jogkivonatok szinonimákként lesznek hozzáadva. Alapértelmezett érték: true (igaz). |
PrioritizedFields
A szemantikai rangsoroláshoz, feliratokhoz, kiemelésekhez és válaszokhoz használandó cím-, tartalom- és kulcsszavak mezőit ismerteti.
Name | Típus | Description |
---|---|---|
prioritizedContentFields |
Meghatározza a szemantikai rangsoroláshoz, feliratokhoz, kiemelésekhez és válaszokhoz használandó tartalommezőket. A legjobb eredmény érdekében a kijelölt mezőknek természetes nyelvű szöveget kell tartalmazniuk. A tömb mezőinek sorrendje a prioritásukat jelöli. Az alacsonyabb prioritású mezők csonkulhatnak, ha a tartalom hosszú. |
|
prioritizedKeywordsFields |
Meghatározza a szemantikai rangsoroláshoz, feliratokhoz, kiemelésekhez és válaszokhoz használandó kulcsszómezőket. A legjobb eredmény érdekében a kijelölt mezőknek tartalmazniuk kell a kulcsszavak listáját. A tömb mezőinek sorrendje a prioritásukat jelöli. Az alacsonyabb prioritású mezők csonkulhatnak, ha a tartalom hosszú. |
|
titleField |
Meghatározza a szemantikai rangsoroláshoz, feliratokhoz, kiemelésekhez és válaszokhoz használandó címmezőt. Ha nincs címmező az indexben, hagyja üresen ezt a mezőt. |
RegexFlags
Olyan jelzőket definiál, amelyek kombinálhatók annak szabályozására, hogy a reguláris kifejezések hogyan legyenek használva a mintaelemzőben és a mintajogkivonat-jelölőben.
Name | Típus | Description |
---|---|---|
CANON_EQ |
string |
Engedélyezi a canonikus egyenértékűséget. |
CASE_INSENSITIVE |
string |
Engedélyezi a kis- és nagybetűk megkülönböztetése nélküli egyeztetést. |
COMMENTS |
string |
Engedélyezi a térközt és a megjegyzéseket a mintában. |
DOTALL |
string |
Engedélyezi a dotall módot. |
LITERAL |
string |
Lehetővé teszi a minta literális elemzését. |
MULTILINE |
string |
Engedélyezi a többsoros módot. |
UNICODE_CASE |
string |
Lehetővé teszi a Unicode-ra képes kis- és nagybetűk összecsukását. |
UNIX_LINES |
string |
Engedélyezi a Unix-vonalak üzemmódot. |
ScoringFunctionAggregation
Meghatározza azt az aggregációs függvényt, amely a pontozási profil összes pontozási függvényének eredményeit egyesíti.
Name | Típus | Description |
---|---|---|
average |
string |
A pontszámok növelése az összes pontozófüggvény eredményének átlagával. |
firstMatching |
string |
Pontszámok növelése a pontozási profil első alkalmazható pontozási függvényével. |
maximum |
string |
A pontszámok növelése az összes pontozófüggvény eredményének maximális értékével. |
minimum |
string |
A pontszámok növelése az összes pontozófüggvény eredményének minimumával. |
sum |
string |
A pontszámok növelése az összes pontozófüggvény eredményének összegével. |
ScoringFunctionInterpolation
Meghatározza azt a függvényt, amely a pontszámok több dokumentumra kiterjedő interpolálására szolgál.
Name | Típus | Description |
---|---|---|
constant |
string |
Állandó tényezővel növeli a pontszámokat. |
linear |
string |
Lineárisan csökkenő mennyiséggel növeli a pontszámokat. Ez a pontozási függvények alapértelmezett interpolációja. |
logarithmic |
string |
A pontszámokat olyan mennyiséggel növeli, amely logaritmikusan csökken. A magasabb pontszámok esetén a kiemelések gyorsan csökkennek, és lassabban, ahogy a pontszámok csökkennek. Ez az interpolációs beállítás nem engedélyezett a címke pontozási függvényeiben. |
quadratic |
string |
A pontszámokat egy olyan összeggel növeli, amely kvadráns módon csökken. A kiemelések lassabban csökkennek a magasabb pontszámok esetén, és gyorsabban, ahogy a pontszámok csökkennek. Ez az interpolációs beállítás nem engedélyezett a címke pontozási függvényeiben. |
ScoringProfile
Olyan keresési index paramétereit határozza meg, amelyek befolyásolják a keresési lekérdezések pontozását.
Name | Típus | Description |
---|---|---|
functionAggregation |
Érték, amely azt jelzi, hogy az egyes pontozási függvények eredményeit hogyan kell kombinálni. Alapértelmezés szerint "Összeg". Figyelmen kívül hagyva, ha nincsenek pontozási függvények. |
|
functions | ScoringFunction[]: |
A dokumentumok pontozását befolyásoló függvények gyűjteménye. |
name |
string |
A pontozási profil neve. |
text |
Olyan paraméterek, amelyek bizonyos indexmezők szöveges egyezései alapján növelik a pontozást. |
SearchError
Az API hibafeltételét ismerteti.
Name | Típus | Description |
---|---|---|
code |
string |
A kiszolgáló által definiált hibakódok egyike. |
details |
A jelentett hibához vezető konkrét hibák részleteinek tömbje. |
|
message |
string |
A hiba emberi olvasásra alkalmas ábrázolása. |
SearchField
Egy indexdefinícióban szereplő mezőt jelöl, amely egy mező nevét, adattípusát és keresési viselkedését írja le.
Name | Típus | Description |
---|---|---|
analyzer |
A mezőhöz használni kívánt elemző neve. Ez a beállítás csak kereshető mezőkkel használható, és nem állítható be a searchAnalyzer vagy az indexAnalyzer elemekkel együtt. Az elemző kiválasztása után nem módosítható a mezőhöz. Összetett mezők esetén null értékűnek kell lennie. |
|
dimensions |
integer |
A vektormező dimenziója. |
facetable |
boolean |
Érték, amely azt jelzi, hogy engedélyezi-e a mező hivatkozását az aspektusos lekérdezésekben. Általában a találatok kategóriánkénti számát tartalmazó keresési eredmények bemutatójában használatos (például digitális kamerák keresése és a találatok márka, megapixelek, ár stb.). Ennek a tulajdonságnak null értékűnek kell lennie az összetett mezők esetében. Az Edm.GeographyPoint vagy Collection(Edm.GeographyPoint) típusú mezők nem lehetnek facetablek. Az alapértelmezett érték az összes többi egyszerű mezőre igaz. |
fields |
Almezők listája, ha ez egy Edm.ComplexType vagy Collection(Edm.ComplexType) típusú mező. Egyszerű mezők esetén null értékűnek vagy üresnek kell lennie. |
|
filterable |
boolean |
Egy érték, amely azt jelzi, hogy engedélyezi-e a mező hivatkozását $filter lekérdezésekben. a szűrhető érték eltér a sztringek kezelésének kereshető módjától. A szűrhető Edm.String vagy Collection(Edm.String) típusú mezők nem kerülnek szótörésbe, így az összehasonlítások csak a pontos egyezésekre használhatók. Ha például egy ilyen f mezőt "napos nap" értékre állít be, $filter=f eq "sunny" nem talál egyezést, de $filter=f eq "napos nap" lesz. Ennek a tulajdonságnak null értékűnek kell lennie az összetett mezők esetében. Az alapértelmezett érték az egyszerű mezőkre, az összetett mezőkre pedig null értékű. |
indexAnalyzer |
A mező indexelési idején használt elemző neve. Ez a beállítás csak kereshető mezőkkel használható. A searchAnalyzerrel együtt kell beállítani, és nem állítható be az elemző beállítással együtt. Ez a tulajdonság nem állítható be nyelvelemző nevére; használja inkább az analyzer tulajdonságot, ha nyelvelemzőre van szüksége. Az elemző kiválasztása után nem módosítható a mezőhöz. Összetett mezők esetén null értékűnek kell lennie. |
|
key |
boolean |
Érték, amely azt jelzi, hogy a mező egyedileg azonosítja-e az indexben lévő dokumentumokat. Minden indexben pontosan egy legfelső szintű mezőt kell kiválasztani kulcsmezőként, és Edm.String típusúnak kell lennie. A kulcsmezők segítségével közvetlenül keresheti meg a dokumentumokat, és frissítheti vagy törölheti az adott dokumentumokat. Az alapértelmezett érték az egyszerű mezőknél hamis, az összetett mezőknél null. |
name |
string |
A mező neve, amelynek egyedinek kell lennie az index vagy szülőmező mezőgyűjteményében. |
retrievable |
boolean |
Egy érték, amely azt jelzi, hogy a mező visszaadható-e a keresési eredményben. Ezt a beállítást letilthatja, ha egy mezőt (például margót) szeretne szűrőként, rendezési vagy pontozási mechanizmusként használni, de nem szeretné, hogy a mező látható legyen a végfelhasználó számára. Ennek a tulajdonságnak igaznak kell lennie a kulcsmezők esetében, és az összetett mezők esetében null értékűnek kell lennie. Ez a tulajdonság a meglévő mezőkön módosítható. A tulajdonság engedélyezése nem okoz növekedést az indextárolási követelményekben. Az alapértelmezett érték az egyszerű mezőkre, az összetett mezőkre pedig null értékű. |
searchAnalyzer |
A mező keresési idején használt elemző neve. Ez a beállítás csak kereshető mezőkkel használható. Az indexAnalyzerrel együtt kell beállítani, és nem állítható be az elemző beállítással együtt. Ez a tulajdonság nem állítható be nyelvelemző nevére; használja inkább az analyzer tulajdonságot, ha nyelvelemzőre van szüksége. Ez az elemző frissíthető egy meglévő mezőn. Összetett mezők esetén null értékűnek kell lennie. |
|
searchable |
boolean |
Érték, amely azt jelzi, hogy a mező kereshető-e teljes szövegesen. Ez azt jelenti, hogy elemzést végez, például szótörést az indexelés során. Ha egy kereshető mező értékének például a „sunny day” szöveget adja meg, akkor az két különálló tokenre lesz bontva: „sunny” és „day”. Ez lehetővé teszi a kifejezések teljes szöveges keresését. Az Edm.String vagy Collection(Edm.String) típusú mezők alapértelmezés szerint kereshetők. Ennek a tulajdonságnak hamisnak kell lennie más nem sztring típusú egyszerű mezők esetében, és az összetett mezők esetében null értékűnek kell lennie. Megjegyzés: A kereshető mezők extra helyet foglalnak el az indexben a mezőérték további tokenizált verzióinak a teljes szöveges keresésekhez való tárolásához. Ha helyet szeretne menteni az indexben, és nincs szüksége olyan mezőre, amely szerepel a keresésekben, állítsa a kereshető értéket hamis értékre. |
sortable |
boolean |
Egy érték, amely azt jelzi, hogy engedélyezi-e a mező hivatkozását $orderby kifejezésekben. Alapértelmezés szerint a keresőmotor pontszám szerint rendezi az eredményeket, de sok esetben a felhasználók a dokumentumok mezői szerint szeretnének rendezni. Egy egyszerű mező csak akkor rendezhető, ha egyértékű (egyetlen értékkel rendelkezik a szülődokumentum hatókörében). Az egyszerű gyűjteménymezők nem rendezhetők, mivel többértékűek. Az összetett gyűjtemények egyszerű almezői szintén többértékűek, ezért nem rendezhetők. Ez igaz, akár közvetlen szülőmezőről, akár ősmezőről van szó, ez az összetett gyűjtemény. Az összetett mezők nem rendezhetők, és az ilyen mezők rendezhető tulajdonságának null értékűnek kell lennie. A rendezhető alapértelmezett érték igaz az egyértékű egyszerű mezőkre, a többértékű egyszerű mezőkre hamis, az összetett mezőkre pedig null értékre. |
synonymMaps |
string[] |
A mezőhöz társítandó szinonimatérképek nevének listája. Ez a beállítás csak kereshető mezőkkel használható. Jelenleg mezőnként csak egy szinonimatérkép támogatott. Szinonimatérkép mezőhöz való hozzárendelése biztosítja, hogy az adott mezőt megcélzó lekérdezési kifejezések lekérdezési időben ki legyenek bontva a szinonimatérkép szabályaival. Ez az attribútum a meglévő mezőkön módosítható. Az összetett mezők esetében null értékűnek vagy üres gyűjteménynek kell lennie. |
type |
A mező adattípusa. |
|
vectorSearchProfile |
string |
A vektorkeresési profil neve, amely meghatározza a vektormezőben való kereséshez használni kívánt algoritmust. |
SearchFieldDataType
Meghatározza egy mező adattípusát egy keresési indexben.
Name | Típus | Description |
---|---|---|
Edm.Boolean |
string |
Azt jelzi, hogy egy mező logikai értéket (igaz vagy hamis) tartalmaz. |
Edm.ComplexType |
string |
Azt jelzi, hogy egy mező egy vagy több összetett objektumot tartalmaz, amelyek más típusú almezőkkel rendelkeznek. |
Edm.DateTimeOffset |
string |
Azt jelzi, hogy egy mező dátum-/időértéket tartalmaz, beleértve az időzónával kapcsolatos információkat is. |
Edm.Double |
string |
Azt jelzi, hogy egy mező IEEE kettős pontosságú lebegőpontos számot tartalmaz. |
Edm.GeographyPoint |
string |
Azt jelzi, hogy egy mező földrajzi helyet tartalmaz a hosszúság és a szélesség szempontjából. |
Edm.Int32 |
string |
Azt jelzi, hogy egy mező 32 bites aláírt egész számot tartalmaz. |
Edm.Int64 |
string |
Azt jelzi, hogy egy mező 64 bites aláírt egész számot tartalmaz. |
Edm.Single |
string |
Azt jelzi, hogy egy mező egy pontosságú lebegőpontos számot tartalmaz. Ez csak a Gyűjtemény (Edm.Single) használatakor érvényes. |
Edm.String |
string |
Azt jelzi, hogy egy mező tartalmaz egy sztringet. |
SearchIndex
A keresési index definícióját jelöli, amely egy index mezőit és keresési viselkedését ismerteti.
Name | Típus | Description |
---|---|---|
@odata.etag |
string |
Az index ETagje. |
analyzers | LexicalAnalyzer[]: |
Az index elemzői. |
charFilters | CharFilter[]: |
Az index karakterszűrői. |
corsOptions |
Az index forrásközi erőforrás-megosztásának (CORS) szabályozására szolgáló beállítások. |
|
defaultScoringProfile |
string |
A használni kívánt pontozási profil neve, ha nincs megadva a lekérdezésben. Ha ez a tulajdonság nincs beállítva, és nincs megadva pontozási profil a lekérdezésben, akkor az alapértelmezett pontozás (tf-idf) lesz használva. |
encryptionKey |
Az Azure Key Vault-ben létrehozott titkosítási kulcs leírása. Ez a kulcs további titkosítási szintet biztosít az adatok számára, ha teljes körű biztosítékot szeretne kapni arról, hogy senki, még a Microsoft sem tudja visszafejteni az adatokat. Miután titkosította az adatokat, az mindig titkosítva marad. A keresési szolgáltatás figyelmen kívül hagyja a tulajdonság null értékűre történő beállítására tett kísérleteket. Szükség szerint módosíthatja ezt a tulajdonságot, ha el szeretné forgatni a titkosítási kulcsot; Az adatok nem lesznek hatással. Az ügyfél által felügyelt kulcsokkal történő titkosítás nem érhető el az ingyenes keresési szolgáltatásokhoz, és csak a 2019. január 1-jén vagy azt követően létrehozott fizetős szolgáltatásokhoz érhető el. |
|
fields |
Az index mezői. |
|
name |
string |
Az index neve. |
scoringProfiles |
Az index pontozási profiljai. |
|
semantic |
Olyan keresési index paramétereit határozza meg, amelyek befolyásolják a szemantikai képességeket. |
|
similarity | Similarity: |
A keresési lekérdezésnek megfelelő dokumentumok pontozásához és rangsorolásához használandó hasonlósági algoritmus típusa. A hasonlósági algoritmus csak az indexlétrehozáskor definiálható, és nem módosítható a meglévő indexeken. Null érték esetén a ClassicSimilarity algoritmust használja a rendszer. |
suggesters |
Az index javaslattevői. |
|
tokenFilters |
TokenFilter[]:
|
Az index jogkivonat-szűrői. |
tokenizers | LexicalTokenizer[]: |
Az index jogkivonat-szabályzói. |
vectorSearch |
A vektorkereséshez kapcsolódó konfigurációs beállításokat tartalmazza. |
SearchResourceEncryptionKey
Ügyfél által felügyelt titkosítási kulcs az Azure Key Vault-ban. A létrehozott és kezelt kulcsokkal titkosíthatja vagy visszafejtheti az inaktív adatokat a keresési szolgáltatásban, például indexeket és szinonimatérképeket.
Name | Típus | Description |
---|---|---|
accessCredentials |
Az Azure Key Vault eléréséhez használt opcionális Azure Active Directory-hitelesítő adatok. Nem szükséges, ha felügyelt identitást használ helyette. |
|
keyVaultKeyName |
string |
Az Inaktív adatok titkosításához használandó Azure Key Vault kulcs neve. |
keyVaultKeyVersion |
string |
Az Azure Key Vault kulcsának verziója, amellyel titkosíthatja az inaktív adatokat. |
keyVaultUri |
string |
Az Azure Key Vault URI-ja, más néven DNS-név, amely tartalmazza az inaktív adatok titkosításához használandó kulcsot. Példa URI-ra: |
SemanticConfiguration
Egy adott konfigurációt határoz meg, amelyet a szemantikai képességek kontextusában kell használni.
Name | Típus | Description |
---|---|---|
name |
string |
A szemantikai konfiguráció neve. |
prioritizedFields |
A szemantikai rangsoroláshoz, feliratokhoz, kiemelésekhez és válaszokhoz használandó cím- és tartalom- és kulcsszómezőket ismerteti. A három altulajdonság közül legalább egyet (titleField, prioritizedKeywordsFields és prioritizedContentFields) be kell állítani. |
SemanticField
A szemantikai konfiguráció részeként használt mező.
Name | Típus | Description |
---|---|---|
fieldName |
string |
SemanticSettings
Olyan keresési index paramétereit határozza meg, amelyek befolyásolják a szemantikai képességeket.
Name | Típus | Description |
---|---|---|
configurations |
Az index szemantikai konfigurációi. |
|
defaultConfiguration |
string |
Lehetővé teszi egy alapértelmezett szemantikai konfiguráció nevének beállítását az indexben, így nem kötelező minden alkalommal lekérdezési paraméterként átadni. |
ShingleTokenFilter
A jogkivonatok kombinációit egyetlen tokenként hozza létre. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.
Name | Típus | Alapértelmezett érték | Description |
---|---|---|---|
@odata.type |
string:
#Microsoft. |
Egy URI-töredék, amely megadja a tokenszűrő típusát. |
|
filterToken |
string |
_ |
A beszúrandó sztring minden olyan pozícióhoz, ahol nincs token. Az alapértelmezett érték egy aláhúzás ("_"). |
maxShingleSize |
integer |
2 |
A zsindely maximális mérete. Az alapértelmezett és minimális érték 2. |
minShingleSize |
integer |
2 |
A minimális zsindelyméret. Az alapértelmezett és minimális érték 2. A maxShingleSize értékénél kisebbnek kell lennie. |
name |
string |
A jogkivonatszűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet. |
|
outputUnigrams |
boolean |
True |
Egy érték, amely azt jelzi, hogy a kimeneti stream tartalmazza-e a bemeneti jogkivonatokat (unigramokat) és az övsömöröket. Alapértelmezett érték: true (igaz). |
outputUnigramsIfNoShingles |
boolean |
False |
Egy érték, amely jelzi, hogy egygrammot kell-e kiadni azokra az időkre, amikor nem áll rendelkezésre zsindely. Ez a tulajdonság elsőbbséget élvez, ha az outputUnigrams értéke hamis. Az alapértelmezett érték a false (hamis). |
tokenSeparator |
string |
A szomszédos tokenek összekapcsolásakor használandó sztring, amely egy zsindelyt alkot. Az alapértelmezett érték egy szóköz (" "). |
SnowballTokenFilter
Egy szűrő, amely a szavakat egy Snowball által generált ősmer használatával szárja. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.
Name | Típus | Description |
---|---|---|
@odata.type |
string:
#Microsoft. |
Egy URI-töredék, amely megadja a tokenszűrő típusát. |
language |
A használni kívánt nyelv. |
|
name |
string |
A jogkivonatszűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet. |
SnowballTokenFilterLanguage
A Snowball-tokenszűrőhöz használandó nyelv.
Name | Típus | Description |
---|---|---|
armenian |
string |
Kiválasztja a Lucene Snowball stemming tokenizer örmény. |
basque |
string |
Kiválasztja a Lucene Snowball stemming tokenizer baszk. |
catalan |
string |
Kiválasztja a Lucene Snowball stemming tokenizer katalán. |
danish |
string |
Kiválasztja a Lucene Snowball stemming tokenizert dánul. |
dutch |
string |
Kiválasztja a Lucene Snowball stemming tokenizer holland. |
english |
string |
Kiválasztja a Lucene Snowball stemming tokenizer angolul. |
finnish |
string |
Kiválasztja a Lucene Snowball stemming tokenizer finn nyelvhez. |
french |
string |
Kiválasztja a Lucene Snowball stemming tokenizer francia. |
german |
string |
Kiválasztja a Lucene Snowball stemming tokenizer német nyelvhez. |
german2 |
string |
Kiválasztja a német változat algoritmust használó Lucene Snowball stemming tokenizert. |
hungarian |
string |
Kiválasztja a Lucene Snowball stemming tokenizert magyarra. |
italian |
string |
Kiválasztja a Lucene Snowball stemming tokenizer olasz. |
kp |
string |
Kiválasztja a Lucene Snowball stemming tokenizert a hollandhoz, amely a Kraaij-Pohlmann stemming algoritmust használja. |
lovins |
string |
Kiválasztja az angol nyelvhez készült Lucene Snowball stemming tokenizert, amely a Lovins stemming algoritmust használja. |
norwegian |
string |
Kiválasztja a Lucene Snowball stemming tokenizert a norvég nyelvhez. |
porter |
string |
Kiválasztja az angol nyelvhez készült Lucene Snowball stemming tokenizert, amely a Porter stemming algoritmust használja. |
portuguese |
string |
Kiválasztja a Lucene Snowball stemming tokenizer portugálul. |
romanian |
string |
Kiválasztja a Lucene Snowball stemming tokenizer román. |
russian |
string |
Kiválasztja a Lucene Snowball stemming tokenizer orosz. |
spanish |
string |
Kiválasztja a Lucene Snowball stemming tokenizer spanyolul. |
swedish |
string |
Kiválasztja a Lucene Snowball stemming tokenizer svéd. |
turkish |
string |
Kiválasztja a Lucene Snowball stemming tokenizer for Török. |
StemmerOverrideTokenFilter
Lehetővé teszi, hogy felülbírálja a többi szárító szűrőt a saját szótáron alapuló szárítással. A szótárból származó kifejezések kulcsszavakként lesznek megjelölve, így nem lesznek a láncban lévő szárak. A szárító szűrők elé kell helyezni. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.
Name | Típus | Description |
---|---|---|
@odata.type |
string:
#Microsoft. |
Egy URI-töredék, amely megadja a tokenszűrő típusát. |
name |
string |
A jogkivonatszűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet. |
rules |
string[] |
A stemming szabályok listája a következő formátumban: "word => stem", például: "ran => run". |
StemmerTokenFilter
Nyelvspecifikus eredetszűrő. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.
Name | Típus | Description |
---|---|---|
@odata.type |
string:
#Microsoft. |
Egy URI-töredék, amely megadja a tokenszűrő típusát. |
language |
A használni kívánt nyelv. |
|
name |
string |
A jogkivonatszűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet. |
StemmerTokenFilterLanguage
A stemmer token szűrőhöz használandó nyelv.
Name | Típus | Description |
---|---|---|
arabic |
string |
Kiválasztja a Lucene stemming tokenizert arabra. |
armenian |
string |
Kiválasztja az örmény Lucene-alapú jogkivonat-jelölőt. |
basque |
string |
Kiválasztja a Lucene stemming tokenizert Baszk számára. |
brazilian |
string |
Kiválasztja a Portugál (Brazília) Lucene stemming tokenizer (Lucene stemming tokenizer) elemét. |
bulgarian |
string |
Kiválasztja a Bolgár Lucene-alapú jogkivonat-jelölőt. |
catalan |
string |
Kiválasztja a KatalánHoz tartozó Lucene-jogkivonat-jelölőt. |
czech |
string |
Kiválasztja a Lucene stemming tokenizert csehhez. |
danish |
string |
Kiválasztja a Dán lucene-alapú jogkivonat-jelölőt. |
dutch |
string |
Kiválasztja a Lucene stemming tokenizert a hollandhoz. |
dutchKp |
string |
Kiválasztja a holland Lucene stemming tokenizert, amely a Kraaij-Pohlmann stemming algoritmust használja. |
english |
string |
Kiválasztja a Lucene stemming tokenizert angolul. |
finnish |
string |
Kiválasztja a finn Lucene-alapú jogkivonat-jelölőt. |
french |
string |
Kiválasztja a Francia Lucene-alapú jogkivonat-jelölőt. |
galician |
string |
Kiválasztja a Lucene stemming tokenizert a galíciaihoz. |
german |
string |
Kiválasztja a német lucene-alapú jogkivonat-jelölőt. |
german2 |
string |
Kiválasztja a német variáns algoritmust használó Lucene-alapú jogkivonat-készítőt. |
greek |
string |
Kiválasztja a Görög Lucene-alapú jogkivonat-jelölőt. |
hindi |
string |
Kiválasztja a Lucene stemming tokenizert hindihez. |
hungarian |
string |
Kiválasztja a Lucene stemming tokenizert magyarra. |
indonesian |
string |
Kiválasztja az indonéz Lucene-alapú jogkivonat-jelölőt. |
irish |
string |
Kiválasztja az ír Lucene stemming tokenizert. |
italian |
string |
Kiválasztja az olasz Lucene-alapú jogkivonat-jelölőt. |
latvian |
string |
Kiválasztja a lett lucene-alapú jogkivonat-jelölőt. |
lightEnglish |
string |
Kiválasztja az angolhoz készült Lucene stemming tokenizert, amely könnyű leszármaztatást végez. |
lightFinnish |
string |
Kiválasztja a finn lucene-alapú tokenizálót, amely világos szározást végez. |
lightFrench |
string |
Kiválasztja a francia Lucene stemming tokenizert, amely világos szárral rendelkezik. |
lightGerman |
string |
Kiválasztja a német Lucene-ből származó tokenizert, amely világos szározást végez. |
lightHungarian |
string |
Kiválasztja a Lucene stemming tokenizert a magyarhoz, amely világos szárú. |
lightItalian |
string |
Kiválasztja az olasz lucene szárító tokenizert, amely világos szárral rendelkezik. |
lightNorwegian |
string |
Kiválasztja a Lucene stemming tokenizert a norvég (Bokmål) számára, amely könnyű leszármaztatást végez. |
lightNynorsk |
string |
Kiválasztja a Lucene stemming tokenizert a norvég (Nynorsk) számára, amely könnyű leszármaztatást végez. |
lightPortuguese |
string |
Kiválasztja a Lucene-alapú jogkivonat-jelölőt a portugál nyelvhez, amely könnyű leszármaztatást végez. |
lightRussian |
string |
Kiválasztja a Lucene stemming tokenizert az oroszhoz, amely könnyű leszármaztatást végez. |
lightSpanish |
string |
Kiválasztja a Lucene-ből származó tokenizert a spanyolhoz, amely világos szárral rendelkezik. |
lightSwedish |
string |
Kiválasztja a Lucene stemming tokenizer svéd, hogy nem könnyű szárú. |
lovins |
string |
Kiválasztja a Lovins stemming algoritmust használó, angol nyelvhez készült Lucene stemming tokenizert. |
minimalEnglish |
string |
Kiválasztja az angolhoz készült Lucene stemming tokenizert, amely minimális szárítást végez. |
minimalFrench |
string |
Kiválasztja a Francia Lucene-alapú jogkivonat-jelölőt, amely minimális szárítást végez. |
minimalGalician |
string |
Kiválasztja a Lucene-ből származó tokenizert a galíciaihoz, amely minimális szárítást végez. |
minimalGerman |
string |
Kiválasztja a német lucene-alapú jogkivonat-jelölőt, amely minimális szárítást végez. |
minimalNorwegian |
string |
Kiválasztja a Lucene stemming tokenizert a norvég (Bokmål) számára, amely minimális szárítást végez. |
minimalNynorsk |
string |
Kiválasztja a Norvég (Nynorsk) lucene-alapú tokenizálóját, amely minimális szárítást végez. |
minimalPortuguese |
string |
Kiválasztja a portugál lucene-alapú jogkivonat-jelölőt, amely minimális szárítást végez. |
norwegian |
string |
Kiválasztja a Lucene stemming tokenizert a norvég (Bokmål) számára. |
porter2 |
string |
Kiválasztja a Porter2 stemming algoritmust használó, angol nyelvhez készült Lucene stemming tokenizert. |
portuguese |
string |
Kiválasztja a portugál Lucene-alapú jogkivonat-jelölőt. |
portugueseRslp |
string |
Kiválasztja az RSLP-alapú stemming algoritmust használó portugál Lucene stemming tokenizert. |
possessiveEnglish |
string |
Kiválasztja az angolhoz készült Lucene-alapú jogkivonat-jelölőt, amely eltávolítja a záró birtokosokat a szavakból. |
romanian |
string |
Kiválasztja a Lucene stemming tokenizert a román nyelvhez. |
russian |
string |
Kiválasztja a Lucene stemming tokenizert oroszul. |
sorani |
string |
Kiválasztja a Soranihoz tartozó Lucene stemming tokenizert. |
spanish |
string |
Kiválasztja a Lucene stemming tokenizert spanyolul. |
swedish |
string |
Kiválasztja a Lucene stemming tokenizert svédhez. |
turkish |
string |
Kiválasztja a Lucene stemming tokenizer for Török lehetőséget. |
StopAnalyzer
A szöveget nem betűkkel osztja el; Alkalmazza a kisbetűs és a stopword jogkivonat szűrőit. Ez az elemző az Apache Lucene használatával van implementálva.
Name | Típus | Description |
---|---|---|
@odata.type |
string:
#Microsoft. |
Az elemző típusát meghatározó URI-töredék. |
name |
string |
Az elemző neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet. |
stopwords |
string[] |
A stopszavak listája. |
StopwordsList
A nyelvspecifikus stopszavak előre definiált listáját azonosítja.
Name | Típus | Description |
---|---|---|
arabic |
string |
Kiválasztja az arabhoz tartozó stopszólistát. |
armenian |
string |
Kiválasztja az örmény stopszólistát. |
basque |
string |
A baszk stopszólista kiválasztása. |
brazilian |
string |
A portugál (Brazília) stopword listájának kiválasztása. |
bulgarian |
string |
Kiválasztja a bolgár stopword listát. |
catalan |
string |
Kiválasztja a katalán stopszólistát. |
czech |
string |
A csehhez tartozó stopszólistát választja ki. |
danish |
string |
Kiválasztja a dán nyelvű stopszólistát. |
dutch |
string |
Kiválasztja a holland stopword listát. |
english |
string |
Kiválasztja az angol nyelvű stopword listát. |
finnish |
string |
Kiválasztja a finn stopword listát. |
french |
string |
Kiválasztja a francia stopword listát. |
galician |
string |
Kiválasztja a galíciaiak stopszólistáját. |
german |
string |
A német nyelvhez tartozó stopword listát választja ki. |
greek |
string |
Kiválasztja a görög stopword listát. |
hindi |
string |
Kiválasztja a hindi stopword listát. |
hungarian |
string |
Kiválasztja a magyar nyelvű stopszólistát. |
indonesian |
string |
Kiválasztja az indonéz stopszólistát. |
irish |
string |
Kiválasztja az írek stopword listáját. |
italian |
string |
Kiválasztja az olasz nyelvhez tartozó stopszólistát. |
latvian |
string |
Kiválasztja a lett nyelvhez tartozó stopszólistát. |
norwegian |
string |
Kiválasztja a norvég nyelvhez tartozó stopszólistát. |
persian |
string |
Kiválasztja a perzsa stopszólistát. |
portuguese |
string |
Kiválasztja a portugál stopword listát. |
romanian |
string |
Kiválasztja a román nyelvű stopword listát. |
russian |
string |
Kiválasztja az orosz nyelvű stopword listát. |
sorani |
string |
A Sorani stopword listájának kiválasztása. |
spanish |
string |
Kiválasztja a spanyol nyelvű stopword listát. |
swedish |
string |
Kiválasztja a svéd stopword listát. |
thai |
string |
Kiválasztja a thai nyelvhez tartozó stopword listát. |
turkish |
string |
Kiválasztja a törökhöz tartozó stopword listát. |
StopwordsTokenFilter
Eltávolítja a leállító szavakat egy jogkivonatfolyamból. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.
Name | Típus | Alapértelmezett érték | Description |
---|---|---|---|
@odata.type |
string:
#Microsoft. |
Egy URI-töredék, amely megadja a tokenszűrő típusát. |
|
ignoreCase |
boolean |
False |
A kis- és nagybetűk figyelmen kívül hagyását jelző érték. Ha igaz, a rendszer először az összes szót kisbetűssé alakítja. Az alapértelmezett érték a false (hamis). |
name |
string |
A jogkivonatszűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet. |
|
removeTrailing |
boolean |
True |
Egy érték, amely azt jelzi, hogy figyelmen kívül kell-e hagyni az utolsó keresési kifejezést, ha az egy stop szó. Alapértelmezett érték: true (igaz). |
stopwords |
string[] |
A stopszavak listája. Ez a tulajdonság és a stopwords lista tulajdonság nem állítható be. |
|
stopwordsList | english |
A használni kívánt stopszavak előre definiált listája. Ez a tulajdonság és a stopwords tulajdonság nem állítható be. Az alapértelmezett érték az angol. |
Suggester
Meghatározza, hogyan kell alkalmazni a Suggest API-t az index mezőinek egy csoportjára.
Name | Típus | Description |
---|---|---|
name |
string |
A javaslattevő neve. |
searchMode |
A javaslattevő képességeit jelző érték. |
|
sourceFields |
string[] |
Azon mezőnevek listája, amelyekre a javaslattevő vonatkozik. Minden mezőnek kereshetőnek kell lennie. |
SuggesterSearchMode
A javaslattevő képességeit jelző érték.
Name | Típus | Description |
---|---|---|
analyzingInfixMatching |
string |
Egy mező egymást követő teljes kifejezéseinek és előtagjainak felel meg. A "Leggyorsabb barna róka" mező esetében például a "fast" és a "leggyorsabb brow" lekérdezések is egyeznek. |
SynonymTokenFilter
Egy vagy többszavas szinonimák egy jogkivonatfolyamban. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.
Name | Típus | Alapértelmezett érték | Description |
---|---|---|---|
@odata.type |
string:
#Microsoft. |
Egy URI-töredék, amely megadja a tokenszűrő típusát. |
|
expand |
boolean |
True |
Egy érték, amely azt jelzi, hogy a szinonimák listájában szereplő összes szó (ha => jelölés nincs használva) megfeleltethető-e egymásnak. Ha igaz, a szinonimák listájában szereplő összes szó (ha => jelölést nem használ) megfelelteti egymásnak. A következő lista: hihetetlen, hihetetlen, mesés, csodálatos egyenértékű: hihetetlen, hihetetlen, mesés, csodálatos => hihetetlen, hihetetlen, mesés, csodálatos. Ha hamis, a következő lista: hihetetlen, hihetetlen, mesés, csodálatos lesz egyenértékű: hihetetlen, hihetetlen, mesés, csodálatos => hihetetlen. Alapértelmezett érték: true (igaz). |
ignoreCase |
boolean |
False |
Egy érték, amely azt jelzi, hogy a bemenetet kis- és nagybetűvel kell-e összehajtani az egyeztetéshez. Az alapértelmezett érték a false (hamis). |
name |
string |
A jogkivonatszűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet. |
|
synonyms |
string[] |
A szinonimák listája a következő két formátum egyikében: 1. hihetetlen, hihetetlen, mesés => csodálatos - a = szimbólum bal oldalán> lévő összes kifejezés helyébe a jobb oldalon lévő összes kifejezés kerül; 2. hihetetlen, hihetetlen, mesés, csodálatos - az egyenértékű szavak vesszővel elválasztott listája. A kibontás beállításával módosíthatja a lista értelmezését. |
TagScoringFunction
Olyan függvényt definiál, amely egy adott címkelistának megfelelő sztringértékekkel növeli a dokumentumok pontszámait.
Name | Típus | Description |
---|---|---|
boost |
number |
A nyers pontszám szorzója. Pozitív számnak kell lennie, amely nem lehet 1,0. |
fieldName |
string |
A pontozófüggvény bemeneteként használt mező neve. |
interpolation |
Egy érték, amely azt jelzi, hogy a kiemelés hogyan lesz interpolálva a dokumentum pontszámai között; alapértelmezett értéke "Lineáris". |
|
tag |
A címkepontozási függvény paraméterértékei. |
|
type |
string:
tag |
A használni kívánt függvény típusát jelzi. Az érvényes értékek közé tartozik a mennyiség, a frissesség, a távolság és a címke. A függvénytípusnak kisbetűsnek kell lennie. |
TagScoringParameters
Paraméterértékeket biztosít egy címkepontozási függvénynek.
Name | Típus | Description |
---|---|---|
tagsParameter |
string |
A keresési lekérdezésekben átadott paraméter neve, amely megadja a célmezővel összehasonlítandó címkék listáját. |
TextWeights
Olyan indexmezők súlyozását határozza meg, amelyek esetében a találatok növelik a keresési lekérdezések pontozását.
Name | Típus | Description |
---|---|---|
weights |
object |
A mezőnkénti súlyozás szótára a dokumentumok pontozásának növeléséhez. A kulcsok mezőnevek, az értékek pedig az egyes mezők súlyozásai. |
TokenCharacterKind
Olyan karakterosztályokat jelöl, amelyeken a jogkivonatszűrők működhetnek.
Name | Típus | Description |
---|---|---|
digit |
string |
A számjegyeket tokenekben tárolja. |
letter |
string |
Jogkivonatokban tárolja a leveleket. |
punctuation |
string |
A tokenekben tárolja az írásjeleket. |
symbol |
string |
A szimbólumokat tokenekben tárolja. |
whitespace |
string |
Jogkivonatokban tárolja a térközt. |
TokenFilterName
Meghatározza a keresőmotor által támogatott összes jogkivonatszűrő nevét.
TruncateTokenFilter
Csonkítja a kifejezéseket egy adott hosszúságúra. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.
Name | Típus | Alapértelmezett érték | Description |
---|---|---|---|
@odata.type |
string:
#Microsoft. |
Egy URI-töredék, amely megadja a tokenszűrő típusát. |
|
length |
integer |
300 |
A kifejezések csonkításának hossza. Az alapértelmezett és a maximális érték 300. |
name |
string |
A jogkivonatszűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet. |
UaxUrlEmailTokenizer
Tokenizálja az URL-címeket és az e-maileket egy jogkivonatként. Ez a jogkivonat-szabályzó az Apache Lucene használatával van implementálva.
Name | Típus | Alapértelmezett érték | Description |
---|---|---|---|
@odata.type |
string:
#Microsoft. |
Egy URI-töredék, amely a tokenizer típusát határozza meg. |
|
maxTokenLength |
integer |
255 |
A jogkivonat maximális hossza. Az alapértelmezett érték 255. A maximális hossznál hosszabb jogkivonatok fel vannak osztva. A maximálisan használható tokenhossz 300 karakter. |
name |
string |
A tokenizer neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet. |
UniqueTokenFilter
Kiszűri az előző jogkivonattal megegyező szövegű jogkivonatokat. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.
Name | Típus | Alapértelmezett érték | Description |
---|---|---|---|
@odata.type |
string:
#Microsoft. |
Egy URI-töredék, amely megadja a tokenszűrő típusát. |
|
name |
string |
A jogkivonatszűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet. |
|
onlyOnSamePosition |
boolean |
False |
Egy érték, amely azt jelzi, hogy a duplikált elemeket csak ugyanabban a pozícióban szeretné-e eltávolítani. Az alapértelmezett érték a false (hamis). |
VectorSearch
A vektorkereséshez kapcsolódó konfigurációs beállításokat tartalmazza.
Name | Típus | Description |
---|---|---|
algorithms | VectorSearchAlgorithmConfiguration[]: |
Az indexelés vagy lekérdezés során használt algoritmusra vonatkozó konfigurációs beállításokat tartalmaz. |
profiles |
A vektorkereséssel használható konfigurációk kombinációit határozza meg. |
VectorSearchAlgorithmKind
Az indexeléshez és lekérdezéshez használt algoritmus.
Name | Típus | Description |
---|---|---|
exhaustiveKnn |
string |
Kimerítő KNN-algoritmus, amely találgatásos keresést hajt végre. |
hnsw |
string |
HNSW (Hierarchikus Navigable Small World), a legközelebbi szomszéd algoritmus típusa. |
VectorSearchAlgorithmMetric
A vektorok összehasonlításához használandó hasonlósági metrika.
Name | Típus | Description |
---|---|---|
cosine |
string |
|
dotProduct |
string |
|
euclidean |
string |
VectorSearchProfile
A vektorkereséssel használható konfigurációk kombinációját határozza meg.
Name | Típus | Description |
---|---|---|
algorithm |
string |
A vektorkeresési algoritmus konfigurációjának neve, amely meghatározza az algoritmust és az opcionális paramétereket. |
name |
string |
Az adott vektoros keresési profilhoz társítandó név. |
WordDelimiterTokenFilter
A szavakat alszavakra osztja fel, és opcionális átalakításokat hajt végre az alszavas csoportokon. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.
Name | Típus | Alapértelmezett érték | Description |
---|---|---|---|
@odata.type |
string:
#Microsoft. |
Egy URI-töredék, amely megadja a tokenszűrő típusát. |
|
catenateAll |
boolean |
False |
Egy érték, amely azt jelzi, hogy az összes alszórész be lesz-e jelölve. Ha például ez igaz értékre van állítva, az "Azure-Search-1" "AzureSearch1" lesz. Az alapértelmezett érték a false (hamis). |
catenateNumbers |
boolean |
False |
Egy érték, amely azt jelzi, hogy a rendszer a számrészek maximális futásait fogja-e kiszolgálni. Ha például ez igaz értékre van állítva, az "1-2" "12" lesz. Az alapértelmezett érték a false (hamis). |
catenateWords |
boolean |
False |
Egy érték, amely azt jelzi, hogy a szórészek maximális futása lesz-e beszúrva. Ha például ez igaz értékre van állítva, az "Azure-Search" "AzureSearch" lesz. Az alapértelmezett érték a false (hamis). |
generateNumberParts |
boolean |
True |
Érték, amely azt jelzi, hogy létre kell-e hozni szám alszavak. Alapértelmezett érték: true (igaz). |
generateWordParts |
boolean |
True |
Egy érték, amely jelzi, hogy létre kell-e hozni részszavat. Ha be van állítva, a szavak részei létrejönnek; például az "AzureSearch" "Azure" "Search" lesz. Alapértelmezett érték: true (igaz). |
name |
string |
A jogkivonatszűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet. |
|
preserveOriginal |
boolean |
False |
Érték, amely azt jelzi, hogy az eredeti szavak megmaradnak-e, és hozzá lesznek-e adva az alszavak listájához. Az alapértelmezett érték a false (hamis). |
protectedWords |
string[] |
A tagolástól védendő jogkivonatok listája. |
|
splitOnCaseChange |
boolean |
True |
Érték, amely azt jelzi, hogy fel kell-e osztani a szavakat a caseChange függvényben. Ha például ez igaz értékre van állítva, az "AzureSearch" "Azure" "Search" lesz. Alapértelmezett érték: true (igaz). |
splitOnNumerics |
boolean |
True |
Érték, amely azt jelzi, hogy fel kell-e osztani a számokat. Ha például ez igaz értékre van állítva, az "Azure1Search" "Azure" "1" "Search" lesz. Alapértelmezett érték: true (igaz). |
stemEnglishPossessive |
boolean |
True |
Egy érték, amely jelzi, hogy el szeretné-e távolítani az egyes alszavak záró "'s"-jét. Alapértelmezett érték: true (igaz). |