Indexes - List
A keresési szolgáltatáshoz elérhető összes indexet felsorolja.
GET {endpoint}/indexes?api-version=2024-07-01
GET {endpoint}/indexes?$select={$select}&api-version=2024-07-01
URI-paraméterek
Name | In | Kötelező | Típus | Description |
---|---|---|---|---|
endpoint
|
path | True |
string |
A keresési szolgáltatás végponti URL-címe. |
api-version
|
query | True |
string |
Ügyfél API-verziója. |
$select
|
query |
string |
Kiválasztja az indexdefiníciók beolvasandó legfelső szintű tulajdonságait. A JSON-tulajdonságnevek vesszővel tagolt listájaként van megadva, vagy "*" az összes tulajdonsághoz. Az alapértelmezett érték az összes tulajdonság. |
Kérelem fejléce
Name | Kötelező | Típus | Description |
---|---|---|---|
x-ms-client-request-id |
string uuid |
A kéréssel együtt küldött nyomkövetési azonosító, amely segít a hibakeresésben. |
Válaszok
Name | Típus | Description |
---|---|---|
200 OK | ||
Other Status Codes |
Hibaválasz. |
Példák
SearchServiceListIndexes
Mintakérelem
GET https://myservice.search.windows.net/indexes?$select=*&api-version=2024-07-01
Mintaválasz
{
"value": [
{
"name": "hotels",
"fields": [
{
"name": "hotelId",
"type": "Edm.String",
"searchable": false,
"filterable": true,
"retrievable": true,
"sortable": true,
"facetable": true,
"key": true,
"indexAnalyzer": null,
"searchAnalyzer": null,
"analyzer": null,
"synonymMaps": []
},
{
"name": "baseRate",
"type": "Edm.Double",
"searchable": false,
"filterable": true,
"retrievable": true,
"sortable": true,
"facetable": true,
"key": false,
"indexAnalyzer": null,
"searchAnalyzer": null,
"analyzer": null,
"synonymMaps": []
},
{
"name": "description",
"type": "Edm.String",
"searchable": true,
"filterable": false,
"retrievable": true,
"sortable": false,
"facetable": false,
"key": false,
"indexAnalyzer": null,
"searchAnalyzer": null,
"analyzer": null,
"synonymMaps": []
},
{
"name": "description_fr",
"type": "Edm.String",
"searchable": true,
"filterable": false,
"retrievable": true,
"sortable": false,
"facetable": false,
"key": false,
"indexAnalyzer": null,
"searchAnalyzer": null,
"analyzer": "fr.lucene",
"synonymMaps": []
},
{
"name": "hotelName",
"type": "Edm.String",
"searchable": true,
"filterable": true,
"retrievable": true,
"sortable": true,
"facetable": true,
"key": false,
"indexAnalyzer": null,
"searchAnalyzer": null,
"analyzer": null,
"synonymMaps": []
},
{
"name": "category",
"type": "Edm.String",
"searchable": true,
"filterable": true,
"retrievable": true,
"sortable": true,
"facetable": true,
"key": false,
"indexAnalyzer": null,
"searchAnalyzer": null,
"analyzer": null,
"synonymMaps": []
},
{
"name": "tags",
"type": "Collection(Edm.String)",
"searchable": true,
"filterable": true,
"retrievable": true,
"sortable": false,
"facetable": true,
"key": false,
"indexAnalyzer": null,
"searchAnalyzer": null,
"analyzer": "tagsAnalyzer",
"synonymMaps": []
},
{
"name": "parkingIncluded",
"type": "Edm.Boolean",
"searchable": false,
"filterable": true,
"retrievable": true,
"sortable": true,
"facetable": true,
"key": false,
"indexAnalyzer": null,
"searchAnalyzer": null,
"analyzer": null,
"synonymMaps": []
},
{
"name": "smokingAllowed",
"type": "Edm.Boolean",
"searchable": false,
"filterable": true,
"retrievable": true,
"sortable": true,
"facetable": true,
"key": false,
"indexAnalyzer": null,
"searchAnalyzer": null,
"analyzer": null,
"synonymMaps": []
},
{
"name": "lastRenovationDate",
"type": "Edm.DateTimeOffset",
"searchable": false,
"filterable": true,
"retrievable": true,
"sortable": true,
"facetable": true,
"key": false,
"indexAnalyzer": null,
"searchAnalyzer": null,
"analyzer": null,
"synonymMaps": []
},
{
"name": "rating",
"type": "Edm.Int32",
"searchable": false,
"filterable": true,
"retrievable": true,
"sortable": true,
"facetable": true,
"key": false,
"indexAnalyzer": null,
"searchAnalyzer": null,
"analyzer": null,
"synonymMaps": []
},
{
"name": "location",
"type": "Edm.GeographyPoint",
"searchable": false,
"filterable": true,
"retrievable": true,
"sortable": true,
"facetable": false,
"key": false,
"indexAnalyzer": null,
"searchAnalyzer": null,
"analyzer": null,
"synonymMaps": []
}
],
"scoringProfiles": [
{
"name": "geo",
"text": {
"weights": {
"hotelName": 5
}
},
"functions": [
{
"type": "distance",
"boost": 5,
"fieldName": "location",
"interpolation": "logarithmic",
"distance": {
"referencePointParameter": "currentLocation",
"boostingDistance": 10
}
}
]
}
],
"defaultScoringProfile": "geo",
"suggesters": [
{
"name": "sg",
"searchMode": "analyzingInfixMatching",
"sourceFields": [
"hotelName"
]
}
],
"analyzers": [
{
"name": "tagsAnalyzer",
"@odata.type": "#Microsoft.Azure.Search.CustomAnalyzer",
"charFilters": [
"html_strip"
],
"tokenizer": "standard_v2"
}
],
"tokenizers": [],
"tokenFilters": [],
"charFilters": [],
"corsOptions": {
"allowedOrigins": [
"tempuri.org"
],
"maxAgeInSeconds": 60
},
"encryptionKey": {
"keyVaultKeyName": "myKeyName",
"keyVaultKeyVersion": "myKeyVersion",
"keyVaultUri": "https://myKeyVault.vault.azure.net",
"accessCredentials": null
},
"semantic": {
"configurations": [
{
"name": "semanticHotels",
"prioritizedFields": {
"titleField": {
"fieldName": "hotelName"
},
"prioritizedContentFields": [
{
"fieldName": "description"
},
{
"fieldName": "description_fr"
}
],
"prioritizedKeywordsFields": [
{
"fieldName": "tags"
},
{
"fieldName": "category"
}
]
}
}
]
}
},
{
"name": "testindex",
"fields": [
{
"name": "id",
"type": "Edm.String",
"searchable": false,
"filterable": false,
"retrievable": true,
"sortable": false,
"facetable": false,
"key": true,
"indexAnalyzer": null,
"searchAnalyzer": null,
"analyzer": null,
"synonymMaps": []
},
{
"name": "hidden",
"type": "Edm.Double",
"searchable": false,
"filterable": true,
"retrievable": false,
"sortable": true,
"facetable": false,
"key": false,
"indexAnalyzer": null,
"searchAnalyzer": null,
"analyzer": null,
"synonymMaps": []
}
],
"scoringProfiles": [],
"defaultScoringProfile": null,
"suggesters": [],
"analyzers": [],
"tokenizers": [],
"tokenFilters": [],
"charFilters": [],
"corsOptions": null,
"encryptionKey": null
}
]
}
Definíciók
Name | Description |
---|---|
Ascii |
Az első 127 ASCII-karakterben nem szereplő betűrendes, numerikus és szimbolikus Unicode-karaktereket (az "Egyszerű latin" Unicode-blokkot) ASCII-ekvivalenssé alakítja, ha léteznek ilyenek. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva. |
Azure |
A keresési szolgáltatáshoz létrehozott regisztrált alkalmazás hitelesítő adatai, amelyeket az Azure Key Vaultban tárolt titkosítási kulcsokhoz való hitelesített hozzáféréshez használnak. |
Azure |
Lehetővé teszi egy vektor beágyazását egy adott szöveges bemenethez az Azure OpenAI-erőforrás használatával. |
Azure |
A meghívandó Azure Open AI-modell neve. |
Azure |
Megadja az Azure OpenAI-erőforráshoz való csatlakozás paramétereit. |
Azure |
Megadja a lekérdezési sztring vektorizálásához használt Azure OpenAI-erőforrást. |
Binary |
Az indexelés és lekérdezés során használt bináris kvantálási tömörítési módszerre vonatkozó konfigurációs beállításokat tartalmaz. |
BM25Similarity |
Rangsorolási függvény az Okapi BM25 hasonlósági algoritmus alapján. A BM25 egy TF-IDF-szerű algoritmus, amely magában foglalja a hossz normalizálását (a "b" paraméterrel vezérelve), valamint a kifejezés gyakoriságának telítését (amelyet a "k1" paraméter szabályoz). |
Char |
Meghatározza a keresőmotor által támogatott összes karakterszűrő nevét. |
Cjk |
A standard tokenizerből létrehozott CJK-kifejezések bigramjai. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva. |
Cjk |
A CjkBigramTokenFilter által figyelmen kívül hagyható szkriptek. |
Classic |
Örökölt hasonlósági algoritmus, amely a TF-IDF Lucene TFIDFSimilarity implementációját használja. A TF-IDF ezen változata statikus dokumentumhossz-normalizálást vezet be, valamint koordinálja azokat a tényezőket, amelyek csak részben egyeznek a keresett lekérdezésekkel. |
Classic |
Nyelvtanalapú tokenizer, amely alkalmas a legtöbb európai nyelvű dokumentum feldolgozására. Ez a tokenizer az Apache Lucene használatával van implementálva. |
Common |
Bigramokat hozhat létre az indexelés során gyakran előforduló kifejezésekhez. Az egyes kifejezések továbbra is indexelve vannak, és a bigramok túl vannak osztva. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva. |
Cors |
Meghatározza az indexek forrásközi erőforrás-megosztásának (CORS) beállítását. |
Custom |
Lehetővé teszi a szöveg indexelhető/kereshető jogkivonatokká alakításának folyamatát. Ez egy felhasználó által definiált konfiguráció, amely egyetlen előre definiált tokenizerből és egy vagy több szűrőből áll. A jogkivonat-készítő felelős a szöveg jogkivonatokra való feltöréséért, valamint a jogkivonat-készítő által kibocsátott jogkivonatok módosítására szolgáló szűrőkért. |
Dictionary |
Több germán nyelven található összetett szavakat bont le. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva. |
Distance |
Olyan függvényt határoz meg, amely a földrajzi helytől való távolság alapján növeli a pontszámokat. |
Distance |
Paraméterértékeket biztosít egy távolsági pontozási függvénynek. |
Edge |
A megadott méret(ek) n grammját hozza létre egy bemeneti jogkivonat elejétől vagy hátuljától kezdve. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva. |
Edge |
Megadja, hogy a bemenet melyik oldaláról kell n-gramot létrehozni. |
Edge |
A megadott méret(ek) n grammját hozza létre egy bemeneti jogkivonat elejétől vagy hátuljától kezdve. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva. |
Edge |
Tokenizálja a bemenetet egy élről az adott méret(ek) n-grammjára. Ez a tokenizer az Apache Lucene használatával van implementálva. |
Elision |
Eltávolítja az elisionst. A "l'avion" (a sík) például "avion" (sík) lesz. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva. |
Error |
Az erőforrás-kezelési hiba további információi. |
Error |
A hiba részletei. |
Error |
Hibaválasz |
Exhaustive |
A teljes KNN-algoritmusra jellemző paramétereket tartalmazza. |
Exhaustive |
A lekérdezés során használt teljes KNN-algoritmusra vonatkozó konfigurációs beállításokat tartalmaz, amelyek találgatásos keresést hajtanak végre a teljes vektorindexben. |
Freshness |
Olyan függvényt határoz meg, amely egy dátum-idő mező értéke alapján növeli a pontszámokat. |
Freshness |
Paraméterértékeket biztosít egy frissesség-pontozási függvénynek. |
Hnsw |
A HNSW algoritmusra jellemző paramétereket tartalmazza. |
Hnsw |
Az indexelés és lekérdezés során használt HNSW közelítő szomszéd algoritmusra vonatkozó konfigurációs beállításokat tartalmaz. A HNSW algoritmus a keresési sebesség és a pontosság közötti kompromisszumot kínálja. |
Input |
Beviteli mező leképezése egy képességhez. |
Keep |
Olyan jogkivonatszűrő, amely csak a megadott szavak listájában lévő szöveggel rendelkező jogkivonatokat tárolja. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva. |
Keyword |
Kulcsszavakként jelöli meg a kifejezéseket. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva. |
Keyword |
A teljes bemenetet egyetlen jogkivonatként bocsátja ki. Ez a tokenizer az Apache Lucene használatával van implementálva. |
Keyword |
A teljes bemenetet egyetlen jogkivonatként bocsátja ki. Ez a tokenizer az Apache Lucene használatával van implementálva. |
Length |
Eltávolítja a túl hosszú vagy túl rövid szavakat. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva. |
Lexical |
Meghatározza a keresőmotor által támogatott összes szövegelemző nevét. |
Lexical |
Meghatározza a keresőmotor által támogatott összes tokenizer nevét. |
Limit |
Korlátozza a jogkivonatok számát az indexelés során. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva. |
List |
Válasz a List Indexes kérelemből. Ha sikeres, az összes index teljes definícióját tartalmazza. |
Lucene |
Standard Apache Lucene-elemző; A standard tokenizerből, kisbetűs szűrőből és stop szűrőből áll. |
Lucene |
A Unicode szövegszegmentálási szabályokat követő szövegtörések. Ez a tokenizer az Apache Lucene használatával van implementálva. |
Lucene |
A Unicode szövegszegmentálási szabályokat követő szövegtörések. Ez a tokenizer az Apache Lucene használatával van implementálva. |
Magnitude |
Olyan függvényt határoz meg, amely egy numerikus mező nagysága alapján növeli a pontszámokat. |
Magnitude |
Paraméterértékeket ad meg egy nagyságrendi pontozási függvénynek. |
Mapping |
A leképezési beállítással definiált leképezéseket alkalmazó karakterszűrő. A megfeleltetés kapzsi (egy adott pontnál a leghosszabb egyező minta nyer). A csere lehet üres sztring. Ez a karakterszűrő az Apache Lucene használatával van implementálva. |
Microsoft |
Nyelvspecifikus szabályokkal osztja el a szöveget, és a szavakat az alapformákra csökkenti. |
Microsoft |
Nyelvspecifikus szabályokkal osztja el a szöveget. |
Microsoft |
A Microsoft nyelv által támogatott nyelveket sorolja fel a jogkivonat-kezelőből. |
Microsoft |
A Microsoft nyelvi tokenizer által támogatott nyelveket sorolja fel. |
NGram |
A megadott méret(ek) n grammját hozza létre. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva. |
NGram |
A megadott méret(ek) n grammját hozza létre. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva. |
NGram |
Tokenizálja a bemenetet az adott méret(ek) n-grammjára. Ez a tokenizer az Apache Lucene használatával van implementálva. |
Output |
Kimeneti mezőleképezés egy képességhez. |
Path |
Tokenizer elérési utakhoz hasonló hierarchiákhoz. Ez a tokenizer az Apache Lucene használatával van implementálva. |
Pattern |
A szöveget rugalmasan elválasztja kifejezésekké egy reguláris kifejezésmintán keresztül. Ez az elemző az Apache Lucene használatával van implementálva. |
Pattern |
Java regexes használatával több jogkivonatot bocsát ki – egyet minden rögzítési csoporthoz egy vagy több mintában. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva. |
Pattern |
Karakterszűrő, amely a bemeneti sztringben szereplő karaktereket helyettesíti. Egy reguláris kifejezéssel azonosítja a megőrizendő karaktersorozatokat, a cseremintát pedig a lecserélendő karakterek azonosításához. Az "aa bb aa bb aa bb", a "(aa)\s+(bb)" minta és az "$1#$2" helyére például az "aa#bb aa#bb" szöveg lesz az eredmény. Ez a karakterszűrő az Apache Lucene használatával van implementálva. |
Pattern |
Karakterszűrő, amely a bemeneti sztringben szereplő karaktereket helyettesíti. Egy reguláris kifejezéssel azonosítja a megőrizendő karaktersorozatokat, a cseremintát pedig a lecserélendő karakterek azonosításához. Az "aa bb aa bb aa bb", a "(aa)\s+(bb)" minta és az "$1#$2" helyére például az "aa#bb aa#bb" szöveg lesz az eredmény. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva. |
Pattern |
A regex mintaegyezést használó tokenizer különböző jogkivonatok létrehozásához. Ez a tokenizer az Apache Lucene használatával van implementálva. |
Phonetic |
A PhoneticTokenFilterrel használandó fonetikus kódoló típusát azonosítja. |
Phonetic |
Jogkivonatok létrehozása fonetikus egyezésekhez. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva. |
Prioritized |
A szemantikai rangsoroláshoz, feliratokhoz, kiemelésekhez és válaszokhoz használandó cím- és tartalom- és kulcsszavakmezőket ismerteti. |
Regex |
Olyan jelzőket határoz meg, amelyek kombinálhatók annak szabályozásához, hogy a rendszer hogyan használja a reguláris kifejezéseket a mintaelemzőben és a minta jogkivonat-jelölőjében. |
Scalar |
A skaláris kvantálásra jellemző paramétereket tartalmazza. |
Scalar |
Az indexelés és lekérdezés során használt skaláris kvantálási tömörítési módszerre vonatkozó konfigurációs beállításokat tartalmaz. |
Scoring |
Meghatározza az összesítési függvényt, amely a pontozási profil összes pontozófüggvényének eredményét egyesíti. |
Scoring |
Meghatározza azt a függvényt, amellyel a pontszámok növelhetőek a dokumentumok egy tartományában. |
Scoring |
Olyan keresési index paramétereit határozza meg, amelyek befolyásolják a keresési lekérdezések pontozását. |
Search |
Egy indexdefinícióban lévő mezőt jelöl, amely egy mező nevét, adattípusát és keresési viselkedését írja le. |
Search |
A keresési indexben lévő mezők adattípusát határozza meg. |
Search |
A keresési index definícióját jelöli, amely egy index mezőit és keresési viselkedését írja le. |
Search |
Törli az adatforrás identitástulajdonságát. |
Search |
Megadja a használni kívánt adatforrás identitását. |
Search |
Ügyfél által felügyelt titkosítási kulcs az Azure Key Vaultban. A létrehozott és kezelt kulcsokkal titkosíthatja vagy visszafejtheti az inaktív adatokat, például indexeket és szinonimatérképeket. |
Semantic |
Meghatároz egy adott konfigurációt, amelyet a szemantikai képességek kontextusában kell használni. |
Semantic |
A szemantikai konfiguráció részeként használt mező. |
Semantic |
Olyan keresési index paramétereit határozza meg, amelyek befolyásolják a szemantikai képességeket. |
Shingle |
A jogkivonatok kombinációit egyetlen jogkivonatként hozza létre. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva. |
Snowball |
Egy szűrő, amely egy Snowball által létrehozott őslelő használatával szározza a szavakat. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva. |
Snowball |
A Snowball-jogkivonat-szűrőhöz használandó nyelv. |
Stemmer |
Lehetővé teszi az egyéb eredetszűrők felülbírálását a saját szótáralapú szárzással. A szótárból származó kifejezések kulcsszavakként lesznek megjelölve, hogy ne legyenek a láncban lévő ősökkel való eredetük. A szűrőt a szárító szűrők elé kell helyezni. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva. |
Stemmer |
Nyelvspecifikus eredetszűrő. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva. |
Stemmer |
A stemmer token szűrőhöz használandó nyelv. |
Stop |
A szöveget nem betűkkel osztja el; Alkalmazza a kisbetűs és a stopword jogkivonat szűrőit. Ez az elemző az Apache Lucene használatával van implementálva. |
Stopwords |
A nyelvspecifikus stopszavak előre definiált listáját azonosítja. |
Stopwords |
Eltávolítja a leállító szavakat egy jogkivonat-adatfolyamból. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva. |
Suggester |
Meghatározza, hogyan kell alkalmazni a Javaslat API-t az index egy mezőcsoportjára. |
Suggester |
A javaslattevő képességeit jelző érték. |
Synonym |
Egy vagy többszavas szinonimák egy jogkivonat-streamben. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva. |
Tag |
Olyan függvényt határoz meg, amely egy adott címkelistának megfelelő sztringértékekkel növeli a dokumentumok pontszámait. |
Tag |
Paraméterértékeket biztosít egy címkepontozási függvénynek. |
Text |
Olyan indexmezők súlyozását határozza meg, amelyek esetében az egyezéseknek növelnie kell a keresési lekérdezések pontozását. |
Token |
Olyan karakterosztályokat jelöl, amelyeken a jogkivonatszűrők működhetnek. |
Token |
Meghatározza a keresőmotor által támogatott összes jogkivonatszűrő nevét. |
Truncate |
A kifejezéseket egy adott hosszra csonkolja. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva. |
Uax |
Tokenizes URL-címek és e-mailek egy jogkivonatként. Ez a tokenizer az Apache Lucene használatával van implementálva. |
Unique |
Kiszűri a jogkivonatokat ugyanazzal a szöveggel, mint az előző jogkivonat. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva. |
Vector |
A vektormező tartalmának értelmezéséhez használt kódolási formátum. |
Vector |
A vektorkereséshez kapcsolódó konfigurációs beállításokat tartalmaz. |
Vector |
Az indexeléshez és lekérdezéshez használt algoritmus. |
Vector |
A vektorok összehasonlításához használandó hasonlósági metrika. Javasoljuk, hogy ugyanazt a hasonlósági metrikát válassza, mint a beágyazási modell betanítása. |
Vector |
Az indexeléshez és lekérdezéshez használt tömörítési módszer. |
Vector |
A tömörített vektorértékek kvantált adattípusa. |
Vector |
A vektorkereséssel használható konfigurációk kombinációját határozza meg. |
Vector |
A lekérdezési idő alatt használandó vektorizációs módszer. |
Web |
Megadja a felhasználó által definiált vektorizálóhoz való csatlakozás tulajdonságait. |
Web |
Felhasználó által definiált vektorizálót ad meg a lekérdezési sztring vektorbeágyazásához. A külső vektorizáló integrálása egy készségkészlet egyéni webes API-felületével érhető el. |
Word |
A szavakat alszavakra osztja, és opcionális átalakításokat hajt végre az alszavas csoportokon. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva. |
AsciiFoldingTokenFilter
Az első 127 ASCII-karakterben nem szereplő betűrendes, numerikus és szimbolikus Unicode-karaktereket (az "Egyszerű latin" Unicode-blokkot) ASCII-ekvivalenssé alakítja, ha léteznek ilyenek. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.
Name | Típus | Alapértelmezett érték | Description |
---|---|---|---|
@odata.type |
string:
#Microsoft. |
Egy URI-töredék, amely megadja a jogkivonatszűrő típusát. |
|
name |
string |
A jogkivonat-szűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet. |
|
preserveOriginal |
boolean |
False |
Egy érték, amely jelzi, hogy az eredeti jogkivonat megmarad-e. Az alapértelmezett érték hamis. |
AzureActiveDirectoryApplicationCredentials
A keresési szolgáltatáshoz létrehozott regisztrált alkalmazás hitelesítő adatai, amelyeket az Azure Key Vaultban tárolt titkosítási kulcsokhoz való hitelesített hozzáféréshez használnak.
Name | Típus | Description |
---|---|---|
applicationId |
string |
Egy AAD-alkalmazásazonosító, amely megkapta a szükséges hozzáférési engedélyeket az Azure Key Vaulthoz, amelyet az inaktív adatok titkosításához kell használni. Az alkalmazásazonosító nem tévesztendő össze az AAD-alkalmazás objektumazonosítójával. |
applicationSecret |
string |
A megadott AAD-alkalmazás hitelesítési kulcsa. |
AzureOpenAIEmbeddingSkill
Lehetővé teszi egy vektor beágyazását egy adott szöveges bemenethez az Azure OpenAI-erőforrás használatával.
Name | Típus | Description |
---|---|---|
@odata.type |
string:
#Microsoft. |
Egy URI-töredék, amely megadja a képesség típusát. |
apiKey |
string |
A kijelölt Azure OpenAI-erőforrás API-kulcsa. |
authIdentity | SearchIndexerDataIdentity: |
A kimenő kapcsolatokhoz használt, felhasználó által hozzárendelt felügyelt identitás. |
context |
string |
A műveletek végrehajtásának szintjét jelöli, például a dokumentum gyökerét vagy a dokumentum tartalmát (például /document vagy /document/content). Az alapértelmezett érték a /document. |
deploymentId |
string |
Az Azure OpenAI-modell üzembe helyezésének azonosítója a kijelölt erőforráson. |
description |
string |
A képesség leírása, amely leírja a képesség bemeneteit, kimeneteit és használatát. |
dimensions |
integer |
Az eredményként kapott kimeneti beágyazások dimenzióinak száma. Csak a text-embedding-3 és újabb modellekben támogatott. |
inputs |
A készségek bemenetei lehetnek a forrásadatkészlet oszlopai, vagy egy felsőbb rétegbeli képesség kimenete. |
|
modelName |
A megadott deploymentId elérési úton üzembe helyezett beágyazási modell neve. |
|
name |
string |
Annak a képességnek a neve, amely egyedileg azonosítja azt a képességkészleten belül. A névvel nem rendelkező képességek a képességtömb 1-alapú indexének alapértelmezett nevét kapják, "#" karakterrel előtaggal. |
outputs |
A szakértelem kimenete vagy egy keresési index mezője, vagy egy olyan érték, amelyet egy másik képesség bemenetként használhat fel. |
|
resourceUri |
string |
Az Azure OpenAI-erőforrás erőforrás-URI-ja. |
AzureOpenAIModelName
A meghívandó Azure Open AI-modell neve.
Name | Típus | Description |
---|---|---|
text-embedding-3-large |
string |
|
text-embedding-3-small |
string |
|
text-embedding-ada-002 |
string |
AzureOpenAIParameters
Megadja az Azure OpenAI-erőforráshoz való csatlakozás paramétereit.
Name | Típus | Description |
---|---|---|
apiKey |
string |
A kijelölt Azure OpenAI-erőforrás API-kulcsa. |
authIdentity | SearchIndexerDataIdentity: |
A kimenő kapcsolatokhoz használt, felhasználó által hozzárendelt felügyelt identitás. |
deploymentId |
string |
Az Azure OpenAI-modell üzembe helyezésének azonosítója a kijelölt erőforráson. |
modelName |
A megadott deploymentId elérési úton üzembe helyezett beágyazási modell neve. |
|
resourceUri |
string |
Az Azure OpenAI-erőforrás erőforrás-URI-ja. |
AzureOpenAIVectorizer
Megadja a lekérdezési sztring vektorizálásához használt Azure OpenAI-erőforrást.
Name | Típus | Description |
---|---|---|
azureOpenAIParameters | AzureOpenAIParameters: |
Az Azure OpenAI beágyazási vektorizálására vonatkozó paramétereket tartalmazza. |
kind |
string:
azure |
A vektorkereséshez konfigurált vektorizációs módszer neve. |
name |
string |
Az adott vektorizálási metódushoz társítandó név. |
BinaryQuantizationVectorSearchCompressionConfiguration
Az indexelés és lekérdezés során használt bináris kvantálási tömörítési módszerre vonatkozó konfigurációs beállításokat tartalmaz.
Name | Típus | Alapértelmezett érték | Description |
---|---|---|---|
defaultOversampling |
number |
Alapértelmezett túlmintavételi tényező. A túlbélyegző belsőleg több dokumentumot kér (ezt a szorzót határozza meg) a kezdeti keresésben. Ez növeli a teljes pontosságú vektorok újrafordított hasonlósági pontszámával újrafordított eredmények készletét. A minimális érték 1, ami azt jelenti, hogy nincs túlampling (1x). Ez a paraméter csak akkor állítható be, ha a rerankWithOriginalVectors értéke igaz. A magasabb értékek a késés rovására javítják a visszahívást. |
|
kind |
string:
binary |
A vektorkereséshez konfigurált tömörítési módszer neve. |
|
name |
string |
Az adott konfigurációhoz társítandó név. |
|
rerankWithOriginalVectors |
boolean |
True |
Ha igaz értékre van állítva, a tömörített vektorokkal kiszámított rendezett eredménykészlet lekérése után a rendszer újraszámítja őket a teljes pontosságú hasonlósági pontszámok újraszámításával. Ez a késés rovására javítja a visszahívást. |
BM25Similarity
Rangsorolási függvény az Okapi BM25 hasonlósági algoritmus alapján. A BM25 egy TF-IDF-szerű algoritmus, amely magában foglalja a hossz normalizálását (a "b" paraméterrel vezérelve), valamint a kifejezés gyakoriságának telítését (amelyet a "k1" paraméter szabályoz).
Name | Típus | Description |
---|---|---|
@odata.type |
string:
#Microsoft. |
|
b |
number |
Ez a tulajdonság szabályozza, hogy a dokumentum hossza hogyan befolyásolja a relevanciapontszámot. Alapértelmezés szerint a rendszer 0,75-ös értéket használ. A 0,0 érték azt jelenti, hogy a program nem alkalmaz hossz normalizálást, míg az 1,0 érték azt jelenti, hogy a pontszámot a dokumentum hossza teljesen normalizálja. |
k1 |
number |
Ez a tulajdonság szabályozza a skálázási függvényt az egyes egyező kifejezések kifejezési gyakorisága és a dokumentum-lekérdezés párok végső relevanciapontszáma között. Alapértelmezés szerint a rendszer 1,2 értéket használ. A 0,0 érték azt jelenti, hogy a pontszám nem skálázható a kifejezés gyakoriságának növekedésével. |
CharFilterName
Meghatározza a keresőmotor által támogatott összes karakterszűrő nevét.
Name | Típus | Description |
---|---|---|
html_strip |
string |
Egy karakterszűrő, amely megpróbálja kiszűrni a HTML-szerkezeteket. Lásd: https://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/charfilter/HTMLStripCharFilter.html |
CjkBigramTokenFilter
A standard tokenizerből létrehozott CJK-kifejezések bigramjai. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.
Name | Típus | Alapértelmezett érték | Description |
---|---|---|---|
@odata.type |
string:
#Microsoft. |
Egy URI-töredék, amely megadja a jogkivonatszűrő típusát. |
|
ignoreScripts |
A figyelmen kívül hagyandó szkriptek. |
||
name |
string |
A jogkivonat-szűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet. |
|
outputUnigrams |
boolean |
False |
Egy érték, amely azt jelzi, hogy az unigramokat és a bigramokat is ki kell-e adni (ha igaz), vagy csak bigramokat (ha hamis). Az alapértelmezett érték hamis. |
CjkBigramTokenFilterScripts
A CjkBigramTokenFilter által figyelmen kívül hagyható szkriptek.
Name | Típus | Description |
---|---|---|
han |
string |
A CJK-kifejezések bigramjainak létrehozásakor figyelmen kívül hagyja a Han-szkriptet. |
hangul |
string |
Hagyja figyelmen kívül a Hangul-szkriptet a CJK-kifejezések bigramjainak létrehozásakor. |
hiragana |
string |
Hagyja figyelmen kívül a Hiragana-szkriptet a CJK-kifejezések bigramjainak létrehozásakor. |
katakana |
string |
Hagyja figyelmen kívül a Katakana-szkriptet a CJK-kifejezések bigramjainak létrehozásakor. |
ClassicSimilarity
Örökölt hasonlósági algoritmus, amely a TF-IDF Lucene TFIDFSimilarity implementációját használja. A TF-IDF ezen változata statikus dokumentumhossz-normalizálást vezet be, valamint koordinálja azokat a tényezőket, amelyek csak részben egyeznek a keresett lekérdezésekkel.
Name | Típus | Description |
---|---|---|
@odata.type |
string:
#Microsoft. |
ClassicTokenizer
Nyelvtanalapú tokenizer, amely alkalmas a legtöbb európai nyelvű dokumentum feldolgozására. Ez a tokenizer az Apache Lucene használatával van implementálva.
Name | Típus | Alapértelmezett érték | Description |
---|---|---|---|
@odata.type |
string:
#Microsoft. |
A tokenizer típusát meghatározó URI-töredék. |
|
maxTokenLength |
integer |
255 |
A jogkivonat maximális hossza. Az alapértelmezett érték 255. A maximális hossznál hosszabb jogkivonatok fel vannak osztva. A maximálisan használható tokenhossz 300 karakter. |
name |
string |
A tokenizer neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet. |
CommonGramTokenFilter
Bigramokat hozhat létre az indexelés során gyakran előforduló kifejezésekhez. Az egyes kifejezések továbbra is indexelve vannak, és a bigramok túl vannak osztva. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.
Name | Típus | Alapértelmezett érték | Description |
---|---|---|---|
@odata.type |
string:
#Microsoft. |
Egy URI-töredék, amely megadja a jogkivonatszűrő típusát. |
|
commonWords |
string[] |
A közös szavak halmaza. |
|
ignoreCase |
boolean |
False |
Egy érték, amely jelzi, hogy a közös szavak egyeztetése érzéketlen lesz-e a kis- és nagybetűk között. Az alapértelmezett érték hamis. |
name |
string |
A jogkivonat-szűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet. |
|
queryMode |
boolean |
False |
Egy érték, amely jelzi, hogy a jogkivonat szűrője lekérdezési módban van-e. Lekérdezési módban a jogkivonat-szűrő bigramokat hoz létre, majd eltávolítja a közös szavakat és az egyszavas kifejezéseket, amelyeket egy közös szó követ. Az alapértelmezett érték hamis. |
CorsOptions
Meghatározza az indexek forrásközi erőforrás-megosztásának (CORS) beállítását.
Name | Típus | Description |
---|---|---|
allowedOrigins |
string[] |
Azon források listája, amelyekből a JavaScript-kód hozzáférést kap az indexhez. A(z) {protocol}://{teljes-qualified-domain-name}[:{port#}] űrlap gazdagépeinek listáját vagy egyetlen "*" elemet is tartalmazhat az összes forrás engedélyezéséhez (nem ajánlott). |
maxAgeInSeconds |
integer |
Az az időtartam, amelyre a böngészőknek gyorsítótáraznia kell a CORS elővizsgálati válaszait. Alapértelmezés szerint 5 perc. |
CustomAnalyzer
Lehetővé teszi a szöveg indexelhető/kereshető jogkivonatokká alakításának folyamatát. Ez egy felhasználó által definiált konfiguráció, amely egyetlen előre definiált tokenizerből és egy vagy több szűrőből áll. A jogkivonat-készítő felelős a szöveg jogkivonatokra való feltöréséért, valamint a jogkivonat-készítő által kibocsátott jogkivonatok módosítására szolgáló szűrőkért.
Name | Típus | Description |
---|---|---|
@odata.type |
string:
#Microsoft. |
Az elemző típusát meghatározó URI-töredék. |
charFilters |
A bemeneti szövegnek a tokenizer általi feldolgozása előtt történő előkészítéséhez használt karakterszűrők listája. Például lecserélhetnek bizonyos karaktereket vagy szimbólumokat. A szűrők a lista sorrendjében futnak. |
|
name |
string |
Az elemző neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet. |
tokenFilters |
A jogkivonat-létrehozó által létrehozott jogkivonatok kiszűrésére vagy módosítására használt jogkivonatszűrők listája. Megadhat például egy kisbetűs szűrőt, amely az összes karaktert kisbetűssé alakítja. A szűrők a lista sorrendjében futnak. |
|
tokenizer |
A jogkivonat-megosztó neve, a folyamatos szöveg jogkivonatok sorozatára való felosztásához, például egy mondat szavakra töréséhez. |
DictionaryDecompounderTokenFilter
Több germán nyelven található összetett szavakat bont le. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.
Name | Típus | Alapértelmezett érték | Description |
---|---|---|---|
@odata.type |
string:
#Microsoft. |
Egy URI-töredék, amely megadja a jogkivonatszűrő típusát. |
|
maxSubwordSize |
integer |
15 |
A maximális alszóméret. Csak az ennél rövidebb alszavak lesznek kimenetben. Az alapértelmezett érték 15. A maximális érték 300. |
minSubwordSize |
integer |
2 |
A minimális alszóméret. A rendszer csak ennél hosszabb alszavakat ad ki. Az alapértelmezett érték 2. A maximális érték 300. |
minWordSize |
integer |
5 |
A szavak minimális mérete. Csak az ennél hosszabb szavak lesznek feldolgozva. Az alapértelmezett érték 5. A maximális érték 300. |
name |
string |
A jogkivonat-szűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet. |
|
onlyLongestMatch |
boolean |
False |
Egy érték, amely azt jelzi, hogy csak a leghosszabb egyező alszót kell-e hozzáadni a kimenethez. Az alapértelmezett érték hamis. |
wordList |
string[] |
Azoknak a szavaknak a listája, |
DistanceScoringFunction
Olyan függvényt határoz meg, amely a földrajzi helytől való távolság alapján növeli a pontszámokat.
Name | Típus | Description |
---|---|---|
boost |
number |
A nyers pontszám szorzója. Pozitív számnak kell lennie, amely nem egyenlő 1,0-sal. |
distance |
A távolságpontozási függvény paraméterértékei. |
|
fieldName |
string |
A pontozási függvény bemeneteként használt mező neve. |
interpolation |
Egy érték, amely azt jelzi, hogy a kiemelés hogyan lesz interpolálva a dokumentum pontszámai között; alapértelmezett értéke "Lineáris". |
|
type |
string:
distance |
A használni kívánt függvény típusát jelzi. Az érvényes értékek közé tartozik a mennyiség, a frissesség, a távolság és a címke. A függvénytípusnak kisbetűsnek kell lennie. |
DistanceScoringParameters
Paraméterértékeket biztosít egy távolsági pontozási függvénynek.
Name | Típus | Description |
---|---|---|
boostingDistance |
number |
Az a távolság, amely kilométerben van attól a referenciahelytől, ahol a kiemelési tartomány véget ér. |
referencePointParameter |
string |
A keresési lekérdezésekben átadott paraméter neve a referenciahely megadásához. |
EdgeNGramTokenFilter
A megadott méret(ek) n grammját hozza létre egy bemeneti jogkivonat elejétől vagy hátuljától kezdve. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.
Name | Típus | Alapértelmezett érték | Description |
---|---|---|---|
@odata.type |
string:
#Microsoft. |
Egy URI-töredék, amely megadja a jogkivonatszűrő típusát. |
|
maxGram |
integer |
2 |
A maximális n-gram hossz. Az alapértelmezett érték 2. |
minGram |
integer |
1 |
Az n-gramm minimális hossza. Az alapértelmezett érték 1. A maxGram értékénél kisebbnek kell lennie. |
name |
string |
A jogkivonat-szűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet. |
|
side | front |
Megadja, hogy az n-gram melyik oldaláról kell létrehozni az n-gramot. Az alapértelmezett érték az "előtér". |
EdgeNGramTokenFilterSide
Megadja, hogy a bemenet melyik oldaláról kell n-gramot létrehozni.
Name | Típus | Description |
---|---|---|
back |
string |
Megadja, hogy az n-gramot a bemenet hátoldaláról kell létrehozni. |
front |
string |
Megadja, hogy az n-gramot a bemenet elejéről kell létrehozni. |
EdgeNGramTokenFilterV2
A megadott méret(ek) n grammját hozza létre egy bemeneti jogkivonat elejétől vagy hátuljától kezdve. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.
Name | Típus | Alapértelmezett érték | Description |
---|---|---|---|
@odata.type |
string:
#Microsoft. |
Egy URI-töredék, amely megadja a jogkivonatszűrő típusát. |
|
maxGram |
integer |
2 |
A maximális n-gram hossz. Az alapértelmezett érték 2. A maximális érték 300. |
minGram |
integer |
1 |
Az n-gramm minimális hossza. Az alapértelmezett érték 1. A maximális érték 300. A maxGram értékénél kisebbnek kell lennie. |
name |
string |
A jogkivonat-szűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet. |
|
side | front |
Megadja, hogy az n-gram melyik oldaláról kell létrehozni az n-gramot. Az alapértelmezett érték az "előtér". |
EdgeNGramTokenizer
Tokenizálja a bemenetet egy élről az adott méret(ek) n-grammjára. Ez a tokenizer az Apache Lucene használatával van implementálva.
Name | Típus | Alapértelmezett érték | Description |
---|---|---|---|
@odata.type |
string:
#Microsoft. |
A tokenizer típusát meghatározó URI-töredék. |
|
maxGram |
integer |
2 |
A maximális n-gram hossz. Az alapértelmezett érték 2. A maximális érték 300. |
minGram |
integer |
1 |
Az n-gramm minimális hossza. Az alapértelmezett érték 1. A maximális érték 300. A maxGram értékénél kisebbnek kell lennie. |
name |
string |
A tokenizer neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet. |
|
tokenChars |
A jogkivonatokban megtartandó karakterosztályok. |
ElisionTokenFilter
Eltávolítja az elisionst. A "l'avion" (a sík) például "avion" (sík) lesz. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.
Name | Típus | Description |
---|---|---|
@odata.type |
string:
#Microsoft. |
Egy URI-töredék, amely megadja a jogkivonatszűrő típusát. |
articles |
string[] |
Az eltávolítandó cikkek készlete. |
name |
string |
A jogkivonat-szűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet. |
ErrorAdditionalInfo
Az erőforrás-kezelési hiba további információi.
Name | Típus | Description |
---|---|---|
info |
object |
A további információk. |
type |
string |
A további információtípus. |
ErrorDetail
A hiba részletei.
Name | Típus | Description |
---|---|---|
additionalInfo |
A hiba további információi. |
|
code |
string |
A hibakód. |
details |
A hiba részletei. |
|
message |
string |
A hibaüzenet. |
target |
string |
A hibacél. |
ErrorResponse
Hibaválasz
Name | Típus | Description |
---|---|---|
error |
A hibaobjektum. |
ExhaustiveKnnParameters
A teljes KNN-algoritmusra jellemző paramétereket tartalmazza.
Name | Típus | Description |
---|---|---|
metric |
A vektorok összehasonlításához használandó hasonlósági metrika. |
ExhaustiveKnnVectorSearchAlgorithmConfiguration
A lekérdezés során használt teljes KNN-algoritmusra vonatkozó konfigurációs beállításokat tartalmaz, amelyek találgatásos keresést hajtanak végre a teljes vektorindexben.
Name | Típus | Description |
---|---|---|
exhaustiveKnnParameters |
A teljes KNN-algoritmusra jellemző paramétereket tartalmazza. |
|
kind |
string:
exhaustive |
A vektorkereséshez konfigurált algoritmus neve. |
name |
string |
Az adott konfigurációhoz társítandó név. |
FreshnessScoringFunction
Olyan függvényt határoz meg, amely egy dátum-idő mező értéke alapján növeli a pontszámokat.
Name | Típus | Description |
---|---|---|
boost |
number |
A nyers pontszám szorzója. Pozitív számnak kell lennie, amely nem egyenlő 1,0-sal. |
fieldName |
string |
A pontozási függvény bemeneteként használt mező neve. |
freshness |
A frissesség-pontozási függvény paraméterértékei. |
|
interpolation |
Egy érték, amely azt jelzi, hogy a kiemelés hogyan lesz interpolálva a dokumentum pontszámai között; alapértelmezett értéke "Lineáris". |
|
type |
string:
freshness |
A használni kívánt függvény típusát jelzi. Az érvényes értékek közé tartozik a mennyiség, a frissesség, a távolság és a címke. A függvénytípusnak kisbetűsnek kell lennie. |
FreshnessScoringParameters
Paraméterértékeket biztosít egy frissesség-pontozási függvénynek.
Name | Típus | Description |
---|---|---|
boostingDuration |
string |
Az a lejárati időszak, amely után a kiemelés leáll egy adott dokumentum esetében. |
HnswParameters
A HNSW algoritmusra jellemző paramétereket tartalmazza.
Name | Típus | Alapértelmezett érték | Description |
---|---|---|---|
efConstruction |
integer |
400 |
A legközelebbi szomszédokat tartalmazó dinamikus lista mérete, amelyet az index ideje alatt használnak. A paraméter növelése javíthatja az index minőségét a megnövekedett indexelési idő rovására. Egy bizonyos ponton ennek a paraméternek a növelése csökkenő visszatéréshez vezet. |
efSearch |
integer |
500 |
A keresési idő alatt használt legközelebbi szomszédokat tartalmazó dinamikus lista mérete. A paraméter növelése javíthatja a keresési eredményeket a lassabb keresés rovására. Egy bizonyos ponton ennek a paraméternek a növelése csökkenő visszatéréshez vezet. |
m |
integer |
4 |
A kétirányú kapcsolatok száma, amelyek minden új elemhez létrejönnek az építés során. A paraméter értékének növelése javíthatja a nagy belső dimenziójú adathalmazok visszahívási és lekérési idejét a megnövekedett memóriahasználat és a hosszabb indexelési idő rovására. |
metric |
A vektorok összehasonlításához használandó hasonlósági metrika. |
HnswVectorSearchAlgorithmConfiguration
Az indexelés és lekérdezés során használt HNSW közelítő szomszéd algoritmusra vonatkozó konfigurációs beállításokat tartalmaz. A HNSW algoritmus a keresési sebesség és a pontosság közötti kompromisszumot kínálja.
Name | Típus | Description |
---|---|---|
hnswParameters |
A HNSW algoritmusra jellemző paramétereket tartalmazza. |
|
kind |
string:
hnsw |
A vektorkereséshez konfigurált algoritmus neve. |
name |
string |
Az adott konfigurációhoz társítandó név. |
InputFieldMappingEntry
Beviteli mező leképezése egy képességhez.
Name | Típus | Description |
---|---|---|
inputs |
Az összetett típus létrehozásakor használt rekurzív bemenetek. |
|
name |
string |
A bemenet neve. |
source |
string |
A bemenet forrása. |
sourceContext |
string |
A rekurzív bemenetek kiválasztásához használt forráskörnyezet. |
KeepTokenFilter
Olyan jogkivonatszűrő, amely csak a megadott szavak listájában lévő szöveggel rendelkező jogkivonatokat tárolja. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.
Name | Típus | Alapértelmezett érték | Description |
---|---|---|---|
@odata.type |
string:
#Microsoft. |
Egy URI-töredék, amely megadja a jogkivonatszűrő típusát. |
|
keepWords |
string[] |
A megtartandó szavak listája. |
|
keepWordsCase |
boolean |
False |
Egy érték, amely azt jelzi, hogy az összes szót először kisbetűvel kell-e kisbetűsíteni. Az alapértelmezett érték hamis. |
name |
string |
A jogkivonat-szűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet. |
KeywordMarkerTokenFilter
Kulcsszavakként jelöli meg a kifejezéseket. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.
Name | Típus | Alapértelmezett érték | Description |
---|---|---|---|
@odata.type |
string:
#Microsoft. |
Egy URI-töredék, amely megadja a jogkivonatszűrő típusát. |
|
ignoreCase |
boolean |
False |
A kis- és nagybetűk figyelmen kívül hagyását jelző érték. Ha igaz, a program először az összes szót kisbetűssé alakítja. Az alapértelmezett érték hamis. |
keywords |
string[] |
Kulcsszavakként megjelölendő szavak listája. |
|
name |
string |
A jogkivonat-szűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet. |
KeywordTokenizer
A teljes bemenetet egyetlen jogkivonatként bocsátja ki. Ez a tokenizer az Apache Lucene használatával van implementálva.
Name | Típus | Alapértelmezett érték | Description |
---|---|---|---|
@odata.type |
string:
#Microsoft. |
A tokenizer típusát meghatározó URI-töredék. |
|
bufferSize |
integer |
256 |
Az olvasási puffer mérete bájtban. Az alapértelmezett érték 256. |
name |
string |
A tokenizer neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet. |
KeywordTokenizerV2
A teljes bemenetet egyetlen jogkivonatként bocsátja ki. Ez a tokenizer az Apache Lucene használatával van implementálva.
Name | Típus | Alapértelmezett érték | Description |
---|---|---|---|
@odata.type |
string:
#Microsoft. |
A tokenizer típusát meghatározó URI-töredék. |
|
maxTokenLength |
integer |
256 |
A jogkivonat maximális hossza. Az alapértelmezett érték 256. A maximális hossznál hosszabb jogkivonatok fel vannak osztva. A maximálisan használható tokenhossz 300 karakter. |
name |
string |
A tokenizer neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet. |
LengthTokenFilter
Eltávolítja a túl hosszú vagy túl rövid szavakat. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.
Name | Típus | Alapértelmezett érték | Description |
---|---|---|---|
@odata.type |
string:
#Microsoft. |
Egy URI-töredék, amely megadja a jogkivonatszűrő típusát. |
|
max |
integer |
300 |
A karakterek maximális hossza. Az alapértelmezett érték és a maximális érték 300. |
min |
integer |
0 |
A karakterek minimális hossza. Az alapértelmezett érték 0. A maximális érték 300. A maximális értéknél kisebbnek kell lennie. |
name |
string |
A jogkivonat-szűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet. |
LexicalAnalyzerName
Meghatározza a keresőmotor által támogatott összes szövegelemző nevét.
Name | Típus | Description |
---|---|---|
ar.lucene |
string |
Lucene elemző arabhoz. |
ar.microsoft |
string |
Microsoft analyzer for Arab. |
bg.lucene |
string |
Lucene elemző bolgárnak. |
bg.microsoft |
string |
Microsoft analyzer for Bolgár. |
bn.microsoft |
string |
A Bangla Microsoft-elemzője. |
ca.lucene |
string |
Lucene elemző katalánnak. |
ca.microsoft |
string |
A Katalán Microsoft elemzője. |
cs.lucene |
string |
Lucene elemző csehnek. |
cs.microsoft |
string |
Microsoft analyzer for Czech. |
da.lucene |
string |
Lucene elemző dánnak. |
da.microsoft |
string |
Microsoft analyzer dán nyelven. |
de.lucene |
string |
Lucene elemző németnek. |
de.microsoft |
string |
Microsoft analyzer for German. |
el.lucene |
string |
Lucene elemző görögnek. |
el.microsoft |
string |
Microsoft analyzer for Greek. |
en.lucene |
string |
Lucene elemző angolul. |
en.microsoft |
string |
Microsoft analyzer for English. |
es.lucene |
string |
Lucene elemző spanyolnak. |
es.microsoft |
string |
Microsoft analyzer for Spanyol. |
et.microsoft |
string |
Microsoft analyzer az észtekhez. |
eu.lucene |
string |
Lucene elemző baszknak. |
fa.lucene |
string |
Lucene elemző perzsa. |
fi.lucene |
string |
Lucene elemző finnnek. |
fi.microsoft |
string |
Microsoft analyzer for Finn. |
fr.lucene |
string |
Lucene elemző franciának. |
fr.microsoft |
string |
Microsoft analyzer for French. |
ga.lucene |
string |
Lucene elemző írnek. |
gl.lucene |
string |
Lucene elemző galíciainak. |
gu.microsoft |
string |
Microsoft analyzer for Gujarati. |
he.microsoft |
string |
Microsoft analyzer for Héber. |
hi.lucene |
string |
Lucene elemző hindinek. |
hi.microsoft |
string |
Microsoft analyzer for Hindi. |
hr.microsoft |
string |
Microsoft analyzer for Horvát. |
hu.lucene |
string |
Lucene elemző magyarnak. |
hu.microsoft |
string |
Microsoft analyzer for Hungarian. |
hy.lucene |
string |
Lucene elemző örménynek. |
id.lucene |
string |
Lucene elemző indonéznek. |
id.microsoft |
string |
Indonéz Microsoft-elemző (Bahasa). |
is.microsoft |
string |
A Microsoft izlandi elemzője. |
it.lucene |
string |
Lucene elemző olasznak. |
it.microsoft |
string |
Microsoft analyzer for Italian. |
ja.lucene |
string |
Lucene elemző japánnak. |
ja.microsoft |
string |
Microsoft Analyzer japánhoz. |
keyword |
string |
Egy mező teljes tartalmát egyetlen jogkivonatként kezeli. Ez olyan adatok esetében hasznos, mint az irányítószámok, az azonosítók és néhány terméknév. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/KeywordAnalyzer.html |
kn.microsoft |
string |
A Kannada Microsoft-elemzője. |
ko.lucene |
string |
Lucene elemző koreainak. |
ko.microsoft |
string |
Microsoft-elemző koreaihoz. |
lt.microsoft |
string |
Microsoft-elemző litvánhoz. |
lv.lucene |
string |
Lucene elemző lettnek. |
lv.microsoft |
string |
Microsoft analyzer for Lett. |
ml.microsoft |
string |
Microsoft-elemző malajalamhoz. |
mr.microsoft |
string |
Marathi Microsoft-elemzője. |
ms.microsoft |
string |
Microsoft Analyzer for Maly (latin). |
nb.microsoft |
string |
Microsoft analyzer for Norwegian (Bokmål). |
nl.lucene |
string |
Lucene elemző hollandnak. |
nl.microsoft |
string |
Microsoft analyzer for Holland. |
no.lucene |
string |
Lucene elemző norvégnak. |
pa.microsoft |
string |
A Punjabi microsoft-elemzője. |
pattern |
string |
A szöveget rugalmasan elválasztja kifejezésekké egy reguláris kifejezésmintán keresztül. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/PatternAnalyzer.html |
pl.lucene |
string |
Lucene elemző lengyelnek. |
pl.microsoft |
string |
Microsoft analyzer for Lengyel. |
pt-BR.lucene |
string |
Lucene analyzer for Portugál (Brazília). |
pt-BR.microsoft |
string |
Microsoft analyzer for Portugál (Brazília). |
pt-PT.lucene |
string |
Lucene analyzer for Portugál (Portugália). |
pt-PT.microsoft |
string |
Microsoft analyzer for Portugál (Portugália). |
ro.lucene |
string |
Lucene elemző románnak. |
ro.microsoft |
string |
Microsoft analyzer for Román. |
ru.lucene |
string |
Lucene elemző orosznak. |
ru.microsoft |
string |
Microsoft-elemző oroszhoz. |
simple |
string |
Nem betűkre osztja a szöveget, és kisbetűssé alakítja őket. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/SimpleAnalyzer.html |
sk.microsoft |
string |
Microsoft analyzer for Szlovák. |
sl.microsoft |
string |
Szlovén Microsoft-elemző. |
sr-cyrillic.microsoft |
string |
Microsoft analyzer for Serbian (cirill betűs). |
sr-latin.microsoft |
string |
Microsoft analyzer for Szerb (latin). |
standard.lucene |
string |
Standard Lucene elemző. |
standardasciifolding.lucene |
string |
Standard ASCII összecsukható Lucene-elemző. Lásd: https://learn.microsoft.com/rest/api/searchservice/Custom-analyzers-in-Azure-Search#Analyzers |
stop |
string |
A szöveget nem betűkkel osztja el; Alkalmazza a kisbetűs és a stopword jogkivonat szűrőit. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/StopAnalyzer.html |
sv.lucene |
string |
Lucene elemző svédnek. |
sv.microsoft |
string |
Microsoft analyzer for Svéd. |
ta.microsoft |
string |
Microsoft analyzer for Tamil. |
te.microsoft |
string |
Microsoft-elemző a Teluguhoz. |
th.lucene |
string |
Lucene elemző thaihoz. |
th.microsoft |
string |
Microsoft analyzer for Thai. |
tr.lucene |
string |
Lucene elemző töröknek. |
tr.microsoft |
string |
Microsoft analyzer for Turkish. |
uk.microsoft |
string |
Microsoft analyzer for Ukrán. |
ur.microsoft |
string |
Microsoft analyzer for Urdu. |
vi.microsoft |
string |
A Vietnami Microsoft elemzője. |
whitespace |
string |
A whitespace tokenizert használó elemző. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/WhitespaceAnalyzer.html |
zh-Hans.lucene |
string |
Lucene elemző kínaihoz (egyszerűsített). |
zh-Hans.microsoft |
string |
Microsoft Analyzer kínaihoz (egyszerűsített). |
zh-Hant.lucene |
string |
Lucene elemző kínaihoz (hagyományos). |
zh-Hant.microsoft |
string |
Microsoft analyzer for Chinese (Hagyományos). |
LexicalTokenizerName
Meghatározza a keresőmotor által támogatott összes tokenizer nevét.
LimitTokenFilter
Korlátozza a jogkivonatok számát az indexelés során. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.
Name | Típus | Alapértelmezett érték | Description |
---|---|---|---|
@odata.type |
string:
#Microsoft. |
Egy URI-töredék, amely megadja a jogkivonatszűrő típusát. |
|
consumeAllTokens |
boolean |
False |
Egy érték, amely azt jelzi, hogy a bemenet összes jogkivonatát akkor is fel kell-e használni, ha eléri a maxTokenCount értéket. Az alapértelmezett érték hamis. |
maxTokenCount |
integer |
1 |
A létrehozandó jogkivonatok maximális száma. Az alapértelmezett érték 1. |
name |
string |
A jogkivonat-szűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet. |
ListIndexesResult
Válasz a List Indexes kérelemből. Ha sikeres, az összes index teljes definícióját tartalmazza.
Name | Típus | Description |
---|---|---|
value |
A Keresési szolgáltatás indexei. |
LuceneStandardAnalyzer
Standard Apache Lucene-elemző; A standard tokenizerből, kisbetűs szűrőből és stop szűrőből áll.
Name | Típus | Alapértelmezett érték | Description |
---|---|---|---|
@odata.type |
string:
#Microsoft. |
Az elemző típusát meghatározó URI-töredék. |
|
maxTokenLength |
integer |
255 |
A jogkivonat maximális hossza. Az alapértelmezett érték 255. A maximális hossznál hosszabb jogkivonatok fel vannak osztva. A maximálisan használható tokenhossz 300 karakter. |
name |
string |
Az elemző neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet. |
|
stopwords |
string[] |
A stopwords listája. |
LuceneStandardTokenizer
A Unicode szövegszegmentálási szabályokat követő szövegtörések. Ez a tokenizer az Apache Lucene használatával van implementálva.
Name | Típus | Alapértelmezett érték | Description |
---|---|---|---|
@odata.type |
string:
#Microsoft. |
A tokenizer típusát meghatározó URI-töredék. |
|
maxTokenLength |
integer |
255 |
A jogkivonat maximális hossza. Az alapértelmezett érték 255. A maximális hossznál hosszabb jogkivonatok fel vannak osztva. |
name |
string |
A tokenizer neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet. |
LuceneStandardTokenizerV2
A Unicode szövegszegmentálási szabályokat követő szövegtörések. Ez a tokenizer az Apache Lucene használatával van implementálva.
Name | Típus | Alapértelmezett érték | Description |
---|---|---|---|
@odata.type |
string:
#Microsoft. |
A tokenizer típusát meghatározó URI-töredék. |
|
maxTokenLength |
integer |
255 |
A jogkivonat maximális hossza. Az alapértelmezett érték 255. A maximális hossznál hosszabb jogkivonatok fel vannak osztva. A maximálisan használható tokenhossz 300 karakter. |
name |
string |
A tokenizer neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet. |
MagnitudeScoringFunction
Olyan függvényt határoz meg, amely egy numerikus mező nagysága alapján növeli a pontszámokat.
Name | Típus | Description |
---|---|---|
boost |
number |
A nyers pontszám szorzója. Pozitív számnak kell lennie, amely nem egyenlő 1,0-sal. |
fieldName |
string |
A pontozási függvény bemeneteként használt mező neve. |
interpolation |
Egy érték, amely azt jelzi, hogy a kiemelés hogyan lesz interpolálva a dokumentum pontszámai között; alapértelmezett értéke "Lineáris". |
|
magnitude |
A magnitúdópontozási függvény paraméterértékei. |
|
type |
string:
magnitude |
A használni kívánt függvény típusát jelzi. Az érvényes értékek közé tartozik a mennyiség, a frissesség, a távolság és a címke. A függvénytípusnak kisbetűsnek kell lennie. |
MagnitudeScoringParameters
Paraméterértékeket ad meg egy nagyságrendi pontozási függvénynek.
Name | Típus | Description |
---|---|---|
boostingRangeEnd |
number |
Az a mezőérték, amelynél a kiemelés véget ér. |
boostingRangeStart |
number |
Az a mezőérték, amelynél a kiemelés elindul. |
constantBoostBeyondRange |
boolean |
Egy érték, amely azt jelzi, hogy a tartomány végértékét meghaladó mezőértékekre állandó lökést kell-e alkalmazni; alapértelmezett értéke hamis. |
MappingCharFilter
A leképezési beállítással definiált leképezéseket alkalmazó karakterszűrő. A megfeleltetés kapzsi (egy adott pontnál a leghosszabb egyező minta nyer). A csere lehet üres sztring. Ez a karakterszűrő az Apache Lucene használatával van implementálva.
Name | Típus | Description |
---|---|---|
@odata.type |
string:
#Microsoft. |
A karakterszűrő típusát meghatározó URI-töredék. |
mappings |
string[] |
A következő formátumú leképezések listája: "a=>b" (az "a" karakter minden előfordulása "b" karakterrel lesz helyettesítve). |
name |
string |
A karakterszűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet. |
MicrosoftLanguageStemmingTokenizer
Nyelvspecifikus szabályokkal osztja el a szöveget, és a szavakat az alapformákra csökkenti.
Name | Típus | Alapértelmezett érték | Description |
---|---|---|---|
@odata.type |
string:
#Microsoft. |
A tokenizer típusát meghatározó URI-töredék. |
|
isSearchTokenizer |
boolean |
False |
A tokenizer használatát jelző érték. Állítsa igaz értékre, ha keresési jogkivonat-képzőként használják, állítsa hamis értékre, ha indexelő jogkivonat-képzőként használják. Az alapértelmezett érték hamis. |
language |
A használni kívánt nyelv. Az alapértelmezett érték az angol. |
||
maxTokenLength |
integer |
255 |
A jogkivonat maximális hossza. A maximális hossznál hosszabb jogkivonatok fel vannak osztva. A használható jogkivonatok maximális hossza 300 karakter. A 300 karakternél hosszabb jogkivonatok először 300 hosszúságú jogkivonatokra lesznek felosztva, majd az egyes jogkivonatok felosztása a jogkivonatok maximális hossza alapján történik. Az alapértelmezett érték 255. |
name |
string |
A tokenizer neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet. |
MicrosoftLanguageTokenizer
Nyelvspecifikus szabályokkal osztja el a szöveget.
Name | Típus | Alapértelmezett érték | Description |
---|---|---|---|
@odata.type |
string:
#Microsoft. |
A tokenizer típusát meghatározó URI-töredék. |
|
isSearchTokenizer |
boolean |
False |
A tokenizer használatát jelző érték. Állítsa igaz értékre, ha keresési jogkivonat-képzőként használják, állítsa hamis értékre, ha indexelő jogkivonat-képzőként használják. Az alapértelmezett érték hamis. |
language |
A használni kívánt nyelv. Az alapértelmezett érték az angol. |
||
maxTokenLength |
integer |
255 |
A jogkivonat maximális hossza. A maximális hossznál hosszabb jogkivonatok fel vannak osztva. A használható jogkivonatok maximális hossza 300 karakter. A 300 karakternél hosszabb jogkivonatok először 300 hosszúságú jogkivonatokra lesznek felosztva, majd az egyes jogkivonatok felosztása a jogkivonatok maximális hossza alapján történik. Az alapértelmezett érték 255. |
name |
string |
A tokenizer neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet. |
MicrosoftStemmingTokenizerLanguage
A Microsoft nyelv által támogatott nyelveket sorolja fel a jogkivonat-kezelőből.
Name | Típus | Description |
---|---|---|
arabic |
string |
Kiválasztja a Microsoft által használt jogkivonat-kezelőt arab nyelven. |
bangla |
string |
A Bangla microsoftos jogkivonat-kezelőjének kiválasztása. |
bulgarian |
string |
Kiválasztja a microsoftos jogkivonat-kezelőt a bolgárhoz. |
catalan |
string |
Kiválasztja a Katalán Microsoft-jogkivonat-kezelőt. |
croatian |
string |
Kiválasztja a microsoftos jogkivonat-kezelőt a horváthoz. |
czech |
string |
Kiválasztja a Microsoft által használt jogkivonat-kezelőt a csehhez. |
danish |
string |
Kiválasztja a microsoftos jogkivonat-kezelőt dán nyelven. |
dutch |
string |
Kiválasztja a Microsoft által használt jogkivonat-kezelőt a hollandhoz. |
english |
string |
Kiválasztja a Microsoft által használt jogkivonat-kezelőt angol nyelven. |
estonian |
string |
Kiválasztja az észt Microsoft-jogkivonat-kezelőt. |
finnish |
string |
Kiválasztja a Finn Microsoft-alapú jogkivonat-kezelőt. |
french |
string |
Kiválasztja a Microsoft által használt jogkivonat-kezelőt franciául. |
german |
string |
Kiválasztja a microsoftos jogkivonat-kezelőt a német nyelvhez. |
greek |
string |
Kiválasztja a microsoftos jogkivonat-kezelőt a göröghöz. |
gujarati |
string |
Kiválasztja a Microsoft által létrehozott jogkivonat-kezelőt a Gujaratihoz. |
hebrew |
string |
Kiválasztja a Héberhez készült Microsoft-jogkivonat-kezelőt. |
hindi |
string |
Kiválasztja a Hindihez készült Microsoft-jogkivonat-kezelőt. |
hungarian |
string |
Kiválasztja a microsoftos jogkivonat-kezelőt a magyarhoz. |
icelandic |
string |
Kiválasztja az izlandi Microsoft-jogkivonat-kezelőt. |
indonesian |
string |
Kiválasztja az indonéz Microsoft-jogkivonat-kezelőt. |
italian |
string |
Kiválasztja az olasz microsoftos jogkivonat-kezelőt. |
kannada |
string |
A Kannada microsoftos jogkivonat-kezelőjének kiválasztása. |
latvian |
string |
Kiválasztja a microsoftos jogkivonat-kezelőt a lett nyelvhez. |
lithuanian |
string |
Kiválasztja a microsoftos jogkivonat-kezelőt a litvánhoz. |
malay |
string |
Kiválasztja a Malájhoz tartozó Microsoft-jogkivonat-kezelőt. |
malayalam |
string |
Kiválasztja a Malájlamhoz tartozó Microsoft-jogkivonat-kezelőt. |
marathi |
string |
Kiválasztja a Marathihoz tartozó Microsoft-jogkivonat-kezelőt. |
norwegianBokmaal |
string |
A Norvég (Bokmål) microsoftos jogkivonat-kezelőt választja ki. |
polish |
string |
Kiválasztja a Microsoft-alapú jogkivonat-kezelőt a lengyelhez. |
portuguese |
string |
Kiválasztja a Portugál Microsoft-jogkivonat-kezelőt. |
portugueseBrazilian |
string |
Kiválasztja a Portugál (Brazília) microsoftos jogkivonat-kezelőt. |
punjabi |
string |
Kiválasztja a Punjabihoz tartozó Microsoft-jogkivonat-kezelőt. |
romanian |
string |
Kiválasztja a Microsoft által használt jogkivonat-kezelőt a román nyelvhez. |
russian |
string |
Kiválasztja az orosz microsoftos jogkivonat-kezelőt. |
serbianCyrillic |
string |
Kiválasztja a Szerb (cirill betűs) Microsoft-jogkivonat-kezelőt. |
serbianLatin |
string |
Kiválasztja a Microsoft által használt jogkivonat-jelölőt a szerb (latin) nyelvhez. |
slovak |
string |
Kiválasztja a microsoftos jogkivonat-kezelőt a szlovák nyelvhez. |
slovenian |
string |
Kiválasztja a szlovén microsoftos jogkivonat-kezelőt. |
spanish |
string |
Kiválasztja a Microsoft által használt jogkivonat-kezelőt spanyol nyelven. |
swedish |
string |
Kiválasztja a microsoftos jogkivonat-kezelőt svéd nyelven. |
tamil |
string |
Kiválasztja a Microsoft által használt jogkivonat-kezelőt a Tamilhez. |
telugu |
string |
Kiválasztja a Teluguhoz készült Microsoft-jogkivonat-kezelőt. |
turkish |
string |
Kiválasztja a Microsoft által a törökhöz használt jogkivonat-kezelőt. |
ukrainian |
string |
Kiválasztja az ukrán microsoftos jogkivonat-kezelőt. |
urdu |
string |
Kiválasztja az Urduhoz tartozó Microsoft-jogkivonat-kezelőt. |
MicrosoftTokenizerLanguage
A Microsoft nyelvi tokenizer által támogatott nyelveket sorolja fel.
Name | Típus | Description |
---|---|---|
bangla |
string |
A Bangla Microsoft-jogkivonat-jelölőjének kiválasztása. |
bulgarian |
string |
Kiválasztja a Microsoft bolgár jogkivonat-jelölőt. |
catalan |
string |
Kiválasztja a Katalán Microsoft-jogkivonat-jelölőt. |
chineseSimplified |
string |
Kiválasztja a Microsoft kínai jogkivonat-készítőt (egyszerűsített). |
chineseTraditional |
string |
Kiválasztja a Microsoft kínai (hagyományos) tokenizert. |
croatian |
string |
Kiválasztja a Horvát Microsoft-jogkivonat-jelölőt. |
czech |
string |
Kiválasztja a Cseh Microsoft tokenizert. |
danish |
string |
Kiválasztja a Dán Microsoft tokenizert. |
dutch |
string |
Kiválasztja a Microsoft holland jogkivonat-jelölőt. |
english |
string |
A Microsoft angol jogkivonat-jelölőjének kiválasztása. |
french |
string |
A Microsoft francia jogkivonat-jelölőjének kiválasztása. |
german |
string |
Kiválasztja a Német Microsoft tokenizert. |
greek |
string |
Kiválasztja a Microsoft-jogkivonat-jelölőt a göröghöz. |
gujarati |
string |
Kiválasztja a Microsoft-jogkivonat-jelölőt Gujaratihoz. |
hindi |
string |
Kiválasztja a Hindihez készült Microsoft tokenizert. |
icelandic |
string |
Kiválasztja az izlandi Microsoft tokenizert. |
indonesian |
string |
Kiválasztja az indonéz Microsoft tokenizert. |
italian |
string |
Kiválasztja az olasz Microsoft tokenizert. |
japanese |
string |
Kiválasztja a Japánhoz készült Microsoft tokenizert. |
kannada |
string |
A Kannada Microsoft-jogkivonat-jelölőjének kiválasztása. |
korean |
string |
Kiválasztja a Microsoft koreai jogkivonat-jelölőt. |
malay |
string |
Kiválasztja a Maláj Microsoft-jogkivonat-jelölőt. |
malayalam |
string |
Kiválasztja a Microsoft malajalam-jogkivonat-jelölőt. |
marathi |
string |
Kiválasztja a Marathihoz készült Microsoft tokenizert. |
norwegianBokmaal |
string |
Kiválasztja a Microsoft tokenizer for Norwegian (Bokmål) lehetőséget. |
polish |
string |
A Microsoft lengyel jogkivonat-jelölőjének kiválasztása. |
portuguese |
string |
Kiválasztja a Portugál Microsoft tokenizert. |
portugueseBrazilian |
string |
Kiválasztja a Portugál (Brazília) Microsoft tokenizert. |
punjabi |
string |
Kiválasztja a Punjabihoz készült Microsoft tokenizert. |
romanian |
string |
Kiválasztja a Microsoft román jogkivonat-jelölőt. |
russian |
string |
Kiválasztja az orosz microsoft jogkivonat-jelölőt. |
serbianCyrillic |
string |
A Szerb (cirill betűs) Microsoft tokenizer kiválasztása. |
serbianLatin |
string |
Kiválasztja a Microsoft tokenizert szerb (latin) nyelven. |
slovenian |
string |
Kiválasztja a szlovén Microsoft tokenizert. |
spanish |
string |
Kiválasztja a Microsoft spanyol jogkivonat-jelölőt. |
swedish |
string |
Kiválasztja a Microsoft svéd jogkivonat-jelölőt. |
tamil |
string |
A Microsoft Tamil-jogkivonat-jelölőjének kiválasztása. |
telugu |
string |
A Microsoft telugu-jogkivonat-jelölőjének kiválasztása. |
thai |
string |
Kiválasztja a Microsoft thai jogkivonat-kezelőt. |
ukrainian |
string |
Kiválasztja az ukrán Microsoft tokenizert. |
urdu |
string |
Kiválasztja az Urduhoz készült Microsoft-jogkivonat-jelölőt. |
vietnamese |
string |
Kiválasztja a vietnami Microsoft tokenizert. |
NGramTokenFilter
A megadott méret(ek) n grammját hozza létre. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.
Name | Típus | Alapértelmezett érték | Description |
---|---|---|---|
@odata.type |
string:
#Microsoft. |
Egy URI-töredék, amely megadja a jogkivonatszűrő típusát. |
|
maxGram |
integer |
2 |
A maximális n-gram hossz. Az alapértelmezett érték 2. |
minGram |
integer |
1 |
Az n-gramm minimális hossza. Az alapértelmezett érték 1. A maxGram értékénél kisebbnek kell lennie. |
name |
string |
A jogkivonat-szűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet. |
NGramTokenFilterV2
A megadott méret(ek) n grammját hozza létre. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.
Name | Típus | Alapértelmezett érték | Description |
---|---|---|---|
@odata.type |
string:
#Microsoft. |
Egy URI-töredék, amely megadja a jogkivonatszűrő típusát. |
|
maxGram |
integer |
2 |
A maximális n-gram hossz. Az alapértelmezett érték 2. A maximális érték 300. |
minGram |
integer |
1 |
Az n-gramm minimális hossza. Az alapértelmezett érték 1. A maximális érték 300. A maxGram értékénél kisebbnek kell lennie. |
name |
string |
A jogkivonat-szűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet. |
NGramTokenizer
Tokenizálja a bemenetet az adott méret(ek) n-grammjára. Ez a tokenizer az Apache Lucene használatával van implementálva.
Name | Típus | Alapértelmezett érték | Description |
---|---|---|---|
@odata.type |
string:
#Microsoft. |
A tokenizer típusát meghatározó URI-töredék. |
|
maxGram |
integer |
2 |
A maximális n-gram hossz. Az alapértelmezett érték 2. A maximális érték 300. |
minGram |
integer |
1 |
Az n-gramm minimális hossza. Az alapértelmezett érték 1. A maximális érték 300. A maxGram értékénél kisebbnek kell lennie. |
name |
string |
A tokenizer neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet. |
|
tokenChars |
A jogkivonatokban megtartandó karakterosztályok. |
OutputFieldMappingEntry
Kimeneti mezőleképezés egy képességhez.
Name | Típus | Description |
---|---|---|
name |
string |
A képesség által definiált kimenet neve. |
targetName |
string |
A kimenet célneve. A név megadása nem kötelező, és alapértelmezés szerint a név megadása kötelező. |
PathHierarchyTokenizerV2
Tokenizer elérési utakhoz hasonló hierarchiákhoz. Ez a tokenizer az Apache Lucene használatával van implementálva.
Name | Típus | Alapértelmezett érték | Description |
---|---|---|---|
@odata.type |
string:
#Microsoft. |
A tokenizer típusát meghatározó URI-töredék. |
|
delimiter |
string |
/ |
A használandó elválasztó karakter. Az alapértelmezett érték a "/". |
maxTokenLength |
integer |
300 |
A jogkivonat maximális hossza. Az alapértelmezett érték és a maximális érték 300. |
name |
string |
A tokenizer neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet. |
|
replacement |
string |
/ |
Egy érték, amely ha be van állítva, az elválasztó karaktert helyettesíti. Az alapértelmezett érték a "/". |
reverse |
boolean |
False |
Egy érték, amely jelzi, hogy fordított sorrendben hoz-e létre jogkivonatokat. Az alapértelmezett érték hamis. |
skip |
integer |
0 |
A kihagyandó kezdeti tokenek száma. Az alapértelmezett érték 0. |
PatternAnalyzer
A szöveget rugalmasan elválasztja kifejezésekké egy reguláris kifejezésmintán keresztül. Ez az elemző az Apache Lucene használatával van implementálva.
Name | Típus | Alapértelmezett érték | Description |
---|---|---|---|
@odata.type |
string:
#Microsoft. |
Az elemző típusát meghatározó URI-töredék. |
|
flags |
Reguláris kifejezésjelölők. |
||
lowercase |
boolean |
True |
Érték, amely jelzi, hogy a kifejezések kisbetűsek-e. Az alapértelmezett érték igaz. |
name |
string |
Az elemző neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet. |
|
pattern |
string |
\W+ |
A tokenelválasztóknak megfelelő reguláris kifejezésminta. Az alapértelmezett kifejezés egy vagy több nem szó karakternek felel meg. |
stopwords |
string[] |
A stopwords listája. |
PatternCaptureTokenFilter
Java regexes használatával több jogkivonatot bocsát ki – egyet minden rögzítési csoporthoz egy vagy több mintában. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.
Name | Típus | Alapértelmezett érték | Description |
---|---|---|---|
@odata.type |
string:
#Microsoft. |
Egy URI-töredék, amely megadja a jogkivonatszűrő típusát. |
|
name |
string |
A jogkivonat-szűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet. |
|
patterns |
string[] |
Az egyes tokenekkel egyeztetendő minták listája. |
|
preserveOriginal |
boolean |
True |
Egy érték, amely azt jelzi, hogy az eredeti jogkivonatot akkor is vissza kell-e adni, ha az egyik minta egyezik. Az alapértelmezett érték igaz. |
PatternReplaceCharFilter
Karakterszűrő, amely a bemeneti sztringben szereplő karaktereket helyettesíti. Egy reguláris kifejezéssel azonosítja a megőrizendő karaktersorozatokat, a cseremintát pedig a lecserélendő karakterek azonosításához. Az "aa bb aa bb aa bb", a "(aa)\s+(bb)" minta és az "$1#$2" helyére például az "aa#bb aa#bb" szöveg lesz az eredmény. Ez a karakterszűrő az Apache Lucene használatával van implementálva.
Name | Típus | Description |
---|---|---|
@odata.type |
string:
#Microsoft. |
A karakterszűrő típusát meghatározó URI-töredék. |
name |
string |
A karakterszűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet. |
pattern |
string |
Egy reguláris kifejezésminta. |
replacement |
string |
A helyettesítő szöveg. |
PatternReplaceTokenFilter
Karakterszűrő, amely a bemeneti sztringben szereplő karaktereket helyettesíti. Egy reguláris kifejezéssel azonosítja a megőrizendő karaktersorozatokat, a cseremintát pedig a lecserélendő karakterek azonosításához. Az "aa bb aa bb aa bb", a "(aa)\s+(bb)" minta és az "$1#$2" helyére például az "aa#bb aa#bb" szöveg lesz az eredmény. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.
Name | Típus | Description |
---|---|---|
@odata.type |
string:
#Microsoft. |
Egy URI-töredék, amely megadja a jogkivonatszűrő típusát. |
name |
string |
A jogkivonat-szűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet. |
pattern |
string |
Egy reguláris kifejezésminta. |
replacement |
string |
A helyettesítő szöveg. |
PatternTokenizer
A regex mintaegyezést használó tokenizer különböző jogkivonatok létrehozásához. Ez a tokenizer az Apache Lucene használatával van implementálva.
Name | Típus | Alapértelmezett érték | Description |
---|---|---|---|
@odata.type |
string:
#Microsoft. |
A tokenizer típusát meghatározó URI-töredék. |
|
flags |
Reguláris kifejezésjelölők. |
||
group |
integer |
-1 |
A normál kifejezésmintában lévő egyező csoport nulla alapú sorszáma, amely tokenekké lesznek kinyerve. Használja a -1, ha a teljes mintát szeretné használni a bemenet jogkivonatokra való felosztásához, függetlenül az egyező csoportoktól. Az alapértelmezett érték -1. |
name |
string |
A tokenizer neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet. |
|
pattern |
string |
\W+ |
A tokenelválasztóknak megfelelő reguláris kifejezésminta. Az alapértelmezett kifejezés egy vagy több nem szó karakternek felel meg. |
PhoneticEncoder
A PhoneticTokenFilterrel használandó fonetikus kódoló típusát azonosítja.
Name | Típus | Description |
---|---|---|
beiderMorse |
string |
Kódol egy jogkivonatot egy Beider-Morse értékre. |
caverphone1 |
string |
Kódol egy tokent egy Caverphone 1.0-értékre. |
caverphone2 |
string |
Kódol egy tokent egy Caverphone 2.0-értékre. |
cologne |
string |
Kódol egy jogkivonatot egy kölni fonetikai értékre. |
doubleMetaphone |
string |
Egy jogkivonatot dupla metafonértékké kódol. |
haasePhonetik |
string |
Kódol egy jogkivonatot a Kölner Phonetik algoritmus Haase-finomításával. |
koelnerPhonetik |
string |
Kódol egy jogkivonatot a Kölner Phonetik algoritmussal. |
metaphone |
string |
Kódol egy jogkivonatot egy Metaphone-értékbe. |
nysiis |
string |
Kódol egy jogkivonatot EGY NYSIIS-értékbe. |
refinedSoundex |
string |
Egy jogkivonatot pontosított Soundex-értékre kódol. |
soundex |
string |
Egy jogkivonatot Egy Soundex-értékbe kódol. |
PhoneticTokenFilter
Jogkivonatok létrehozása fonetikus egyezésekhez. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.
Name | Típus | Alapértelmezett érték | Description |
---|---|---|---|
@odata.type |
string:
#Microsoft. |
Egy URI-töredék, amely megadja a jogkivonatszűrő típusát. |
|
encoder | metaphone |
A használni kívánt fonetikus kódoló. Az alapértelmezett érték a "metaphone". |
|
name |
string |
A jogkivonat-szűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet. |
|
replace |
boolean |
True |
Egy érték, amely jelzi, hogy a kódolt jogkivonatok lecserélik-e az eredeti jogkivonatokat. Ha hamis, a kódolt jogkivonatok szinonimákként lesznek hozzáadva. Az alapértelmezett érték igaz. |
PrioritizedFields
A szemantikai rangsoroláshoz, feliratokhoz, kiemelésekhez és válaszokhoz használandó cím- és tartalom- és kulcsszavakmezőket ismerteti.
Name | Típus | Description |
---|---|---|
prioritizedContentFields |
Meghatározza a szemantikai rangsoroláshoz, feliratokhoz, kiemelésekhez és válaszokhoz használandó tartalommezőket. A legjobb eredmény érdekében a kijelölt mezőknek természetes nyelvű szöveget kell tartalmazniuk. A tömb mezőinek sorrendje a prioritásukat jelöli. Az alacsonyabb prioritású mezők csonkulhatnak, ha a tartalom hosszú. |
|
prioritizedKeywordsFields |
Meghatározza a szemantikai rangsoroláshoz, feliratokhoz, kiemelésekhez és válaszokhoz használandó kulcsszómezőket. A legjobb eredmény érdekében a kijelölt mezőknek tartalmazniuk kell a kulcsszavak listáját. A tömb mezőinek sorrendje a prioritásukat jelöli. Az alacsonyabb prioritású mezők csonkulhatnak, ha a tartalom hosszú. |
|
titleField |
Meghatározza a szemantikai rangsoroláshoz, feliratokhoz, kiemelésekhez és válaszokhoz használandó címmezőt. Ha nem szerepel címmező az indexben, hagyja üresen. |
RegexFlags
Olyan jelzőket határoz meg, amelyek kombinálhatók annak szabályozásához, hogy a rendszer hogyan használja a reguláris kifejezéseket a mintaelemzőben és a minta jogkivonat-jelölőjében.
Name | Típus | Description |
---|---|---|
CANON_EQ |
string |
Engedélyezi a canonikus egyenértékűséget. |
CASE_INSENSITIVE |
string |
Engedélyezi a kis- és nagybetűk érzéketlen egyeztetését. |
COMMENTS |
string |
Engedélyezi a térközt és a megjegyzéseket a mintában. |
DOTALL |
string |
Engedélyezi a dotall módot. |
LITERAL |
string |
Lehetővé teszi a minta literális elemzését. |
MULTILINE |
string |
Engedélyezi a többsoros módot. |
UNICODE_CASE |
string |
Engedélyezi a Unicode-ra képes kis- és nagybetűk összecsukását. |
UNIX_LINES |
string |
Engedélyezi a Unix-vonalak üzemmódot. |
ScalarQuantizationParameters
A skaláris kvantálásra jellemző paramétereket tartalmazza.
Name | Típus | Description |
---|---|---|
quantizedDataType |
A tömörített vektorértékek kvantált adattípusa. |
ScalarQuantizationVectorSearchCompressionConfiguration
Az indexelés és lekérdezés során használt skaláris kvantálási tömörítési módszerre vonatkozó konfigurációs beállításokat tartalmaz.
Name | Típus | Alapértelmezett érték | Description |
---|---|---|---|
defaultOversampling |
number |
Alapértelmezett túlmintavételi tényező. A túlbélyegző belsőleg több dokumentumot kér (ezt a szorzót határozza meg) a kezdeti keresésben. Ez növeli a teljes pontosságú vektorok újrafordított hasonlósági pontszámával újrafordított eredmények készletét. A minimális érték 1, ami azt jelenti, hogy nincs túlampling (1x). Ez a paraméter csak akkor állítható be, ha a rerankWithOriginalVectors értéke igaz. A magasabb értékek a késés rovására javítják a visszahívást. |
|
kind |
string:
scalar |
A vektorkereséshez konfigurált tömörítési módszer neve. |
|
name |
string |
Az adott konfigurációhoz társítandó név. |
|
rerankWithOriginalVectors |
boolean |
True |
Ha igaz értékre van állítva, a tömörített vektorokkal kiszámított rendezett eredménykészlet lekérése után a rendszer újraszámítja őket a teljes pontosságú hasonlósági pontszámok újraszámításával. Ez a késés rovására javítja a visszahívást. |
scalarQuantizationParameters |
A skaláris kvantálásra jellemző paramétereket tartalmazza. |
ScoringFunctionAggregation
Meghatározza az összesítési függvényt, amely a pontozási profil összes pontozófüggvényének eredményét egyesíti.
Name | Típus | Description |
---|---|---|
average |
string |
A pontszámok növelése az összes pontozó függvény eredményének átlagával. |
firstMatching |
string |
A pontszámok növelése a pontozási profil első alkalmazható pontozási függvényével. |
maximum |
string |
A pontszámok növelése az összes pontozó függvény eredményének maximális értékével. |
minimum |
string |
A pontszámok növelése az összes pontozó függvény eredményének minimális értékével. |
sum |
string |
A pontszámok növelése az összes pontozó függvény eredményének összegével. |
ScoringFunctionInterpolation
Meghatározza azt a függvényt, amellyel a pontszámok növelhetőek a dokumentumok egy tartományában.
Name | Típus | Description |
---|---|---|
constant |
string |
Állandó tényezővel növeli a pontszámokat. |
linear |
string |
Lineárisan csökkenő összeggel növeli a pontszámokat. Ez a pontozási függvények alapértelmezett interpolációja. |
logarithmic |
string |
A pontszámokat olyan mennyiséggel növeli, amely logaritmikusan csökken. A kiemelések gyorsan csökkennek a magasabb pontszámok esetén, és lassabban, ahogy a pontszámok csökkennek. Ez az interpolációs beállítás nem engedélyezett a címkepontozási függvényekben. |
quadratic |
string |
A pontszámokat a kvadratikusan csökkenő összeggel növeli. A kiemelések a magasabb pontszámok esetében lassan csökkennek, és gyorsabban, ahogy a pontszámok csökkennek. Ez az interpolációs beállítás nem engedélyezett a címkepontozási függvényekben. |
ScoringProfile
Olyan keresési index paramétereit határozza meg, amelyek befolyásolják a keresési lekérdezések pontozását.
Name | Típus | Description |
---|---|---|
functionAggregation |
Az egyes pontozási függvények eredményeinek kombinálását jelző érték. Alapértelmezés szerint "Összeg". Figyelmen kívül hagyja, ha nincsenek pontozófüggvények. |
|
functions | ScoringFunction[]: |
A dokumentumok pontozását befolyásoló függvények gyűjteménye. |
name |
string |
A pontozási profil neve. |
text |
Olyan paraméterek, amelyek bizonyos indexmezők szöveges egyezései alapján növelik a pontozást. |
SearchField
Egy indexdefinícióban lévő mezőt jelöl, amely egy mező nevét, adattípusát és keresési viselkedését írja le.
Name | Típus | Description |
---|---|---|
analyzer |
A mezőhöz használni kívánt elemző neve. Ez a beállítás csak kereshető mezőkkel használható, és nem állítható be együtt sem a searchAnalyzer, sem az indexAnalyzer beállítással. Az elemző kiválasztása után a mező nem módosítható. Összetett mezők esetén null értékűnek kell lennie. |
|
dimensions |
integer |
A vektormező dimenziója. |
facetable |
boolean |
Érték, amely azt jelzi, hogy engedélyezi-e a mező hivatkozását az aspektusos lekérdezésekben. A találatok kategóriánkénti számát (például digitális kamerák keresését és a találatok márka, megapixel, ár stb. alapján történő megtekintését) tartalmazó találatok bemutatójában általában használják. Ennek a tulajdonságnak null értékűnek kell lennie az összetett mezők esetében. Az Edm.GeographyPoint vagy a Collection (Edm.GeographyPoint) típusú mezők nem lehetnek facetablek. Az alapértelmezett érték az összes többi egyszerű mezőre igaz. |
fields |
Almezők listája, ha ez egy Edm.ComplexType vagy Collection(Edm.ComplexType) típusú mező. Egyszerű mezők esetén null értékűnek vagy üresnek kell lennie. |
|
filterable |
boolean |
Egy érték, amely azt jelzi, hogy engedélyezi-e a mező hivatkozását $filter lekérdezésekben. a szűrhető érték eltér a sztringek kezelési módjában kereshetőtől. A szűrhető Edm.String vagy Collection (Edm.String) típusú mezők nem esnek szófelhővé, ezért az összehasonlítások csak pontos egyezéseket tartalmaznak. Ha például egy ilyen f mezőt "napos napra" állít be, $filter=f eq "sunny" nem talál egyezést, de $filter=f eq "napos nap" lesz. Ennek a tulajdonságnak null értékűnek kell lennie az összetett mezők esetében. Az alapértelmezett érték az egyszerű mezőkre, az összetett mezőkre pedig null értékű. |
indexAnalyzer |
A mező indexelési idején használt elemző neve. Ez a beállítás csak kereshető mezőkkel használható. A searchAnalyzerrel együtt kell beállítani, és az elemző beállítással együtt nem állítható be. Ez a tulajdonság nem állítható be egy nyelvelemző nevére; használja az elemző tulajdonságot, ha nyelvelemzőre van szüksége. Az elemző kiválasztása után a mező nem módosítható. Összetett mezők esetén null értékűnek kell lennie. |
|
key |
boolean |
Érték, amely jelzi, hogy a mező egyedileg azonosítja-e az indexben lévő dokumentumokat. Minden indexben pontosan egy legfelső szintű mezőt kell kiválasztani kulcsmezőként, és Edm.String típusúnak kell lennie. A kulcsmezők a dokumentumok közvetlen keresésére és adott dokumentumok frissítésére vagy törlésére használhatók. Az alapértelmezett érték az egyszerű mezők esetében hamis, az összetett mezők esetében pedig null. |
name |
string |
A mező neve, amelynek egyedinek kell lennie az index vagy szülőmező mezőgyűjteményében. |
retrievable |
boolean |
Egy érték, amely azt jelzi, hogy a mező visszaadható-e a keresési eredményben. Ezt a beállítást letilthatja, ha egy mezőt (például margót) szeretne szűrőként, rendezési vagy pontozási mechanizmusként használni, de nem szeretné, hogy a mező látható legyen a végfelhasználó számára. Ennek a tulajdonságnak igaznak kell lennie a kulcsmezőkre, és az összetett mezők esetében null értékűnek kell lennie. Ez a tulajdonság a meglévő mezőkön módosítható. A tulajdonság engedélyezése nem jár az indextárolási követelmények növekedésével. Az alapértelmezett érték igaz az egyszerű mezőkre, a vektormezőkre hamis, az összetett mezőkre pedig null értékre. |
searchAnalyzer |
A mező keresési idején használt elemző neve. Ez a beállítás csak kereshető mezőkkel használható. Az indexAnalyzerrel együtt kell beállítani, és nem állítható be együtt az elemző beállítással. Ez a tulajdonság nem állítható be egy nyelvelemző nevére; használja az elemző tulajdonságot, ha nyelvelemzőre van szüksége. Ez az elemző frissíthető egy meglévő mezőben. Összetett mezők esetén null értékűnek kell lennie. |
|
searchable |
boolean |
Egy érték, amely azt jelzi, hogy a mező kereshető-e teljes szöveges formátumban. Ez azt jelenti, hogy az indexelés során elemzést végez, például szótörést. Ha egy kereshető mezőt olyan értékre állít be, mint a "napos nap", a rendszer belsőleg a "napos" és a "nap" egyedi jogkivonatokra lesz felosztva. Ez lehetővé teszi a kifejezések teljes szöveges keresését. Az Edm.String vagy Collection (Edm.String) típusú mezők alapértelmezés szerint kereshetők. Ennek a tulajdonságnak hamisnak kell lennie más nem sztring típusú egyszerű mezők esetében, és az összetett mezők esetében null értékűnek kell lennie. Megjegyzés: A kereshető mezők extra helyet foglalnak el az indexben a mezőérték további jogkivonatos verzióinak elhelyezéséhez a teljes szöveges keresésekhez. Ha helyet szeretne menteni az indexben, és nincs szüksége olyan mezőre, amely szerepel a keresésekben, állítsa a kereshető értéket hamisra. |
sortable |
boolean |
Egy érték, amely azt jelzi, hogy engedélyezi-e a mező hivatkozását $orderby kifejezésekben. Alapértelmezés szerint a keresőmotor pontszám szerint rendezi az eredményeket, de sok esetben a felhasználók a dokumentumok mezői szerint szeretnének rendezni. Egy egyszerű mező csak akkor rendezhető, ha egyértékű (egyetlen értékkel rendelkezik a szülődokumentum hatókörében). Az egyszerű gyűjteménymezők nem rendezhetők, mivel többértékűek. Az összetett gyűjtemények egyszerű almezői szintén többértékűek, ezért nem rendezhetők. Ez igaz, akár közvetlen szülőmezőről, akár ősmezőről van szó, ez az összetett gyűjtemény. Az összetett mezők nem rendezhetők, és a rendezhető tulajdonságnak null értékűnek kell lennie az ilyen mezőkhöz. A rendezhető érték alapértelmezett értéke igaz az egyértékű egyszerű mezőkre, a többértékű egyszerű mezőkre hamis, az összetett mezők esetében pedig null értékre. |
stored |
boolean |
Nem módosítható érték, amely azt jelzi, hogy a mező külön marad-e a lemezen, és a keresési eredményben lesz visszaadva. Letilthatja ezt a beállítást, ha nem tervezi visszaadni a mező tartalmát egy keresési válaszban, hogy a tárterület terhelésére mentsen. Ez csak az index létrehozásakor és csak vektormezők esetén állítható be. Ez a tulajdonság nem módosítható meglévő mezők esetében, és nem állítható be hamisként az új mezőkhöz. Ha a tulajdonság értéke hamis, akkor a "beolvasható" tulajdonságnak is hamisnak kell lennie. Ennek a tulajdonságnak igaznak vagy nem halmaznak kell lennie a kulcsmezők, az új mezők és a nem vektoros mezők esetében, és az összetett mezők esetében null értékűnek kell lennie. A tulajdonság letiltása csökkenti az index tárolási követelményeit. Az alapértelmezett érték a vektormezők esetében igaz. |
synonymMaps |
string[] |
A mezőhöz társítandó szinonimatérképek nevének listája. Ez a beállítás csak kereshető mezőkkel használható. Jelenleg mezőnként csak egy szinonimatérkép támogatott. Szinonimák leképezésének mezőhöz való hozzárendelése biztosítja, hogy a mezőre vonatkozó lekérdezési kifejezések lekérdezési időben ki legyenek bontva a szinonimatérkép szabályaival. Ez az attribútum a meglévő mezőkön módosítható. Az összetett mezők esetében null értékűnek vagy üres gyűjteménynek kell lennie. |
type |
A mező adattípusa. |
|
vectorEncoding |
A mező tartalmának értelmezéséhez használt kódolási formátum. |
|
vectorSearchProfile |
string |
A vektorkeresési profil neve, amely meghatározza a vektormezőben való kereséshez használni kívánt algoritmust és vektorizálót. |
SearchFieldDataType
A keresési indexben lévő mezők adattípusát határozza meg.
Name | Típus | Description |
---|---|---|
Edm.Boolean |
string |
Azt jelzi, hogy egy mező logikai értéket tartalmaz (igaz vagy hamis). |
Edm.Byte |
string |
Azt jelzi, hogy egy mező 8 bites, aláíratlan egész számot tartalmaz. Ez csak a Collection(Edm.Byte) használatakor érvényes. |
Edm.ComplexType |
string |
Azt jelzi, hogy egy mező egy vagy több összetett objektumot tartalmaz, amelyek más típusú almezőkkel rendelkeznek. |
Edm.DateTimeOffset |
string |
Azt jelzi, hogy egy mező dátum/idő értéket tartalmaz, beleértve az időzónák adatait is. |
Edm.Double |
string |
Azt jelzi, hogy egy mező IEEE kettős pontosságú lebegőpontos számot tartalmaz. |
Edm.GeographyPoint |
string |
Azt jelzi, hogy egy mező földrajzi helyet tartalmaz a hosszúság és a szélesség szempontjából. |
Edm.Half |
string |
Azt jelzi, hogy egy mező fél pontosságú lebegőpontos számot tartalmaz. Ez csak a Collection(Edm.Half) használatakor érvényes. |
Edm.Int16 |
string |
Azt jelzi, hogy egy mező 16 bites aláírt egész számot tartalmaz. Ez csak a Collection(Edm.Int16) használatakor érvényes. |
Edm.Int32 |
string |
Azt jelzi, hogy egy mező 32 bites aláírt egész számot tartalmaz. |
Edm.Int64 |
string |
Azt jelzi, hogy egy mező 64 bites aláírt egész számot tartalmaz. |
Edm.SByte |
string |
Azt jelzi, hogy egy mező 8 bites aláírt egész számot tartalmaz. Ez csak a Collection(Edm.SByte) használatakor érvényes. |
Edm.Single |
string |
Azt jelzi, hogy egy mező egy pontosságú lebegőpontos számot tartalmaz. Ez csak a Collection(Edm.Single) használatakor érvényes. |
Edm.String |
string |
Azt jelzi, hogy egy mező sztringet tartalmaz. |
SearchIndex
A keresési index definícióját jelöli, amely egy index mezőit és keresési viselkedését írja le.
Name | Típus | Description |
---|---|---|
@odata.etag |
string |
Az index ETagje. |
analyzers | LexicalAnalyzer[]: |
Az index elemzői. |
charFilters | CharFilter[]: |
Az index karakterszűrői. |
corsOptions |
Az index forrásközi erőforrás-megosztásának (CORS) szabályozására szolgáló beállítások. |
|
defaultScoringProfile |
string |
A használni kívánt pontozási profil neve, ha nincs megadva a lekérdezésben. Ha ez a tulajdonság nincs beállítva, és nincs megadva pontozási profil a lekérdezésben, akkor az alapértelmezett pontozás (tf-idf) lesz használva. |
encryptionKey |
Az Azure Key Vaultban létrehozott titkosítási kulcs leírása. Ez a kulcs további titkosítási szintet biztosít az adatok számára, ha teljes bizonyosságot szeretne arról, hogy senki, még a Microsoft sem tudja visszafejteni az adatokat. Miután titkosította az adatokat, az mindig titkosítva marad. A keresési szolgáltatás figyelmen kívül hagyja a tulajdonság null értékre történő beállítására tett kísérleteket. Szükség szerint módosíthatja ezt a tulajdonságot, ha el szeretné forgatni a titkosítási kulcsot; Az adatok nem lesznek hatással. Az ügyfél által felügyelt kulcsokkal rendelkező titkosítás nem érhető el az ingyenes keresési szolgáltatásokhoz, és csak a 2019. január 1-jén vagy azt követően létrehozott fizetős szolgáltatásokhoz érhető el. |
|
fields |
Az index mezői. |
|
name |
string |
Az index neve. |
scoringProfiles |
Az index pontozási profiljai. |
|
semantic |
Olyan keresési index paramétereit határozza meg, amelyek befolyásolják a szemantikai képességeket. |
|
similarity | Similarity: |
A keresési lekérdezésnek megfelelő dokumentumok pontozásához és rangsorolásához használandó hasonlósági algoritmus típusa. A hasonlósági algoritmus csak az index létrehozásakor definiálható, és a meglévő indexeken nem módosítható. Null érték esetén a ClassicSimilarity algoritmust használja a rendszer. |
suggesters |
Az index javaslattevői. |
|
tokenFilters |
TokenFilter[]:
|
Az index tokenszűrői. |
tokenizers | LexicalTokenizer[]: |
Az index jogkivonat-szabályzói. |
vectorSearch |
A vektorkereséshez kapcsolódó konfigurációs beállításokat tartalmaz. |
SearchIndexerDataNoneIdentity
Törli az adatforrás identitástulajdonságát.
Name | Típus | Description |
---|---|---|
@odata.type |
string:
#Microsoft. |
Az identitás típusát meghatározó URI-töredék. |
SearchIndexerDataUserAssignedIdentity
Megadja a használni kívánt adatforrás identitását.
Name | Típus | Description |
---|---|---|
@odata.type |
string:
#Microsoft. |
Az identitás típusát meghatározó URI-töredék. |
userAssignedIdentity |
string |
A felhasználó által hozzárendelt felügyelt identitás teljes Azure-erőforrás-azonosítója általában "/subscriptions/12345678-1234-1234-1234-1234-1234567890ab/resourceGroups/rg/providers/Microsoft.ManagedIdentity/userAssignedIdentities/myId" formában található, amelyet hozzá kellett volna rendelni a keresési szolgáltatáshoz. |
SearchResourceEncryptionKey
Ügyfél által felügyelt titkosítási kulcs az Azure Key Vaultban. A létrehozott és kezelt kulcsokkal titkosíthatja vagy visszafejtheti az inaktív adatokat, például indexeket és szinonimatérképeket.
Name | Típus | Description |
---|---|---|
accessCredentials |
Az Azure Key Vault eléréséhez használt opcionális Azure Active Directory-hitelesítő adatok. Nem kötelező, ha ehelyett felügyelt identitást használ. |
|
keyVaultKeyName |
string |
A inaktív adatok titkosításához használandó Azure Key Vault-kulcs neve. |
keyVaultKeyVersion |
string |
Az Azure Key Vault-kulcs inaktív adatok titkosításához használandó verziója. |
keyVaultUri |
string |
Az Azure Key Vault URI-ja, más néven DNS-név, amely tartalmazza az inaktív adatok titkosításához használandó kulcsot. Példa URI lehet |
SemanticConfiguration
Meghatároz egy adott konfigurációt, amelyet a szemantikai képességek kontextusában kell használni.
Name | Típus | Description |
---|---|---|
name |
string |
A szemantikai konfiguráció neve. |
prioritizedFields |
A szemantikai rangsoroláshoz, feliratokhoz, kiemelésekhez és válaszokhoz használandó cím- és tartalom- és kulcsszómezőket ismerteti. A három altulajdonság (titleField, prioritizedKeywordsFields és prioritizedContentFields) közül legalább egyet be kell állítani. |
SemanticField
A szemantikai konfiguráció részeként használt mező.
Name | Típus | Description |
---|---|---|
fieldName |
string |
SemanticSettings
Olyan keresési index paramétereit határozza meg, amelyek befolyásolják a szemantikai képességeket.
Name | Típus | Description |
---|---|---|
configurations |
Az index szemantikai konfigurációi. |
|
defaultConfiguration |
string |
Lehetővé teszi egy alapértelmezett szemantikai konfiguráció nevének beállítását az indexben, így nem kötelező minden alkalommal lekérdezési paraméterként átadni. |
ShingleTokenFilter
A jogkivonatok kombinációit egyetlen jogkivonatként hozza létre. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.
Name | Típus | Alapértelmezett érték | Description |
---|---|---|---|
@odata.type |
string:
#Microsoft. |
Egy URI-töredék, amely megadja a jogkivonatszűrő típusát. |
|
filterToken |
string |
_ |
A beszúrandó sztring minden olyan pozícióhoz, ahol nincs token. Az alapértelmezett érték egy aláhúzás ("_"). |
maxShingleSize |
integer |
2 |
A maximális zsindelyméret. Az alapértelmezett és a minimális érték 2. |
minShingleSize |
integer |
2 |
A minimális zsindelyméret. Az alapértelmezett és a minimális érték 2. A maxShingleSize értékénél kisebbnek kell lennie. |
name |
string |
A jogkivonat-szűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet. |
|
outputUnigrams |
boolean |
True |
Egy érték, amely azt jelzi, hogy a kimeneti stream tartalmazza-e a bemeneti jogkivonatokat (unigramokat) és a zsindelyeket. Az alapértelmezett érték igaz. |
outputUnigramsIfNoShingles |
boolean |
False |
Egy érték, amely azt jelzi, hogy unigramokat kell-e kiadni azokra az időkre, amikor nem áll rendelkezésre övsömör. Ez a tulajdonság elsőbbséget élvez, ha az outputUnigrams értéke hamis. Az alapértelmezett érték hamis. |
tokenSeparator |
string |
A szomszédos jogkivonatok összekapcsolásakor használandó sztring zsindely létrehozásához. Az alapértelmezett érték egy szóköz (" "). |
SnowballTokenFilter
Egy szűrő, amely egy Snowball által létrehozott őslelő használatával szározza a szavakat. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.
Name | Típus | Description |
---|---|---|
@odata.type |
string:
#Microsoft. |
Egy URI-töredék, amely megadja a jogkivonatszűrő típusát. |
language |
A használni kívánt nyelv. |
|
name |
string |
A jogkivonat-szűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet. |
SnowballTokenFilterLanguage
A Snowball-jogkivonat-szűrőhöz használandó nyelv.
Name | Típus | Description |
---|---|---|
armenian |
string |
A Lucene Snowball örmény jogkivonat-jelölőt választja ki. |
basque |
string |
Kiválasztja a Lucene Snowball szárító tokenizer baszk. |
catalan |
string |
Kiválasztja a Lucene Snowball-t, amely a katalán jogkivonat-jelölőt tartalmazza. |
danish |
string |
Kiválasztja a Lucene Snowball stemming tokenizer a dán. |
dutch |
string |
Kiválasztja a Holland Lucene Snowball-jogkivonat-jelölőt. |
english |
string |
Kiválasztja a Lucene Snowball stemming tokenizert angol nyelven. |
finnish |
string |
Kiválasztja a Lucene Snowball stemming tokenizer for Finn. |
french |
string |
Kiválasztja a Lucene Snowball szárító tokenizer a francia. |
german |
string |
Kiválasztja a Lucene Snowball stemming tokenizer német. |
german2 |
string |
Kiválasztja a német variációs algoritmust használó Lucene Snowball-jogkivonat-készítőt. |
hungarian |
string |
Kiválasztja a Lucene Snowball stemming tokenizer a magyar. |
italian |
string |
Kiválasztja az olasz Lucene Snowball jogkivonat-jelölőt. |
kp |
string |
Kiválasztja a Lucene Snowball származtatási tokenizert hollandul, amely a Kraaij-Pohlmann származtatási algoritmust használja. |
lovins |
string |
Kiválasztja a Lovins-származtatási algoritmust használó angol lucene Snowball-jogkivonat-készítőt. |
norwegian |
string |
Kiválasztja a Lucene Snowball stemming tokenizer a norvég. |
porter |
string |
A Porter-származtatási algoritmust használó, angol nyelvhez készült Lucene Snowball-jogkivonat-készítőt választja ki. |
portuguese |
string |
Kiválasztja a Lucene Snowball stemming tokenizer portugál. |
romanian |
string |
Kiválasztja a Lucene Snowball stemming tokenizer a román. |
russian |
string |
Kiválasztja a Lucene Snowball eredetjogkivonat-jelölőt az oroszhoz. |
spanish |
string |
Kiválasztja a Lucene Snowball stemming tokenizer a spanyol. |
swedish |
string |
Kiválasztja a Lucene Snowball stemming tokenizer svéd. |
turkish |
string |
Kiválasztja a Lucene Snowball szárító tokenizer a török. |
StemmerOverrideTokenFilter
Lehetővé teszi az egyéb eredetszűrők felülbírálását a saját szótáralapú szárzással. A szótárból származó kifejezések kulcsszavakként lesznek megjelölve, hogy ne legyenek a láncban lévő ősökkel való eredetük. A szűrőt a szárító szűrők elé kell helyezni. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.
Name | Típus | Description |
---|---|---|
@odata.type |
string:
#Microsoft. |
Egy URI-töredék, amely megadja a jogkivonatszűrő típusát. |
name |
string |
A jogkivonat-szűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet. |
rules |
string[] |
Az eredetszabályok listája a következő formátumban: "word => stem", például: "ran => run". |
StemmerTokenFilter
Nyelvspecifikus eredetszűrő. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.
Name | Típus | Description |
---|---|---|
@odata.type |
string:
#Microsoft. |
Egy URI-töredék, amely megadja a jogkivonatszűrő típusát. |
language |
A használni kívánt nyelv. |
|
name |
string |
A jogkivonat-szűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet. |
StemmerTokenFilterLanguage
A stemmer token szűrőhöz használandó nyelv.
Name | Típus | Description |
---|---|---|
arabic |
string |
Kiválasztja az arabhoz tartozó Lucene-jogkivonat-jelölőt. |
armenian |
string |
Kiválasztja az örmény Lucene-jogkivonat-jelölőt. |
basque |
string |
Kiválasztja a Lucene-alapú jogkivonat-jelölőt a baszkhoz. |
brazilian |
string |
Kiválasztja a lucene-i jogkivonat-jelölőt a portugál (Brazília) számára. |
bulgarian |
string |
Kiválasztja a Lucene-alapú jogkivonat-jelölőt a bolgárhoz. |
catalan |
string |
Kiválasztja a lucene-i jogkivonat-jelölőt a katalánhoz. |
czech |
string |
Kiválasztja a Lucene-alapú jogkivonat-kezelőt a csehhez. |
danish |
string |
Kiválasztja a lucene-i jogkivonat-jelölőt a dánhoz. |
dutch |
string |
Kiválasztja a Lucene-alapú jogkivonat-kezelőt a hollandhoz. |
dutchKp |
string |
Kiválasztja a Lucene-származtatási tokenizert a hollandhoz, amely a Kraaij-Pohlmann származtatási algoritmust használja. |
english |
string |
Kiválasztja a Lucene-alapú jogkivonat-kezelőt az angol nyelvhez. |
finnish |
string |
Kiválasztja a Lucene-alapú jogkivonat-jelölőt a finn nyelvhez. |
french |
string |
Kiválasztja a Francia Lucene-alapú jogkivonat-jelölőt. |
galician |
string |
Kiválasztja a Lucene-alapú jogkivonat-jelölőt a galíciaihoz. |
german |
string |
Kiválasztja a lucene-i jogkivonat-jelölőt a némethez. |
german2 |
string |
Kiválasztja a német variációs algoritmust használó Lucene-alapú jogkivonat-készítőt. |
greek |
string |
Kiválasztja a lucene-i jogkivonat-jelölőt a göröghöz. |
hindi |
string |
Kiválasztja a Hindihez tartozó Lucene-jogkivonat-jelölőt. |
hungarian |
string |
Kiválasztja a lucene-i jogkivonat-jelölőt a magyarhoz. |
indonesian |
string |
Kiválasztja az indonéz Lucene-alapú jogkivonat-kezelőt. |
irish |
string |
Kiválasztja az ír Lucene-alapú jogkivonat-jelölőt. |
italian |
string |
Kiválasztja az olasz Lucene-alapú jogkivonat-jelölőt. |
latvian |
string |
Kiválasztja a Lucene-alapú jogkivonat-jelölőt a lett számára. |
lightEnglish |
string |
Kiválasztja a Lucene stemming tokenizer for English, amely nem világos szárú. |
lightFinnish |
string |
Kiválasztja a Lucene szárító tokenizer finn, hogy nem könnyű szárú. |
lightFrench |
string |
Kiválasztja a Lucene szárító tokenizer a francia, hogy nem könnyű szárú. |
lightGerman |
string |
Kiválasztja a lucene-i jogkivonat-jelölőt a némethez, amely világos szározást végez. |
lightHungarian |
string |
Kiválasztja a lucene-i jogkivonat-jelölőt a magyarhoz, amely világos szárú. |
lightItalian |
string |
Kiválasztja a Lucene szárító tokenizer az olasz, hogy nem könnyű szárú. |
lightNorwegian |
string |
Kiválasztja a Lucene stemming tokenizer a norvég (Bokmål), amely nem könnyű stemming. |
lightNynorsk |
string |
Kiválasztja a Lucene stemming tokenizer a norvég (Nynorsk), amely nem könnyű szárú. |
lightPortuguese |
string |
Kiválasztja a Lucene szárító tokenizer portugál, hogy nem könnyű szárú. |
lightRussian |
string |
Kiválasztja a Lucene szárító tokenizer az orosz, hogy nem könnyű stemming. |
lightSpanish |
string |
Kiválasztja a Lucene szárító tokenizer a spanyol, hogy nem könnyű szárú. |
lightSwedish |
string |
Kiválasztja a Lucene stemming tokenizer svéd, hogy nem könnyű szárú. |
lovins |
string |
Kiválasztja a Lovins-származtatási algoritmust használó angol Lucene-jogkivonat-készítőt. |
minimalEnglish |
string |
Kiválasztja a Lucene stemming tokenizert az angolhoz, amely minimálisan hajtja ki azokat. |
minimalFrench |
string |
Kiválasztja a Lucene szárító tokenizer a francia, hogy nem minimális stemming. |
minimalGalician |
string |
Kiválasztja a Lucene-alapú jogkivonat-jelölőt a galíciaihoz, amely minimális szározást végez. |
minimalGerman |
string |
Kiválasztja a lucene-alapú jogkivonat-jelölőt a némethez, amely minimálisan szározza a elemet. |
minimalNorwegian |
string |
Kiválasztja a Lucene szárító tokenizer a norvég (Bokmål), hogy nem minimális szárítás. |
minimalNynorsk |
string |
Kiválasztja a Lucene stemming tokenizert a norvég (Nynorsk) számára, amely minimális szárítást végez. |
minimalPortuguese |
string |
Kiválasztja a lucene-i jogkivonat-jelölőt a portugálhoz, amely minimális szárítást végez. |
norwegian |
string |
Kiválasztja a Lucene stemming tokenizer for Norwegian (Bokmål). |
porter2 |
string |
Kiválasztja a Porter2 stemming algoritmust használó angol lucene-alapú jogkivonat-készítőt. |
portuguese |
string |
Kiválasztja a lucene-i jogkivonat-jelölőt a portugálhoz. |
portugueseRslp |
string |
Kiválasztja az RSLP-alapú származtatási algoritmust használó portugál Lucene-jogkivonat-készítőt. |
possessiveEnglish |
string |
Kiválasztja az angol nyelvhez tartozó Lucene-jogkivonat-jelölőt, amely eltávolítja a záró birtokosokat a szavakból. |
romanian |
string |
Kiválasztja a Lucene-alapú jogkivonat-jelölőt a román nyelvhez. |
russian |
string |
Kiválasztja az orosz Lucene-alapú jogkivonat-jelölőt. |
sorani |
string |
A Soranihoz tartozó Lucene-jogkivonat-jelölő kiválasztása. |
spanish |
string |
Kiválasztja a lucene-i jogkivonat-jelölőt a spanyolhoz. |
swedish |
string |
Kiválasztja a Lucene stemming tokenizer svéd. |
turkish |
string |
Kiválasztja a Lucene-alapú jogkivonat-kezelőt a törökhöz. |
StopAnalyzer
A szöveget nem betűkkel osztja el; Alkalmazza a kisbetűs és a stopword jogkivonat szűrőit. Ez az elemző az Apache Lucene használatával van implementálva.
Name | Típus | Description |
---|---|---|
@odata.type |
string:
#Microsoft. |
Az elemző típusát meghatározó URI-töredék. |
name |
string |
Az elemző neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet. |
stopwords |
string[] |
A stopwords listája. |
StopwordsList
A nyelvspecifikus stopszavak előre definiált listáját azonosítja.
Name | Típus | Description |
---|---|---|
arabic |
string |
Kiválasztja az arab nyelvű stopword listát. |
armenian |
string |
Kiválasztja az örmény nyelvű stopword listát. |
basque |
string |
Kiválasztja a baszk stopword listát. |
brazilian |
string |
Kiválasztja a portugál (Brazília) stopword listát. |
bulgarian |
string |
Kiválasztja a bolgár nyelvű stopword listát. |
catalan |
string |
Kiválasztja a katalán stopword listát. |
czech |
string |
Kiválasztja a cseh stopword listát. |
danish |
string |
Kiválasztja a dán nyelvű stopword listát. |
dutch |
string |
Kiválasztja a holland stopword listát. |
english |
string |
Kiválasztja az angol nyelvű stopword listát. |
finnish |
string |
Kiválasztja a finn nyelvű stopword listát. |
french |
string |
Kiválasztja a francia nyelvű stopword listát. |
galician |
string |
Kiválasztja a galíciai stopword listát. |
german |
string |
A német nyelvhez tartozó stopword listát választja ki. |
greek |
string |
Kiválasztja a göröghöz tartozó stopword listát. |
hindi |
string |
Kiválasztja a Hindihez tartozó stopword listát. |
hungarian |
string |
Kiválasztja a magyar nyelvű stopword listát. |
indonesian |
string |
Kiválasztja az indonéz stopword listát. |
irish |
string |
Kiválasztja az írek stopword listáját. |
italian |
string |
Kiválasztja az olasz nyelvű stopword listát. |
latvian |
string |
Kiválasztja a lett stopword listát. |
norwegian |
string |
Kiválasztja a norvég nyelvhez tartozó stopword listát. |
persian |
string |
Kiválasztja a perzsa stopword listát. |
portuguese |
string |
Kiválasztja a portugál stopword listát. |
romanian |
string |
Kiválasztja a román nyelvű stopword listát. |
russian |
string |
Kiválasztja az orosz nyelvű stopword listát. |
sorani |
string |
A Sorani stopword listájának kiválasztása. |
spanish |
string |
Kiválasztja a spanyol nyelvű stopword listát. |
swedish |
string |
Kiválasztja a svéd stopword listát. |
thai |
string |
Kiválasztja a thai nyelvhez tartozó stopword listát. |
turkish |
string |
Kiválasztja a törökhöz tartozó stopword listát. |
StopwordsTokenFilter
Eltávolítja a leállító szavakat egy jogkivonat-adatfolyamból. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.
Name | Típus | Alapértelmezett érték | Description |
---|---|---|---|
@odata.type |
string:
#Microsoft. |
Egy URI-töredék, amely megadja a jogkivonatszűrő típusát. |
|
ignoreCase |
boolean |
False |
A kis- és nagybetűk figyelmen kívül hagyását jelző érték. Ha igaz, a program először az összes szót kisbetűssé alakítja. Az alapértelmezett érték hamis. |
name |
string |
A jogkivonat-szűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet. |
|
removeTrailing |
boolean |
True |
Egy érték, amely azt jelzi, hogy figyelmen kívül kell-e hagyni az utolsó keresési kifejezést, ha az egy stop szó. Az alapértelmezett érték igaz. |
stopwords |
string[] |
A stopwords listája. Ez a tulajdonság és a stopwords lista tulajdonság nem állítható be. |
|
stopwordsList | english |
A használni kívánt stopwords előre definiált listája. Ez a tulajdonság és a stopwords tulajdonság nem állítható be. Az alapértelmezett érték az angol. |
Suggester
Meghatározza, hogyan kell alkalmazni a Javaslat API-t az index egy mezőcsoportjára.
Name | Típus | Description |
---|---|---|
name |
string |
A javaslattevő neve. |
searchMode |
A javaslattevő képességeit jelző érték. |
|
sourceFields |
string[] |
Azon mezőnevek listája, amelyekre a javaslattevő vonatkozik. Minden mezőnek kereshetőnek kell lennie. |
SuggesterSearchMode
A javaslattevő képességeit jelző érték.
Name | Típus | Description |
---|---|---|
analyzingInfixMatching |
string |
Egy mező egymást követő teljes kifejezéseinek és előtagjainak felel meg. A "Leggyorsabb barna róka" mező esetében például a "gyors" és a "leggyorsabb szemöldök" lekérdezések is egyeznek. |
SynonymTokenFilter
Egy vagy többszavas szinonimák egy jogkivonat-streamben. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.
Name | Típus | Alapértelmezett érték | Description |
---|---|---|---|
@odata.type |
string:
#Microsoft. |
Egy URI-töredék, amely megadja a jogkivonatszűrő típusát. |
|
expand |
boolean |
True |
Egy érték, amely jelzi, hogy a szinonimák listájában szereplő összes szó (ha => jelölés nem használatos) megfeleltethető-e egymásnak. Ha igaz, a szinonimák listájában szereplő összes szó (ha => jelölés nem használatos) megfeleltethető egymással. A következő lista: hihetetlen, hihetetlen, mesés, csodálatos egyenértékű: hihetetlen, hihetetlen, mesés, csodálatos => hihetetlen, hihetetlen, mesés, csodálatos. Ha hamis, a következő lista: hihetetlen, hihetetlen, mesés, csodálatos lesz egyenértékű: hihetetlen, hihetetlen, mesés, csodálatos => hihetetlen. Az alapértelmezett érték igaz. |
ignoreCase |
boolean |
False |
Egy érték, amely azt jelzi, hogy a kis- és nagybetűs bemenet egyezésre van-e behajtva. Az alapértelmezett érték hamis. |
name |
string |
A jogkivonat-szűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet. |
|
synonyms |
string[] |
A szinonimák listája a következő két formátum egyikében: 1. hihetetlen, hihetetlen, mesés => csodálatos - az => szimbólum bal oldalán lévő összes kifejezés helyébe a jobb oldalon lévő összes kifejezés lép; 2. hihetetlen, hihetetlen, mesés, csodálatos - vesszővel elválasztott lista egyenértékű szavak. A kibontás beállításával módosíthatja a lista értelmezését. |
TagScoringFunction
Olyan függvényt határoz meg, amely egy adott címkelistának megfelelő sztringértékekkel növeli a dokumentumok pontszámait.
Name | Típus | Description |
---|---|---|
boost |
number |
A nyers pontszám szorzója. Pozitív számnak kell lennie, amely nem egyenlő 1,0-sal. |
fieldName |
string |
A pontozási függvény bemeneteként használt mező neve. |
interpolation |
Egy érték, amely azt jelzi, hogy a kiemelés hogyan lesz interpolálva a dokumentum pontszámai között; alapértelmezett értéke "Lineáris". |
|
tag |
A címkepontozási függvény paraméterértékei. |
|
type |
string:
tag |
A használni kívánt függvény típusát jelzi. Az érvényes értékek közé tartozik a mennyiség, a frissesség, a távolság és a címke. A függvénytípusnak kisbetűsnek kell lennie. |
TagScoringParameters
Paraméterértékeket biztosít egy címkepontozási függvénynek.
Name | Típus | Description |
---|---|---|
tagsParameter |
string |
A keresési lekérdezésekben átadott paraméter neve, amely megadja a célmezővel összehasonlítandó címkék listáját. |
TextWeights
Olyan indexmezők súlyozását határozza meg, amelyek esetében az egyezéseknek növelnie kell a keresési lekérdezések pontozását.
Name | Típus | Description |
---|---|---|
weights |
object |
A mezőnkénti súlyok szótára a dokumentumpontszámozás növeléséhez. A kulcsok mezőnevek, az értékek pedig az egyes mezők súlyozásai. |
TokenCharacterKind
Olyan karakterosztályokat jelöl, amelyeken a jogkivonatszűrők működhetnek.
Name | Típus | Description |
---|---|---|
digit |
string |
A számjegyeket jogkivonatokban tárolja. |
letter |
string |
A betűket jogkivonatokban tárolja. |
punctuation |
string |
Az írásjelek a tokenekben maradnak. |
symbol |
string |
A szimbólumokat jogkivonatokban tárolja. |
whitespace |
string |
Jogkivonatokban tartja a whitespace-t. |
TokenFilterName
Meghatározza a keresőmotor által támogatott összes jogkivonatszűrő nevét.
TruncateTokenFilter
A kifejezéseket egy adott hosszra csonkolja. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.
Name | Típus | Alapértelmezett érték | Description |
---|---|---|---|
@odata.type |
string:
#Microsoft. |
Egy URI-töredék, amely megadja a jogkivonatszűrő típusát. |
|
length |
integer |
300 |
A kifejezés csonkításának hossza. Az alapértelmezett érték és a maximális érték 300. |
name |
string |
A jogkivonat-szűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet. |
UaxUrlEmailTokenizer
Tokenizes URL-címek és e-mailek egy jogkivonatként. Ez a tokenizer az Apache Lucene használatával van implementálva.
Name | Típus | Alapértelmezett érték | Description |
---|---|---|---|
@odata.type |
string:
#Microsoft. |
A tokenizer típusát meghatározó URI-töredék. |
|
maxTokenLength |
integer |
255 |
A jogkivonat maximális hossza. Az alapértelmezett érték 255. A maximális hossznál hosszabb jogkivonatok fel vannak osztva. A maximálisan használható tokenhossz 300 karakter. |
name |
string |
A tokenizer neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet. |
UniqueTokenFilter
Kiszűri a jogkivonatokat ugyanazzal a szöveggel, mint az előző jogkivonat. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.
Name | Típus | Alapértelmezett érték | Description |
---|---|---|---|
@odata.type |
string:
#Microsoft. |
Egy URI-töredék, amely megadja a jogkivonatszűrő típusát. |
|
name |
string |
A jogkivonat-szűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet. |
|
onlyOnSamePosition |
boolean |
False |
Egy érték, amely azt jelzi, hogy csak ugyanazon a helyen szeretné-e eltávolítani az ismétlődéseket. Az alapértelmezett érték hamis. |
VectorEncodingFormat
A vektormező tartalmának értelmezéséhez használt kódolási formátum.
Name | Típus | Description |
---|---|---|
packedBit |
string |
A szélesebb adattípusba csomagolt biteket ábrázoló kódolási formátum. |
VectorSearch
A vektorkereséshez kapcsolódó konfigurációs beállításokat tartalmaz.
Name | Típus | Description |
---|---|---|
algorithms | VectorSearchAlgorithmConfiguration[]: |
Az indexelés vagy lekérdezés során használt algoritmusra vonatkozó konfigurációs beállításokat tartalmaz. |
compressions | VectorSearchCompressionConfiguration[]: |
Az indexelés vagy lekérdezés során használt tömörítési módszerre vonatkozó konfigurációs beállításokat tartalmaz. |
profiles |
A vektorkereséshez használandó konfigurációk kombinációit határozza meg. |
|
vectorizers | VectorSearchVectorizer[]: |
A szöveges vektoros lekérdezések vektorizálására vonatkozó konfigurációs beállításokat tartalmaz. |
VectorSearchAlgorithmKind
Az indexeléshez és lekérdezéshez használt algoritmus.
Name | Típus | Description |
---|---|---|
exhaustiveKnn |
string |
Teljes körű KNN-algoritmus, amely találgatásos keresést hajt végre. |
hnsw |
string |
HNSW (Hierarchikus Navigable Small World), a legközelebbi szomszéd algoritmus típusa. |
VectorSearchAlgorithmMetric
A vektorok összehasonlításához használandó hasonlósági metrika. Javasoljuk, hogy ugyanazt a hasonlósági metrikát válassza, mint a beágyazási modell betanítása.
Name | Típus | Description |
---|---|---|
cosine |
string |
A vektorok közötti szöget méri a hasonlóságuk számszerűsítéséhez, figyelmen kívül hagyva a nagyságrendet. Minél kisebb a szög, annál közelebb van a hasonlóság. |
dotProduct |
string |
Kiszámítja az elemalapú termékek összegét az igazítás és a nagyságrendi hasonlóság méréséhez. Minél nagyobb és pozitívabb, annál közelebb van a hasonlóság. |
euclidean |
string |
Kiszámítja a vektorok közötti egyenes egyenes távolságot egy többdimenziós térben. Minél kisebb a távolság, annál közelebb van a hasonlóság. |
hamming |
string |
Csak bitcsomagolt bináris adattípusokra alkalmazható. Az eltérőséget a bináris vektorok eltérő pozícióinak megszámolásával határozza meg. Minél kevesebb a különbség, annál közelebb van a hasonlóság. |
VectorSearchCompressionKind
Az indexeléshez és lekérdezéshez használt tömörítési módszer.
Name | Típus | Description |
---|---|---|
binaryQuantization |
string |
Bináris kvantálás, a tömörítési módszer típusa. A bináris kvantálás során az eredeti vektorértékek a szűkebb bináris típusba lesznek tömörítve a vektor egyes összetevőinek bináris értékekkel való megkülönböztetésével és ábrázolásával, ezáltal csökkentve a teljes adatméretet. |
scalarQuantization |
string |
Skaláris kvantálás, a tömörítési módszer típusa. A skaláris kvantálás során az eredeti vektorértékek szűkebb típusba vannak tömörítve a vektorok egyes összetevőinek megkülönböztetésével és megjelenítésével csökkentett kvantált értékek használatával, ezáltal csökkentve a teljes adatméretet. |
VectorSearchCompressionTargetDataType
A tömörített vektorértékek kvantált adattípusa.
Name | Típus | Description |
---|---|---|
int8 |
string |
VectorSearchProfile
A vektorkereséssel használható konfigurációk kombinációját határozza meg.
Name | Típus | Description |
---|---|---|
algorithm |
string |
A vektorkeresési algoritmus konfigurációjának neve, amely meghatározza az algoritmust és az opcionális paramétereket. |
compression |
string |
A tömörítési metódus konfigurációjának neve, amely megadja a tömörítési módszert és az opcionális paramétereket. |
name |
string |
Az adott vektorkeresési profilhoz társítandó név. |
vectorizer |
string |
A vektorkereséshez konfigurált vektorizáció neve. |
VectorSearchVectorizerKind
A lekérdezési idő alatt használandó vektorizációs módszer.
Name | Típus | Description |
---|---|---|
azureOpenAI |
string |
Beágyazásokat hozhat létre egy Azure OpenAI-erőforrás használatával lekérdezéskor. |
customWebApi |
string |
Beágyazások létrehozása egyéni webes végpont használatával lekérdezéskor. |
WebApiParameters
Megadja a felhasználó által definiált vektorizálóhoz való csatlakozás tulajdonságait.
Name | Típus | Description |
---|---|---|
authIdentity | SearchIndexerDataIdentity: |
A kimenő kapcsolatokhoz használt, felhasználó által hozzárendelt felügyelt identitás. Ha authResourceId van megadva, és nincs megadva, a rendszer a rendszer által hozzárendelt felügyelt identitást használja. Az indexelő frissítéseinél, ha az identitás nincs meghatározva, az érték változatlan marad. Ha a "nincs" értékre van állítva, a tulajdonság értéke törlődik. |
authResourceId |
string |
Olyan egyéni végpontokra vonatkozik, amelyek külső kódhoz csatlakoznak egy Azure-függvényben, vagy más olyan alkalmazásra, amely az átalakításokat biztosítja. Ennek az értéknek a függvényhez vagy alkalmazáshoz az Azure Active Directoryban való regisztráláskor létrehozott alkalmazásazonosítónak kell lennie. Ha meg van adva, a vektorizálás a keresési szolgáltatás felügyelt azonosítójával (rendszer vagy felhasználó által hozzárendelt) és a függvény vagy alkalmazás hozzáférési jogkivonatával csatlakozik a függvényhez vagy alkalmazáshoz, és ezt az értéket használja erőforrás-azonosítóként a hozzáférési jogkivonat hatókörének létrehozásához. |
httpHeaders |
object |
A HTTP-kérés végrehajtásához szükséges fejlécek. |
httpMethod |
string |
A HTTP-kérés metódusa. |
timeout |
string |
A kérés kívánt időtúllépése. Az alapértelmezett érték 30 másodperc. |
uri |
string |
A vektorizálót biztosító webes API URI-ja. |
WebApiVectorizer
Felhasználó által definiált vektorizálót ad meg a lekérdezési sztring vektorbeágyazásához. A külső vektorizáló integrálása egy készségkészlet egyéni webes API-felületével érhető el.
Name | Típus | Description |
---|---|---|
customWebApiParameters |
A felhasználó által definiált vektorizáló tulajdonságait adja meg. |
|
kind |
string:
custom |
A vektorkereséshez konfigurált vektorizációs módszer neve. |
name |
string |
Az adott vektorizálási metódushoz társítandó név. |
WordDelimiterTokenFilter
A szavakat alszavakra osztja, és opcionális átalakításokat hajt végre az alszavas csoportokon. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.
Name | Típus | Alapértelmezett érték | Description |
---|---|---|---|
@odata.type |
string:
#Microsoft. |
Egy URI-töredék, amely megadja a jogkivonatszűrő típusát. |
|
catenateAll |
boolean |
False |
Egy érték, amely azt jelzi, hogy az összes alszavas rész be lesz-e jelölve. Ha például ez igaz értékre van állítva, az "Azure-Search-1" lesz az "AzureSearch1". Az alapértelmezett érték hamis. |
catenateNumbers |
boolean |
False |
Egy érték, amely azt jelzi, hogy a számrészek maximális futását a rendszer elvégzi-e. Ha például ez igaz értékre van állítva, az "1-2" "12" lesz. Az alapértelmezett érték hamis. |
catenateWords |
boolean |
False |
Egy érték, amely azt jelzi, hogy a szórészek maximális futása ki lesz-e jelölve. Ha például ez igaz értékre van állítva, az "Azure-Search" az "AzureSearch" lesz. Az alapértelmezett érték hamis. |
generateNumberParts |
boolean |
True |
Szám alszavainak generálását jelző érték. Az alapértelmezett érték igaz. |
generateWordParts |
boolean |
True |
Egy érték, amely jelzi, hogy létre kell-e hozni részszavat. Ha be van állítva, a szavak egyes részei létrejönnek; például az "AzureSearch" "Azure" "Search" lesz. Az alapértelmezett érték igaz. |
name |
string |
A jogkivonat-szűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet. |
|
preserveOriginal |
boolean |
False |
Egy érték, amely jelzi, hogy az eredeti szavak megmaradnak-e, és hozzáadva lesznek-e az alszavak listájához. Az alapértelmezett érték hamis. |
protectedWords |
string[] |
A tagolástól védendő jogkivonatok listája. |
|
splitOnCaseChange |
boolean |
True |
Egy érték, amely azt jelzi, hogy fel kell-e osztani a szavakat a caseChange-en. Ha például ez igaz értékre van állítva, az "AzureSearch" "Azure" "Search" lesz. Az alapértelmezett érték igaz. |
splitOnNumerics |
boolean |
True |
Érték, amely azt jelzi, hogy fel kell-e osztani a számokat. Ha például ez igaz értékre van állítva, az "Azure1Search" "Azure" "1" "Search" lesz. Az alapértelmezett érték igaz. |
stemEnglishPossessive |
boolean |
True |
Egy érték, amely jelzi, hogy el szeretné-e távolítani az egyes alszavak záró "'s"-jét. Az alapértelmezett érték igaz. |