Indexes - Create
Új keresési indexet hoz létre.
POST {endpoint}/indexes?api-version=2024-05-01-preview
URI-paraméterek
Name | In | Kötelező | Típus | Description |
---|---|---|---|---|
endpoint
|
path | True |
string |
A keresési szolgáltatás végponti URL-címe. |
api-version
|
query | True |
string |
Ügyfél API-verziója. |
Kérelem fejléce
Name | Kötelező | Típus | Description |
---|---|---|---|
x-ms-client-request-id |
string uuid |
A kéréssel együtt küldött nyomkövetési azonosító, amely segít a hibakeresésben. |
Kérelem törzse
Name | Kötelező | Típus | Description |
---|---|---|---|
fields | True |
Az index mezői. |
|
name | True |
string |
Az index neve. |
@odata.etag |
string |
Az index ETagje. |
|
analyzers | LexicalAnalyzer[]: |
Az index elemzői. |
|
charFilters | CharFilter[]: |
Az index karakterszűrői. |
|
corsOptions |
Az index forrásközi erőforrás-megosztásának (CORS) szabályozására szolgáló beállítások. |
||
defaultScoringProfile |
string |
A használni kívánt pontozási profil neve, ha nincs megadva a lekérdezésben. Ha ez a tulajdonság nincs beállítva, és nincs megadva pontozási profil a lekérdezésben, akkor az alapértelmezett pontozás (tf-idf) lesz használva. |
|
encryptionKey |
Az Azure Key Vault-ben létrehozott titkosítási kulcs leírása. Ez a kulcs további titkosítási szintet biztosít az adatok számára, ha teljes körű biztosítékot szeretne kapni arról, hogy senki, még a Microsoft sem tudja visszafejteni az adatokat. Miután titkosította az adatokat, az mindig titkosítva marad. A keresési szolgáltatás figyelmen kívül hagyja a tulajdonság null értékűre történő beállítására tett kísérleteket. Szükség szerint módosíthatja ezt a tulajdonságot, ha el szeretné forgatni a titkosítási kulcsot; Az adatok nem lesznek hatással. Az ügyfél által felügyelt kulcsokkal történő titkosítás nem érhető el az ingyenes keresési szolgáltatásokhoz, és csak a 2019. január 1-jén vagy azt követően létrehozott fizetős szolgáltatásokhoz érhető el. |
||
normalizers | LexicalNormalizer[]: |
Az index normalizálói. |
|
scoringProfiles |
Az index pontozási profiljai. |
||
semantic |
Olyan keresési index paramétereit határozza meg, amelyek befolyásolják a szemantikai képességeket. |
||
similarity | Similarity: |
A keresési lekérdezésnek megfelelő dokumentumok pontozásához és rangsorolásához használandó hasonlósági algoritmus típusa. A hasonlósági algoritmus csak az indexlétrehozáskor definiálható, és nem módosítható a meglévő indexeken. Null érték esetén a ClassicSimilarity algoritmust használja a rendszer. |
|
suggesters |
Az index javaslattevői. |
||
tokenFilters |
TokenFilter[]:
|
Az index jogkivonat-szűrői. |
|
tokenizers | LexicalTokenizer[]: |
Az index jogkivonat-szabályzói. |
|
vectorSearch |
A vektorkereséshez kapcsolódó konfigurációs beállításokat tartalmazza. |
Válaszok
Name | Típus | Description |
---|---|---|
201 Created | ||
Other Status Codes |
Hibaválasz. |
Példák
SearchServiceCreateIndex
Mintakérelem
POST https://myservice.search.windows.net/indexes?api-version=2024-05-01-preview
{
"name": "hotels",
"fields": [
{
"name": "hotelId",
"type": "Edm.String",
"key": true,
"searchable": false
},
{
"name": "baseRate",
"type": "Edm.Double"
},
{
"name": "description",
"type": "Edm.String",
"filterable": false,
"sortable": false,
"facetable": false
},
{
"name": "descriptionEmbedding",
"type": "Collection(Edm.Single)",
"searchable": true,
"filterable": false,
"retrievable": true,
"sortable": false,
"facetable": false,
"key": false,
"indexAnalyzer": null,
"searchAnalyzer": null,
"analyzer": null,
"synonymMaps": [],
"dimensions": 1536,
"vectorSearchProfile": "myCompressedHnswProfile"
},
{
"name": "descriptionEmbedding_notstored",
"type": "Collection(Edm.Single)",
"searchable": true,
"filterable": false,
"retrievable": false,
"stored": false,
"sortable": false,
"facetable": false,
"key": false,
"indexAnalyzer": null,
"searchAnalyzer": null,
"analyzer": null,
"synonymMaps": [],
"dimensions": 1536,
"vectorSearchProfile": "myCompressedHnswProfile"
},
{
"name": "description_fr",
"type": "Edm.String",
"filterable": false,
"sortable": false,
"facetable": false,
"analyzer": "fr.lucene"
},
{
"name": "hotelName",
"type": "Edm.String"
},
{
"name": "nameEmbedding",
"type": "Collection(Edm.Half)",
"searchable": true,
"filterable": false,
"retrievable": true,
"sortable": false,
"facetable": false,
"key": false,
"indexAnalyzer": null,
"searchAnalyzer": null,
"analyzer": null,
"synonymMaps": [],
"dimensions": 1536,
"vectorSearchProfile": "myHnswProfile"
},
{
"name": "category",
"type": "Edm.String"
},
{
"name": "tags",
"type": "Collection(Edm.String)",
"analyzer": "tagsAnalyzer"
},
{
"name": "parkingIncluded",
"type": "Edm.Boolean"
},
{
"name": "smokingAllowed",
"type": "Edm.Boolean"
},
{
"name": "lastRenovationDate",
"type": "Edm.DateTimeOffset"
},
{
"name": "rating",
"type": "Edm.Int32"
},
{
"name": "location",
"type": "Edm.GeographyPoint"
}
],
"scoringProfiles": [
{
"name": "geo",
"text": {
"weights": {
"hotelName": 5
}
},
"functions": [
{
"type": "distance",
"boost": 5,
"fieldName": "location",
"interpolation": "logarithmic",
"distance": {
"referencePointParameter": "currentLocation",
"boostingDistance": 10
}
}
]
}
],
"defaultScoringProfile": "geo",
"suggesters": [
{
"name": "sg",
"searchMode": "analyzingInfixMatching",
"sourceFields": [
"hotelName"
]
}
],
"analyzers": [
{
"name": "tagsAnalyzer",
"@odata.type": "#Microsoft.Azure.Search.CustomAnalyzer",
"charFilters": [
"html_strip"
],
"tokenizer": "standard_v2"
}
],
"corsOptions": {
"allowedOrigins": [
"tempuri.org"
],
"maxAgeInSeconds": 60
},
"encryptionKey": {
"keyVaultKeyName": "myUserManagedEncryptionKey-createdinAzureKeyVault",
"keyVaultKeyVersion": "myKeyVersion-32charAlphaNumericString",
"keyVaultUri": "https://myKeyVault.vault.azure.net",
"accessCredentials": {
"applicationId": "00000000-0000-0000-0000-000000000000",
"applicationSecret": "<applicationSecret>"
}
},
"similarity": {
"@odata.type": "#Microsoft.Azure.Search.BM25Similarity",
"b": 0.5,
"k1": 1.3
},
"semantic": {
"configurations": [
{
"name": "semanticHotels",
"prioritizedFields": {
"titleField": {
"fieldName": "hotelName"
},
"prioritizedContentFields": [
{
"fieldName": "description"
},
{
"fieldName": "description_fr"
}
],
"prioritizedKeywordsFields": [
{
"fieldName": "tags"
},
{
"fieldName": "category"
}
]
}
}
]
},
"vectorSearch": {
"profiles": [
{
"name": "myHnswProfile",
"algorithm": "myHnsw",
"vectorizer": "myOpenAi"
},
{
"name": "myCompressedHnswProfile",
"algorithm": "myHnsw",
"vectorizer": "myOpenAi",
"compression": "mySQ8"
},
{
"name": "myAlgorithm",
"algorithm": "myHnsw"
}
],
"algorithms": [
{
"name": "myHnsw",
"kind": "hnsw",
"hnswParameters": {
"m": 4,
"metric": "cosine",
"efConstruction": 400,
"efSearch": 500
}
},
{
"name": "myExhaustiveKnn",
"kind": "exhaustiveKnn",
"exhaustiveKnnParameters": {
"metric": "cosine"
}
}
],
"compressions": [
{
"name": "mySQ8",
"kind": "scalarQuantization",
"scalarQuantizationParameters": {
"quantizedDataType": "int8"
},
"rerankWithOriginalVectors": true,
"defaultOversampling": 10
}
],
"vectorizers": [
{
"name": "myOpenAi",
"kind": "azureOpenAI",
"azureOpenAIParameters": {
"resourceUri": "https://url.openai.azure.com",
"deploymentId": "text-embedding-ada-002",
"apiKey": "topsecretkey"
}
}
]
}
}
Mintaválasz
{
"name": "hotels",
"fields": [
{
"name": "hotelId",
"type": "Edm.String",
"searchable": false,
"filterable": true,
"retrievable": true,
"sortable": true,
"facetable": true,
"key": true,
"indexAnalyzer": null,
"searchAnalyzer": null,
"analyzer": null,
"normalizer": null,
"dimensions": null,
"vectorSearchProfile": null,
"synonymMaps": []
},
{
"name": "baseRate",
"type": "Edm.Double",
"searchable": false,
"filterable": true,
"retrievable": true,
"sortable": true,
"facetable": true,
"key": false,
"indexAnalyzer": null,
"searchAnalyzer": null,
"analyzer": null,
"normalizer": null,
"dimensions": null,
"vectorSearchProfile": null,
"synonymMaps": []
},
{
"name": "description",
"type": "Edm.String",
"searchable": true,
"filterable": false,
"retrievable": true,
"sortable": false,
"facetable": false,
"key": false,
"indexAnalyzer": null,
"searchAnalyzer": null,
"analyzer": null,
"normalizer": null,
"dimensions": null,
"vectorSearchProfile": null,
"synonymMaps": []
},
{
"name": "descriptionEmbedding",
"type": "Collection(Edm.Single)",
"searchable": true,
"filterable": false,
"retrievable": true,
"sortable": false,
"facetable": false,
"key": false,
"indexAnalyzer": null,
"searchAnalyzer": null,
"analyzer": null,
"normalizer": null,
"dimensions": 1536,
"vectorSearchProfile": "myCompressedHnswProfile",
"synonymMaps": []
},
{
"name": "descriptionEmbedding_notstored",
"type": "Collection(Edm.Single)",
"searchable": true,
"filterable": false,
"retrievable": false,
"stored": false,
"sortable": false,
"facetable": false,
"key": false,
"indexAnalyzer": null,
"searchAnalyzer": null,
"analyzer": null,
"synonymMaps": [],
"dimensions": 1536,
"vectorSearchProfile": "myCompressedHnswProfile"
},
{
"name": "description_fr",
"type": "Edm.String",
"searchable": true,
"filterable": false,
"retrievable": true,
"sortable": false,
"facetable": false,
"key": false,
"indexAnalyzer": null,
"searchAnalyzer": null,
"analyzer": "fr.lucene",
"normalizer": null,
"dimensions": null,
"vectorSearchProfile": null,
"synonymMaps": []
},
{
"name": "hotelName",
"type": "Edm.String",
"searchable": true,
"filterable": true,
"retrievable": true,
"sortable": true,
"facetable": true,
"key": false,
"indexAnalyzer": null,
"searchAnalyzer": null,
"analyzer": null,
"normalizer": null,
"dimensions": null,
"vectorSearchProfile": null,
"synonymMaps": []
},
{
"name": "nameEmbedding",
"type": "Collection(Edm.Half)",
"searchable": true,
"filterable": false,
"retrievable": true,
"sortable": false,
"facetable": false,
"key": false,
"indexAnalyzer": null,
"searchAnalyzer": null,
"analyzer": null,
"normalizer": null,
"dimensions": 1536,
"vectorSearchProfile": "myHnswProfile",
"synonymMaps": []
},
{
"name": "category",
"type": "Edm.String",
"searchable": true,
"filterable": true,
"retrievable": true,
"sortable": true,
"facetable": true,
"key": false,
"indexAnalyzer": null,
"searchAnalyzer": null,
"analyzer": null,
"normalizer": null,
"dimensions": null,
"vectorSearchProfile": null,
"synonymMaps": []
},
{
"name": "tags",
"type": "Collection(Edm.String)",
"searchable": true,
"filterable": true,
"retrievable": true,
"sortable": false,
"facetable": true,
"key": false,
"indexAnalyzer": null,
"searchAnalyzer": null,
"analyzer": "tagsAnalyzer",
"normalizer": null,
"dimensions": null,
"vectorSearchProfile": null,
"synonymMaps": []
},
{
"name": "parkingIncluded",
"type": "Edm.Boolean",
"searchable": false,
"filterable": true,
"retrievable": true,
"sortable": true,
"facetable": true,
"key": false,
"indexAnalyzer": null,
"searchAnalyzer": null,
"analyzer": null,
"normalizer": null,
"dimensions": null,
"vectorSearchProfile": null,
"synonymMaps": []
},
{
"name": "smokingAllowed",
"type": "Edm.Boolean",
"searchable": false,
"filterable": true,
"retrievable": true,
"sortable": true,
"facetable": true,
"key": false,
"indexAnalyzer": null,
"searchAnalyzer": null,
"analyzer": null,
"normalizer": null,
"dimensions": null,
"vectorSearchProfile": null,
"synonymMaps": []
},
{
"name": "lastRenovationDate",
"type": "Edm.DateTimeOffset",
"searchable": false,
"filterable": true,
"retrievable": true,
"sortable": true,
"facetable": true,
"key": false,
"indexAnalyzer": null,
"searchAnalyzer": null,
"analyzer": null,
"normalizer": null,
"dimensions": null,
"vectorSearchProfile": null,
"synonymMaps": []
},
{
"name": "rating",
"type": "Edm.Int32",
"searchable": false,
"filterable": true,
"retrievable": true,
"sortable": true,
"facetable": true,
"key": false,
"indexAnalyzer": null,
"searchAnalyzer": null,
"analyzer": null,
"normalizer": null,
"dimensions": null,
"vectorSearchProfile": null,
"synonymMaps": []
},
{
"name": "location",
"type": "Edm.GeographyPoint",
"searchable": false,
"filterable": true,
"retrievable": true,
"sortable": true,
"facetable": false,
"key": false,
"indexAnalyzer": null,
"searchAnalyzer": null,
"analyzer": null,
"normalizer": null,
"dimensions": null,
"vectorSearchProfile": null,
"synonymMaps": []
}
],
"scoringProfiles": [
{
"name": "geo",
"functionAggregation": "sum",
"text": {
"weights": {
"hotelName": 5
}
},
"functions": [
{
"fieldName": "location",
"interpolation": "logarithmic",
"type": "distance",
"boost": 5,
"distance": {
"referencePointParameter": "currentLocation",
"boostingDistance": 10
}
}
]
}
],
"defaultScoringProfile": "geo",
"suggesters": [
{
"name": "sg",
"searchMode": "analyzingInfixMatching",
"sourceFields": [
"hotelName"
]
}
],
"analyzers": [
{
"name": "tagsAnalyzer",
"@odata.type": "#Microsoft.Azure.Search.CustomAnalyzer",
"charFilters": [
"html_strip"
],
"tokenizer": "standard_v2",
"tokenFilters": []
}
],
"tokenizers": [],
"normalizers": [],
"tokenFilters": [],
"charFilters": [],
"corsOptions": {
"allowedOrigins": [
"tempuri.org"
],
"maxAgeInSeconds": 60
},
"encryptionKey": {
"keyVaultKeyName": "myUserManagedEncryptionKey-createdinAzureKeyVault",
"keyVaultKeyVersion": "myKeyVersion-32charAlphaNumericString",
"keyVaultUri": "https://myKeyVault.vault.azure.net",
"accessCredentials": {
"applicationId": "00000000-0000-0000-0000-000000000000",
"applicationSecret": null
}
},
"similarity": {
"@odata.type": "#Microsoft.Azure.Search.BM25Similarity",
"b": 0.5,
"k1": 1.3
},
"semantic": {
"defaultConfiguration": null,
"configurations": [
{
"name": "semanticHotels",
"prioritizedFields": {
"titleField": {
"fieldName": "hotelName"
},
"prioritizedContentFields": [
{
"fieldName": "description"
},
{
"fieldName": "description_fr"
}
],
"prioritizedKeywordsFields": [
{
"fieldName": "tags"
},
{
"fieldName": "category"
}
]
}
}
]
},
"vectorSearch": {
"algorithms": [
{
"name": "myHnsw",
"kind": "hnsw",
"hnswParameters": {
"metric": "cosine",
"m": 4,
"efConstruction": 400,
"efSearch": 500
}
},
{
"name": "myExhaustiveKnn",
"kind": "exhaustiveKnn",
"exhaustiveKnnParameters": {
"metric": "cosine"
}
}
],
"profiles": [
{
"name": "myHnswProfile",
"algorithm": "myHnsw",
"vectorizer": "myOpenAi"
},
{
"name": "myCompressedHnswProfile",
"algorithm": "myHnsw",
"vectorizer": "myOpenAi",
"compression": "mySQ8"
},
{
"name": "myAlgorithm",
"algorithm": "myHnsw"
}
],
"compressions": [
{
"name": "mySQ8",
"kind": "scalarQuantization",
"scalarQuantizationParameters": {
"quantizedDataType": "int8"
},
"rerankWithOriginalVectors": true,
"defaultOversampling": 10
}
],
"vectorizers": [
{
"name": "myOpenAi",
"kind": "azureOpenAI",
"azureOpenAIParameters": {
"resourceUri": "https://url.openai.azure.com",
"deploymentId": "text-embedding-ada-002",
"apiKey": "topsecretkey",
"authIdentity": null
}
}
]
}
}
Definíciók
Name | Description |
---|---|
AIServices |
Megadja az AI Services Vision paramétereit egy lekérdezési kép vagy szöveg vektorizálásához. |
AIServices |
Megadja az AI Services Vision paramétereit egy lekérdezési kép vagy szöveg vektorizálásához. |
AIStudio |
A meghívandó Azure AI Studio-katalógusból származó beágyazási modell neve. |
AMLParameters |
Megadja az AML-vektorizálóhoz való csatlakozás tulajdonságait. |
AMLVectorizer |
A Azure AI Studio modellkatalóguson keresztül üzembe helyezett Azure Machine Learning-végpontot adja meg a lekérdezési sztring vektoros beágyazásának létrehozásához. |
Ascii |
Az első 127 ASCII-karakterben nem szereplő unicode-karaktereket (az "Egyszerű latin" Unicode-blokkot) ASCII-ekvivalenssé alakítja át, ha léteznek ilyen megfelelők. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva. |
Azure |
A keresési szolgáltatáshoz létrehozott regisztrált alkalmazás hitelesítő adatai, amelyet az Azure Key Vault tárolt titkosítási kulcsokhoz való hitelesített hozzáféréshez használnak. |
Azure |
Lehetővé teszi, hogy vektoros beágyazást hozzon létre egy adott szöveges bemenethez az Azure OpenAI-erőforrás használatával. |
Azure |
A meghívandó Azure Open AI-modell neve. |
Azure |
Megadja az Azure OpenAI-erőforráshoz való csatlakozás paramétereit. |
Azure |
Meghatározza a lekérdezési sztringek vektorizálásához használt Azure OpenAI-erőforrást. |
BM25Similarity |
Az Okapi BM25 hasonlósági algoritmuson alapuló rangsorolási függvény. A BM25 egy TF-IDF-szerű algoritmus, amely magában foglalja a hossz normalizálását (amelyet a "b" paraméter szabályoz), valamint a kifejezés frekvenciatelítettségét (amelyet a "k1" paraméter szabályoz). |
Char |
Meghatározza a keresőmotor által támogatott összes karakterszűrő nevét. |
Cjk |
Forms standard tokenizerből létrehozott CJK-kifejezések bigramját. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva. |
Cjk |
A CjkBigramTokenFilter által figyelmen kívül hagyható szkriptek. |
Classic |
Örökölt hasonlósági algoritmus, amely a TF-IDF Lucene TFIDFSimilarity implementációját használja. A TF-IDF ezen változata statikus dokumentumhossz normalizálást vezet be, valamint koordinálja azokat a tényezőket, amelyek csak részben egyeznek a keresett lekérdezésekkel. |
Classic |
Nyelvhelyességi alapú jogkivonat-szabályzó, amely alkalmas a legtöbb európai nyelvű dokumentum feldolgozására. Ez a jogkivonat-szabályzó az Apache Lucene használatával van implementálva. |
Common |
Bigramokat hozhat létre az indexelés során gyakran előforduló kifejezésekhez. Az egyes kifejezések továbbra is indexelve vannak, és a bigramok túl vannak osztva. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva. |
Cors |
Meghatározza az indexek eltérő eredetű erőforrás-megosztásának (CORS) szabályozására szolgáló beállításokat. |
Custom |
Lehetővé teszi a szöveg indexelhető/kereshető jogkivonattá alakításának folyamatát. Ez egy felhasználó által definiált konfiguráció, amely egyetlen előre definiált tokenizerből és egy vagy több szűrőből áll. A jogkivonat-szabályzó feladata a szöveg jogkivonatokra törése, valamint a jogkivonat-szabályzó által kibocsátott jogkivonatok módosítására szolgáló szűrők. |
Custom |
Lehetővé teszi a normalizálás konfigurálását szűrhető, rendezhető és táblázatos mezőkhöz, amelyek alapértelmezés szerint szigorú egyezéssel működnek. Ez egy felhasználó által definiált konfiguráció, amely legalább egy szűrőből áll, és módosítja a tárolt jogkivonatot. |
Custom |
Felhasználó által definiált vektorizálót ad meg a lekérdezési sztringek vektorbeágyazásának létrehozásához. A külső vektorizáló integrálása egy képességcsoport egyéni webes API-felületével érhető el. |
Custom |
Megadja a felhasználó által definiált vektorizálóhoz való csatlakozás tulajdonságait. |
Dictionary |
Felbontja a sok germán nyelven található összetett szavakat. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva. |
Distance |
Olyan függvényt definiál, amely a földrajzi helytől való távolság alapján növeli a pontszámokat. |
Distance |
Paraméterértékeket biztosít egy távolsági pontozási függvénynek. |
Edge |
A megadott méret(ek) n-grammját hozza létre egy bemeneti jogkivonat elejétől vagy hátuljától kezdve. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva. |
Edge |
Megadja, hogy a bemenet melyik oldaláról kell n-gramot létrehozni. |
Edge |
A megadott méret(ek) n-grammját hozza létre egy bemeneti jogkivonat elejétől vagy hátuljától kezdve. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva. |
Edge |
Tokenizálja a bemenetet egy élről az adott méret(ek) n-grammjára. Ez a jogkivonat-szabályzó az Apache Lucene használatával van implementálva. |
Elision |
Eltávolítja az elisionokat. A "l'avion" (a sík) például "avion" (sík) lesz. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva. |
Error |
Az erőforrás-kezelési hiba további információi. |
Error |
A hiba részletei. |
Error |
Hibaválasz |
Exhaustive |
A teljes KNN-algoritmusra jellemző paramétereket tartalmazza. |
Exhaustive |
A lekérdezés során használt teljes KNN-algoritmusra vonatkozó konfigurációs beállításokat tartalmaz, amelyek találgatásos keresést hajtanak végre a teljes vektorindexben. |
Freshness |
Olyan függvényt definiál, amely egy dátum-idő mező értéke alapján növeli a pontszámokat. |
Freshness |
Paraméterértékeket biztosít egy frissesség-pontozási függvénynek. |
Hnsw |
A HNSW algoritmusra jellemző paramétereket tartalmazza. |
Hnsw |
Az indexelés és lekérdezés során használt HNSW közelítő szomszéd algoritmusra vonatkozó konfigurációs beállításokat tartalmaz. A HNSW algoritmus a keresési sebesség és a pontosság közötti kompromisszumot kínálja. |
Input |
Egy képesség bemeneti mezőleképezése. |
Keep |
Egy jogkivonatszűrő, amely csak a megadott szavak listájában lévő szöveggel rendelkező jogkivonatokat tárolja. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva. |
Keyword |
Kulcsszavakként jelöli meg a kifejezéseket. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva. |
Keyword |
A teljes bemenetet egyetlen jogkivonatként bocsátja ki. Ez a jogkivonat-szabályzó az Apache Lucene használatával van implementálva. |
Keyword |
A teljes bemenetet egyetlen jogkivonatként bocsátja ki. Ez a jogkivonat-szabályzó az Apache Lucene használatával van implementálva. |
Length |
Eltávolítja a túl hosszú vagy túl rövid szavakat. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva. |
Lexical |
Meghatározza a keresőmotor által támogatott összes szövegelemző nevét. |
Lexical |
Meghatározza a keresőmotor által támogatott összes szöveg normalizálójának nevét. |
Lexical |
Meghatározza a keresőmotor által támogatott összes tokenizer nevét. |
Limit |
Korlátozza a tokenek számát az indexelés során. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva. |
Lucene |
Standard Apache Lucene-elemző; A standard tokenizerből, kisbetűs szűrőből és leállításszűrőből áll. |
Lucene |
A Unicode-szöveg szegmentálási szabályai szerint töri a szöveget. Ez a jogkivonat-szabályzó az Apache Lucene használatával van implementálva. |
Lucene |
A Unicode-szöveg szegmentálási szabályai szerint töri a szöveget. Ez a jogkivonat-szabályzó az Apache Lucene használatával van implementálva. |
Magnitude |
Olyan függvényt definiál, amely egy numerikus mező nagysága alapján növeli a pontszámokat. |
Magnitude |
Paraméterértékeket biztosít egy nagyságrendi pontozó függvénynek. |
Mapping |
Karakterszűrő, amely a leképezési beállítással definiált leképezéseket alkalmazza. A megfeleltetés kapzsi (a leghosszabb mintaegyeztetés egy adott ponton nyer). A csere lehet üres sztring. Ez a karakterszűrő az Apache Lucene használatával van implementálva. |
Microsoft |
Nyelvspecifikus szabályokkal osztja el a szöveget, és csökkenti a szavak alapformáit. |
Microsoft |
Nyelvspecifikus szabályokkal osztja el a szöveget. |
Microsoft |
Listák a Microsoft-nyelv által támogatott nyelveket, amely a jogkivonat-szabályzóból származik. |
Microsoft |
Listák a Microsoft nyelvi tokenizer által támogatott nyelveket. |
NGram |
A megadott méret(ek) n-grammját hozza létre. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva. |
NGram |
A megadott méret(ek) n-grammját hozza létre. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva. |
NGram |
Tokenizálja a bemenetet az adott méret(ek) n-grammjára. Ez a jogkivonat-szabályzó az Apache Lucene használatával van implementálva. |
Output |
Egy képesség kimeneti mezőleképezése. |
Path |
Tokenizer elérésiút-szerű hierarchiákhoz. Ez a jogkivonat-szabályzó az Apache Lucene használatával van implementálva. |
Pattern |
A szöveget rugalmasan elválasztja a kifejezések között egy reguláris kifejezésmintán keresztül. Ez az elemző az Apache Lucene használatával van implementálva. |
Pattern |
Java-regexek használatával több jogkivonatot bocsát ki – egyet minden rögzítési csoporthoz egy vagy több mintában. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva. |
Pattern |
Karakterszűrő, amely lecseréli a bemeneti sztringben szereplő karaktereket. Egy reguláris kifejezéssel azonosítja a megőrizni kívánt karaktersorozatokat, a lecserélendő karaktereket pedig helyettesítő mintával azonosítja. Ha például az "aa bb aa bb", a "(aa)\s+(bb)" minta és az "$1#$2" helyettesítő szöveg szerepel, az eredmény "aa#bb aa#bb". Ez a karakterszűrő az Apache Lucene használatával van implementálva. |
Pattern |
Karakterszűrő, amely lecseréli a bemeneti sztringben szereplő karaktereket. Egy reguláris kifejezéssel azonosítja a megőrizni kívánt karaktersorozatokat, a lecserélendő karaktereket pedig helyettesítő mintával azonosítja. Ha például az "aa bb aa bb", a "(aa)\s+(bb)" minta és az "$1#$2" helyettesítő szöveg szerepel, az eredmény "aa#bb aa#bb". Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva. |
Pattern |
Tokenizer, amely regex mintaegyeztetést használ a különböző tokenek létrehozásához. Ez a jogkivonat-szabályzó az Apache Lucene használatával van implementálva. |
Phonetic |
A fonetikus kódoló fonetikus kódoló típusát azonosítja a PhoneticTokenFilterrel való használathoz. |
Phonetic |
Létrehozás fonetikus egyezések tokenjei. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva. |
Prioritized |
A szemantikai rangsoroláshoz, feliratokhoz, kiemelésekhez és válaszokhoz használandó cím-, tartalom- és kulcsszavak mezőit ismerteti. |
Regex |
Definiálja azokat a jelzőket, amelyek kombinálhatók annak szabályozásához, hogy a rendszer hogyan használja a reguláris kifejezéseket a mintaelemzőben és a minta jogkivonat-jelölőjében. |
Scalar |
A skaláris kvantálásra jellemző paramétereket tartalmazza. |
Scalar |
Az indexelés és lekérdezés során használt skaláris kvantálási tömörítési módszerre vonatkozó konfigurációs beállításokat tartalmazza. |
Scoring |
Meghatározza az összesítési függvényt, amely a pontozási profil összes pontozási függvényének eredményeit egyesíti. |
Scoring |
Meghatározza azt a függvényt, amellyel a pontszámok felpörgethetőek egy dokumentumtartományban. |
Scoring |
Olyan keresési index paramétereit határozza meg, amelyek befolyásolják a keresési lekérdezések pontozását. |
Search |
Egy indexdefinícióban lévő mezőt jelöl, amely leírja egy mező nevét, adattípusát és keresési viselkedését. |
Search |
Meghatározza egy mező adattípusát egy keresési indexben. |
Search |
A keresési index definícióját jelöli, amely egy index mezőit és keresési viselkedését ismerteti. |
Search |
Törli az adatforrás identitástulajdonságát. |
Search |
Megadja a használni kívánt adatforrás identitását. |
Search |
Ügyfél által felügyelt titkosítási kulcs az Azure Key Vault. A létrehozott és kezelt kulcsok az inaktív adatok, például indexek és szinonimák titkosítására vagy visszafejtésére használhatók. |
Semantic |
Egy adott konfigurációt határoz meg, amelyet a szemantikai képességek kontextusában kell használni. |
Semantic |
A szemantikai konfiguráció részeként használt mező. |
Semantic |
Olyan keresési index paramétereit határozza meg, amelyek befolyásolják a szemantikai képességeket. |
Shingle |
Tokenkombinációkat hoz létre egyetlen tokenként. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva. |
Snowball |
Egy szűrő, amely a szavakat egy Snowball által generált őst használ. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva. |
Snowball |
A Snowball-jogkivonat-szűrőhöz használandó nyelv. |
Stemmer |
Lehetővé teszi, hogy felülbírálja a többi stemming szűrőt a saját szótáralapú szárítással. A szótárból származó kifejezések kulcsszavakként lesznek megjelölve, így nem lesznek a láncban lévő stemmerek. A törzsszűrők elé kell helyezni. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva. |
Stemmer |
Nyelvspecifikus eredetszűrő. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva. |
Stemmer |
A stemmer token szűrőhöz használandó nyelv. |
Stop |
A szöveget nem betűkkel osztja el; Alkalmazza a kisbetűs és a stopword jogkivonat szűrőit. Ez az elemző az Apache Lucene használatával van implementálva. |
Stopwords |
A nyelvspecifikus stopszók előre definiált listáját azonosítja. |
Stopwords |
Eltávolítja a leállító szavakat egy jogkivonat-adatfolyamból. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva. |
Suggester |
Meghatározza, hogyan kell alkalmazni a Suggest API-t az index egy mezőcsoportjára. |
Suggester |
A javaslattevő képességeit jelző érték. |
Synonym |
Egy- vagy többszavas szinonimák egy jogkivonatfolyamban. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva. |
Tag |
Olyan függvényt definiál, amely egy adott címkelistának megfelelő sztringértékekkel növeli a dokumentumok pontszámait. |
Tag |
Paraméterértékeket biztosít egy címkepontozási függvénynek. |
Text |
Olyan indexmezők súlyozását határozza meg, amelyek esetében a találatok növelik a keresési lekérdezések pontozását. |
Token |
Olyan karakterosztályokat jelöl, amelyeken a jogkivonatszűrők működhetnek. |
Token |
Meghatározza a keresőmotor által támogatott összes jogkivonatszűrő nevét. |
Truncate |
A kifejezéseket adott hosszúságúra csonkítja. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva. |
Uax |
Tokenizálja az URL-címeket és az e-maileket egy jogkivonatként. Ez a jogkivonat-szabályzó az Apache Lucene használatával van implementálva. |
Unique |
Kiszűri a jogkivonatokat az előző token szövegével megegyező szöveggel. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva. |
Vector |
A vektormező tartalmának értelmezésére szolgáló kódolási formátum. |
Vector |
A vektorkereséshez kapcsolódó konfigurációs beállításokat tartalmazza. |
Vector |
Az indexeléshez és lekérdezéshez használt algoritmus. |
Vector |
A vektorok összehasonlításához használandó hasonlósági metrika. Javasoljuk, hogy ugyanazt a hasonlósági metrikát válassza, amelyre a beágyazási modellt betanította. |
Vector |
Az indexeléshez és lekérdezéshez használt tömörítési módszer. |
Vector |
A tömörített vektorértékek kvantált adattípusa. |
Vector |
A vektorkereséssel használható konfigurációk kombinációját határozza meg. |
Vector |
A lekérdezési idő alatt használandó vektorizálási módszer. |
Word |
A szavakat alszavakra osztja, és opcionális átalakításokat hajt végre az alszócsoportokon. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva. |
AIServicesVisionParameters
Megadja az AI Services Vision paramétereit egy lekérdezési kép vagy szöveg vektorizálásához.
Name | Típus | Description |
---|---|---|
apiKey |
string |
A kijelölt AI Services-erőforrás API-kulcsa. |
authIdentity | SearchIndexerDataIdentity: |
A kimenő kapcsolatokhoz használt, felhasználó által hozzárendelt felügyelt identitás. Ha authResourceId van megadva, és nincs megadva, a rendszer a rendszer által hozzárendelt felügyelt identitást használja. Ha az index frissítésekor az identitás nincs meghatározva, az érték változatlan marad. Ha a "nincs" értékre van állítva, a tulajdonság értéke törlődik. |
modelVersion |
string |
Az AI Services Vision szolgáltatás meghívásakor használni kívánt modell verziója. Alapértelmezés szerint a legújabb elérhető lesz, ha nincs megadva. |
resourceUri |
string |
Az AI Services-erőforrás erőforrás-URI-ja. |
AIServicesVisionVectorizer
Megadja az AI Services Vision paramétereit egy lekérdezési kép vagy szöveg vektorizálásához.
Name | Típus | Description |
---|---|---|
aiServicesVisionParameters |
Az AI Services Vision beágyazási vektorizációjára jellemző paramétereket tartalmazza. |
|
kind |
string:
ai |
A vektoros kereséshez konfigurált vektorizálási módszer neve. |
name |
string |
Az adott vektorizációs metódushoz társítandó név. |
AIStudioModelCatalogName
A meghívandó Azure AI Studio-katalógusból származó beágyazási modell neve.
Name | Típus | Description |
---|---|---|
Cohere-embed-v3-english |
string |
|
Cohere-embed-v3-multilingual |
string |
|
Facebook-DinoV2-Image-Embeddings-ViT-Base |
string |
|
Facebook-DinoV2-Image-Embeddings-ViT-Giant |
string |
|
OpenAI-CLIP-Image-Text-Embeddings-ViT-Large-Patch14-336 |
string |
|
OpenAI-CLIP-Image-Text-Embeddings-vit-base-patch32 |
string |
AMLParameters
Megadja az AML-vektorizálóhoz való csatlakozás tulajdonságait.
Name | Típus | Description |
---|---|---|
key |
string |
(Kulcshitelesítéshez szükséges) Az AML szolgáltatás kulcsa. |
modelName |
A megadott végponton üzembe helyezett Azure AI Studio-katalógusból származó beágyazási modell neve. |
|
region |
string |
(Nem kötelező a jogkivonat-hitelesítéshez). Az a régió, amelyben az AML-szolgáltatás üzembe van helyezve. |
resourceId |
string |
(Jogkivonat-hitelesítéshez szükséges). Az AML szolgáltatás Azure Resource Manager erőforrás-azonosítója. Ennek előfizetések/{guid}/resourceGroups/{resource-group-name}/Microsoft.MachineLearningServices/workspaces/{workspace-name}/services/{service_name} formátumban kell lennie. |
timeout |
string |
(Nem kötelező) Ha meg van adva, az API-hívást kezdeményező HTTP-ügyfél időtúllépését jelzi. |
uri |
string |
(Hitelesítés vagy kulcshitelesítés nélkül szükséges) Annak az AML-szolgáltatásnak a pontozási URI-ja, amelyre a JSON hasznos adatokat elküldi. Csak a https URI-séma engedélyezett. |
AMLVectorizer
A Azure AI Studio modellkatalóguson keresztül üzembe helyezett Azure Machine Learning-végpontot adja meg a lekérdezési sztring vektoros beágyazásának létrehozásához.
Name | Típus | Description |
---|---|---|
amlParameters |
Az AML-vektorizáló tulajdonságait adja meg. |
|
kind |
string:
aml |
A vektoros kereséshez konfigurált vektorizálási módszer neve. |
name |
string |
Az adott vektorizációs metódushoz társítandó név. |
AsciiFoldingTokenFilter
Az első 127 ASCII-karakterben nem szereplő unicode-karaktereket (az "Egyszerű latin" Unicode-blokkot) ASCII-ekvivalenssé alakítja át, ha léteznek ilyen megfelelők. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.
Name | Típus | Alapértelmezett érték | Description |
---|---|---|---|
@odata.type |
string:
#Microsoft. |
Egy URI-töredék, amely megadja a tokenszűrő típusát. |
|
name |
string |
A jogkivonatszűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet. |
|
preserveOriginal |
boolean |
False |
Egy érték, amely azt jelzi, hogy az eredeti jogkivonat megmarad-e. Az alapértelmezett érték a false (hamis). |
AzureActiveDirectoryApplicationCredentials
A keresési szolgáltatáshoz létrehozott regisztrált alkalmazás hitelesítő adatai, amelyet az Azure Key Vault tárolt titkosítási kulcsokhoz való hitelesített hozzáféréshez használnak.
Name | Típus | Description |
---|---|---|
applicationId |
string |
Egy AAD-alkalmazásazonosító, amely megkapta a szükséges hozzáférési engedélyeket az Azure Key Vault, amelyet az inaktív adatok titkosításához kell használni. Az alkalmazásazonosító nem tévesztendő össze az AAD-alkalmazás objektumazonosítójával. |
applicationSecret |
string |
A megadott AAD-alkalmazás hitelesítési kulcsa. |
AzureOpenAIEmbeddingSkill
Lehetővé teszi, hogy vektoros beágyazást hozzon létre egy adott szöveges bemenethez az Azure OpenAI-erőforrás használatával.
Name | Típus | Description |
---|---|---|
@odata.type |
string:
#Microsoft. |
Egy URI-töredék, amely a képesség típusát határozza meg. |
apiKey |
string |
A kijelölt Azure OpenAI-erőforrás API-kulcsa. |
authIdentity | SearchIndexerDataIdentity: |
A kimenő kapcsolatokhoz használt, felhasználó által hozzárendelt felügyelt identitás. |
context |
string |
A műveletek végrehajtásának szintjét jelöli, például a dokumentum gyökerét vagy a dokumentum tartalmát (például /document vagy /document/content). Az alapértelmezett érték a /document. |
deploymentId |
string |
Az Azure OpenAI-modell üzembe helyezésének azonosítója a kijelölt erőforráson. |
description |
string |
A képesség leírása, amely a képesség bemeneteit, kimeneteit és használatát ismerteti. |
dimensions |
integer |
Az eredményként kapott kimeneti beágyazások dimenzióinak száma. Csak a text-embedding-3 és újabb modellekben támogatott. |
inputs |
A képességek bemenetei lehetnek egy oszlop a forrásadatkészletben, vagy egy felsőbb rétegbeli képesség kimenete. |
|
modelName |
A megadott deploymentId elérési úton üzembe helyezett beágyazási modell neve. |
|
name |
string |
Annak a képességnek a neve, amely egyedileg azonosítja azt a képességkészleten belül. A névvel nem rendelkező képességek a képességtömb 1-alapú indexének alapértelmezett nevét kapják, amelynek előtagja a "#" karakter. |
outputs |
A képesség kimenete vagy egy keresési index mezője, vagy egy másik képesség bemeneteként felhasználható érték. |
|
resourceUri |
string |
Az Azure OpenAI-erőforrás erőforrás-URI-ja. |
AzureOpenAIModelName
A meghívandó Azure Open AI-modell neve.
Name | Típus | Description |
---|---|---|
experimental |
string |
|
text-embedding-3-large |
string |
|
text-embedding-3-small |
string |
|
text-embedding-ada-002 |
string |
AzureOpenAIParameters
Megadja az Azure OpenAI-erőforráshoz való csatlakozás paramétereit.
Name | Típus | Description |
---|---|---|
apiKey |
string |
A kijelölt Azure OpenAI-erőforrás API-kulcsa. |
authIdentity | SearchIndexerDataIdentity: |
A kimenő kapcsolatokhoz használt, felhasználó által hozzárendelt felügyelt identitás. |
deploymentId |
string |
Az Azure OpenAI-modell üzembe helyezésének azonosítója a kijelölt erőforráson. |
modelName |
A megadott deploymentId elérési úton üzembe helyezett beágyazási modell neve. |
|
resourceUri |
string |
Az Azure OpenAI-erőforrás erőforrás-URI-ja. |
AzureOpenAIVectorizer
Meghatározza a lekérdezési sztringek vektorizálásához használt Azure OpenAI-erőforrást.
Name | Típus | Description |
---|---|---|
azureOpenAIParameters | AzureOpenAIParameters: |
Az Azure OpenAI beágyazási vektorizálására jellemző paramétereket tartalmazza. |
kind |
string:
azure |
A vektoros kereséshez konfigurált vektorizálási módszer neve. |
name |
string |
Az adott vektorizációs metódushoz társítandó név. |
BM25Similarity
Az Okapi BM25 hasonlósági algoritmuson alapuló rangsorolási függvény. A BM25 egy TF-IDF-szerű algoritmus, amely magában foglalja a hossz normalizálását (amelyet a "b" paraméter szabályoz), valamint a kifejezés frekvenciatelítettségét (amelyet a "k1" paraméter szabályoz).
Name | Típus | Description |
---|---|---|
@odata.type |
string:
#Microsoft. |
|
b |
number |
Ez a tulajdonság határozza meg, hogy a dokumentum hossza hogyan befolyásolja a relevanciapontszámot. Alapértelmezés szerint a rendszer 0,75 értéket használ. A 0,0 érték azt jelenti, hogy nincs hossz normalizálás alkalmazva, míg az 1,0 érték azt jelenti, hogy a pontszám teljesen normalizálódik a dokumentum hosszával. |
k1 |
number |
Ez a tulajdonság szabályozza a skálázási függvényt az egyes egyező kifejezések kifejezési gyakorisága és a dokumentum-lekérdezés párok végső relevanciapontszáma között. Alapértelmezés szerint a rendszer 1,2 értéket használ. A 0,0 érték azt jelenti, hogy a pontszám nem skálázható a kifejezés gyakoriságának növekedésével. |
CharFilterName
Meghatározza a keresőmotor által támogatott összes karakterszűrő nevét.
Name | Típus | Description |
---|---|---|
html_strip |
string |
Egy karakterszűrő, amely HTML-szerkezeteket próbál szétszedni. Lásd: https://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/charfilter/HTMLStripCharFilter.html |
CjkBigramTokenFilter
Forms standard tokenizerből létrehozott CJK-kifejezések bigramját. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.
Name | Típus | Alapértelmezett érték | Description |
---|---|---|---|
@odata.type |
string:
#Microsoft. |
Egy URI-töredék, amely megadja a tokenszűrő típusát. |
|
ignoreScripts |
A figyelmen kívül hagyandó szkriptek. |
||
name |
string |
A jogkivonatszűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet. |
|
outputUnigrams |
boolean |
False |
Egy érték, amely azt jelzi, hogy az egygrammot és a bigramot is ki kell-e adni (ha igaz), vagy csak bigramot (ha hamis). Az alapértelmezett érték a false (hamis). |
CjkBigramTokenFilterScripts
A CjkBigramTokenFilter által figyelmen kívül hagyható szkriptek.
Name | Típus | Description |
---|---|---|
han |
string |
A CJK-kifejezések bigramjainak létrehozásakor hagyja figyelmen kívül a Han-szkriptet. |
hangul |
string |
Hagyja figyelmen kívül a Hangul-szkriptet a CJK-kifejezések bigramjainak létrehozásakor. |
hiragana |
string |
Hagyja figyelmen kívül a Hiragana-szkriptet a CJK-kifejezések bigramjainak létrehozásakor. |
katakana |
string |
CJK-kifejezések bigramjainak létrehozásakor hagyja figyelmen kívül a Katakana-szkriptet. |
ClassicSimilarity
Örökölt hasonlósági algoritmus, amely a TF-IDF Lucene TFIDFSimilarity implementációját használja. A TF-IDF ezen változata statikus dokumentumhossz normalizálást vezet be, valamint koordinálja azokat a tényezőket, amelyek csak részben egyeznek a keresett lekérdezésekkel.
Name | Típus | Description |
---|---|---|
@odata.type |
string:
#Microsoft. |
ClassicTokenizer
Nyelvhelyességi alapú jogkivonat-szabályzó, amely alkalmas a legtöbb európai nyelvű dokumentum feldolgozására. Ez a jogkivonat-szabályzó az Apache Lucene használatával van implementálva.
Name | Típus | Alapértelmezett érték | Description |
---|---|---|---|
@odata.type |
string:
#Microsoft. |
Egy URI-töredék, amely a tokenizer típusát határozza meg. |
|
maxTokenLength |
integer |
255 |
A jogkivonat maximális hossza. Az alapértelmezett érték 255. A maximális hossznál hosszabb jogkivonatok fel vannak osztva. A maximálisan használható tokenhossz 300 karakter. |
name |
string |
A tokenizer neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet. |
CommonGramTokenFilter
Bigramokat hozhat létre az indexelés során gyakran előforduló kifejezésekhez. Az egyes kifejezések továbbra is indexelve vannak, és a bigramok túl vannak osztva. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.
Name | Típus | Alapértelmezett érték | Description |
---|---|---|---|
@odata.type |
string:
#Microsoft. |
Egy URI-töredék, amely megadja a tokenszűrő típusát. |
|
commonWords |
string[] |
A közös szavak halmaza. |
|
ignoreCase |
boolean |
False |
Egy érték, amely azt jelzi, hogy a közös szavak egyeztetése érzéketlen lesz-e a kis- és nagybetűk között. Az alapértelmezett érték a false (hamis). |
name |
string |
A jogkivonatszűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet. |
|
queryMode |
boolean |
False |
Egy érték, amely azt jelzi, hogy a jogkivonatszűrő lekérdezési módban van-e. Lekérdezési módban a jogkivonatszűrő bigramokat hoz létre, majd eltávolítja a közös szavakat és az egyszeres kifejezéseket, majd egy közös szót. Az alapértelmezett érték a false (hamis). |
CorsOptions
Meghatározza az indexek eltérő eredetű erőforrás-megosztásának (CORS) szabályozására szolgáló beállításokat.
Name | Típus | Description |
---|---|---|
allowedOrigins |
string[] |
Azoknak a forrásoknak a listája, amelyekből a JavaScript-kód hozzáférést kap az indexhez. A(z) {protocol}://{teljesen minősített-tartománynév}[:{port#}], illetve egyetlen "*" formátumú gazdagéplistát tartalmazhat az összes forrás engedélyezéséhez (nem ajánlott). |
maxAgeInSeconds |
integer |
Az az időtartam, amelyre a böngészőknek gyorsítótáraznia kell a CORS elővizsgálati válaszait. Alapértelmezés szerint 5 perc. |
CustomAnalyzer
Lehetővé teszi a szöveg indexelhető/kereshető jogkivonattá alakításának folyamatát. Ez egy felhasználó által definiált konfiguráció, amely egyetlen előre definiált tokenizerből és egy vagy több szűrőből áll. A jogkivonat-szabályzó feladata a szöveg jogkivonatokra törése, valamint a jogkivonat-szabályzó által kibocsátott jogkivonatok módosítására szolgáló szűrők.
Name | Típus | Description |
---|---|---|
@odata.type |
string:
#Microsoft. |
Az elemző típusát meghatározó URI-töredék. |
charFilters |
A bemeneti szöveg előkészítéséhez használt karakterszűrők listája, mielőtt a tokenizer feldolgozta volna. Lecserélhetnek például bizonyos karaktereket vagy szimbólumokat. A szűrők a lista sorrendjében futnak. |
|
name |
string |
Az elemző neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet. |
tokenFilters |
A tokenizáló által létrehozott jogkivonatok szűréséhez vagy módosításához használt jogkivonatszűrők listája. Megadhat például egy kisbetűs szűrőt, amely az összes karaktert kisbetűvé alakítja. A szűrők a lista sorrendjében futnak. |
|
tokenizer |
A jogkivonat-megosztó neve a folyamatos szöveg jogkivonatok sorozatára való felosztásához, például egy mondat szavakra töréséhez. |
CustomNormalizer
Lehetővé teszi a normalizálás konfigurálását szűrhető, rendezhető és táblázatos mezőkhöz, amelyek alapértelmezés szerint szigorú egyezéssel működnek. Ez egy felhasználó által definiált konfiguráció, amely legalább egy szűrőből áll, és módosítja a tárolt jogkivonatot.
Name | Típus | Description |
---|---|---|
@odata.type |
string:
#Microsoft. |
A normalizáló típusát meghatározó URI-töredék. |
charFilters |
A bemeneti szöveg feldolgozását megelőző előkészítéséhez használt karakterszűrők listája. Lecserélhetnek például bizonyos karaktereket vagy szimbólumokat. A szűrők a lista sorrendjében futnak. |
|
name |
string |
A normalizáló neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet. Nem végződhet ".microsoft" vagy ".lucene" végződéssel, és nem nevezhető "asciifolding", "standard", "kisbetűs", "nagybetűs" vagy "elision" névvel. |
tokenFilters |
A bemeneti jogkivonat szűréséhez vagy módosításához használt jogkivonatszűrők listája. Megadhat például egy kisbetűs szűrőt, amely az összes karaktert kisbetűssé alakítja. A szűrők a lista sorrendjében futnak. |
CustomVectorizer
Felhasználó által definiált vektorizálót ad meg a lekérdezési sztringek vektorbeágyazásának létrehozásához. A külső vektorizáló integrálása egy képességcsoport egyéni webes API-felületével érhető el.
Name | Típus | Description |
---|---|---|
customWebApiParameters |
A felhasználó által definiált vektorizáló tulajdonságait adja meg. |
|
kind |
string:
custom |
A vektoros kereséshez konfigurált vektorizálási módszer neve. |
name |
string |
Az adott vektorizációs metódushoz társítandó név. |
CustomWebApiParameters
Megadja a felhasználó által definiált vektorizálóhoz való csatlakozás tulajdonságait.
Name | Típus | Description |
---|---|---|
authIdentity | SearchIndexerDataIdentity: |
A kimenő kapcsolatokhoz használt, felhasználó által hozzárendelt felügyelt identitás. Ha authResourceId van megadva, és nincs megadva, a rendszer a rendszer által hozzárendelt felügyelt identitást használja. Ha az indexelő frissítései során az identitás nincs meghatározva, az érték változatlan marad. Ha a "nincs" értékre van állítva, a tulajdonság értéke törlődik. |
authResourceId |
string |
Olyan egyéni végpontokra vonatkozik, amelyek külső kódhoz csatlakoznak egy Azure-függvényben vagy más, átalakításokat biztosító alkalmazásban. Ennek az értéknek a függvényhez vagy alkalmazáshoz az Azure Active Directoryban való regisztrálásakor létrehozott alkalmazásazonosítónak kell lennie. Ha meg van adva, a vektorizáció a keresési szolgáltatás felügyelt azonosítójával (rendszer vagy felhasználó által hozzárendelt) és a függvény vagy alkalmazás hozzáférési jogkivonatával csatlakozik a függvényhez vagy alkalmazáshoz, és ezt az értéket használja erőforrás-azonosítóként a hozzáférési jogkivonat hatókörének létrehozásához. |
httpHeaders |
object |
A HTTP-kérés létrehozásához szükséges fejlécek. |
httpMethod |
string |
A HTTP-kérés metódusa. |
timeout |
string |
A kérés kívánt időtúllépése. Az alapértelmezett érték 30 másodperc. |
uri |
string |
A vektorizálót biztosító webes API URI-ja. |
DictionaryDecompounderTokenFilter
Felbontja a sok germán nyelven található összetett szavakat. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.
Name | Típus | Alapértelmezett érték | Description |
---|---|---|---|
@odata.type |
string:
#Microsoft. |
Egy URI-töredék, amely megadja a tokenszűrő típusát. |
|
maxSubwordSize |
integer |
15 |
A maximális alszóméret. Csak az ennél rövidebb alszavak lesznek kimenetben. Az alapértelmezett érték 15. A maximális érték 300. |
minSubwordSize |
integer |
2 |
A minimális alszóméret. Csak az ennél hosszabb alszavak lesznek kimenetben. Az alapértelmezett érték 2. A maximális érték 300. |
minWordSize |
integer |
5 |
A szavak minimális mérete. Csak az ennél hosszabb szavak lesznek feldolgozva. Az alapértelmezett érték 5. A maximális érték 300. |
name |
string |
A jogkivonatszűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet. |
|
onlyLongestMatch |
boolean |
False |
Egy érték, amely azt jelzi, hogy csak a leghosszabb egyező alszót szeretné-e hozzáadni a kimenethez. Az alapértelmezett érték a false (hamis). |
wordList |
string[] |
Azoknak a szavaknak a listája, |
DistanceScoringFunction
Olyan függvényt definiál, amely a földrajzi helytől való távolság alapján növeli a pontszámokat.
Name | Típus | Description |
---|---|---|
boost |
number |
A nyers pontszám szorzója. Pozitív számnak kell lennie, amely nem lehet 1,0. |
distance |
A távolságpontozási függvény paraméterértékei. |
|
fieldName |
string |
A pontozási függvény bemeneteként használt mező neve. |
interpolation |
Egy érték, amely azt jelzi, hogy a kiemelés hogyan lesz interpolálva a dokumentum pontszámai között; alapértelmezés szerint "Lineáris". |
|
type |
string:
distance |
A használni kívánt függvény típusát jelzi. Az érvényes értékek közé tartozik a magnitúdó, a frissesség, a távolság és a címke. A függvénytípusnak kisbetűsnek kell lennie. |
DistanceScoringParameters
Paraméterértékeket biztosít egy távolsági pontozási függvénynek.
Name | Típus | Description |
---|---|---|
boostingDistance |
number |
A távolság kilométerben attól a referenciahelytől, ahol a kiemelési tartomány véget ér. |
referencePointParameter |
string |
A keresési lekérdezésekben átadott paraméter neve a referenciahely megadásához. |
EdgeNGramTokenFilter
A megadott méret(ek) n-grammját hozza létre egy bemeneti jogkivonat elejétől vagy hátuljától kezdve. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.
Name | Típus | Alapértelmezett érték | Description |
---|---|---|---|
@odata.type |
string:
#Microsoft. |
Egy URI-töredék, amely megadja a tokenszűrő típusát. |
|
maxGram |
integer |
2 |
A maximális n-gram hossz. Az alapértelmezett érték 2. |
minGram |
integer |
1 |
Az n-gramm minimális hossza. Az alapértelmezett érték 1. A maxGram értékénél kisebbnek kell lennie. |
name |
string |
A jogkivonatszűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet. |
|
side | front |
Meghatározza, hogy az n-gram melyik oldaláról kell létrehozni az n-gramot. Az alapértelmezett érték az "előtér". |
EdgeNGramTokenFilterSide
Megadja, hogy a bemenet melyik oldaláról kell n-gramot létrehozni.
Name | Típus | Description |
---|---|---|
back |
string |
Megadja, hogy az n-gramot a bemenet hátoldaláról kell létrehozni. |
front |
string |
Megadja, hogy az n-gramot a bemenet elejéről kell létrehozni. |
EdgeNGramTokenFilterV2
A megadott méret(ek) n-grammját hozza létre egy bemeneti jogkivonat elejétől vagy hátuljától kezdve. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.
Name | Típus | Alapértelmezett érték | Description |
---|---|---|---|
@odata.type |
string:
#Microsoft. |
Egy URI-töredék, amely megadja a tokenszűrő típusát. |
|
maxGram |
integer |
2 |
A maximális n-gram hossz. Az alapértelmezett érték 2. A maximális érték 300. |
minGram |
integer |
1 |
Az n-gramm minimális hossza. Az alapértelmezett érték 1. A maximális érték 300. A maxGram értékénél kisebbnek kell lennie. |
name |
string |
A jogkivonatszűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet. |
|
side | front |
Meghatározza, hogy az n-gram melyik oldaláról kell létrehozni az n-gramot. Az alapértelmezett érték az "előtér". |
EdgeNGramTokenizer
Tokenizálja a bemenetet egy élről az adott méret(ek) n-grammjára. Ez a jogkivonat-szabályzó az Apache Lucene használatával van implementálva.
Name | Típus | Alapértelmezett érték | Description |
---|---|---|---|
@odata.type |
string:
#Microsoft. |
Egy URI-töredék, amely a tokenizer típusát határozza meg. |
|
maxGram |
integer |
2 |
A maximális n-gram hossz. Az alapértelmezett érték 2. A maximális érték 300. |
minGram |
integer |
1 |
Az n-gramm minimális hossza. Az alapértelmezett érték 1. A maximális érték 300. A maxGram értékénél kisebbnek kell lennie. |
name |
string |
A tokenizer neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet. |
|
tokenChars |
A tokenekben megtartandó karakterosztályok. |
ElisionTokenFilter
Eltávolítja az elisionokat. A "l'avion" (a sík) például "avion" (sík) lesz. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.
Name | Típus | Description |
---|---|---|
@odata.type |
string:
#Microsoft. |
Egy URI-töredék, amely megadja a tokenszűrő típusát. |
articles |
string[] |
Az eltávolítandó cikkek halmaza. |
name |
string |
A jogkivonatszűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet. |
ErrorAdditionalInfo
Az erőforrás-kezelési hiba további információi.
Name | Típus | Description |
---|---|---|
info |
object |
A további információk. |
type |
string |
A további adattípus. |
ErrorDetail
A hiba részletei.
Name | Típus | Description |
---|---|---|
additionalInfo |
A hiba további információi. |
|
code |
string |
A hibakód. |
details |
A hiba részletei. |
|
message |
string |
A hibaüzenet. |
target |
string |
A hiba célja. |
ErrorResponse
Hibaválasz
Name | Típus | Description |
---|---|---|
error |
A hibaobjektum. |
ExhaustiveKnnParameters
A teljes KNN-algoritmusra jellemző paramétereket tartalmazza.
Name | Típus | Description |
---|---|---|
metric |
A vektorok összehasonlításához használandó hasonlósági metrika. |
ExhaustiveKnnVectorSearchAlgorithmConfiguration
A lekérdezés során használt teljes KNN-algoritmusra vonatkozó konfigurációs beállításokat tartalmaz, amelyek találgatásos keresést hajtanak végre a teljes vektorindexben.
Name | Típus | Description |
---|---|---|
exhaustiveKnnParameters |
A teljes KNN-algoritmusra jellemző paramétereket tartalmazza. |
|
kind |
string:
exhaustive |
A vektorkereséshez konfigurált algoritmus neve. |
name |
string |
Az adott konfigurációhoz társítandó név. |
FreshnessScoringFunction
Olyan függvényt definiál, amely egy dátum-idő mező értéke alapján növeli a pontszámokat.
Name | Típus | Description |
---|---|---|
boost |
number |
A nyers pontszám szorzója. Pozitív számnak kell lennie, amely nem lehet 1,0. |
fieldName |
string |
A pontozási függvény bemeneteként használt mező neve. |
freshness |
A frissesség-pontozási függvény paraméterértékei. |
|
interpolation |
Egy érték, amely azt jelzi, hogy a kiemelés hogyan lesz interpolálva a dokumentum pontszámai között; alapértelmezés szerint "Lineáris". |
|
type |
string:
freshness |
A használni kívánt függvény típusát jelzi. Az érvényes értékek közé tartozik a magnitúdó, a frissesség, a távolság és a címke. A függvénytípusnak kisbetűsnek kell lennie. |
FreshnessScoringParameters
Paraméterértékeket biztosít egy frissesség-pontozási függvénynek.
Name | Típus | Description |
---|---|---|
boostingDuration |
string |
Az a lejárati idő, amely után a kiemelés leáll egy adott dokumentum esetében. |
HnswParameters
A HNSW algoritmusra jellemző paramétereket tartalmazza.
Name | Típus | Alapértelmezett érték | Description |
---|---|---|---|
efConstruction |
integer |
400 |
A legközelebbi szomszédokat tartalmazó dinamikus lista mérete, amelyet az indexidő során használnak. A paraméter növelése javíthatja az index minőségét a megnövekedett indexelési idő rovására. Egy bizonyos ponton ennek a paraméternek a növelése csökkenő visszatéréshez vezet. |
efSearch |
integer |
500 |
A legközelebbi szomszédokat tartalmazó dinamikus lista mérete, amelyet a keresési idő során használnak. A paraméter növelése javíthatja a keresési eredményeket a lassabb keresés rovására. Egy bizonyos ponton ennek a paraméternek a növelése csökkenő visszatéréshez vezet. |
m |
integer |
4 |
Az összes új elemhez létrehozott kétirányú kapcsolatok száma az építés során. A paraméter értékének növelése javíthatja a visszahívási időt, és csökkentheti a nagy belső dimenziójú adathalmazok lekérési idejét a megnövekedett memóriahasználat és a hosszabb indexelési idő rovására. |
metric |
A vektorok összehasonlításához használandó hasonlósági metrika. |
HnswVectorSearchAlgorithmConfiguration
Az indexelés és lekérdezés során használt HNSW közelítő szomszéd algoritmusra vonatkozó konfigurációs beállításokat tartalmaz. A HNSW algoritmus a keresési sebesség és a pontosság közötti kompromisszumot kínálja.
Name | Típus | Description |
---|---|---|
hnswParameters |
A HNSW-algoritmusra jellemző paramétereket tartalmazza. |
|
kind |
string:
hnsw |
A vektorkereséshez konfigurált algoritmus neve. |
name |
string |
Az adott konfigurációhoz társítandó név. |
InputFieldMappingEntry
Egy képesség bemeneti mezőleképezése.
Name | Típus | Description |
---|---|---|
inputs |
Az összetett típus létrehozásakor használt rekurzív bemenetek. |
|
name |
string |
A bemenet neve. |
source |
string |
A bemenet forrása. |
sourceContext |
string |
A rekurzív bemenetek kiválasztásához használt forráskörnyezet. |
KeepTokenFilter
Egy jogkivonatszűrő, amely csak a megadott szavak listájában lévő szöveggel rendelkező jogkivonatokat tárolja. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.
Name | Típus | Alapértelmezett érték | Description |
---|---|---|---|
@odata.type |
string:
#Microsoft. |
Egy URI-töredék, amely megadja a tokenszűrő típusát. |
|
keepWords |
string[] |
A megtartandó szavak listája. |
|
keepWordsCase |
boolean |
False |
Egy érték, amely azt jelzi, hogy az összes szót először kisbetűsre kell-e csökkenteni. Az alapértelmezett érték a false (hamis). |
name |
string |
A jogkivonatszűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet. |
KeywordMarkerTokenFilter
Kulcsszavakként jelöli meg a kifejezéseket. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.
Name | Típus | Alapértelmezett érték | Description |
---|---|---|---|
@odata.type |
string:
#Microsoft. |
Egy URI-töredék, amely megadja a tokenszűrő típusát. |
|
ignoreCase |
boolean |
False |
A kis- és nagybetűk figyelmen kívül hagyását jelző érték. Ha igaz, a rendszer először az összes szót kisbetűssé alakítja. Az alapértelmezett érték a false (hamis). |
keywords |
string[] |
Kulcsszavakként megjelölendő szavak listája. |
|
name |
string |
A jogkivonatszűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet. |
KeywordTokenizer
A teljes bemenetet egyetlen jogkivonatként bocsátja ki. Ez a jogkivonat-szabályzó az Apache Lucene használatával van implementálva.
Name | Típus | Alapértelmezett érték | Description |
---|---|---|---|
@odata.type |
string:
#Microsoft. |
Egy URI-töredék, amely a tokenizer típusát határozza meg. |
|
bufferSize |
integer |
256 |
Az olvasási puffer mérete bájtban. Az alapértelmezett érték 256. |
name |
string |
A tokenizer neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet. |
KeywordTokenizerV2
A teljes bemenetet egyetlen jogkivonatként bocsátja ki. Ez a jogkivonat-szabályzó az Apache Lucene használatával van implementálva.
Name | Típus | Alapértelmezett érték | Description |
---|---|---|---|
@odata.type |
string:
#Microsoft. |
Egy URI-töredék, amely a tokenizer típusát határozza meg. |
|
maxTokenLength |
integer |
256 |
A jogkivonat maximális hossza. Az alapértelmezett érték 256. A maximális hossznál hosszabb jogkivonatok fel vannak osztva. A maximálisan használható tokenhossz 300 karakter. |
name |
string |
A tokenizer neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet. |
LengthTokenFilter
Eltávolítja a túl hosszú vagy túl rövid szavakat. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.
Name | Típus | Alapértelmezett érték | Description |
---|---|---|---|
@odata.type |
string:
#Microsoft. |
Egy URI-töredék, amely megadja a tokenszűrő típusát. |
|
max |
integer |
300 |
A karakterek maximális hossza. Az alapértelmezett és a maximális érték 300. |
min |
integer |
0 |
A karakterek minimális hossza. Az alapértelmezett érték a 0. A maximális érték 300. A maximális értéknél kisebbnek kell lennie. |
name |
string |
A jogkivonatszűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet. |
LexicalAnalyzerName
Meghatározza a keresőmotor által támogatott összes szövegelemző nevét.
Name | Típus | Description |
---|---|---|
ar.lucene |
string |
Lucene analyzer arab nyelven. |
ar.microsoft |
string |
Microsoft Analyzer arab nyelven. |
bg.lucene |
string |
Lucene-elemző bolgárnak. |
bg.microsoft |
string |
Microsoft analyzer for Bolgár. |
bn.microsoft |
string |
A Bangla Microsoft-elemzője. |
ca.lucene |
string |
Lucene elemző katalánnak. |
ca.microsoft |
string |
A Microsoft elemzője katalán nyelven. |
cs.lucene |
string |
Lucene elemző csehnek. |
cs.microsoft |
string |
A Microsoft elemzője csehül. |
da.lucene |
string |
Lucene analyzer dánnak. |
da.microsoft |
string |
Microsoft analyzer dán nyelven. |
de.lucene |
string |
Lucene-elemző németül. |
de.microsoft |
string |
Microsoft analyzer német nyelven. |
el.lucene |
string |
Lucene elemző göröghöz. |
el.microsoft |
string |
Microsoft Analyzer görög nyelven. |
en.lucene |
string |
Lucene analyzer angol nyelven. |
en.microsoft |
string |
Microsoft Analyzer angol nyelven. |
es.lucene |
string |
Lucene elemző spanyolul. |
es.microsoft |
string |
Microsoft Analyzer spanyol nyelven. |
et.microsoft |
string |
Microsoft analyzer az észtekhez. |
eu.lucene |
string |
Lucene-elemző Baszknak. |
fa.lucene |
string |
Lucene elemző perzsa. |
fi.lucene |
string |
Lucene analyzer finnhez. |
fi.microsoft |
string |
Microsoft analyzer for Finn. |
fr.lucene |
string |
Lucene elemző francia nyelvre. |
fr.microsoft |
string |
Microsoft analyzer francia nyelven. |
ga.lucene |
string |
Lucene-elemző írnek. |
gl.lucene |
string |
Lucene-elemző a galíciaiaknak. |
gu.microsoft |
string |
Microsoft analyzer for Gujarati. |
he.microsoft |
string |
Microsoft Analyzer héber nyelven. |
hi.lucene |
string |
Lucene elemző hindinek. |
hi.microsoft |
string |
Microsoft analyzer for Hindi. |
hr.microsoft |
string |
Microsoft analyzer for Horvát. |
hu.lucene |
string |
Lucene-elemző magyarra. |
hu.microsoft |
string |
Microsoft-elemző magyar nyelven. |
hy.lucene |
string |
Lucene-elemző örménynek. |
id.lucene |
string |
Lucene analyzer indonéz. |
id.microsoft |
string |
Indonéz Microsoft-elemző (Bahasa). |
is.microsoft |
string |
Izlandi Microsoft-elemző. |
it.lucene |
string |
Lucene elemző olasznak. |
it.microsoft |
string |
Microsoft Analyzer olasz nyelven. |
ja.lucene |
string |
Lucene-elemző japánhoz. |
ja.microsoft |
string |
Microsoft analyzer japán nyelven. |
keyword |
string |
A mező teljes tartalmát egyetlen jogkivonatként kezeli. Ez olyan adatok esetében hasznos, mint az irányítószámok, az azonosítók és egyes terméknevek. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/KeywordAnalyzer.html |
kn.microsoft |
string |
A Kannada Microsoft-elemzője. |
ko.lucene |
string |
Lucene elemző koreaihoz. |
ko.microsoft |
string |
Microsoft-elemző koreaihoz. |
lt.microsoft |
string |
Microsoft-elemző litvánhoz. |
lv.lucene |
string |
Lucene-elemző lettnek. |
lv.microsoft |
string |
Microsoft Analyzer lett nyelvhez. |
ml.microsoft |
string |
Microsoft analyzer for Malayalam. |
mr.microsoft |
string |
Microsoft analyzer for Marathi. |
ms.microsoft |
string |
Microsoft-elemző malájhoz (latin betűs). |
nb.microsoft |
string |
Microsoft analyzer for Norwegian (Bokmål). |
nl.lucene |
string |
Lucene analyzer hollandra. |
nl.microsoft |
string |
Microsoft Analyzer holland nyelven. |
no.lucene |
string |
Lucene-elemző norvégra. |
pa.microsoft |
string |
Microsoft analyzer for Punjabi. |
pattern |
string |
A szöveget rugalmasan elválasztja a kifejezések között egy reguláris kifejezésmintán keresztül. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/PatternAnalyzer.html |
pl.lucene |
string |
Lucene-elemző a lengyelhez. |
pl.microsoft |
string |
Microsoft Analyzer lengyel nyelven. |
pt-BR.lucene |
string |
Lucene analyzer portugál (Brazília). |
pt-BR.microsoft |
string |
Microsoft analyzer for Portuguese (Brazília). |
pt-PT.lucene |
string |
Lucene analyzer portugál (Portugália) számára. |
pt-PT.microsoft |
string |
Microsoft analyzer for Portuguese (Portugália). |
ro.lucene |
string |
Lucene analyzer románra. |
ro.microsoft |
string |
Microsoft Analyzer román nyelven. |
ru.lucene |
string |
Lucene elemző orosznak. |
ru.microsoft |
string |
Microsoft analyzer orosz nyelven. |
simple |
string |
Nem betűkre osztja a szöveget, és kisbetűssé alakítja őket. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/SimpleAnalyzer.html |
sk.microsoft |
string |
Microsoft analyzer for Szlovák. |
sl.microsoft |
string |
Microsoft analyzer szlovén nyelven. |
sr-cyrillic.microsoft |
string |
Microsoft analyzer for Szerb (cirill betűs). |
sr-latin.microsoft |
string |
Microsoft Analyzer szerb (latin betűs) nyelven. |
standard.lucene |
string |
Standard Lucene-elemző. |
standardasciifolding.lucene |
string |
Standard ASCII folding Lucene analyzer. Lásd: https://docs.microsoft.com/rest/api/searchservice/Custom-analyzers-in-Azure-Search#Analyzers |
stop |
string |
A szöveget nem betűkkel osztja el; Alkalmazza a kisbetűs és a stopword jogkivonat szűrőit. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/StopAnalyzer.html |
sv.lucene |
string |
Lucene-elemző svédnek. |
sv.microsoft |
string |
Microsoft analyzer for Svéd. |
ta.microsoft |
string |
Microsoft analyzer for Tamil. |
te.microsoft |
string |
Microsoft analyzer for Telugu. |
th.lucene |
string |
Lucene elemző thai nyelvhez. |
th.microsoft |
string |
Microsoft Analyzer thai nyelven. |
tr.lucene |
string |
Lucene-elemző töröknek. |
tr.microsoft |
string |
Microsoft analyzer for Török. |
uk.microsoft |
string |
Microsoft Analyzer ukrán nyelven. |
ur.microsoft |
string |
Microsoft analyzer for Urdu. |
vi.microsoft |
string |
A Vietnami Microsoft-elemző. |
whitespace |
string |
A whitespace tokenizert használó elemző. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/WhitespaceAnalyzer.html |
zh-Hans.lucene |
string |
Lucene analyzer kínaihoz (egyszerűsített). |
zh-Hans.microsoft |
string |
Microsoft Analyzer kínaihoz (egyszerűsített). |
zh-Hant.lucene |
string |
Lucene analyzer kínaihoz (hagyományos). |
zh-Hant.microsoft |
string |
Microsoft Analyzer kínaihoz (hagyományos). |
LexicalNormalizerName
Meghatározza a keresőmotor által támogatott összes szöveg normalizálójának nevét.
Name | Típus | Description |
---|---|---|
asciifolding |
string |
Az első 127 ASCII-karakterben nem szereplő unicode-karaktereket (az "Egyszerű latin" Unicode-blokkot) ASCII-ekvivalenssé alakítja át, ha léteznek ilyen megfelelők. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/ASCIIFoldingFilter.html |
elision |
string |
Eltávolítja az elisionokat. A "l'avion" (a sík) például "avion" (sík) lesz. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/util/ElisionFilter.html |
lowercase |
string |
A jogkivonat szövegének normalizálása kisbetűssé. Lásd: https://lucene.apache.org/core/6_6_1/analyzers-common/org/apache/lucene/analysis/core/LowerCaseFilter.html |
standard |
string |
Standard normalizáló, amely kisbetűkből és asciifoldingból áll. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/reverse/ReverseStringFilter.html |
uppercase |
string |
A jogkivonat szövegének nagybetűsre normalizálása. Lásd: https://lucene.apache.org/core/6_6_1/analyzers-common/org/apache/lucene/analysis/core/UpperCaseFilter.html |
LexicalTokenizerName
Meghatározza a keresőmotor által támogatott összes tokenizer nevét.
Name | Típus | Description |
---|---|---|
classic |
string |
Nyelvhelyességi alapú jogkivonat-szabályzó, amely alkalmas a legtöbb európai nyelvű dokumentum feldolgozására. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/standard/ClassicTokenizer.html |
edgeNGram |
string |
Tokenizálja a bemenetet egy élről az adott méret(ek) n-grammjára. Lásd: https://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/ngram/EdgeNGramTokenizer.html |
keyword_v2 |
string |
A teljes bemenetet egyetlen jogkivonatként bocsátja ki. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/KeywordTokenizer.html |
letter |
string |
A szöveget nem betűkkel osztja el. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/LetterTokenizer.html |
lowercase |
string |
Nem betűkre osztja a szöveget, és kisbetűssé alakítja őket. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/LowerCaseTokenizer.html |
microsoft_language_stemming_tokenizer |
string |
Nyelvspecifikus szabályokkal osztja el a szöveget, és csökkenti a szavak alapformáit. |
microsoft_language_tokenizer |
string |
Nyelvspecifikus szabályokkal osztja el a szöveget. |
nGram |
string |
Tokenizálja a bemenetet az adott méret(ek) n-grammjára. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/ngram/NGramTokenizer.html |
path_hierarchy_v2 |
string |
Tokenizer elérésiút-szerű hierarchiákhoz. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/path/PathHierarchyTokenizer.html |
pattern |
string |
Tokenizer, amely regex mintaegyeztetést használ a különböző tokenek létrehozásához. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/pattern/PatternTokenizer.html |
standard_v2 |
string |
Standard Lucene-elemző; A standard tokenizerből, kisbetűs szűrőből és leállításszűrőből áll. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/standard/StandardTokenizer.html |
uax_url_email |
string |
Tokenizálja az URL-címeket és az e-maileket egy jogkivonatként. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/standard/UAX29URLEmailTokenizer.html |
whitespace |
string |
Elosztja a szöveget a szóközök között. Lásd: http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/WhitespaceTokenizer.html |
LimitTokenFilter
Korlátozza a tokenek számát az indexelés során. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.
Name | Típus | Alapértelmezett érték | Description |
---|---|---|---|
@odata.type |
string:
#Microsoft. |
Egy URI-töredék, amely megadja a tokenszűrő típusát. |
|
consumeAllTokens |
boolean |
False |
Egy érték, amely azt jelzi, hogy a bemenetből származó összes jogkivonatot fel kell-e használni akkor is, ha eléri a maxTokenCount értéket. Az alapértelmezett érték a false (hamis). |
maxTokenCount |
integer |
1 |
A létrehozandó jogkivonatok maximális száma. Az alapértelmezett érték 1. |
name |
string |
A jogkivonatszűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet. |
LuceneStandardAnalyzer
Standard Apache Lucene-elemző; A standard tokenizerből, kisbetűs szűrőből és leállításszűrőből áll.
Name | Típus | Alapértelmezett érték | Description |
---|---|---|---|
@odata.type |
string:
#Microsoft. |
Az elemző típusát meghatározó URI-töredék. |
|
maxTokenLength |
integer |
255 |
A jogkivonat maximális hossza. Az alapértelmezett érték 255. A maximális hossznál hosszabb jogkivonatok fel vannak osztva. A maximálisan használható tokenhossz 300 karakter. |
name |
string |
Az elemző neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet. |
|
stopwords |
string[] |
A stopszavak listája. |
LuceneStandardTokenizer
A Unicode-szöveg szegmentálási szabályai szerint töri a szöveget. Ez a jogkivonat-szabályzó az Apache Lucene használatával van implementálva.
Name | Típus | Alapértelmezett érték | Description |
---|---|---|---|
@odata.type |
string:
#Microsoft. |
Egy URI-töredék, amely a tokenizer típusát határozza meg. |
|
maxTokenLength |
integer |
255 |
A jogkivonat maximális hossza. Az alapértelmezett érték 255. A maximális hossznál hosszabb jogkivonatok fel vannak osztva. |
name |
string |
A tokenizer neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet. |
LuceneStandardTokenizerV2
A Unicode-szöveg szegmentálási szabályai szerint töri a szöveget. Ez a jogkivonat-szabályzó az Apache Lucene használatával van implementálva.
Name | Típus | Alapértelmezett érték | Description |
---|---|---|---|
@odata.type |
string:
#Microsoft. |
Egy URI-töredék, amely a tokenizer típusát határozza meg. |
|
maxTokenLength |
integer |
255 |
A jogkivonat maximális hossza. Az alapértelmezett érték 255. A maximális hossznál hosszabb jogkivonatok fel vannak osztva. A maximálisan használható tokenhossz 300 karakter. |
name |
string |
A tokenizer neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet. |
MagnitudeScoringFunction
Olyan függvényt definiál, amely egy numerikus mező nagysága alapján növeli a pontszámokat.
Name | Típus | Description |
---|---|---|
boost |
number |
A nyers pontszám szorzója. Pozitív számnak kell lennie, amely nem lehet 1,0. |
fieldName |
string |
A pontozási függvény bemeneteként használt mező neve. |
interpolation |
Egy érték, amely azt jelzi, hogy a kiemelés hogyan lesz interpolálva a dokumentum pontszámai között; alapértelmezés szerint "Lineáris". |
|
magnitude |
A magnitúdópontozási függvény paraméterértékei. |
|
type |
string:
magnitude |
A használni kívánt függvény típusát jelzi. Az érvényes értékek közé tartozik a magnitúdó, a frissesség, a távolság és a címke. A függvénytípusnak kisbetűsnek kell lennie. |
MagnitudeScoringParameters
Paraméterértékeket biztosít egy nagyságrendi pontozó függvénynek.
Name | Típus | Description |
---|---|---|
boostingRangeEnd |
number |
Az a mezőérték, amelynél a kiemelés véget ér. |
boostingRangeStart |
number |
Az a mezőérték, amelynél a kiemelés kezdődik. |
constantBoostBeyondRange |
boolean |
Egy érték, amely azt jelzi, hogy a tartomány végértékét meghaladó mezőértékek esetében állandó lökést kell-e alkalmazni; az alapértelmezett érték hamis. |
MappingCharFilter
Karakterszűrő, amely a leképezési beállítással definiált leképezéseket alkalmazza. A megfeleltetés kapzsi (a leghosszabb mintaegyeztetés egy adott ponton nyer). A csere lehet üres sztring. Ez a karakterszűrő az Apache Lucene használatával van implementálva.
Name | Típus | Description |
---|---|---|
@odata.type |
string:
#Microsoft. |
A karakterszűrő típusát meghatározó URI-töredék. |
mappings |
string[] |
A következő formátumú leképezések listája: "a=>b" (az "a" karakter minden előfordulása a "b" karakterrel lesz helyettesítve). |
name |
string |
A karakterszűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet. |
MicrosoftLanguageStemmingTokenizer
Nyelvspecifikus szabályokkal osztja el a szöveget, és csökkenti a szavak alapformáit.
Name | Típus | Alapértelmezett érték | Description |
---|---|---|---|
@odata.type |
string:
#Microsoft. |
Egy URI-töredék, amely a tokenizer típusát határozza meg. |
|
isSearchTokenizer |
boolean |
False |
A tokenizer használatát jelző érték. Állítsa igaz értékre, ha keresési jogkivonat-szabályzóként használják, állítsa hamis értékre, ha indexelő jogkivonat-szabályzóként használják. Az alapértelmezett érték a false (hamis). |
language |
A használni kívánt nyelv. Az alapértelmezett érték az angol. |
||
maxTokenLength |
integer |
255 |
A jogkivonat maximális hossza. A maximális hossznál hosszabb jogkivonatok fel vannak osztva. A használható jogkivonatok maximális hossza 300 karakter. A 300 karakternél hosszabb jogkivonatok először 300 hosszúságú jogkivonatokra lesznek felosztva, majd az egyes jogkivonatok felosztása a jogkivonatok maximális hosszának beállítása alapján történik. Az alapértelmezett érték 255. |
name |
string |
A tokenizer neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet. |
MicrosoftLanguageTokenizer
Nyelvspecifikus szabályokkal osztja el a szöveget.
Name | Típus | Alapértelmezett érték | Description |
---|---|---|---|
@odata.type |
string:
#Microsoft. |
Egy URI-töredék, amely a tokenizer típusát határozza meg. |
|
isSearchTokenizer |
boolean |
False |
A tokenizer használatát jelző érték. Állítsa igaz értékre, ha keresési jogkivonat-szabályzóként használják, állítsa hamis értékre, ha indexelő jogkivonat-szabályzóként használják. Az alapértelmezett érték a false (hamis). |
language |
A használni kívánt nyelv. Az alapértelmezett érték az angol. |
||
maxTokenLength |
integer |
255 |
A jogkivonat maximális hossza. A maximális hossznál hosszabb jogkivonatok fel vannak osztva. A használható jogkivonatok maximális hossza 300 karakter. A 300 karakternél hosszabb jogkivonatok először 300 hosszúságú jogkivonatokra lesznek felosztva, majd az egyes jogkivonatok felosztása a jogkivonatok maximális hosszának beállítása alapján történik. Az alapértelmezett érték 255. |
name |
string |
A tokenizer neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet. |
MicrosoftStemmingTokenizerLanguage
Listák a Microsoft-nyelv által támogatott nyelveket, amely a jogkivonat-szabályzóból származik.
Name | Típus | Description |
---|---|---|
arabic |
string |
Kiválasztja a Microsoft-alapú jogkivonat-jelölőt arab nyelven. |
bangla |
string |
A Bangla microsoftos jogkivonat-jelölőjének kiválasztása. |
bulgarian |
string |
Kiválasztja a microsoftos jogkivonat-jelölőt a bolgár nyelvhez. |
catalan |
string |
Kiválasztja a Microsoft-alapú jogkivonat-jelölőt katalán nyelven. |
croatian |
string |
Kiválasztja a Microsoft-alapú jogkivonat-jelölőt a horvát nyelvhez. |
czech |
string |
Kiválasztja a Microsoft-alapú jogkivonat-kezelőt a csehhez. |
danish |
string |
Kiválasztja a Microsoft-alapú jogkivonat-jelölőt dán nyelven. |
dutch |
string |
Kiválasztja a Microsoft-alapú jogkivonat-kezelőt a holland nyelvhez. |
english |
string |
Kiválasztja a Microsoft-alapú jogkivonat-kezelőt angol nyelven. |
estonian |
string |
Kiválasztja az észt microsoftos jogkivonat-kezelőt. |
finnish |
string |
Kiválasztja a microsoftos jogkivonat-kezelőt a finn nyelvhez. |
french |
string |
Kiválasztja a Microsoft-alapú jogkivonat-jelölőt francia nyelven. |
german |
string |
A microsoftos jogkivonat-jelölőt választja a német nyelvhez. |
greek |
string |
Kiválasztja a Microsoft-alapú jogkivonat-kezelőt a göröghöz. |
gujarati |
string |
A Gujarati microsoftos jogkivonat-kezelőjének kiválasztása. |
hebrew |
string |
Kiválasztja a Microsoft-alapú jogkivonat-jelölőt héberül. |
hindi |
string |
Kiválasztja a Hindihez tartozó Microsoft-jogkivonat-jelölőt. |
hungarian |
string |
Kiválasztja a Microsoft-alapú jogkivonat-kezelőt magyar nyelven. |
icelandic |
string |
Kiválasztja az izlandi Microsoft-jogkivonat-jelölőt. |
indonesian |
string |
Kiválasztja az indonéz Microsoft-alapú jogkivonat-kezelőt. |
italian |
string |
Kiválasztja az olasz microsoftos jogkivonat-kezelőt. |
kannada |
string |
A Kannada microsoftos jogkivonat-jelölőjének kiválasztása. |
latvian |
string |
A Letthöz tartozó Microsoft-jogkivonat-jelölő kiválasztása. |
lithuanian |
string |
Kiválasztja a microsoftos jogkivonat-jelölőt a litvánhoz. |
malay |
string |
Kiválasztja a Malájhoz tartozó Microsoft-jogkivonat-kezelőt. |
malayalam |
string |
Kiválasztja a Malayalamhoz tartozó Microsoft-jogkivonat-jelölőt. |
marathi |
string |
Kiválasztja a Marathihoz tartozó Microsoft-jogkivonat-jelölőt. |
norwegianBokmaal |
string |
Kiválasztja a Microsoft stemming tokenizer for Norwegian (Bokmål) elemét. |
polish |
string |
Kiválasztja a Microsoft-alapú jogkivonat-jelölőt a lengyelhez. |
portuguese |
string |
Kiválasztja a microsoftos jogkivonat-jelölőt portugálul. |
portugueseBrazilian |
string |
Kiválasztja a Portugál (Brazília) microsoftos jogkivonat-jelölőt. |
punjabi |
string |
Kiválasztja a Punjabihoz tartozó Microsoft-jogkivonat-jelölőt. |
romanian |
string |
Kiválasztja a Microsoft-alapú jogkivonat-jelölőt a román nyelvhez. |
russian |
string |
Kiválasztja a Microsoft által létrehozott jogkivonat-jelölőt orosz nyelven. |
serbianCyrillic |
string |
A Szerb (cirill betűs) microsoftos jogkivonat-jelölőt választja ki. |
serbianLatin |
string |
Kiválasztja a Microsoft-alapú jogkivonat-jelölőt szerb (latin) nyelven. |
slovak |
string |
Kiválasztja a Microsoft-alapú jogkivonat-jelölőt a szlovák nyelvhez. |
slovenian |
string |
Kiválasztja a microsoftos jogkivonat-jelölőt a szlovénhez. |
spanish |
string |
Kiválasztja a Microsoft-alapú jogkivonat-kezelőt spanyol nyelven. |
swedish |
string |
Kiválasztja a microsoftos jogkivonat-kezelőt svéd nyelven. |
tamil |
string |
Kiválasztja a Microsoft által létrehozott jogkivonat-jelölőt a Tamilhez. |
telugu |
string |
Kiválasztja a TeluguHoz tartozó Microsoft-jogkivonat-jelölőt. |
turkish |
string |
Kiválasztja a Törökhöz tartozó Microsoft-jogkivonat-jelölőt. |
ukrainian |
string |
Kiválasztja az ukrán microsoftos jogkivonat-kezelőt. |
urdu |
string |
Kiválasztja a Microsoft-alapú jogkivonat-jelölőt az Urduhoz. |
MicrosoftTokenizerLanguage
Listák a Microsoft nyelvi tokenizer által támogatott nyelveket.
Name | Típus | Description |
---|---|---|
bangla |
string |
A Bangla Microsoft-jogkivonat-jelölőjének kiválasztása. |
bulgarian |
string |
Kiválasztja a Bolgár Microsoft-jogkivonat-jelölőt. |
catalan |
string |
Kiválasztja a Microsoft-jogkivonat-jelölőt a katalánhoz. |
chineseSimplified |
string |
Kiválasztja a Microsoft-jogkivonat-készítőt a kínaihoz (egyszerűsített). |
chineseTraditional |
string |
Kiválasztja a Kínai (hagyományos) Microsoft-jogkivonat-jelölőt. |
croatian |
string |
Kiválasztja a Microsoft-jogkivonat-jelölőt a horváthoz. |
czech |
string |
Kiválasztja a Microsoft-jogkivonat-jelölőt a csehhez. |
danish |
string |
Kiválasztja a Microsoft-jogkivonat-jelölőt dán nyelven. |
dutch |
string |
Kiválasztja a Microsoft holland jogkivonat-jelölőt. |
english |
string |
A Microsoft angol jogkivonat-jelölőjének kiválasztása. |
french |
string |
Kiválasztja a Microsoft-jogkivonat-jelölőt francia nyelven. |
german |
string |
Kiválasztja a Microsoft-jogkivonat-jelölőt a német nyelvhez. |
greek |
string |
Kiválasztja a Microsoft-jogkivonat-jelölőt a göröghöz. |
gujarati |
string |
Kiválasztja a Microsoft-jogkivonat-jelölőt Gujaratihoz. |
hindi |
string |
Kiválasztja a Hindihez készült Microsoft-jogkivonat-jelölőt. |
icelandic |
string |
Kiválasztja az izlandi Microsoft-jogkivonat-jelölőt. |
indonesian |
string |
Kiválasztja az indonéz Microsoft-jogkivonat-jelölőt. |
italian |
string |
Kiválasztja az olasz Microsoft-jogkivonat-jelölőt. |
japanese |
string |
Kiválasztja a Japánhoz készült Microsoft-jogkivonat-jelölőt. |
kannada |
string |
A Kannada Microsoft-jogkivonat-jelölőjének kiválasztása. |
korean |
string |
Kiválasztja a Koreai Microsoft-jogkivonat-jelölőt. |
malay |
string |
Kiválasztja a Microsoft-jogkivonat-jelölőt malájhoz. |
malayalam |
string |
Kiválasztja a Microsoft-jogkivonat-jelölőt a Malayalamhoz. |
marathi |
string |
Kiválasztja a Marathihoz készült Microsoft-jogkivonat-jelölőt. |
norwegianBokmaal |
string |
Kiválasztja a Microsoft tokenizert a norvég (Bokmål) számára. |
polish |
string |
Kiválasztja a Microsoft-jogkivonat-jelölőt a lengyelhez. |
portuguese |
string |
Kiválasztja a Microsoft-jogkivonat-jelölőt portugálul. |
portugueseBrazilian |
string |
Kiválasztja a Microsoft-jogkivonat-jelölőt portugál (Brazília) nyelvhez. |
punjabi |
string |
Kiválasztja a Punjabihoz tartozó Microsoft-jogkivonat-jelölőt. |
romanian |
string |
Kiválasztja a Microsoft-jogkivonat-jelölőt a román nyelvhez. |
russian |
string |
Kiválasztja a Microsoft-jogkivonat-jelölőt orosz nyelven. |
serbianCyrillic |
string |
A Szerb (cirill betűs) Microsoft-jogkivonat-jelölőt választja ki. |
serbianLatin |
string |
Kiválasztja a Microsoft tokenizert szerb (latin) nyelven. |
slovenian |
string |
Kiválasztja a szlovén Microsoft-jogkivonat-jelölőt. |
spanish |
string |
Kiválasztja a Microsoft-jogkivonat-jelölőt spanyolul. |
swedish |
string |
Kiválasztja a Svéd Microsoft-jogkivonat-jelölőt. |
tamil |
string |
Kiválasztja a Microsoft-jogkivonat-jelölőt a Tamilhez. |
telugu |
string |
Kiválasztja a Teluguhoz készült Microsoft-jogkivonat-jelölőt. |
thai |
string |
Kiválasztja a Microsoft-jogkivonat-kezelőt thai nyelven. |
ukrainian |
string |
Kiválasztja az ukrán Microsoft-jogkivonat-jelölőt. |
urdu |
string |
Kiválasztja az Urduhoz tartozó Microsoft-jogkivonat-jelölőt. |
vietnamese |
string |
Kiválasztja a Vietnami Microsoft-jogkivonat-jelölőt. |
NGramTokenFilter
A megadott méret(ek) n-grammját hozza létre. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.
Name | Típus | Alapértelmezett érték | Description |
---|---|---|---|
@odata.type |
string:
#Microsoft. |
Egy URI-töredék, amely megadja a tokenszűrő típusát. |
|
maxGram |
integer |
2 |
A maximális n-gram hossz. Az alapértelmezett érték 2. |
minGram |
integer |
1 |
Az n-gramm minimális hossza. Az alapértelmezett érték 1. A maxGram értékénél kisebbnek kell lennie. |
name |
string |
A jogkivonatszűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet. |
NGramTokenFilterV2
A megadott méret(ek) n-grammját hozza létre. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.
Name | Típus | Alapértelmezett érték | Description |
---|---|---|---|
@odata.type |
string:
#Microsoft. |
Egy URI-töredék, amely megadja a tokenszűrő típusát. |
|
maxGram |
integer |
2 |
A maximális n-gram hossz. Az alapértelmezett érték 2. A maximális érték 300. |
minGram |
integer |
1 |
Az n-gramm minimális hossza. Az alapértelmezett érték 1. A maximális érték 300. A maxGram értékénél kisebbnek kell lennie. |
name |
string |
A jogkivonatszűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet. |
NGramTokenizer
Tokenizálja a bemenetet az adott méret(ek) n-grammjára. Ez a jogkivonat-szabályzó az Apache Lucene használatával van implementálva.
Name | Típus | Alapértelmezett érték | Description |
---|---|---|---|
@odata.type |
string:
#Microsoft. |
Egy URI-töredék, amely a tokenizer típusát határozza meg. |
|
maxGram |
integer |
2 |
A maximális n-gram hossz. Az alapértelmezett érték 2. A maximális érték 300. |
minGram |
integer |
1 |
Az n-gramm minimális hossza. Az alapértelmezett érték 1. A maximális érték 300. A maxGram értékénél kisebbnek kell lennie. |
name |
string |
A tokenizer neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet. |
|
tokenChars |
A tokenekben megtartandó karakterosztályok. |
OutputFieldMappingEntry
Egy képesség kimeneti mezőleképezése.
Name | Típus | Description |
---|---|---|
name |
string |
A képesség által definiált kimenet neve. |
targetName |
string |
A kimenet célneve. A név megadása nem kötelező, és alapértelmezés szerint a név megadása kötelező. |
PathHierarchyTokenizerV2
Tokenizer elérésiút-szerű hierarchiákhoz. Ez a jogkivonat-szabályzó az Apache Lucene használatával van implementálva.
Name | Típus | Alapértelmezett érték | Description |
---|---|---|---|
@odata.type |
string:
#Microsoft. |
Egy URI-töredék, amely a tokenizer típusát határozza meg. |
|
delimiter |
string |
/ |
A használni kívánt elválasztó karakter. Az alapértelmezett érték a "/". |
maxTokenLength |
integer |
300 |
A jogkivonat maximális hossza. Az alapértelmezett és a maximális érték 300. |
name |
string |
A tokenizer neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet. |
|
replacement |
string |
/ |
Egy érték, amely ha be van állítva, lecseréli a határoló karaktert. Az alapértelmezett érték a "/". |
reverse |
boolean |
False |
Egy érték, amely azt jelzi, hogy fordított sorrendben kell-e létrehozni a jogkivonatokat. Az alapértelmezett érték a false (hamis). |
skip |
integer |
0 |
A kihagyandó kezdeti tokenek száma. Az alapértelmezett érték a 0. |
PatternAnalyzer
A szöveget rugalmasan elválasztja a kifejezések között egy reguláris kifejezésmintán keresztül. Ez az elemző az Apache Lucene használatával van implementálva.
Name | Típus | Alapértelmezett érték | Description |
---|---|---|---|
@odata.type |
string:
#Microsoft. |
Az elemző típusát meghatározó URI-töredék. |
|
flags |
Reguláris kifejezésjelölők. |
||
lowercase |
boolean |
True |
Érték, amely azt jelzi, hogy a kifejezések kisbetűsek-e. Alapértelmezett érték: true (igaz). |
name |
string |
Az elemző neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet. |
|
pattern |
string |
\W+ |
Normál kifejezésminta a tokenelválasztókhoz. Az alapértelmezett kifejezés egy vagy több nem szó karakternek megfelelő kifejezés. |
stopwords |
string[] |
A stopszavak listája. |
PatternCaptureTokenFilter
Java-regexek használatával több jogkivonatot bocsát ki – egyet minden rögzítési csoporthoz egy vagy több mintában. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.
Name | Típus | Alapértelmezett érték | Description |
---|---|---|---|
@odata.type |
string:
#Microsoft. |
A tokenszűrő típusát meghatározó URI-töredék. |
|
name |
string |
A jogkivonatszűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet. |
|
patterns |
string[] |
Az egyes tokenekhez illeszkedő minták listája. |
|
preserveOriginal |
boolean |
True |
Egy érték, amely azt jelzi, hogy az eredeti jogkivonatot akkor is vissza kell-e adni, ha az egyik minta megegyezik. Alapértelmezett érték: true (igaz). |
PatternReplaceCharFilter
Karakterszűrő, amely lecseréli a bemeneti sztringben szereplő karaktereket. Egy reguláris kifejezéssel azonosítja a megőrizni kívánt karaktersorozatokat, a lecserélendő karaktereket pedig helyettesítő mintával azonosítja. Ha például az "aa bb aa bb", a "(aa)\s+(bb)" minta és az "$1#$2" helyettesítő szöveg szerepel, az eredmény "aa#bb aa#bb". Ez a karakterszűrő az Apache Lucene használatával van implementálva.
Name | Típus | Description |
---|---|---|
@odata.type |
string:
#Microsoft. |
A karakterszűrő típusát meghatározó URI-töredék. |
name |
string |
A karakterszűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet. |
pattern |
string |
Egy reguláris kifejezésminta. |
replacement |
string |
A helyettesítő szöveg. |
PatternReplaceTokenFilter
Karakterszűrő, amely lecseréli a bemeneti sztringben szereplő karaktereket. Egy reguláris kifejezéssel azonosítja a megőrizni kívánt karaktersorozatokat, a lecserélendő karaktereket pedig helyettesítő mintával azonosítja. Ha például az "aa bb aa bb", a "(aa)\s+(bb)" minta és az "$1#$2" helyettesítő szöveg szerepel, az eredmény "aa#bb aa#bb". Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.
Name | Típus | Description |
---|---|---|
@odata.type |
string:
#Microsoft. |
A tokenszűrő típusát meghatározó URI-töredék. |
name |
string |
A jogkivonatszűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet. |
pattern |
string |
Egy reguláris kifejezésminta. |
replacement |
string |
A helyettesítő szöveg. |
PatternTokenizer
Tokenizer, amely regex mintaegyeztetést használ a különböző tokenek létrehozásához. Ez a jogkivonat-szabályzó az Apache Lucene használatával van implementálva.
Name | Típus | Alapértelmezett érték | Description |
---|---|---|---|
@odata.type |
string:
#Microsoft. |
Egy URI-töredék, amely a tokenizer típusát határozza meg. |
|
flags |
Reguláris kifejezésjelölők. |
||
group |
integer |
-1 |
Az egyező csoport nulla alapú sorszáma a reguláris kifejezésmintában, amely tokenekké nyerhető ki. Használja a -1 értéket, ha a teljes mintát szeretné használni a bemenet jogkivonatokra való felosztásához, függetlenül az egyező csoportoktól. Az alapértelmezett érték -1. |
name |
string |
A tokenizer neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet. |
|
pattern |
string |
\W+ |
Normál kifejezésminta a tokenelválasztókhoz. Az alapértelmezett kifejezés egy vagy több nem szó karakternek megfelelő kifejezés. |
PhoneticEncoder
A fonetikus kódoló fonetikus kódoló típusát azonosítja a PhoneticTokenFilterrel való használathoz.
Name | Típus | Description |
---|---|---|
beiderMorse |
string |
Kódol egy jogkivonatot egy Beider-Morse értékre. |
caverphone1 |
string |
Kódol egy tokent egy Caverphone 1.0 értékre. |
caverphone2 |
string |
Kódol egy tokent egy Caverphone 2.0 értékre. |
cologne |
string |
Kódol egy jogkivonatot egy kölni fonetikus értékre. |
doubleMetaphone |
string |
Egy jogkivonatot dupla metafonértékké kódol. |
haasePhonetik |
string |
Kódol egy jogkivonatot a Kölner Phonetik algoritmus Haase finomításával. |
koelnerPhonetik |
string |
Kódol egy jogkivonatot a Kölner Phonetik algoritmussal. |
metaphone |
string |
Kódol egy tokent metafonértékké. |
nysiis |
string |
Kódol egy jogkivonatot EGY NYSIIS-értékbe. |
refinedSoundex |
string |
Egy jogkivonatot pontosított Soundex-értékké kódol. |
soundex |
string |
Egy jogkivonatot Soundex-értékké kódol. |
PhoneticTokenFilter
Létrehozás fonetikus egyezések tokenjei. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.
Name | Típus | Alapértelmezett érték | Description |
---|---|---|---|
@odata.type |
string:
#Microsoft. |
A tokenszűrő típusát meghatározó URI-töredék. |
|
encoder | metaphone |
A használni kívánt fonetikus kódoló. Az alapértelmezett érték a "metaphone". |
|
name |
string |
A jogkivonatszűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet. |
|
replace |
boolean |
True |
Egy érték, amely azt jelzi, hogy a kódolt jogkivonatok lecserélik-e az eredeti jogkivonatokat. Ha hamis, a kódolt jogkivonatok szinonimákként lesznek hozzáadva. Alapértelmezett érték: true (igaz). |
PrioritizedFields
A szemantikai rangsoroláshoz, feliratokhoz, kiemelésekhez és válaszokhoz használandó cím-, tartalom- és kulcsszavak mezőit ismerteti.
Name | Típus | Description |
---|---|---|
prioritizedContentFields |
Meghatározza a szemantikai rangsoroláshoz, feliratokhoz, kiemelésekhez és válaszokhoz használandó tartalommezőket. A legjobb eredmény érdekében a kijelölt mezőknek természetes nyelvű szöveget kell tartalmazniuk. A tömb mezőinek sorrendje a prioritásukat jelöli. Az alacsonyabb prioritású mezők csonkulhatnak, ha a tartalom hosszú. |
|
prioritizedKeywordsFields |
Meghatározza a szemantikai rangsoroláshoz, feliratokhoz, kiemelésekhez és válaszokhoz használandó kulcsszómezőket. A legjobb eredmény érdekében a kijelölt mezőknek tartalmazniuk kell a kulcsszavak listáját. A tömb mezőinek sorrendje a prioritásukat jelöli. Az alacsonyabb prioritású mezők csonkulhatnak, ha a tartalom hosszú. |
|
titleField |
Meghatározza a szemantikai rangsoroláshoz, feliratokhoz, kiemelésekhez és válaszokhoz használandó címmezőt. Ha nincs címmező az indexben, hagyja üresen ezt a mezőt. |
RegexFlags
Definiálja azokat a jelzőket, amelyek kombinálhatók annak szabályozásához, hogy a rendszer hogyan használja a reguláris kifejezéseket a mintaelemzőben és a minta jogkivonat-jelölőjében.
Name | Típus | Description |
---|---|---|
CANON_EQ |
string |
Engedélyezi a canonikus egyenértékűséget. |
CASE_INSENSITIVE |
string |
Engedélyezi a kis- és nagybetűk érzéketlen egyeztetését. |
COMMENTS |
string |
Engedélyezi a térközt és a megjegyzéseket a mintában. |
DOTALL |
string |
Engedélyezi a dotall módot. |
LITERAL |
string |
Lehetővé teszi a minta literális elemzését. |
MULTILINE |
string |
Engedélyezi a többsoros módot. |
UNICODE_CASE |
string |
Engedélyezi a Unicode-ra képes kis- és nagybetűk összecsukását. |
UNIX_LINES |
string |
Engedélyezi a Unix-vonalak üzemmódot. |
ScalarQuantizationParameters
A skaláris kvantálásra jellemző paramétereket tartalmazza.
Name | Típus | Description |
---|---|---|
quantizedDataType |
A tömörített vektorértékek kvantált adattípusa. |
ScalarQuantizationVectorSearchCompressionConfiguration
Az indexelés és lekérdezés során használt skaláris kvantálási tömörítési módszerre vonatkozó konfigurációs beállításokat tartalmazza.
Name | Típus | Alapértelmezett érték | Description |
---|---|---|---|
defaultOversampling |
number |
Alapértelmezett túlméretezési tényező. A túlbélyegző belsőleg több dokumentumot kér (ezt a szorzót határozza meg) a kezdeti keresésben. Ez növeli a teljes pontosságú vektorok újrafordított hasonlósági pontszámával újrafordított eredmények készletét. A minimális érték 1, ami azt jelenti, hogy nincs túlampling (1x). Ez a paraméter csak akkor állítható be, ha a rerankWithOriginalVectors értéke igaz. A magasabb értékek a késés rovására javítják a visszahívást. |
|
kind |
string:
scalar |
A vektorkereséshez konfigurált tömörítési módszer neve. |
|
name |
string |
Az adott konfigurációhoz társítandó név. |
|
rerankWithOriginalVectors |
boolean |
True |
Ha igaz értékre van állítva, a tömörített vektorokkal kiszámított rendezett eredményhalmaz lekérése után a rendszer újraszámítja őket a teljes pontosságú hasonlósági pontszámok újraszámításával. Ez a késés rovására javítja a visszahívást. |
scalarQuantizationParameters |
A skaláris kvantálásra jellemző paramétereket tartalmazza. |
ScoringFunctionAggregation
Meghatározza az összesítési függvényt, amely a pontozási profil összes pontozási függvényének eredményeit egyesíti.
Name | Típus | Description |
---|---|---|
average |
string |
A pontszámok növelése az összes pontozási függvény eredményeinek átlagával. |
firstMatching |
string |
Pontszámok növelése a pontozási profil első alkalmazható pontozási függvényével. |
maximum |
string |
A pontszámok növelése az összes pontozási függvény eredményének maximális értékével. |
minimum |
string |
A pontszámok növelése a pontozási függvények eredményeinek minimális értékével. |
sum |
string |
A pontszámok növelése az összes pontozófüggvény eredményének összegével. |
ScoringFunctionInterpolation
Meghatározza azt a függvényt, amellyel a pontszámok felpörgethetőek egy dokumentumtartományban.
Name | Típus | Description |
---|---|---|
constant |
string |
Állandó tényezővel növeli a pontszámokat. |
linear |
string |
Lineárisan csökkenő mennyiséggel növeli a pontszámokat. Ez a pontozófüggvények alapértelmezett interpolációja. |
logarithmic |
string |
A pontszámokat a logaritmikusan csökkenő mennyiséggel növeli. A magasabb pontszámok esetében a kiemelések gyorsan csökkennek, és lassabban, ahogy a pontszámok csökkennek. Ez az interpolációs beállítás nem engedélyezett a címkepontozási függvényekben. |
quadratic |
string |
A pontszámokat kvadratikusan csökkenő összeggel növeli. A magasabb pontszámok esetében az lökések lassan csökkennek, és gyorsabban, ahogy a pontszámok csökkennek. Ez az interpolációs beállítás nem engedélyezett a címkepontozási függvényekben. |
ScoringProfile
Olyan keresési index paramétereit határozza meg, amelyek befolyásolják a keresési lekérdezések pontozását.
Name | Típus | Description |
---|---|---|
functionAggregation |
Az egyes pontozófüggvények eredményeinek kombinálását jelző érték. Alapértelmezés szerint a "Sum" (Összeg) értékre van kapcsolva. Figyelmen kívül hagyja, ha nincsenek pontozófüggvények. |
|
functions | ScoringFunction[]: |
A dokumentumok pontozását befolyásoló függvények gyűjteménye. |
name |
string |
A pontozási profil neve. |
text |
Olyan paraméterek, amelyek bizonyos indexmezők szöveges egyezései alapján növelik a pontozást. |
SearchField
Egy indexdefinícióban lévő mezőt jelöl, amely leírja egy mező nevét, adattípusát és keresési viselkedését.
Name | Típus | Description |
---|---|---|
analyzer |
A mezőhöz használandó elemző neve. Ez a beállítás csak kereshető mezőkkel használható, és nem állítható be a searchAnalyzer vagy az indexAnalyzer paraméterrel együtt. Az elemző kiválasztása után nem módosítható a mezőhöz. Komplex mezők esetén null értékűnek kell lennie. |
|
dimensions |
integer |
A vektormező dimenziója. |
facetable |
boolean |
Egy érték, amely azt jelzi, hogy engedélyezi-e a mező hivatkozását az aspektusos lekérdezésekben. Általában a találatok kategória szerinti számát (például digitális kamerák keresését és a találatok márka, megapixelek, ár stb. szerinti megtekintését) tartalmazó keresési eredmények bemutatójában használatos. Ennek a tulajdonságnak null értékűnek kell lennie az összetett mezők esetében. Az Edm.GeographyPoint vagy a Collection(Edm.GeographyPoint) típusú mezők nem lehetnek facetablek. Az alapértelmezett érték az összes többi egyszerű mezőre igaz. |
fields |
Almezők listája, ha ez egy Edm.ComplexType vagy Collection(Edm.ComplexType) típusú mező. Egyszerű mezők esetén null értékűnek vagy üresnek kell lennie. |
|
filterable |
boolean |
Egy érték, amely azt jelzi, hogy engedélyezi-e a mező hivatkozását $filter lekérdezésekben. a szűrhető a sztringek kezelésének módjában különbözik a kereshetőtől. A szűrhető Edm.String vagy Collection(Edm.String) típusú mezők nem esnek szótörésbe, így az összehasonlítások csak pontos egyezésekre használhatók. Ha például egy ilyen f mezőt "napos nap" értékre állít be, $filter=f eq "sunny" nem talál egyezést, de $filter=f eq "napos nap" lesz. Ennek a tulajdonságnak null értékűnek kell lennie az összetett mezők esetében. Az alapértelmezett érték az egyszerű mezőkre, az összetett mezőkre pedig a null értékre vonatkozik. |
indexAnalyzer |
A mező indexelésekor használt elemző neve. Ez a beállítás csak kereshető mezőkkel használható. A searchAnalyzerrel együtt kell beállítani, és nem állítható be az elemző beállítással együtt. Ez a tulajdonság nem állítható be nyelvelemző nevére; használja inkább az analyzer tulajdonságot, ha nyelvelemzőre van szüksége. Az elemző kiválasztása után nem módosítható a mezőhöz. Komplex mezők esetén null értékűnek kell lennie. |
|
key |
boolean |
Egy érték, amely azt jelzi, hogy a mező egyedileg azonosítja-e az indexben lévő dokumentumokat. Minden indexben pontosan egy legfelső szintű mezőt kell kiválasztani kulcsmezőként, és Edm.String típusúnak kell lennie. A kulcsmezők a dokumentumok közvetlen keresésére és adott dokumentumok frissítésére vagy törlésére használhatók. Az alapértelmezett érték az egyszerű mezők esetében hamis, az összetett mezők esetében pedig null. |
name |
string |
A mező neve, amelynek egyedinek kell lennie az index vagy szülőmező mezőgyűjteményében. |
normalizer |
A mezőhöz használandó normalizáló neve. Ez a beállítás csak szűrhető, rendezhető vagy táblázatos mezőkkel használható. A normalizáló kiválasztása után nem módosítható a mezőhöz. Komplex mezők esetén null értékűnek kell lennie. |
|
retrievable |
boolean |
Egy érték, amely azt jelzi, hogy a mező visszaadható-e egy keresési eredményben. Ezt a beállítást letilthatja, ha egy mezőt (például margót) szeretne szűrőként, rendezési vagy pontozási mechanizmusként használni, de nem szeretné, hogy a mező látható legyen a végfelhasználó számára. Ennek a tulajdonságnak igaznak kell lennie a kulcsmezők esetében, és az összetett mezők esetében null értékűnek kell lennie. Ez a tulajdonság meglévő mezőkön módosítható. A tulajdonság engedélyezése nem okozza az indextárolási követelmények növekedését. Az alapértelmezett érték igaz az egyszerű mezőkre, a hamis a vektormezőkre, a null érték pedig az összetett mezőkre. |
searchAnalyzer |
A mező keresési idején használt elemző neve. Ez a beállítás csak kereshető mezőkkel használható. Az indexAnalyzerrel együtt kell beállítani, és nem állítható be az elemző beállítással együtt. Ez a tulajdonság nem állítható be nyelvelemző nevére; használja inkább az analyzer tulajdonságot, ha nyelvelemzőre van szüksége. Ez az elemző frissíthető egy meglévő mezőn. Komplex mezők esetén null értékűnek kell lennie. |
|
searchable |
boolean |
Egy érték, amely azt jelzi, hogy a mező kereshető-e. Ez azt jelenti, hogy az indexelés során olyan elemzések mennek végbe, mint a szótörés. Ha egy kereshető mező értékének például a „sunny day” szöveget adja meg, akkor az két különálló tokenre lesz bontva: „sunny” és „day”. Ez lehetővé teszi a kifejezések teljes szöveges keresését. Az Edm.String vagy Collection(Edm.String) típusú mezők alapértelmezés szerint kereshetők. Ennek a tulajdonságnak hamisnak kell lennie más nem sztring típusú egyszerű mezők esetében, és az összetett mezők esetében null értékűnek kell lennie. Megjegyzés: A kereshető mezők extra helyet foglalnak el az indexben, hogy a teljes szöveges keresésekhez a mezőérték további jogkivonatos verzióit is elférjenek. Ha helyet szeretne menteni az indexben, és nincs szükség arra, hogy egy mező szerepeljen a keresésekben, állítsa a kereshető értéket false (hamis) értékre. |
sortable |
boolean |
Egy érték, amely azt jelzi, hogy engedélyezi-e a mező hivatkozását $orderby kifejezésekben. Alapértelmezés szerint a keresőmotor pontszám szerint rendezi az eredményeket, de sok esetben a felhasználók a dokumentumok mezői szerint szeretnének rendezni. Az egyszerű mezők csak akkor rendezhetők, ha egyértékűek (egyetlen értékkel rendelkezik a szülődokumentum hatókörében). Az egyszerű gyűjteménymezők nem rendezhetők, mivel többértékűek. Az összetett gyűjtemények egyszerű almezői szintén többértékűek, ezért nem rendezhetők. Ez akkor is igaz, ha egy közvetlen szülőmezőről vagy egy elődmezőről van szó, ez az összetett gyűjtemény. Az összetett mezők nem rendezhetők, és a rendezhető tulajdonságnak null értékűnek kell lennie az ilyen mezők esetében. A rendezhető alapértelmezett értéke igaz az egyértékű egyszerű mezőkre, a többértékű egyszerű mezőkre hamis, az összetett mezők esetében pedig null értékre. |
stored |
boolean |
Nem módosítható érték, amely azt jelzi, hogy a mező külön marad-e a lemezen, hogy a keresési eredményben megjelenjen. Ezt a beállítást letilthatja, ha nem tervezi visszaadni a mező tartalmát egy keresési válaszban, hogy a tárterület többletterhelését mentse. Ez csak az index létrehozásakor állítható be, és csak vektormezők esetén. Ez a tulajdonság nem módosítható meglévő mezők esetében, és nem állítható be hamis értékre az új mezők esetében. Ha ez a tulajdonság false (hamis) értékre van állítva, a "retrieveable" tulajdonságot is false (hamis) értékre kell állítani. Ennek a tulajdonságnak igaznak vagy nem halmaznak kell lennie a kulcsmezők, az új mezők és a nem vektoros mezők esetében, és az összetett mezők esetében null értékűnek kell lennie. A tulajdonság letiltása csökkenti az indextárolási követelményeket. Az alapértelmezett érték a vektormezők esetében igaz. |
synonymMaps |
string[] |
A mezőhöz társítandó szinonimatérképek nevének listája. Ez a beállítás csak kereshető mezőkkel használható. Jelenleg mezőnként csak egy szinonimatérkép támogatott. Szinonimatérkép mezőhöz rendelése biztosítja, hogy a mezőt megcélzó lekérdezési kifejezések a szinonimatérkép szabályainak használatával lekérdezéskor ki legyenek bontva. Ez az attribútum a meglévő mezőkön módosítható. Az összetett mezők esetében null értékűnek vagy üres gyűjteménynek kell lennie. |
type |
A mező adattípusa. |
|
vectorEncoding |
A mező tartalmának értelmezésére használt kódolási formátum. |
|
vectorSearchProfile |
string |
A vektorkeresési profil neve, amely meghatározza a vektormezőben való kereséshez használni kívánt algoritmust és vektorizálót. |
SearchFieldDataType
Meghatározza egy mező adattípusát egy keresési indexben.
Name | Típus | Description |
---|---|---|
Edm.Boolean |
string |
Azt jelzi, hogy egy mező logikai értéket (igaz vagy hamis) tartalmaz. |
Edm.Byte |
string |
Azt jelzi, hogy egy mező 8 bites, aláíratlan egész számot tartalmaz. Ez csak a Collection(Edm.Byte) használatakor érvényes. |
Edm.ComplexType |
string |
Azt jelzi, hogy egy mező egy vagy több összetett objektumot tartalmaz, amelyek más típusú almezőkkel rendelkeznek. |
Edm.DateTimeOffset |
string |
Azt jelzi, hogy egy mező dátum-/időértéket tartalmaz, beleértve az időzónával kapcsolatos információkat is. |
Edm.Double |
string |
Azt jelzi, hogy egy mező IEEE kettős pontosságú lebegőpontos számot tartalmaz. |
Edm.GeographyPoint |
string |
Azt jelzi, hogy egy mező földrajzi helyet tartalmaz a hosszúság és a szélesség szempontjából. |
Edm.Half |
string |
Azt jelzi, hogy egy mező félpontos lebegőpontos számot tartalmaz. Ez csak a Collection(Edm.Half) esetében érvényes. |
Edm.Int16 |
string |
Azt jelzi, hogy egy mező 16 bites aláírt egész számot tartalmaz. Ez csak a Collection(Edm.Int16) használatakor érvényes. |
Edm.Int32 |
string |
Azt jelzi, hogy egy mező 32 bites aláírt egész számot tartalmaz. |
Edm.Int64 |
string |
Azt jelzi, hogy egy mező 64 bites aláírt egész számot tartalmaz. |
Edm.SByte |
string |
Azt jelzi, hogy egy mező egy 8 bites aláírt egész számot tartalmaz. Ez csak a Gyűjtemény (Edm.SByte) használatakor érvényes. |
Edm.Single |
string |
Azt jelzi, hogy egy mező egy pontosságú lebegőpontos számot tartalmaz. Ez csak a Gyűjtemény (Edm.Single) használatakor érvényes. |
Edm.String |
string |
Azt jelzi, hogy egy mező tartalmaz egy sztringet. |
SearchIndex
A keresési index definícióját jelöli, amely egy index mezőit és keresési viselkedését ismerteti.
Name | Típus | Description |
---|---|---|
@odata.etag |
string |
Az index ETagje. |
analyzers | LexicalAnalyzer[]: |
Az index elemzői. |
charFilters | CharFilter[]: |
Az index karakterszűrői. |
corsOptions |
Az index forrásközi erőforrás-megosztásának (CORS) szabályozására szolgáló beállítások. |
|
defaultScoringProfile |
string |
A használni kívánt pontozási profil neve, ha nincs megadva a lekérdezésben. Ha ez a tulajdonság nincs beállítva, és nincs megadva pontozási profil a lekérdezésben, akkor az alapértelmezett pontozás (tf-idf) lesz használva. |
encryptionKey |
Az Azure Key Vault-ben létrehozott titkosítási kulcs leírása. Ez a kulcs további titkosítási szintet biztosít az adatok számára, ha teljes körű biztosítékot szeretne kapni arról, hogy senki, még a Microsoft sem tudja visszafejteni az adatokat. Miután titkosította az adatokat, az mindig titkosítva marad. A keresési szolgáltatás figyelmen kívül hagyja a tulajdonság null értékűre történő beállítására tett kísérleteket. Szükség szerint módosíthatja ezt a tulajdonságot, ha el szeretné forgatni a titkosítási kulcsot; Az adatok nem lesznek hatással. Az ügyfél által felügyelt kulcsokkal történő titkosítás nem érhető el az ingyenes keresési szolgáltatásokhoz, és csak a 2019. január 1-jén vagy azt követően létrehozott fizetős szolgáltatásokhoz érhető el. |
|
fields |
Az index mezői. |
|
name |
string |
Az index neve. |
normalizers | LexicalNormalizer[]: |
Az index normalizálói. |
scoringProfiles |
Az index pontozási profiljai. |
|
semantic |
Olyan keresési index paramétereit határozza meg, amelyek befolyásolják a szemantikai képességeket. |
|
similarity | Similarity: |
A keresési lekérdezésnek megfelelő dokumentumok pontozásához és rangsorolásához használandó hasonlósági algoritmus típusa. A hasonlósági algoritmus csak az indexlétrehozáskor definiálható, és nem módosítható a meglévő indexeken. Null érték esetén a ClassicSimilarity algoritmust használja a rendszer. |
suggesters |
Az index javaslattevői. |
|
tokenFilters |
TokenFilter[]:
|
Az index jogkivonat-szűrői. |
tokenizers | LexicalTokenizer[]: |
Az index jogkivonat-szabályzói. |
vectorSearch |
A vektorkereséshez kapcsolódó konfigurációs beállításokat tartalmazza. |
SearchIndexerDataNoneIdentity
Törli az adatforrás identitástulajdonságát.
Name | Típus | Description |
---|---|---|
@odata.type |
string:
#Microsoft. |
Az identitás típusát meghatározó URI-töredék. |
SearchIndexerDataUserAssignedIdentity
Megadja a használni kívánt adatforrás identitását.
Name | Típus | Description |
---|---|---|
@odata.type |
string:
#Microsoft. |
Az identitás típusát meghatározó URI-töredék. |
userAssignedIdentity |
string |
A felhasználó által hozzárendelt felügyelt identitás teljes Azure-erőforrás-azonosítója általában a keresési szolgáltatáshoz hozzárendelt "/subscriptions/12345678-1234-1234-1234-1234567890ab/resourceGroups/rg/providers/Microsoft.ManagedIdentity/userAssignedIdentities/myId" formában található. |
SearchResourceEncryptionKey
Ügyfél által felügyelt titkosítási kulcs az Azure Key Vault. A létrehozott és kezelt kulcsok az inaktív adatok, például indexek és szinonimák titkosítására vagy visszafejtésére használhatók.
Name | Típus | Description |
---|---|---|
accessCredentials |
Az Azure Key Vault eléréséhez használt opcionális Azure Active Directory-hitelesítő adatok. Nem szükséges, ha felügyelt identitást használ helyette. |
|
identity | SearchIndexerDataIdentity: |
Explicit felügyelt identitás ehhez a titkosítási kulcshoz. Ha nincs megadva, és a hozzáférési hitelesítő adatok tulajdonság null értékű, a rendszer a rendszer által hozzárendelt felügyelt identitást használja. Ha az erőforrás frissítésekor az explicit identitás nincs meghatározva, az változatlan marad. Ha a "nincs" érték van megadva, a tulajdonság értéke törlődik. |
keyVaultKeyName |
string |
Az Inaktív adatok titkosításához használandó Azure-Key Vault kulcs neve. |
keyVaultKeyVersion |
string |
Az Azure Key Vault kulcsának verziója, amellyel titkosíthatja az inaktív adatokat. |
keyVaultUri |
string |
Az Azure Key Vault URI-ja, más néven DNS-név, amely tartalmazza az inaktív adatok titkosításához használandó kulcsot. Példa URI-ra: |
SemanticConfiguration
Egy adott konfigurációt határoz meg, amelyet a szemantikai képességek kontextusában kell használni.
Name | Típus | Description |
---|---|---|
name |
string |
A szemantikai konfiguráció neve. |
prioritizedFields |
A szemantikai rangsoroláshoz, feliratokhoz, kiemelésekhez és válaszokhoz használandó cím- és tartalom- és kulcsszómezőket ismerteti. A három altulajdonság közül legalább egyet (titleField, prioritizedKeywordsFields és prioritizedContentFields) be kell állítani. |
SemanticField
A szemantikai konfiguráció részeként használt mező.
Name | Típus | Description |
---|---|---|
fieldName |
string |
SemanticSettings
Olyan keresési index paramétereit határozza meg, amelyek befolyásolják a szemantikai képességeket.
Name | Típus | Description |
---|---|---|
configurations |
Az index szemantikai konfigurációi. |
|
defaultConfiguration |
string |
Lehetővé teszi egy alapértelmezett szemantikai konfiguráció nevének beállítását az indexben, így nem kötelező minden alkalommal lekérdezési paraméterként átadni. |
ShingleTokenFilter
Tokenkombinációkat hoz létre egyetlen tokenként. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.
Name | Típus | Alapértelmezett érték | Description |
---|---|---|---|
@odata.type |
string:
#Microsoft. |
A tokenszűrő típusát meghatározó URI-töredék. |
|
filterToken |
string |
_ |
A beszúrandó sztring minden olyan pozícióhoz, ahol nincs token. Az alapértelmezett érték egy aláhúzás ("_"). |
maxShingleSize |
integer |
2 |
A maximális zsindelyméret. Az alapértelmezett és minimális érték 2. |
minShingleSize |
integer |
2 |
A minimális zsindelyméret. Az alapértelmezett és minimális érték 2. A maxShingleSize értékénél kisebbnek kell lennie. |
name |
string |
A jogkivonatszűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet. |
|
outputUnigrams |
boolean |
True |
Egy érték, amely azt jelzi, hogy a kimeneti stream tartalmazza-e a bemeneti jogkivonatokat (unigramokat) és a zsindelyeket. Alapértelmezett érték: true (igaz). |
outputUnigramsIfNoShingles |
boolean |
False |
Egy érték, amely azt jelzi, hogy egygrammot kell-e kiadni azokra az időkre, amikor nem áll rendelkezésre zsindely. Ez a tulajdonság elsőbbséget élvez, ha az outputUnigrams értéke hamis. Az alapértelmezett érték a false (hamis). |
tokenSeparator |
string |
A szomszédos tokenek összekapcsolásakor használandó sztring zsindely létrehozásához. Az alapértelmezett érték egyetlen szóköz (" "). |
SnowballTokenFilter
Egy szűrő, amely a szavakat egy Snowball által generált őst használ. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.
Name | Típus | Description |
---|---|---|
@odata.type |
string:
#Microsoft. |
A tokenszűrő típusát meghatározó URI-töredék. |
language |
A használni kívánt nyelv. |
|
name |
string |
A jogkivonatszűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet. |
SnowballTokenFilterLanguage
A Snowball-jogkivonat-szűrőhöz használandó nyelv.
Name | Típus | Description |
---|---|---|
armenian |
string |
Kiválasztja a Lucene Snowball stemming tokenizer for örmény. |
basque |
string |
Kiválasztja a Lucene Snowball stemming tokenizert Baszk számára. |
catalan |
string |
Kiválasztja a Lucene Snowball szárító tokenizer katalán. |
danish |
string |
Kiválasztja a Lucene Snowball stemming tokenizert dánul. |
dutch |
string |
Kiválasztja a Lucene Snowball stemming tokenizert hollandul. |
english |
string |
Kiválasztja a Lucene Snowball stemming tokenizert angol nyelven. |
finnish |
string |
Kiválasztja a Lucene Snowball stemming tokenizert a finn nyelvhez. |
french |
string |
Kiválasztja a Francia Lucene Snowball-jogkivonat-jelölőt. |
german |
string |
Kiválasztja a Lucene Snowball stemming tokenizer német nyelven. |
german2 |
string |
Kiválasztja a Lucene Snowball-alapú jogkivonat-készítőt, amely a német variáns algoritmust használja. |
hungarian |
string |
Kiválasztja a Lucene Snowball stemming tokenizer for Hungarian (Lucene Snowball stemming tokenizer for Hungarian) lehetőséget. |
italian |
string |
Kiválasztja az olasz Lucene Snowball-jogkivonat-jelölőt. |
kp |
string |
Kiválasztja a Lucene Snowball származtatási jogkivonat-készítőt hollandul, amely a Kraaij-Pohlmann stemming algoritmust használja. |
lovins |
string |
Kiválasztja a Lovins-eredeti algoritmust használó angol nyelvhez készült Lucene Snowball-jogkivonat-készítőt. |
norwegian |
string |
Kiválasztja a Lucene Snowball stemming tokenizert a norvég nyelvhez. |
porter |
string |
Kiválasztja az angol nyelvhez készült Lucene Snowball stemming tokenizert, amely a Porter stemming algoritmust használja. |
portuguese |
string |
Kiválasztja a Lucene Snowball stemming tokenizert portugálul. |
romanian |
string |
Kiválasztja a Lucene Snowball stemming tokenizer a román. |
russian |
string |
Kiválasztja a Lucene Snowball-alapú jogkivonat-jelölőt az oroszhoz. |
spanish |
string |
Kiválasztja a Lucene Snowball szárító tokenizer spanyol. |
swedish |
string |
Kiválasztja a Lucene Snowball stemming tokenizer svéd. |
turkish |
string |
Kiválasztja a Lucene Snowball stemming tokenizer for Török. |
StemmerOverrideTokenFilter
Lehetővé teszi, hogy felülbírálja a többi stemming szűrőt a saját szótáralapú szárítással. A szótárból származó kifejezések kulcsszavakként lesznek megjelölve, így nem lesznek a láncban lévő stemmerek. A törzsszűrők elé kell helyezni. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.
Name | Típus | Description |
---|---|---|
@odata.type |
string:
#Microsoft. |
A tokenszűrő típusát meghatározó URI-töredék. |
name |
string |
A jogkivonatszűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet. |
rules |
string[] |
A következő formátumú stemming szabályok listája: "word => stem", például: "ran => run". |
StemmerTokenFilter
Nyelvspecifikus eredetszűrő. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.
Name | Típus | Description |
---|---|---|
@odata.type |
string:
#Microsoft. |
A tokenszűrő típusát meghatározó URI-töredék. |
language |
A használni kívánt nyelv. |
|
name |
string |
A jogkivonatszűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet. |
StemmerTokenFilterLanguage
A stemmer token szűrőhöz használandó nyelv.
Name | Típus | Description |
---|---|---|
arabic |
string |
Kiválasztja a Lucene-alapú jogkivonat-jelölőt arabul. |
armenian |
string |
Kiválasztja az örmény Lucene-alapú jogkivonat-jelölőt. |
basque |
string |
Kiválasztja a Lucene-alapú jogkivonat-jelölőt Baszk számára. |
brazilian |
string |
Kiválasztja a Lucene-ből származó jogkivonat-jelölőt a portugál (Brazília) számára. |
bulgarian |
string |
Kiválasztja a Lucene-alapú jogkivonat-jelölőt a bolgárhoz. |
catalan |
string |
Kiválasztja a Lucene-alapú jogkivonat-jelölőt a katalánhoz. |
czech |
string |
Kiválasztja a Lucene-alapú jogkivonat-jelölőt a csehhez. |
danish |
string |
Kiválasztja a Lucene-alapú jogkivonat-jelölőt a dánhoz. |
dutch |
string |
Kiválasztja a Lucene-alapú jogkivonat-jelölőt a hollandhoz. |
dutchKp |
string |
Kiválasztja a Lucene-alapú jogkivonat-készítőt a holland nyelvhez, amely a Kraaij-Pohlmann származtatási algoritmust használja. |
english |
string |
Kiválasztja a Lucene-alapú jogkivonat-jelölőt az angol nyelvhez. |
finnish |
string |
Kiválasztja a Lucene-alapú jogkivonat-jelölőt a finn nyelvhez. |
french |
string |
Kiválasztja a Francia Lucene-alapú jogkivonat-jelölőt. |
galician |
string |
Kiválasztja a Lucene-alapú jogkivonat-jelölőt a galíciaihoz. |
german |
string |
Kiválasztja a Lucene-alapú jogkivonat-jelölőt a német nyelvhez. |
german2 |
string |
Kiválasztja a német variáns algoritmust használó Lucene-alapú jogkivonat-készítőt. |
greek |
string |
Kiválasztja a Lucene-alapú jogkivonat-jelölőt a göröghöz. |
hindi |
string |
Kiválasztja a Lucene-alapú jogkivonat-jelölőt Hindi számára. |
hungarian |
string |
Kiválasztja a Lucene-alapú jogkivonat-jelölőt a magyarhoz. |
indonesian |
string |
Kiválasztja az indonéz Lucene-alapú jogkivonat-jelölőt. |
irish |
string |
Kiválasztja az ír Lucene-alapú jogkivonat-jelölőt. |
italian |
string |
Kiválasztja az olasz Lucene-alapú jogkivonat-jelölőt. |
latvian |
string |
Kiválasztja a Lett lucene-alapú jogkivonat-jelölőt. |
lightEnglish |
string |
Kiválasztja a Lucene-alapú jogkivonat-jelölőt az angol nyelvhez, amely könnyű leszármaztatást végez. |
lightFinnish |
string |
Kiválasztja a Lucene-alapú jogkivonat-jelölőt a finn nyelvhez, amely könnyű leszármaztatást végez. |
lightFrench |
string |
Kiválasztja a Lucene-alapú jogkivonat-jelölőt a francia nyelvhez, amely könnyű leszármaztatást végez. |
lightGerman |
string |
Kiválasztja a Lucene-alapú jogkivonat-jelölőt a német nyelvhez, amely könnyű leszármaztatást végez. |
lightHungarian |
string |
Kiválasztja a Lucene-alapú jogkivonat-jelölőt a magyarhoz, amely könnyű leszármaztatást végez. |
lightItalian |
string |
Kiválasztja a Lucene-alapú jogkivonat-jelölőt az olaszhoz, amely könnyű leszármaztatást végez. |
lightNorwegian |
string |
Kiválasztja a Lucene-alapú jogkivonat-jelölőt a norvég (Bokmål) számára, amely könnyű leszármaztatást végez. |
lightNynorsk |
string |
Kiválasztja a Lucene stemming tokenizert a norvég (Nynorsk) számára, amely könnyű leszármaztatást végez. |
lightPortuguese |
string |
Kiválasztja a Lucene-alapú jogkivonat-jelölőt a portugálhoz, amely könnyű leszármaztatást végez. |
lightRussian |
string |
Kiválasztja a Lucene-alapú jogkivonat-jelölőt az oroszhoz, amely könnyű leszármaztatást végez. |
lightSpanish |
string |
Kiválasztja a Lucene-alapú jogkivonat-jelölőt a spanyolhoz, amely könnyű leszármaztatást végez. |
lightSwedish |
string |
Kiválasztja a Lucene-alapú jogkivonat-jelölőt a svédhez, amely könnyű leszármaztatást végez. |
lovins |
string |
Kiválasztja a Lovins-származtatási algoritmust használó angol nyelvű Lucene-alapú jogkivonat-készítőt. |
minimalEnglish |
string |
Kiválasztja a Lucene-alapú jogkivonat-jelölőt az angol nyelvhez, amely minimálisan száraz. |
minimalFrench |
string |
Kiválasztja a Francia Lucene-alapú jogkivonat-jelölőt, amely minimálisan száraz. |
minimalGalician |
string |
Kiválasztja a Lucene-alapú jogkivonat-jelölőt a galíciaihoz, amely minimálisan száraz. |
minimalGerman |
string |
Kiválasztja a Lucene-alapú jogkivonat-jelölőt a német nyelvhez, amely minimálisan hajtja a szárat. |
minimalNorwegian |
string |
Kiválasztja a Lucene stemming tokenizert norvég (Bokmål) számára, amely minimálisan száraz. |
minimalNynorsk |
string |
Kiválasztja a Lucene-alapú jogkivonat-jelölőt a norvég (Nynorsk) számára, amely minimálisan száraz. |
minimalPortuguese |
string |
Kiválasztja a Lucene-alapú jogkivonat-jelölőt a portugálhoz, amely minimálisan szárít. |
norwegian |
string |
Kiválasztja a Lucene-alapú jogkivonat-jelölőt a norvég (Bokmål) számára. |
porter2 |
string |
Kiválasztja a Porter2 stemming algoritmust használó angol nyelvű Lucene-alapú jogkivonat-készítőt. |
portuguese |
string |
Kiválasztja a Lucene-alapú jogkivonat-jelölőt a portugál nyelvhez. |
portugueseRslp |
string |
Kiválasztja a Lucene-alapú jogkivonat-jelölőt portugálul, amely az RSLP-származtatási algoritmust használja. |
possessiveEnglish |
string |
Kiválasztja a Lucene-alapú jogkivonat-jelölőt az angol nyelvhez, amely eltávolítja a záró birtokosokat a szavakból. |
romanian |
string |
Kiválasztja a Lucene-alapú jogkivonat-jelölőt a román nyelvhez. |
russian |
string |
Kiválasztja az orosz Lucene-alapú jogkivonat-jelölőt. |
sorani |
string |
A Sorani lucene-alapú jogkivonat-jelölőjének kiválasztása. |
spanish |
string |
Kiválasztja a Lucene-alapú jogkivonat-jelölőt spanyolul. |
swedish |
string |
Kiválasztja a Lucene-alapú jogkivonat-jelölőt a svéd nyelvhez. |
turkish |
string |
Kiválasztja a Lucene-alapú jogkivonat-jelölőt a törökhöz. |
StopAnalyzer
A szöveget nem betűkkel osztja el; Alkalmazza a kisbetűs és a stopword jogkivonat szűrőit. Ez az elemző az Apache Lucene használatával van implementálva.
Name | Típus | Description |
---|---|---|
@odata.type |
string:
#Microsoft. |
Az elemző típusát meghatározó URI-töredék. |
name |
string |
Az elemző neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet. |
stopwords |
string[] |
A stopszavak listája. |
StopwordsList
A nyelvspecifikus stopszók előre definiált listáját azonosítja.
Name | Típus | Description |
---|---|---|
arabic |
string |
Kiválasztja az arab nyelvű stopword listát. |
armenian |
string |
Kiválasztja az örmények stopszólistáját. |
basque |
string |
Kiválasztja a baszk stopszólistát. |
brazilian |
string |
Kiválasztja a portugál (Brazília) stopword listáját. |
bulgarian |
string |
Kiválasztja a bolgár stopword listát. |
catalan |
string |
Kiválasztja a katalán stopword listát. |
czech |
string |
Kiválasztja a cseh stopword listát. |
danish |
string |
Kiválasztja a dán stopword listát. |
dutch |
string |
Kiválasztja a holland stopword listát. |
english |
string |
Kiválasztja az angol nyelvű stopword listát. |
finnish |
string |
Kiválasztja a finn stopword listát. |
french |
string |
Kiválasztja a francia stopword listát. |
galician |
string |
Kiválasztja a galíciai stopword listát. |
german |
string |
A német nyelvhez tartozó stopword listát választja ki. |
greek |
string |
Kiválasztja a göröghöz tartozó stopszólistát. |
hindi |
string |
Kiválasztja a hindi stopword listát. |
hungarian |
string |
Kiválasztja a magyar nyelvű stopszólistát. |
indonesian |
string |
Kiválasztja az indonéz stopword listát. |
irish |
string |
Kiválasztja az írek stopword listáját. |
italian |
string |
Kiválasztja az olasz stopword listát. |
latvian |
string |
Kiválasztja a lett stopword listát. |
norwegian |
string |
Kiválasztja a norvég nyelvhez tartozó stopword listát. |
persian |
string |
Kiválasztja a perzsa stopword listát. |
portuguese |
string |
Kiválasztja a portugál stopword listát. |
romanian |
string |
Kiválasztja a román nyelvű stopword listát. |
russian |
string |
Kiválasztja az orosz nyelvű stopword listát. |
sorani |
string |
A Sorani stopword listájának kiválasztása. |
spanish |
string |
Kiválasztja a spanyol nyelvű stopword listát. |
swedish |
string |
Kiválasztja a svéd stopword listát. |
thai |
string |
Kiválasztja a thai nyelvhez tartozó stopword listát. |
turkish |
string |
Kiválasztja a törökhöz tartozó stopword listát. |
StopwordsTokenFilter
Eltávolítja a leállító szavakat egy jogkivonat-adatfolyamból. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.
Name | Típus | Alapértelmezett érték | Description |
---|---|---|---|
@odata.type |
string:
#Microsoft. |
A tokenszűrő típusát meghatározó URI-töredék. |
|
ignoreCase |
boolean |
False |
A kis- és nagybetűk figyelmen kívül hagyását jelző érték. Ha igaz, a program először az összes szót kisbetűssé alakítja. Az alapértelmezett érték a false (hamis). |
name |
string |
A jogkivonatszűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet. |
|
removeTrailing |
boolean |
True |
Egy érték, amely azt jelzi, hogy figyelmen kívül hagyja-e az utolsó keresési kifejezést, ha az egy stop szó. Alapértelmezett érték: true (igaz). |
stopwords |
string[] |
A stopszavak listája. Ez a tulajdonság és a stopwords lista tulajdonság nem állítható be. |
|
stopwordsList | english |
A használandó stopszavak előre definiált listája. Ez a tulajdonság és a stopwords tulajdonság nem állítható be. Az alapértelmezett érték az angol. |
Suggester
Meghatározza, hogyan kell alkalmazni a Suggest API-t az index egy mezőcsoportjára.
Name | Típus | Description |
---|---|---|
name |
string |
A javaslattevő neve. |
searchMode |
A javaslattevő képességeit jelző érték. |
|
sourceFields |
string[] |
Azon mezőnevek listája, amelyekre a javaslattevő vonatkozik. Minden mezőnek kereshetőnek kell lennie. |
SuggesterSearchMode
A javaslattevő képességeit jelző érték.
Name | Típus | Description |
---|---|---|
analyzingInfixMatching |
string |
Egy mező egymást követő teljes kifejezéseinek és előtagjainak felel meg. A "Leggyorsabb barna róka" mező esetében például a "gyors" és a "leggyorsabb szemöldök" lekérdezések is egyeznek. |
SynonymTokenFilter
Egy- vagy többszavas szinonimák egy jogkivonatfolyamban. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.
Name | Típus | Alapértelmezett érték | Description |
---|---|---|---|
@odata.type |
string:
#Microsoft. |
A tokenszűrő típusát meghatározó URI-töredék. |
|
expand |
boolean |
True |
Egy érték, amely azt jelzi, hogy a szinonimák listájában szereplő összes szó (ha => jelölés nincs használatban) megfeleltethető-e egymásnak. Ha igaz, a szinonimák listájában szereplő összes szó (ha az => jelölés nincs használatban) megfeleltethető egymással. A következő lista: hihetetlen, hihetetlen, mesés, csodálatos egyenértékű: hihetetlen, hihetetlen, mesés, csodálatos => hihetetlen, hihetetlen, mesés, csodálatos. Ha hamis, a következő lista: hihetetlen, hihetetlen, mesés, csodálatos lesz egyenértékű: hihetetlen, hihetetlen, mesés, csodálatos => hihetetlen. Alapértelmezett érték: true (igaz). |
ignoreCase |
boolean |
False |
Egy érték, amely azt jelzi, hogy a kis- és nagybetűkre kell-e behajtani a bemenetet az egyeztetéshez. Az alapértelmezett érték a false (hamis). |
name |
string |
A jogkivonatszűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet. |
|
synonyms |
string[] |
Szinonimák listája a következő két formátum egyikében: 1. hihetetlen, hihetetlen, mesés => csodálatos - az => szimbólum bal oldalán lévő összes kifejezés helyébe a jobb oldalon lévő összes kifejezés kerül; 2. hihetetlen, hihetetlen, mesés, csodálatos - az egyenértékű szavak vesszővel elválasztott listája. A lista értelmezésének módosításához állítsa be a kibontás beállítást. |
TagScoringFunction
Olyan függvényt definiál, amely egy adott címkelistának megfelelő sztringértékekkel növeli a dokumentumok pontszámait.
Name | Típus | Description |
---|---|---|
boost |
number |
A nyers pontszám szorzója. Pozitív számnak kell lennie, amely nem lehet 1,0. |
fieldName |
string |
A pontozási függvény bemeneteként használt mező neve. |
interpolation |
Egy érték, amely azt jelzi, hogy a kiemelés hogyan lesz interpolálva a dokumentum pontszámai között; alapértelmezés szerint "Lineáris". |
|
tag |
A címke pontozási függvényének paraméterértékei. |
|
type |
string:
tag |
A használni kívánt függvény típusát jelzi. Az érvényes értékek közé tartozik a magnitúdó, a frissesség, a távolság és a címke. A függvénytípusnak kisbetűsnek kell lennie. |
TagScoringParameters
Paraméterértékeket biztosít egy címkepontozási függvénynek.
Name | Típus | Description |
---|---|---|
tagsParameter |
string |
A keresési lekérdezésekben átadott paraméter neve a célmezővel összehasonlítandó címkék listájának megadásához. |
TextWeights
Olyan indexmezők súlyozását határozza meg, amelyek esetében a találatok növelik a keresési lekérdezések pontozását.
Name | Típus | Description |
---|---|---|
weights |
object |
A mezőenkénti súlyok szótára a dokumentum pontozásának növeléséhez. A kulcsok mezőnevek, az értékek pedig az egyes mezők súlyozásai. |
TokenCharacterKind
Olyan karakterosztályokat jelöl, amelyeken a jogkivonatszűrők működhetnek.
Name | Típus | Description |
---|---|---|
digit |
string |
A számjegyeket tokenekben tárolja. |
letter |
string |
A betűket tokenekben tárolja. |
punctuation |
string |
A tokenekben tárolja az írásjeleket. |
symbol |
string |
A szimbólumokat tokenekben tárolja. |
whitespace |
string |
Jogkivonatokban tárolja a térközt. |
TokenFilterName
Meghatározza a keresőmotor által támogatott összes jogkivonatszűrő nevét.
TruncateTokenFilter
A kifejezéseket adott hosszúságúra csonkítja. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.
Name | Típus | Alapértelmezett érték | Description |
---|---|---|---|
@odata.type |
string:
#Microsoft. |
A tokenszűrő típusát meghatározó URI-töredék. |
|
length |
integer |
300 |
Az a hossz, amelyen a kifejezések csonkulnak. Az alapértelmezett és a maximális érték 300. |
name |
string |
A jogkivonatszűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet. |
UaxUrlEmailTokenizer
Tokenizálja az URL-címeket és az e-maileket egy jogkivonatként. Ez a jogkivonat-szabályzó az Apache Lucene használatával van implementálva.
Name | Típus | Alapértelmezett érték | Description |
---|---|---|---|
@odata.type |
string:
#Microsoft. |
Egy URI-töredék, amely a tokenizer típusát határozza meg. |
|
maxTokenLength |
integer |
255 |
A jogkivonat maximális hossza. Az alapértelmezett érték 255. A maximális hossznál hosszabb jogkivonatok fel vannak osztva. A maximálisan használható tokenhossz 300 karakter. |
name |
string |
A tokenizer neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet. |
UniqueTokenFilter
Kiszűri a jogkivonatokat az előző token szövegével megegyező szöveggel. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.
Name | Típus | Alapértelmezett érték | Description |
---|---|---|---|
@odata.type |
string:
#Microsoft. |
A tokenszűrő típusát meghatározó URI-töredék. |
|
name |
string |
A jogkivonatszűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet. |
|
onlyOnSamePosition |
boolean |
False |
Egy érték, amely azt jelzi, hogy az ismétlődések eltávolítása csak ugyanazon a helyen történik-e. Az alapértelmezett érték a false (hamis). |
VectorEncodingFormat
A vektormező tartalmának értelmezésére szolgáló kódolási formátum.
Name | Típus | Description |
---|---|---|
packedBit |
string |
A szélesebb adattípusba csomagolt biteket ábrázoló kódolási formátum. |
VectorSearch
A vektorkereséshez kapcsolódó konfigurációs beállításokat tartalmazza.
Name | Típus | Description |
---|---|---|
algorithms | VectorSearchAlgorithmConfiguration[]: |
Az indexelés vagy lekérdezés során használt algoritmusra vonatkozó konfigurációs beállításokat tartalmaz. |
compressions | VectorSearchCompressionConfiguration[]: |
Az indexelés vagy lekérdezés során használt tömörítési módszerre vonatkozó konfigurációs beállításokat tartalmazza. |
profiles |
A vektorkereséssel használható konfigurációk kombinációit határozza meg. |
|
vectorizers | VectorSearchVectorizer[]: |
A szövegvektor-lekérdezések vektorizálására vonatkozó konfigurációs beállításokat tartalmaz. |
VectorSearchAlgorithmKind
Az indexeléshez és lekérdezéshez használt algoritmus.
Name | Típus | Description |
---|---|---|
exhaustiveKnn |
string |
Kimerítő KNN-algoritmus, amely találgatásos keresést hajt végre. |
hnsw |
string |
HNSW (Hierarchikus Navigable Small World), a közelítő szomszéd algoritmus típusa. |
VectorSearchAlgorithmMetric
A vektorok összehasonlításához használandó hasonlósági metrika. Javasoljuk, hogy ugyanazt a hasonlósági metrikát válassza, amelyre a beágyazási modellt betanította.
Name | Típus | Description |
---|---|---|
cosine |
string |
A vektorok közötti szöget méri a hasonlóságuk számszerűsítéséhez, figyelmen kívül hagyva a nagyságrendet. Minél kisebb a szög, annál közelebb van a hasonlóság. |
dotProduct |
string |
Kiszámítja az elemalapú termékek összegét az igazítás és a nagyságrendi hasonlóság méréséhez. Minél nagyobb és pozitívabb, annál közelebb van a hasonlóság. |
euclidean |
string |
Kiszámítja a vektorok közötti egyenes távolságot egy többdimenziós térben. Minél kisebb a távolság, annál közelebb van a hasonlóság. |
hamming |
string |
Csak bitcsomagolt bináris adattípusokra alkalmazható. Az eltérőséget a bináris vektorok eltérő pozícióinak megszámolásával határozza meg. Minél kevesebb a különbség, annál közelebb van a hasonlóság. |
VectorSearchCompressionKind
Az indexeléshez és lekérdezéshez használt tömörítési módszer.
Name | Típus | Description |
---|---|---|
scalarQuantization |
string |
Skaláris kvantálás, a tömörítési módszer típusa. A skaláris kvantálás során az eredeti vektorértékek szűkebb típusba vannak tömörítve a vektorok egyes összetevőinek megkülönböztetésével és ábrázolásával, csökkentve a kvantált értékek készletét, ezáltal csökkentve a teljes adatméretet. |
VectorSearchCompressionTargetDataType
A tömörített vektorértékek kvantált adattípusa.
Name | Típus | Description |
---|---|---|
int8 |
string |
VectorSearchProfile
A vektorkereséssel használható konfigurációk kombinációját határozza meg.
Name | Típus | Description |
---|---|---|
algorithm |
string |
A vektorkeresési algoritmus konfigurációjának neve, amely meghatározza az algoritmust és az opcionális paramétereket. |
compression |
string |
A tömörítési módszer konfigurációjának neve, amely meghatározza a tömörítési módszert és az opcionális paramétereket. |
name |
string |
Az adott vektoros keresési profilhoz társítandó név. |
vectorizer |
string |
A vektoros kereséshez konfigurált vektorizálási módszer neve. |
VectorSearchVectorizerKind
A lekérdezési idő alatt használandó vektorizálási módszer.
Name | Típus | Description |
---|---|---|
aiServicesVision |
string |
Beágyazásokat hozhat létre egy kép- vagy szövegbevitelhez lekérdezéskor az Azure AI Services Vision Vectorize API használatával. |
aml |
string |
Beágyazásokat hozhat létre a Azure AI Studio modellkatalóguson keresztül, lekérdezéskor üzembe helyezett Azure Machine Learning-végpont használatával. |
azureOpenAI |
string |
Beágyazásokat hozhat létre egy Azure OpenAI-erőforrás használatával lekérdezéskor. |
customWebApi |
string |
Beágyazások létrehozása egyéni webes végpont használatával lekérdezéskor. |
WordDelimiterTokenFilter
A szavakat alszavakra osztja, és opcionális átalakításokat hajt végre az alszócsoportokon. Ez a jogkivonat-szűrő az Apache Lucene használatával van implementálva.
Name | Típus | Alapértelmezett érték | Description |
---|---|---|---|
@odata.type |
string:
#Microsoft. |
A tokenszűrő típusát meghatározó URI-töredék. |
|
catenateAll |
boolean |
False |
Egy érték, amely azt jelzi, hogy az összes alszórész fel lesz-e adva. Ha például ez igaz értékre van állítva, az "Azure-Search-1" "AzureSearch1" lesz. Az alapértelmezett érték a false (hamis). |
catenateNumbers |
boolean |
False |
Egy érték, amely azt jelzi, hogy a rendszer a számrészek maximális futásait fogja-e kiszolgálni. Ha például ez igaz értékre van állítva, az "1-2" "12" lesz. Az alapértelmezett érték a false (hamis). |
catenateWords |
boolean |
False |
A szórészek maximális futását jelző érték. Ha például ez igaz értékre van állítva, az "Azure-Search" "AzureSearch" lesz. Az alapértelmezett érték a false (hamis). |
generateNumberParts |
boolean |
True |
Egy érték, amely azt jelzi, hogy szám alszavak generálására van-e szüksége. Alapértelmezett érték: true (igaz). |
generateWordParts |
boolean |
True |
Egy érték, amely jelzi, hogy létre kell-e hozni részszavat. Ha be van állítva, a szavak részeit generálja; Például az "AzureSearch" "Azure" "Search" lesz. Alapértelmezett érték: true (igaz). |
name |
string |
A jogkivonatszűrő neve. Csak betűket, számjegyeket, szóközöket, kötőjeleket vagy aláhúzásjeleket tartalmazhat, csak alfanumerikus karakterekkel kezdődhet és végződhet, és legfeljebb 128 karakter hosszúságú lehet. |
|
preserveOriginal |
boolean |
False |
Egy érték, amely azt jelzi, hogy az eredeti szavak megmaradnak-e, és hozzá lesznek-e adva az alszólistához. Az alapértelmezett érték a false (hamis). |
protectedWords |
string[] |
A tagolástól védendő jogkivonatok listája. |
|
splitOnCaseChange |
boolean |
True |
Egy érték, amely azt jelzi, hogy fel kell-e osztani a szavakat a caseChange függvényben. Ha például ez igaz értékre van állítva, az "AzureSearch" "Azure" "Search" lesz. Alapértelmezett érték: true (igaz). |
splitOnNumerics |
boolean |
True |
Egy érték, amely azt jelzi, hogy fel kell-e osztani a számokat. Ha például ez igaz értékre van állítva, az "Azure1Search" "Azure" "1" "Search" lesz. Alapértelmezett érték: true (igaz). |
stemEnglishPossessive |
boolean |
True |
Egy érték, amely azt jelzi, hogy el szeretné-e távolítani az egyes alszók záró "s" karaktereit. Alapértelmezett érték: true (igaz). |