Indexes - Create

Riferimento

Servizio:: Search Service

Versione API:: 2024-07-01

Crea un nuovo indice di ricerca.

POST {endpoint}/indexes?api-version=2024-07-01

Parametri dell'URI

Nome	In	Necessario	Tipo	Descrizione
endpoint	path	True	string	URL dell'endpoint del servizio di ricerca.
api-version	query	True	string	Versione dell'API client.

Intestazione della richiesta

Nome	Necessario	Tipo	Descrizione
x-ms-client-request-id		string (uuid)	ID di rilevamento inviato con la richiesta per facilitare il debug.

Corpo della richiesta

Nome	Necessario	Tipo	Descrizione
fields	True	SearchField[]	Campi dell'indice.
name	True	string	Nome dell'indice.
@odata.etag		string	ETag dell'indice.
analyzers		LexicalAnalyzer[]: CustomAnalyzer[] PatternAnalyzer[] LuceneStandardAnalyzer[] StopAnalyzer[]	Analizzatori per l'indice.
charFilters		CharFilter[]: MappingCharFilter[] PatternReplaceCharFilter[]	Filtro dei caratteri per l'indice.
corsOptions		CorsOptions	Opzioni per controllare la condivisione di risorse tra le origini (CORS) per l'indice.
defaultScoringProfile		string	Nome del profilo di assegnazione dei punteggi da utilizzare se non è specificato alcun oggetto nella query. Se questa proprietà non è impostata e nella query non viene specificato alcun profilo di punteggio, verrà usato il punteggio predefinito (tf-idf).
encryptionKey		SearchResourceEncryptionKey	Descrizione di una chiave di crittografia creata in Azure Key Vault. Questa chiave viene usata per fornire un livello aggiuntivo di crittografia dei dati inattivi quando si vuole garantire che nessuno, nemmeno Microsoft, possa decrittografare i dati. Dopo aver crittografato i dati, i dati rimarranno sempre crittografati. Il servizio di ricerca ignorerà i tentativi di impostare questa proprietà su Null. È possibile modificare questa proprietà in base alle esigenze se si vuole ruotare la chiave di crittografia; I dati non saranno interessati. La crittografia con chiavi gestite dal cliente non è disponibile per i servizi di ricerca gratuiti ed è disponibile solo per i servizi a pagamento creati il 1° gennaio 2019.
scoringProfiles		ScoringProfile[]	Profili di punteggio per l'indice.
semantic		SemanticSettings	Definisce i parametri per un indice di ricerca che influisce sulle funzionalità semantiche.
similarity		Similarity: ClassicSimilarity BM25Similarity	Tipo di algoritmo di somiglianza da usare per l'assegnazione dei punteggi e la classificazione dei documenti corrispondenti a una query di ricerca. L'algoritmo di somiglianza può essere definito solo in fase di creazione dell'indice e non può essere modificato negli indici esistenti. Se null, viene usato l'algoritmo ClassicSimilarity.
suggesters		Suggester[]	Suggerimenti per l'indice.
tokenFilters		TokenFilter[]: AsciiFoldingTokenFilter[] CjkBigramTokenFilter[] CommonGramTokenFilter[] DictionaryDecompounderTokenFilter[] EdgeNGramTokenFilter[] EdgeNGramTokenFilterV2[] ElisionTokenFilter[] KeepTokenFilter[] KeywordMarkerTokenFilter[] LengthTokenFilter[] LimitTokenFilter[] NGramTokenFilter[] NGramTokenFilterV2[] PatternCaptureTokenFilter[] PatternReplaceTokenFilter[] PhoneticTokenFilter[] ShingleTokenFilter[] SnowballTokenFilter[] StemmerTokenFilter[] StemmerOverrideTokenFilter[] StopwordsTokenFilter[] SynonymTokenFilter[] TruncateTokenFilter[] UniqueTokenFilter[] WordDelimiterTokenFilter[]	Il token filtra per l'indice.
tokenizers		LexicalTokenizer[]: ClassicTokenizer[] EdgeNGramTokenizer[] KeywordTokenizer[] KeywordTokenizerV2[] MicrosoftLanguageTokenizer[] MicrosoftLanguageStemmingTokenizer[] NGramTokenizer[] PathHierarchyTokenizerV2[] PatternTokenizer[] LuceneStandardTokenizer[] LuceneStandardTokenizerV2[] UaxUrlEmailTokenizer[]	Tokenizer per l'indice.
vectorSearch		VectorSearch	Contiene le opzioni di configurazione correlate alla ricerca vettoriale.

Risposte

Nome	Tipo	Descrizione
201 Created	SearchIndex
Other Status Codes	ErrorResponse	Risposta di errore.

Esempio

SearchServiceCreateIndex

Esempio di richiesta

HTTP

POST https://myservice.search.windows.net/indexes?api-version=2024-07-01

{
  "name": "hotels",
  "fields": [
    {
      "name": "hotelId",
      "type": "Edm.String",
      "key": true,
      "searchable": false
    },
    {
      "name": "baseRate",
      "type": "Edm.Double"
    },
    {
      "name": "description",
      "type": "Edm.String",
      "filterable": false,
      "sortable": false,
      "facetable": false
    },
    {
      "name": "descriptionEmbedding",
      "type": "Collection(Edm.Single)",
      "searchable": true,
      "filterable": false,
      "retrievable": true,
      "sortable": false,
      "facetable": false,
      "key": false,
      "indexAnalyzer": null,
      "searchAnalyzer": null,
      "analyzer": null,
      "synonymMaps": [],
      "dimensions": 1536,
      "vectorSearchProfile": "myHnswSQProfile"
    },
    {
      "name": "descriptionEmbedding_notstored",
      "type": "Collection(Edm.Single)",
      "searchable": true,
      "filterable": false,
      "retrievable": false,
      "stored": false,
      "sortable": false,
      "facetable": false,
      "key": false,
      "indexAnalyzer": null,
      "searchAnalyzer": null,
      "analyzer": null,
      "synonymMaps": [],
      "dimensions": 1536,
      "vectorSearchProfile": "myHnswSQProfile"
    },
    {
      "name": "descriptionEmbedding_forBQ",
      "type": "Collection(Edm.Single)",
      "searchable": true,
      "filterable": false,
      "retrievable": true,
      "sortable": false,
      "facetable": false,
      "key": false,
      "indexAnalyzer": null,
      "searchAnalyzer": null,
      "analyzer": null,
      "synonymMaps": [],
      "dimensions": 1536,
      "vectorSearchProfile": "myHnswBQProfile"
    },
    {
      "name": "description_fr",
      "type": "Edm.String",
      "filterable": false,
      "sortable": false,
      "facetable": false,
      "analyzer": "fr.lucene"
    },
    {
      "name": "hotelName",
      "type": "Edm.String"
    },
    {
      "name": "nameEmbedding",
      "type": "Collection(Edm.Half)",
      "searchable": true,
      "filterable": false,
      "retrievable": true,
      "sortable": false,
      "facetable": false,
      "key": false,
      "indexAnalyzer": null,
      "searchAnalyzer": null,
      "analyzer": null,
      "synonymMaps": [],
      "dimensions": 1536,
      "vectorSearchProfile": "myHnswProfile"
    },
    {
      "name": "category",
      "type": "Edm.String"
    },
    {
      "name": "tags",
      "type": "Collection(Edm.String)",
      "analyzer": "tagsAnalyzer"
    },
    {
      "name": "parkingIncluded",
      "type": "Edm.Boolean"
    },
    {
      "name": "smokingAllowed",
      "type": "Edm.Boolean"
    },
    {
      "name": "lastRenovationDate",
      "type": "Edm.DateTimeOffset"
    },
    {
      "name": "rating",
      "type": "Edm.Int32"
    },
    {
      "name": "location",
      "type": "Edm.GeographyPoint"
    }
  ],
  "scoringProfiles": [
    {
      "name": "geo",
      "text": {
        "weights": {
          "hotelName": 5
        }
      },
      "functions": [
        {
          "type": "distance",
          "boost": 5,
          "fieldName": "location",
          "interpolation": "logarithmic",
          "distance": {
            "referencePointParameter": "currentLocation",
            "boostingDistance": 10
          }
        }
      ]
    }
  ],
  "defaultScoringProfile": "geo",
  "suggesters": [
    {
      "name": "sg",
      "searchMode": "analyzingInfixMatching",
      "sourceFields": [
        "hotelName"
      ]
    }
  ],
  "analyzers": [
    {
      "name": "tagsAnalyzer",
      "@odata.type": "#Microsoft.Azure.Search.CustomAnalyzer",
      "charFilters": [
        "html_strip"
      ],
      "tokenizer": "standard_v2"
    }
  ],
  "corsOptions": {
    "allowedOrigins": [
      "tempuri.org"
    ],
    "maxAgeInSeconds": 60
  },
  "encryptionKey": {
    "keyVaultKeyName": "myUserManagedEncryptionKey-createdinAzureKeyVault",
    "keyVaultKeyVersion": "myKeyVersion-32charAlphaNumericString",
    "keyVaultUri": "https://myKeyVault.vault.azure.net",
    "accessCredentials": {
      "applicationId": "00000000-0000-0000-0000-000000000000",
      "applicationSecret": "<applicationSecret>"
    }
  },
  "similarity": {
    "@odata.type": "#Microsoft.Azure.Search.BM25Similarity",
    "b": 0.5,
    "k1": 1.3
  },
  "semantic": {
    "configurations": [
      {
        "name": "semanticHotels",
        "prioritizedFields": {
          "titleField": {
            "fieldName": "hotelName"
          },
          "prioritizedContentFields": [
            {
              "fieldName": "description"
            },
            {
              "fieldName": "description_fr"
            }
          ],
          "prioritizedKeywordsFields": [
            {
              "fieldName": "tags"
            },
            {
              "fieldName": "category"
            }
          ]
        }
      }
    ]
  },
  "vectorSearch": {
    "profiles": [
      {
        "name": "myHnswProfile",
        "algorithm": "myHnsw"
      },
      {
        "name": "myHnswSQProfile",
        "algorithm": "myHnsw",
        "compression": "mySQ8"
      },
      {
        "name": "myHnswBQProfile",
        "algorithm": "myHnsw",
        "compression": "myBQ"
      },
      {
        "name": "myAlgorithm",
        "algorithm": "myExhaustive"
      }
    ],
    "algorithms": [
      {
        "name": "myHnsw",
        "kind": "hnsw",
        "hnswParameters": {
          "m": 4,
          "metric": "cosine"
        }
      },
      {
        "name": "myExhaustive",
        "kind": "exhaustiveKnn",
        "exhaustiveKnnParameters": {
          "metric": "cosine"
        }
      }
    ],
    "compressions": [
      {
        "name": "mySQ8",
        "kind": "scalarQuantization",
        "scalarQuantizationParameters": {
          "quantizedDataType": "int8"
        },
        "rerankWithOriginalVectors": true,
        "defaultOversampling": 10
      },
      {
        "name": "myBQ",
        "kind": "binaryQuantization",
        "rerankWithOriginalVectors": true,
        "defaultOversampling": 10
      }
    ]
  }
}

Risposta di esempio

Codice di stato:: 201

{
  "name": "hotels",
  "fields": [
    {
      "name": "hotelId",
      "type": "Edm.String",
      "searchable": false,
      "filterable": true,
      "retrievable": true,
      "sortable": true,
      "facetable": true,
      "key": true,
      "indexAnalyzer": null,
      "searchAnalyzer": null,
      "analyzer": null,
      "dimensions": null,
      "vectorSearchProfile": null,
      "synonymMaps": []
    },
    {
      "name": "baseRate",
      "type": "Edm.Double",
      "searchable": false,
      "filterable": true,
      "retrievable": true,
      "sortable": true,
      "facetable": true,
      "key": false,
      "indexAnalyzer": null,
      "searchAnalyzer": null,
      "analyzer": null,
      "dimensions": null,
      "vectorSearchProfile": null,
      "synonymMaps": []
    },
    {
      "name": "description",
      "type": "Edm.String",
      "searchable": true,
      "filterable": false,
      "retrievable": true,
      "sortable": false,
      "facetable": false,
      "key": false,
      "indexAnalyzer": null,
      "searchAnalyzer": null,
      "analyzer": null,
      "dimensions": null,
      "vectorSearchProfile": null,
      "synonymMaps": []
    },
    {
      "name": "descriptionEmbedding",
      "type": "Collection(Edm.Single)",
      "searchable": true,
      "filterable": false,
      "retrievable": true,
      "sortable": false,
      "facetable": false,
      "key": false,
      "indexAnalyzer": null,
      "searchAnalyzer": null,
      "analyzer": null,
      "dimensions": 1536,
      "vectorSearchProfile": "myHnswSQProfile",
      "synonymMaps": []
    },
    {
      "name": "descriptionEmbedding_notstored",
      "type": "Collection(Edm.Single)",
      "searchable": true,
      "filterable": false,
      "retrievable": false,
      "stored": false,
      "sortable": false,
      "facetable": false,
      "key": false,
      "indexAnalyzer": null,
      "searchAnalyzer": null,
      "analyzer": null,
      "synonymMaps": [],
      "dimensions": 1536,
      "vectorSearchProfile": "myHnswSQProfile"
    },
    {
      "name": "descriptionEmbedding_forBQ",
      "type": "Collection(Edm.Single)",
      "searchable": true,
      "filterable": false,
      "retrievable": true,
      "sortable": false,
      "facetable": false,
      "key": false,
      "indexAnalyzer": null,
      "searchAnalyzer": null,
      "analyzer": null,
      "dimensions": 1536,
      "vectorSearchProfile": "myHnswBQProfile",
      "synonymMaps": []
    },
    {
      "name": "description_fr",
      "type": "Edm.String",
      "searchable": true,
      "filterable": false,
      "retrievable": true,
      "sortable": false,
      "facetable": false,
      "key": false,
      "indexAnalyzer": null,
      "searchAnalyzer": null,
      "analyzer": "fr.lucene",
      "dimensions": null,
      "vectorSearchProfile": null,
      "synonymMaps": []
    },
    {
      "name": "hotelName",
      "type": "Edm.String",
      "searchable": true,
      "filterable": true,
      "retrievable": true,
      "sortable": true,
      "facetable": true,
      "key": false,
      "indexAnalyzer": null,
      "searchAnalyzer": null,
      "analyzer": null,
      "dimensions": null,
      "vectorSearchProfile": null,
      "synonymMaps": []
    },
    {
      "name": "nameEmbedding",
      "type": "Collection(Edm.Half)",
      "searchable": true,
      "filterable": false,
      "retrievable": true,
      "sortable": false,
      "facetable": false,
      "key": false,
      "indexAnalyzer": null,
      "searchAnalyzer": null,
      "analyzer": null,
      "dimensions": 1536,
      "vectorSearchProfile": "myHnswProfile",
      "synonymMaps": []
    },
    {
      "name": "category",
      "type": "Edm.String",
      "searchable": true,
      "filterable": true,
      "retrievable": true,
      "sortable": true,
      "facetable": true,
      "key": false,
      "indexAnalyzer": null,
      "searchAnalyzer": null,
      "analyzer": null,
      "dimensions": null,
      "vectorSearchProfile": null,
      "synonymMaps": []
    },
    {
      "name": "tags",
      "type": "Collection(Edm.String)",
      "searchable": true,
      "filterable": true,
      "retrievable": true,
      "sortable": false,
      "facetable": true,
      "key": false,
      "indexAnalyzer": null,
      "searchAnalyzer": null,
      "analyzer": "tagsAnalyzer",
      "dimensions": null,
      "vectorSearchProfile": null,
      "synonymMaps": []
    },
    {
      "name": "parkingIncluded",
      "type": "Edm.Boolean",
      "searchable": false,
      "filterable": true,
      "retrievable": true,
      "sortable": true,
      "facetable": true,
      "key": false,
      "indexAnalyzer": null,
      "searchAnalyzer": null,
      "analyzer": null,
      "dimensions": null,
      "vectorSearchProfile": null,
      "synonymMaps": []
    },
    {
      "name": "smokingAllowed",
      "type": "Edm.Boolean",
      "searchable": false,
      "filterable": true,
      "retrievable": true,
      "sortable": true,
      "facetable": true,
      "key": false,
      "indexAnalyzer": null,
      "searchAnalyzer": null,
      "analyzer": null,
      "dimensions": null,
      "vectorSearchProfile": null,
      "synonymMaps": []
    },
    {
      "name": "lastRenovationDate",
      "type": "Edm.DateTimeOffset",
      "searchable": false,
      "filterable": true,
      "retrievable": true,
      "sortable": true,
      "facetable": true,
      "key": false,
      "indexAnalyzer": null,
      "searchAnalyzer": null,
      "analyzer": null,
      "dimensions": null,
      "vectorSearchProfile": null,
      "synonymMaps": []
    },
    {
      "name": "rating",
      "type": "Edm.Int32",
      "searchable": false,
      "filterable": true,
      "retrievable": true,
      "sortable": true,
      "facetable": true,
      "key": false,
      "indexAnalyzer": null,
      "searchAnalyzer": null,
      "analyzer": null,
      "dimensions": null,
      "vectorSearchProfile": null,
      "synonymMaps": []
    },
    {
      "name": "location",
      "type": "Edm.GeographyPoint",
      "searchable": false,
      "filterable": true,
      "retrievable": true,
      "sortable": true,
      "facetable": false,
      "key": false,
      "indexAnalyzer": null,
      "searchAnalyzer": null,
      "analyzer": null,
      "dimensions": null,
      "vectorSearchProfile": null,
      "synonymMaps": []
    }
  ],
  "scoringProfiles": [
    {
      "name": "geo",
      "functionAggregation": "sum",
      "text": {
        "weights": {
          "hotelName": 5
        }
      },
      "functions": [
        {
          "fieldName": "location",
          "interpolation": "logarithmic",
          "type": "distance",
          "boost": 5,
          "distance": {
            "referencePointParameter": "currentLocation",
            "boostingDistance": 10
          }
        }
      ]
    }
  ],
  "defaultScoringProfile": "geo",
  "suggesters": [
    {
      "name": "sg",
      "searchMode": "analyzingInfixMatching",
      "sourceFields": [
        "hotelName"
      ]
    }
  ],
  "analyzers": [
    {
      "name": "tagsAnalyzer",
      "@odata.type": "#Microsoft.Azure.Search.CustomAnalyzer",
      "charFilters": [
        "html_strip"
      ],
      "tokenFilters": [],
      "tokenizer": "standard_v2"
    }
  ],
  "tokenizers": [],
  "tokenFilters": [],
  "charFilters": [],
  "corsOptions": {
    "allowedOrigins": [
      "tempuri.org"
    ],
    "maxAgeInSeconds": 60
  },
  "encryptionKey": {
    "keyVaultKeyName": "myUserManagedEncryptionKey-createdinAzureKeyVault",
    "keyVaultKeyVersion": "myKeyVersion-32charAlphaNumericString",
    "keyVaultUri": "https://myKeyVault.vault.azure.net",
    "accessCredentials": {
      "applicationId": "00000000-0000-0000-0000-000000000000",
      "applicationSecret": null
    }
  },
  "similarity": {
    "@odata.type": "#Microsoft.Azure.Search.BM25Similarity",
    "b": 0.5,
    "k1": 1.3
  },
  "semantic": {
    "configurations": [
      {
        "name": "semanticHotels",
        "prioritizedFields": {
          "titleField": {
            "fieldName": "hotelName"
          },
          "prioritizedContentFields": [
            {
              "fieldName": "description"
            },
            {
              "fieldName": "description_fr"
            }
          ],
          "prioritizedKeywordsFields": [
            {
              "fieldName": "tags"
            },
            {
              "fieldName": "category"
            }
          ]
        }
      }
    ]
  },
  "vectorSearch": {
    "algorithms": [
      {
        "name": "myHnsw",
        "kind": "hnsw",
        "hnswParameters": {
          "metric": "cosine",
          "m": 4,
          "efConstruction": 400,
          "efSearch": 500
        }
      },
      {
        "name": "myExhaustive",
        "kind": "exhaustiveKnn",
        "exhaustiveKnnParameters": {
          "metric": "cosine"
        }
      }
    ],
    "profiles": [
      {
        "name": "myHnswProfile",
        "algorithm": "myHnsw"
      },
      {
        "name": "myHnswSQProfile",
        "algorithm": "myHnsw",
        "compression": "mySQ8"
      },
      {
        "name": "myHnswBQProfile",
        "algorithm": "myHnsw",
        "vectorizer": "myOpenAi",
        "compression": "myBQ"
      },
      {
        "name": "myAlgorithm",
        "algorithm": "myExhaustive"
      }
    ],
    "compressions": [
      {
        "name": "mySQ8",
        "kind": "scalarQuantization",
        "scalarQuantizationParameters": {
          "quantizedDataType": "int8"
        },
        "rerankWithOriginalVectors": true,
        "defaultOversampling": 10
      },
      {
        "name": "myBQ",
        "kind": "binaryQuantization",
        "rerankWithOriginalVectors": true,
        "defaultOversampling": 10
      }
    ]
  }
}

Definizioni

Nome	Descrizione
AsciiFoldingTokenFilter	Converte caratteri Unicode alfabetici, numerici e simbolici che non si trovano nei primi 127 caratteri ASCII (blocco Unicode "Latino di base") nei rispettivi equivalenti ASCII, se tali equivalenti esistono. Questo filtro di token viene implementato usando Apache Lucene.
AzureActiveDirectoryApplicationCredentials	Credenziali di un'applicazione registrata creata per il servizio di ricerca, usata per l'accesso autenticato alle chiavi di crittografia archiviate in Azure Key Vault.
AzureOpenAIEmbeddingSkill	Consente di generare un'incorporamento vettoriale per un input di testo specificato usando la risorsa OpenAI di Azure.
AzureOpenAIModelName	Nome del modello di Azure Open AI che verrà chiamato.
AzureOpenAIParameters	Specifica i parametri per la connessione alla risorsa OpenAI di Azure.
AzureOpenAIVectorizer	Specifica la risorsa OpenAI di Azure usata per vettorizzare una stringa di query.
BinaryQuantizationVectorSearchCompressionConfiguration	Contiene opzioni di configurazione specifiche per il metodo di compressione della quantizzazione binaria usato durante l'indicizzazione e l'esecuzione di query.
BM25Similarity	Funzione di classificazione basata sull'algoritmo di somiglianza okapi BM25. BM25 è un algoritmo simile a TF-IDF che include la normalizzazione della lunghezza (controllata dal parametro 'b'), nonché la saturazione della frequenza dei termini (controllata dal parametro 'k1').
CharFilterName	Definisce i nomi di tutti i filtri di caratteri supportati dal motore di ricerca.
CjkBigramTokenFilter	Forma bigrams dei termini CJK generati dal tokenizer standard. Questo filtro di token viene implementato usando Apache Lucene.
CjkBigramTokenFilterScripts	Script che possono essere ignorati da CjkBigramTokenFilter.
ClassicSimilarity	Algoritmo di somiglianza legacy che usa l'implementazione lucene TFIDFSimilarity di TF-IDF. Questa variazione di TF-IDF introduce la normalizzazione statica della lunghezza del documento, nonché fattori di coordinamento che penalizzano i documenti che corrispondono solo parzialmente alle query sottoposte a ricerca.
ClassicTokenizer	Tokenizzatore basato su grammatica adatto per l'elaborazione della maggior parte dei documenti in lingua europea. Questo tokenizer viene implementato tramite Apache Lucene.
CommonGramTokenFilter	Costruisci bigram per i termini che si verificano di frequente durante l'indicizzazione. Anche i termini singoli sono indicizzati, con bigrams sovrapposti. Questo filtro di token viene implementato usando Apache Lucene.
CorsOptions	Definisce le opzioni per controllare la condivisione di risorse tra le origini (CORS) per un indice.
CustomAnalyzer	Consente di assumere il controllo del processo di conversione del testo in token indicizzabili/ricercabili. Si tratta di una configurazione definita dall'utente costituita da un singolo tokenizzatore predefinito e uno o più filtri. Il tokenizer è responsabile dell'interruzione del testo nei token e dei filtri per la modifica dei token generati dal tokenizer.
DictionaryDecompounderTokenFilter	Scompone parole composte presenti in molte lingue germaniche. Questo filtro di token viene implementato usando Apache Lucene.
DistanceScoringFunction	Definisce una funzione che aumenta i punteggi in base alla distanza da una posizione geografica.
DistanceScoringParameters	Fornisce i valori dei parametri a una funzione di assegnazione dei punteggi della distanza.
EdgeNGramTokenFilter	Genera n-grammi delle dimensioni specificate a partire dalla parte anteriore o posteriore di un token di input. Questo filtro di token viene implementato usando Apache Lucene.
EdgeNGramTokenFilterSide	Specifica il lato dell'input da cui deve essere generato un n-gram.
EdgeNGramTokenFilterV2	Genera n-grammi delle dimensioni specificate a partire dalla parte anteriore o posteriore di un token di input. Questo filtro di token viene implementato usando Apache Lucene.
EdgeNGramTokenizer	Tokenzza l'input da un bordo in n-grammi delle dimensioni specificate. Questo tokenizer viene implementato tramite Apache Lucene.
ElisionTokenFilter	Rimuove le elisioni. Ad esempio, "l'avion" (il piano) verrà convertito in "avion" (piano). Questo filtro di token viene implementato usando Apache Lucene.
ErrorAdditionalInfo	Informazioni aggiuntive sull'errore di gestione delle risorse.
ErrorDetail	Dettagli dell'errore.
ErrorResponse	Risposta di errore
ExhaustiveKnnParameters	Contiene i parametri specifici dell'algoritmo KNN completo.
ExhaustiveKnnVectorSearchAlgorithmConfiguration	Contiene opzioni di configurazione specifiche dell'algoritmo KNN completo usato durante l'esecuzione di query, che eseguirà la ricerca di forza bruta nell'intero indice vettoriale.
FreshnessScoringFunction	Definisce una funzione che aumenta i punteggi in base al valore di un campo di data e ora.
FreshnessScoringParameters	Fornisce i valori dei parametri a una funzione di assegnazione dei punteggi di aggiornamento.
HnswParameters	Contiene i parametri specifici dell'algoritmo HNSW.
HnswVectorSearchAlgorithmConfiguration	Contiene opzioni di configurazione specifiche dell'algoritmo HNSW approssimato vicino usato durante l'indicizzazione e l'esecuzione di query. L'algoritmo HNSW offre un compromesso ottimizzabile tra velocità di ricerca e accuratezza.
InputFieldMappingEntry	Mapping dei campi di input per una competenza.
KeepTokenFilter	Filtro di token che mantiene solo i token con testo contenuto in un elenco specificato di parole. Questo filtro di token viene implementato usando Apache Lucene.
KeywordMarkerTokenFilter	Contrassegna i termini come parole chiave. Questo filtro di token viene implementato usando Apache Lucene.
KeywordTokenizer	Genera l'intero input come singolo token. Questo tokenizer viene implementato tramite Apache Lucene.
KeywordTokenizerV2	Genera l'intero input come singolo token. Questo tokenizer viene implementato tramite Apache Lucene.
LengthTokenFilter	Rimuove parole troppo lunghe o troppo brevi. Questo filtro di token viene implementato usando Apache Lucene.
LexicalAnalyzerName	Definisce i nomi di tutti gli analizzatori di testo supportati dal motore di ricerca.
LexicalTokenizerName	Definisce i nomi di tutti i tokenizer supportati dal motore di ricerca.
LimitTokenFilter	Limita il numero di token durante l'indicizzazione. Questo filtro di token viene implementato usando Apache Lucene.
LuceneStandardAnalyzer	Analizzatore Apache Lucene standard; Composto dal tokenizer standard, dal filtro minuscolo e dal filtro di arresto.
LuceneStandardTokenizer	Interrompe il testo seguendo le regole di segmentazione del testo Unicode. Questo tokenizer viene implementato tramite Apache Lucene.
LuceneStandardTokenizerV2	Interrompe il testo seguendo le regole di segmentazione del testo Unicode. Questo tokenizer viene implementato tramite Apache Lucene.
MagnitudeScoringFunction	Definisce una funzione che aumenta i punteggi in base alla grandezza di un campo numerico.
MagnitudeScoringParameters	Fornisce i valori dei parametri a una funzione di assegnazione dei punteggi di grandezza.
MappingCharFilter	Filtro di caratteri che applica i mapping definiti con l'opzione mapping. La corrispondenza è greedy (criteri di ricerca più lunghi in un determinato punto vince). La sostituzione può essere la stringa vuota. Questo filtro di caratteri viene implementato tramite Apache Lucene.
MicrosoftLanguageStemmingTokenizer	Divide il testo usando regole specifiche della lingua e riduce le parole alle relative forme di base.
MicrosoftLanguageTokenizer	Divide il testo usando regole specifiche della lingua.
MicrosoftStemmingTokenizerLanguage	Elenca le lingue supportate dal tokenizer di stemming della lingua Microsoft.
MicrosoftTokenizerLanguage	Elenca le lingue supportate dal tokenizzatore di linguaggio Microsoft.
NGramTokenFilter	Genera n-grammi delle dimensioni specificate. Questo filtro di token viene implementato usando Apache Lucene.
NGramTokenFilterV2	Genera n-grammi delle dimensioni specificate. Questo filtro di token viene implementato usando Apache Lucene.
NGramTokenizer	Tokenzza l'input in n-grammi delle dimensioni specificate. Questo tokenizer viene implementato tramite Apache Lucene.
OutputFieldMappingEntry	Mapping dei campi di output per una competenza.
PathHierarchyTokenizerV2	Tokenizer per gerarchie simili al percorso. Questo tokenizer viene implementato tramite Apache Lucene.
PatternAnalyzer	Separa in modo flessibile il testo in termini tramite un criterio di espressione regolare. Questo analizzatore viene implementato usando Apache Lucene.
PatternCaptureTokenFilter	Usa espressioni regolari Java per generare più token, uno per ogni gruppo di acquisizione in uno o più modelli. Questo filtro di token viene implementato usando Apache Lucene.
PatternReplaceCharFilter	Filtro di caratteri che sostituisce i caratteri nella stringa di input. Usa un'espressione regolare per identificare le sequenze di caratteri da mantenere e un criterio di sostituzione per identificare i caratteri da sostituire. Ad esempio, dato il testo di input "aa bb aa bb", pattern "(aa)\s+(bb)" e sostituzione "$1#$2", il risultato sarà "aa#bb aa#bb". Questo filtro di caratteri viene implementato tramite Apache Lucene.
PatternReplaceTokenFilter	Filtro di caratteri che sostituisce i caratteri nella stringa di input. Usa un'espressione regolare per identificare le sequenze di caratteri da mantenere e un criterio di sostituzione per identificare i caratteri da sostituire. Ad esempio, dato il testo di input "aa bb aa bb", pattern "(aa)\s+(bb)" e sostituzione "$1#$2", il risultato sarà "aa#bb aa#bb". Questo filtro di token viene implementato usando Apache Lucene.
PatternTokenizer	Tokenizer che usa criteri regex corrispondenti per costruire token distinti. Questo tokenizer viene implementato tramite Apache Lucene.
PhoneticEncoder	Identifica il tipo di codificatore fonetico da usare con phoneticTokenFilter.
PhoneticTokenFilter	Creare token per corrispondenze fonetiche. Questo filtro di token viene implementato usando Apache Lucene.
PrioritizedFields	Descrive i campi titolo, contenuto e parole chiave da usare per la classificazione semantica, le didascalie, le evidenziazioni e le risposte.
RegexFlags	Definisce i flag che possono essere combinati per controllare il modo in cui vengono usate le espressioni regolari nell'analizzatore dei criteri e nel tokenizzatore di criteri.
ScalarQuantizationParameters	Contiene i parametri specifici della quantizzazione scalare.
ScalarQuantizationVectorSearchCompressionConfiguration	Contiene opzioni di configurazione specifiche per il metodo di compressione della quantizzazione scalare usato durante l'indicizzazione e l'esecuzione di query.
ScoringFunctionAggregation	Definisce la funzione di aggregazione usata per combinare i risultati di tutte le funzioni di assegnazione dei punteggi in un profilo di punteggio.
ScoringFunctionInterpolation	Definisce la funzione usata per interpolare il boosting del punteggio in un intervallo di documenti.
ScoringProfile	Definisce i parametri per un indice di ricerca che influisce sul punteggio nelle query di ricerca.
SearchField	Rappresenta un campo in una definizione di indice, che descrive il nome, il tipo di dati e il comportamento di ricerca di un campo.
SearchFieldDataType	Definisce il tipo di dati di un campo in un indice di ricerca.
SearchIndex	Rappresenta una definizione di indice di ricerca, che descrive i campi e il comportamento di ricerca di un indice.
SearchIndexerDataNoneIdentity	Cancella la proprietà Identity di un'origine dati.
SearchIndexerDataUserAssignedIdentity	Specifica l'identità di un'origine dati da usare.
SearchResourceEncryptionKey	Una chiave di crittografia gestita dal cliente in Azure Key Vault. Le chiavi create e gestite possono essere usate per crittografare o decrittografare i dati inattivi, ad esempio indici e mappe sinonimi.
SemanticConfiguration	Definisce una configurazione specifica da usare nel contesto delle funzionalità semantiche.
SemanticField	Campo utilizzato come parte della configurazione semantica.
SemanticSettings	Definisce i parametri per un indice di ricerca che influisce sulle funzionalità semantiche.
ShingleTokenFilter	Crea combinazioni di token come singolo token. Questo filtro di token viene implementato usando Apache Lucene.
SnowballTokenFilter	Filtro che deriva le parole usando uno stemmer generato da Snowball. Questo filtro di token viene implementato usando Apache Lucene.
SnowballTokenFilterLanguage	Lingua da usare per un filtro token Snowball.
StemmerOverrideTokenFilter	Consente di eseguire l'override di altri filtri di stemming con stemming basato su dizionario personalizzato. Tutti i termini con stemmy-stemming verranno contrassegnati come parole chiave in modo che non vengano stemmati lungo la catena. Deve essere posizionato prima di qualsiasi filtro di stemming. Questo filtro di token viene implementato usando Apache Lucene.
StemmerTokenFilter	Filtro di stemming specifico della lingua. Questo filtro di token viene implementato usando Apache Lucene.
StemmerTokenFilterLanguage	Lingua da usare per un filtro di token stemmer.
StopAnalyzer	Divide il testo in corrispondenza di lettere non; Applica i filtri di token minuscoli e non significative. Questo analizzatore viene implementato usando Apache Lucene.
StopwordsList	Identifica un elenco predefinito di parole non significative specifiche della lingua.
StopwordsTokenFilter	Rimuove le parole non significative da un flusso di token. Questo filtro di token viene implementato usando Apache Lucene.
Suggester	Definisce il modo in cui l'API Suggerisci deve essere applicata a un gruppo di campi nell'indice.
SuggesterSearchMode	Valore che indica le funzionalità del suggerimento.
SynonymTokenFilter	Trova la corrispondenza con sinonimi singoli o con più parole in un flusso di token. Questo filtro di token viene implementato usando Apache Lucene.
TagScoringFunction	Definisce una funzione che aumenta i punteggi dei documenti con valori stringa corrispondenti a un determinato elenco di tag.
TagScoringParameters	Fornisce i valori dei parametri a una funzione di assegnazione dei punteggi di tag.
TextWeights	Definisce i pesi nei campi di indice per i quali le corrispondenze devono aumentare il punteggio nelle query di ricerca.
TokenCharacterKind	Rappresenta le classi di caratteri in cui può funzionare un filtro di token.
TokenFilterName	Definisce i nomi di tutti i filtri di token supportati dal motore di ricerca.
TruncateTokenFilter	Tronca i termini a una lunghezza specifica. Questo filtro di token viene implementato usando Apache Lucene.
UaxUrlEmailTokenizer	Tokenzza url e messaggi di posta elettronica come un token. Questo tokenizer viene implementato tramite Apache Lucene.
UniqueTokenFilter	Filtra i token con lo stesso testo del token precedente. Questo filtro di token viene implementato usando Apache Lucene.
VectorEncodingFormat	Formato di codifica per l'interpretazione del contenuto del campo vettoriale.
VectorSearch	Contiene le opzioni di configurazione correlate alla ricerca vettoriale.
VectorSearchAlgorithmKind	Algoritmo utilizzato per l'indicizzazione e l'esecuzione di query.
VectorSearchAlgorithmMetric	Metrica di somiglianza da usare per i confronti vettoriali. È consigliabile scegliere la stessa metrica di somiglianza del modello di incorporamento su cui è stato eseguito il training.
VectorSearchCompressionKind	Metodo di compressione utilizzato per l'indicizzazione e l'esecuzione di query.
VectorSearchCompressionTargetDataType	Tipo di dati quantizzato di valori vettoriali compressi.
VectorSearchProfile	Definisce una combinazione di configurazioni da usare con la ricerca vettoriale.
VectorSearchVectorizerKind	Metodo di vettorizzazione da usare durante il tempo di query.
WebApiParameters	Specifica le proprietà per la connessione a un vettore definito dall'utente.
WebApiVectorizer	Specifica un vettore definito dall'utente per generare l'incorporamento del vettore di una stringa di query. L'integrazione di un vettore esterno viene ottenuta usando l'interfaccia API Web personalizzata di un set di competenze.
WordDelimiterTokenFilter	Suddivide le parole in parole secondarie ed esegue trasformazioni facoltative nei gruppi di sottoword. Questo filtro di token viene implementato usando Apache Lucene.

AsciiFoldingTokenFilter

Object

Converte caratteri Unicode alfabetici, numerici e simbolici che non si trovano nei primi 127 caratteri ASCII (blocco Unicode "Latino di base") nei rispettivi equivalenti ASCII, se tali equivalenti esistono. Questo filtro di token viene implementato usando Apache Lucene.

Nome	Tipo	Valore predefinito	Descrizione
@odata.type	string: #Microsoft.Azure.Search.AsciiFoldingTokenFilter		Frammento URI che specifica il tipo di filtro del token.
name	string		Nome del filtro del token. Deve contenere solo lettere, cifre, spazi, trattini o caratteri di sottolineatura, può iniziare e terminare solo con caratteri alfanumerici ed è limitato a 128 caratteri.
preserveOriginal	boolean	False	Valore che indica se il token originale verrà mantenuto. Il valore predefinito è false.

AzureActiveDirectoryApplicationCredentials

Object

Credenziali di un'applicazione registrata creata per il servizio di ricerca, usata per l'accesso autenticato alle chiavi di crittografia archiviate in Azure Key Vault.

Nome	Tipo	Descrizione
applicationId	string	ID applicazione AAD a cui sono state concesse le autorizzazioni di accesso necessarie all'insieme di credenziali delle chiavi di Azure da usare durante la crittografia dei dati inattivi. L'ID applicazione non deve essere confuso con l'ID oggetto per l'applicazione AAD.
applicationSecret	string	Chiave di autenticazione dell'applicazione AAD specificata.

AzureOpenAIEmbeddingSkill

Object

Consente di generare un'incorporamento vettoriale per un input di testo specificato usando la risorsa OpenAI di Azure.

Nome	Tipo	Descrizione
@odata.type	string: #Microsoft.Skills.Text.AzureOpenAIEmbeddingSkill	Frammento URI che specifica il tipo di competenza.
apiKey	string	Chiave API della risorsa OpenAI di Azure designata.
authIdentity	SearchIndexerDataIdentity: SearchIndexerDataNoneIdentity SearchIndexerDataUserAssignedIdentity	Identità gestita assegnata dall'utente usata per le connessioni in uscita.
context	string	Rappresenta il livello in cui vengono eseguite le operazioni, ad esempio la radice del documento o il contenuto del documento, ad esempio /document o /document/content. Il valore predefinito è /document.
deploymentId	string	ID della distribuzione del modello OpenAI di Azure nella risorsa designata.
description	string	Descrizione della competenza che descrive gli input, gli output e l'utilizzo della competenza.
dimensions	integer (int32)	Numero di dimensioni che devono essere presenti gli incorporamenti di output risultanti. Supportato solo nei modelli text-embedding-3 e versioni successive.
inputs	InputFieldMappingEntry[]	Gli input delle competenze possono essere una colonna nel set di dati di origine o l'output di una competenza upstream.
modelName	AzureOpenAIModelName	Nome del modello di incorporamento distribuito nel percorso deploymentId specificato.
name	string	Nome della competenza che lo identifica in modo univoco all'interno del set di competenze. A una competenza senza nome definito verrà assegnato un nome predefinito del relativo indice basato su 1 nella matrice di competenze, preceduto dal carattere '#'.
outputs	OutputFieldMappingEntry[]	L'output di una competenza è un campo in un indice di ricerca o un valore che può essere utilizzato come input da un'altra competenza.
resourceUri	string (uri)	URI della risorsa OpenAI di Azure.

AzureOpenAIModelName

Enumerazione

Nome del modello di Azure Open AI che verrà chiamato.

Valore	Descrizione
text-embedding-3-large
text-embedding-3-small
text-embedding-ada-002

AzureOpenAIParameters

Object

Specifica i parametri per la connessione alla risorsa OpenAI di Azure.

Nome	Tipo	Descrizione
apiKey	string	Chiave API della risorsa OpenAI di Azure designata.
authIdentity	SearchIndexerDataIdentity: SearchIndexerDataNoneIdentity SearchIndexerDataUserAssignedIdentity	Identità gestita assegnata dall'utente usata per le connessioni in uscita.
deploymentId	string	ID della distribuzione del modello OpenAI di Azure nella risorsa designata.
modelName	AzureOpenAIModelName	Nome del modello di incorporamento distribuito nel percorso deploymentId specificato.
resourceUri	string (uri)	URI della risorsa OpenAI di Azure.

AzureOpenAIVectorizer

Object

Specifica la risorsa OpenAI di Azure usata per vettorizzare una stringa di query.

Nome	Tipo	Descrizione
azureOpenAIParameters	AzureOpenAIParameters: AzureOpenAIEmbeddingSkill	Contiene i parametri specifici per l'incorporamento di Azure OpenAI.
kind	string: azureOpenAI	Nome del tipo di metodo di vettorizzazione configurato per l'uso con la ricerca vettoriale.
name	string	Nome da associare a questo particolare metodo di vettorizzazione.

BinaryQuantizationVectorSearchCompressionConfiguration

Object

Contiene opzioni di configurazione specifiche per il metodo di compressione della quantizzazione binaria usato durante l'indicizzazione e l'esecuzione di query.

Nome	Tipo	Valore predefinito	Descrizione
defaultOversampling	number (double)		Fattore di sovracampionamento predefinito. L'overcampionamento richiede internamente più documenti (specificati da questo moltiplicatore) nella ricerca iniziale. Questo aumenta il set di risultati che verranno rivalutati usando punteggi di somiglianza ricalcolata da vettori con precisione completa. Il valore minimo è 1, ovvero nessun sovracampionamento (1x). Questo parametro può essere impostato solo quando rerankWithOriginalVectors è true. I valori più elevati migliorano il richiamo a scapito della latenza.
kind	string: binaryQuantization		Nome del tipo di metodo di compressione da configurare per l'uso con la ricerca vettoriale.
name	string		Nome da associare a questa configurazione specifica.
rerankWithOriginalVectors	boolean	True	Se impostato su true, una volta ottenuto il set ordinato di risultati calcolati usando vettori compressi, questi verranno rivalutati ricalcolando i punteggi di somiglianza con precisione completa. Ciò migliorerà il richiamo a scapito della latenza.

BM25Similarity

Object

Funzione di classificazione basata sull'algoritmo di somiglianza okapi BM25. BM25 è un algoritmo simile a TF-IDF che include la normalizzazione della lunghezza (controllata dal parametro 'b'), nonché la saturazione della frequenza dei termini (controllata dal parametro 'k1').

Nome	Tipo	Descrizione
@odata.type	string: #Microsoft.Azure.Search.BM25Similarity
b	number (double)	Questa proprietà controlla il modo in cui la lunghezza di un documento influisce sul punteggio di pertinenza. Per impostazione predefinita, viene usato un valore pari a 0,75. Il valore 0,0 indica che non viene applicata alcuna normalizzazione della lunghezza, mentre un valore pari a 1,0 indica che il punteggio è completamente normalizzato in base alla lunghezza del documento.
k1	number (double)	Questa proprietà controlla la funzione di ridimensionamento tra la frequenza dei termini di ogni termine e il punteggio di pertinenza finale di una coppia di query di documenti. Per impostazione predefinita, viene usato un valore pari a 1,2. Un valore pari a 0,0 indica che il punteggio non viene ridimensionato con un aumento della frequenza di termine.

CharFilterName

Enumerazione

Definisce i nomi di tutti i filtri di caratteri supportati dal motore di ricerca.

Valore	Descrizione
html_strip	Filtro di caratteri che tenta di rimuovere i costrutti HTML. Fare riferimento a https://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/charfilter/HTMLStripCharFilter.html

CjkBigramTokenFilter

Object

Forma bigrams dei termini CJK generati dal tokenizer standard. Questo filtro di token viene implementato usando Apache Lucene.

Nome	Tipo	Valore predefinito	Descrizione
@odata.type	string: #Microsoft.Azure.Search.CjkBigramTokenFilter		Frammento URI che specifica il tipo di filtro del token.
ignoreScripts	CjkBigramTokenFilterScripts[]		Script da ignorare.
name	string		Nome del filtro del token. Deve contenere solo lettere, cifre, spazi, trattini o caratteri di sottolineatura, può iniziare e terminare solo con caratteri alfanumerici ed è limitato a 128 caratteri.
outputUnigrams	boolean	False	Valore che indica se restituire sia unigrammi che bigrams (se true) o solo bigrams (se false). Il valore predefinito è false.

CjkBigramTokenFilterScripts

Enumerazione

Script che possono essere ignorati da CjkBigramTokenFilter.

Valore	Descrizione
han	Ignorare lo script Han durante la creazione di bigram dei termini CJK.
hangul	Ignorare lo script Hangul quando si formano grandiram dei termini CJK.
hiragana	Ignorare lo script Hiragana durante la creazione di bigram dei termini CJK.
katakana	Ignorare lo script Katakana durante la creazione di bigram dei termini CJK.

ClassicSimilarity

Object

Algoritmo di somiglianza legacy che usa l'implementazione lucene TFIDFSimilarity di TF-IDF. Questa variazione di TF-IDF introduce la normalizzazione statica della lunghezza del documento, nonché fattori di coordinamento che penalizzano i documenti che corrispondono solo parzialmente alle query sottoposte a ricerca.

Nome	Tipo	Descrizione
@odata.type	string: #Microsoft.Azure.Search.ClassicSimilarity

ClassicTokenizer

Object

Tokenizzatore basato su grammatica adatto per l'elaborazione della maggior parte dei documenti in lingua europea. Questo tokenizer viene implementato tramite Apache Lucene.

Nome	Tipo	Valore predefinito	Descrizione
@odata.type	string: #Microsoft.Azure.Search.ClassicTokenizer		Frammento URI che specifica il tipo di tokenizer.
maxTokenLength	integer (int32) maximum: 300	255	Lunghezza massima del token. Il valore predefinito è 255. I token più lunghi della lunghezza massima vengono suddivisi. La lunghezza massima del token che può essere usata è di 300 caratteri.
name	string		Nome del tokenizer. Deve contenere solo lettere, cifre, spazi, trattini o caratteri di sottolineatura, può iniziare e terminare solo con caratteri alfanumerici ed è limitato a 128 caratteri.

CommonGramTokenFilter

Object

Costruisci bigram per i termini che si verificano di frequente durante l'indicizzazione. Anche i termini singoli sono indicizzati, con bigrams sovrapposti. Questo filtro di token viene implementato usando Apache Lucene.

Nome	Tipo	Valore predefinito	Descrizione
@odata.type	string: #Microsoft.Azure.Search.CommonGramTokenFilter		Frammento URI che specifica il tipo di filtro del token.
commonWords	string[]		Set di parole comuni.
ignoreCase	boolean	False	Valore che indica se le parole comuni corrispondenti saranno senza distinzione tra maiuscole e minuscole. Il valore predefinito è false.
name	string		Nome del filtro del token. Deve contenere solo lettere, cifre, spazi, trattini o caratteri di sottolineatura, può iniziare e terminare solo con caratteri alfanumerici ed è limitato a 128 caratteri.
queryMode	boolean	False	Valore che indica se il filtro del token è in modalità query. In modalità query, il filtro token genera bigrams e quindi rimuove parole comuni e singoli termini seguiti da una parola comune. Il valore predefinito è false.

CorsOptions

Object

Definisce le opzioni per controllare la condivisione di risorse tra le origini (CORS) per un indice.

Nome	Tipo	Descrizione
allowedOrigins	string[]	Elenco di origini da cui al codice JavaScript verrà concesso l'accesso all'indice. Può contenere un elenco di host nel formato {protocol}://{fully-qualified-domain-name}[:{port#}], o un singolo '*' per consentire tutte le origini (non consigliate).
maxAgeInSeconds	integer (int64)	Durata per cui i browser devono memorizzare nella cache le risposte preliminari CORS. Il valore predefinito è 5 minuti.

CustomAnalyzer

Object

Consente di assumere il controllo del processo di conversione del testo in token indicizzabili/ricercabili. Si tratta di una configurazione definita dall'utente costituita da un singolo tokenizzatore predefinito e uno o più filtri. Il tokenizer è responsabile dell'interruzione del testo nei token e dei filtri per la modifica dei token generati dal tokenizer.

Nome	Tipo	Descrizione
@odata.type	string: #Microsoft.Azure.Search.CustomAnalyzer	Frammento URI che specifica il tipo di analizzatore.
charFilters	CharFilterName[]	Elenco di filtri di caratteri usati per preparare il testo di input prima che venga elaborato dal tokenizer. Ad esempio, possono sostituire determinati caratteri o simboli. I filtri vengono eseguiti nell'ordine in cui sono elencati.
name	string	Nome dell'analizzatore. Deve contenere solo lettere, cifre, spazi, trattini o caratteri di sottolineatura, può iniziare e terminare solo con caratteri alfanumerici ed è limitato a 128 caratteri.
tokenFilters	TokenFilterName[]	Elenco di filtri di token usati per filtrare o modificare i token generati da un tokenizer. Ad esempio, è possibile specificare un filtro minuscolo che converte tutti i caratteri in lettere minuscole. I filtri vengono eseguiti nell'ordine in cui sono elencati.
tokenizer	LexicalTokenizerName	Nome del tokenizer da usare per dividere il testo continuo in una sequenza di token, ad esempio suddividendo una frase in parole.

DictionaryDecompounderTokenFilter

Object

Scompone parole composte presenti in molte lingue germaniche. Questo filtro di token viene implementato usando Apache Lucene.

Nome	Tipo	Valore predefinito	Descrizione
@odata.type	string: #Microsoft.Azure.Search.DictionaryDecompounderTokenFilter		Frammento URI che specifica il tipo di filtro del token.
maxSubwordSize	integer (int32) maximum: 300	15	Dimensione massima della sottomaschera. Vengono restituite solo le parole secondarie più brevi di questa. Il valore predefinito è 15. Il valore massimo è 300.
minSubwordSize	integer (int32) maximum: 300	2	Dimensione minima della sottomaschera. Vengono restituite solo le parole secondarie più lunghe di questa. Il valore predefinito è 2. Il valore massimo è 300.
minWordSize	integer (int32) maximum: 300	5	Dimensioni minime delle parole. Solo parole più lunghe di quelle elaborate. Il valore predefinito è 5. Il valore massimo è 300.
name	string		Nome del filtro del token. Deve contenere solo lettere, cifre, spazi, trattini o caratteri di sottolineatura, può iniziare e terminare solo con caratteri alfanumerici ed è limitato a 128 caratteri.
onlyLongestMatch	boolean	False	Valore che indica se aggiungere all'output solo la sottofazione corrispondente più lunga. Il valore predefinito è false.
wordList	string[]		Elenco di parole con cui trovare una corrispondenza.

DistanceScoringFunction

Object

Definisce una funzione che aumenta i punteggi in base alla distanza da una posizione geografica.

Nome	Tipo	Descrizione
boost	number (double)	Moltiplicatore per il punteggio non elaborato. Deve essere un numero positivo diverso da 1,0.
distance	DistanceScoringParameters	Valori dei parametri per la funzione di assegnazione dei punteggi della distanza.
fieldName	string	Nome del campo utilizzato come input per la funzione di assegnazione dei punteggi.
interpolation	ScoringFunctionInterpolation	Valore che indica come verrà interpolata la priorità tra i punteggi dei documenti; il valore predefinito è "Lineare".
type	string: distance	Indica il tipo di funzione da usare. I valori validi includono grandezza, freschezza, distanza e tag. Il tipo di funzione deve essere minuscolo.

DistanceScoringParameters

Object

Fornisce i valori dei parametri a una funzione di assegnazione dei punteggi della distanza.

Nome	Tipo	Descrizione
boostingDistance	number (double)	Distanza in chilometri dalla posizione di riferimento in cui termina l'intervallo di boosting.
referencePointParameter	string	Nome del parametro passato nelle query di ricerca per specificare il percorso di riferimento.

EdgeNGramTokenFilter

Object

Genera n-grammi delle dimensioni specificate a partire dalla parte anteriore o posteriore di un token di input. Questo filtro di token viene implementato usando Apache Lucene.

Nome	Tipo	Valore predefinito	Descrizione
@odata.type	string: #Microsoft.Azure.Search.EdgeNGramTokenFilter		Frammento URI che specifica il tipo di filtro del token.
maxGram	integer (int32)	2	Lunghezza massima di n grammi. Il valore predefinito è 2.
minGram	integer (int32)	1	Lunghezza minima di n grammi. Il valore predefinito è 1. Deve essere minore del valore di maxGram.
name	string		Nome del filtro del token. Deve contenere solo lettere, cifre, spazi, trattini o caratteri di sottolineatura, può iniziare e terminare solo con caratteri alfanumerici ed è limitato a 128 caratteri.
side	EdgeNGramTokenFilterSide	front	Specifica il lato dell'input da cui deve essere generato il n-gram. Il valore predefinito è "front".

EdgeNGramTokenFilterSide

Enumerazione

Specifica il lato dell'input da cui deve essere generato un n-gram.

Valore	Descrizione
back	Specifica che il n-gram deve essere generato dalla parte posteriore dell'input.
front	Specifica che il n-gram deve essere generato dalla parte anteriore dell'input.

EdgeNGramTokenFilterV2

Object

Genera n-grammi delle dimensioni specificate a partire dalla parte anteriore o posteriore di un token di input. Questo filtro di token viene implementato usando Apache Lucene.

Nome	Tipo	Valore predefinito	Descrizione
@odata.type	string: #Microsoft.Azure.Search.EdgeNGramTokenFilterV2		Frammento URI che specifica il tipo di filtro del token.
maxGram	integer (int32) maximum: 300	2	Lunghezza massima di n grammi. Il valore predefinito è 2. Il valore massimo è 300.
minGram	integer (int32) maximum: 300	1	Lunghezza minima di n grammi. Il valore predefinito è 1. Il valore massimo è 300. Deve essere minore del valore di maxGram.
name	string		Nome del filtro del token. Deve contenere solo lettere, cifre, spazi, trattini o caratteri di sottolineatura, può iniziare e terminare solo con caratteri alfanumerici ed è limitato a 128 caratteri.
side	EdgeNGramTokenFilterSide	front	Specifica il lato dell'input da cui deve essere generato il n-gram. Il valore predefinito è "front".

EdgeNGramTokenizer

Object

Tokenzza l'input da un bordo in n-grammi delle dimensioni specificate. Questo tokenizer viene implementato tramite Apache Lucene.

Nome	Tipo	Valore predefinito	Descrizione
@odata.type	string: #Microsoft.Azure.Search.EdgeNGramTokenizer		Frammento URI che specifica il tipo di tokenizer.
maxGram	integer (int32) maximum: 300	2	Lunghezza massima di n grammi. Il valore predefinito è 2. Il valore massimo è 300.
minGram	integer (int32) maximum: 300	1	Lunghezza minima di n grammi. Il valore predefinito è 1. Il valore massimo è 300. Deve essere minore del valore di maxGram.
name	string		Nome del tokenizer. Deve contenere solo lettere, cifre, spazi, trattini o caratteri di sottolineatura, può iniziare e terminare solo con caratteri alfanumerici ed è limitato a 128 caratteri.
tokenChars	TokenCharacterKind[]		Classi di caratteri da mantenere nei token.

ElisionTokenFilter

Object

Rimuove le elisioni. Ad esempio, "l'avion" (il piano) verrà convertito in "avion" (piano). Questo filtro di token viene implementato usando Apache Lucene.

Nome	Tipo	Descrizione
@odata.type	string: #Microsoft.Azure.Search.ElisionTokenFilter	Frammento URI che specifica il tipo di filtro del token.
articles	string[]	Set di articoli da rimuovere.
name	string	Nome del filtro del token. Deve contenere solo lettere, cifre, spazi, trattini o caratteri di sottolineatura, può iniziare e terminare solo con caratteri alfanumerici ed è limitato a 128 caratteri.

ErrorAdditionalInfo

Object

Informazioni aggiuntive sull'errore di gestione delle risorse.

Nome	Tipo	Descrizione
info	object	Informazioni aggiuntive.
type	string	Tipo di informazioni aggiuntive.

ErrorDetail

Object

Dettagli dell'errore.

Nome	Tipo	Descrizione
additionalInfo	ErrorAdditionalInfo[]	Informazioni aggiuntive sull'errore.
code	string	Codice di errore.
details	ErrorDetail[]	Dettagli dell'errore.
message	string	Messaggio di errore.
target	string	Destinazione dell'errore.

ErrorResponse

Object

Risposta di errore

Nome	Tipo	Descrizione
error	ErrorDetail	Oggetto error.

ExhaustiveKnnParameters

Object

Contiene i parametri specifici dell'algoritmo KNN completo.

Nome	Tipo	Descrizione
metric	VectorSearchAlgorithmMetric	Metrica di somiglianza da usare per i confronti vettoriali.

ExhaustiveKnnVectorSearchAlgorithmConfiguration

Object

Contiene opzioni di configurazione specifiche dell'algoritmo KNN completo usato durante l'esecuzione di query, che eseguirà la ricerca di forza bruta nell'intero indice vettoriale.

Nome	Tipo	Descrizione
exhaustiveKnnParameters	ExhaustiveKnnParameters	Contiene i parametri specifici dell'algoritmo KNN completo.
kind	string: exhaustiveKnn	Nome del tipo di algoritmo configurato per l'uso con la ricerca vettoriale.
name	string	Nome da associare a questa configurazione specifica.

FreshnessScoringFunction

Object

Definisce una funzione che aumenta i punteggi in base al valore di un campo di data e ora.

Nome	Tipo	Descrizione
boost	number (double)	Moltiplicatore per il punteggio non elaborato. Deve essere un numero positivo diverso da 1,0.
fieldName	string	Nome del campo utilizzato come input per la funzione di assegnazione dei punteggi.
freshness	FreshnessScoringParameters	Valori dei parametri per la funzione di assegnazione dei punteggi di aggiornamento.
interpolation	ScoringFunctionInterpolation	Valore che indica come verrà interpolata la priorità tra i punteggi dei documenti; il valore predefinito è "Lineare".
type	string: freshness	Indica il tipo di funzione da usare. I valori validi includono grandezza, freschezza, distanza e tag. Il tipo di funzione deve essere minuscolo.

FreshnessScoringParameters

Object

Fornisce i valori dei parametri a una funzione di assegnazione dei punteggi di aggiornamento.

Nome	Tipo	Descrizione
boostingDuration	string (duration)	Periodo di scadenza dopo il quale l'aumento della priorità verrà interrotto per un documento specifico.

HnswParameters

Object

Contiene i parametri specifici dell'algoritmo HNSW.

Nome	Tipo	Valore predefinito	Descrizione
efConstruction	integer (int32) minimum: 100 maximum: 1000	400	Dimensione dell'elenco dinamico contenente i vicini più vicini, che viene utilizzato durante il tempo di indice. L'aumento di questo parametro può migliorare la qualità dell'indice, a scapito dell'aumento del tempo di indicizzazione. A un certo punto, l'aumento di questo parametro comporta una diminuzione dei rendimenti.
efSearch	integer (int32) minimum: 100 maximum: 1000	500	Dimensioni dell'elenco dinamico contenente i vicini più vicini, che vengono utilizzati durante la ricerca. L'aumento di questo parametro può migliorare i risultati della ricerca, a scapito della ricerca più lenta. A un certo punto, l'aumento di questo parametro comporta una diminuzione dei rendimenti.
m	integer (int32) minimum: 4 maximum: 10	4	Numero di collegamenti bidirezionali creati per ogni nuovo elemento durante la costruzione. L'aumento di questo valore di parametro può migliorare il richiamo e ridurre i tempi di recupero per i set di dati con un'elevata dimensionalità intrinseca a scapito dell'aumento del consumo di memoria e del tempo di indicizzazione più lungo.
metric	VectorSearchAlgorithmMetric		Metrica di somiglianza da usare per i confronti vettoriali.

HnswVectorSearchAlgorithmConfiguration

Object

Contiene opzioni di configurazione specifiche dell'algoritmo HNSW approssimato vicino usato durante l'indicizzazione e l'esecuzione di query. L'algoritmo HNSW offre un compromesso ottimizzabile tra velocità di ricerca e accuratezza.

Nome	Tipo	Descrizione
hnswParameters	HnswParameters	Contiene i parametri specifici dell'algoritmo HNSW.
kind	string: hnsw	Nome del tipo di algoritmo configurato per l'uso con la ricerca vettoriale.
name	string	Nome da associare a questa configurazione specifica.

InputFieldMappingEntry

Object

Mapping dei campi di input per una competenza.

Nome	Tipo	Descrizione
inputs	InputFieldMappingEntry[]	Input ricorsivi utilizzati durante la creazione di un tipo complesso.
name	string	Nome dell'input.
source	string	Origine dell'input.
sourceContext	string	Contesto di origine usato per la selezione di input ricorsivi.

KeepTokenFilter

Object

Filtro di token che mantiene solo i token con testo contenuto in un elenco specificato di parole. Questo filtro di token viene implementato usando Apache Lucene.

Nome	Tipo	Valore predefinito	Descrizione
@odata.type	string: #Microsoft.Azure.Search.KeepTokenFilter		Frammento URI che specifica il tipo di filtro del token.
keepWords	string[]		Elenco di parole da conservare.
keepWordsCase	boolean	False	Valore che indica se prima tutte le parole vengono minuscole. Il valore predefinito è false.
name	string		Nome del filtro del token. Deve contenere solo lettere, cifre, spazi, trattini o caratteri di sottolineatura, può iniziare e terminare solo con caratteri alfanumerici ed è limitato a 128 caratteri.

KeywordMarkerTokenFilter

Object

Contrassegna i termini come parole chiave. Questo filtro di token viene implementato usando Apache Lucene.

Nome	Tipo	Valore predefinito	Descrizione
@odata.type	string: #Microsoft.Azure.Search.KeywordMarkerTokenFilter		Frammento URI che specifica il tipo di filtro del token.
ignoreCase	boolean	False	Valore che indica se ignorare la distinzione tra maiuscole e minuscole. Se true, tutte le parole vengono convertite in lettere minuscole. Il valore predefinito è false.
keywords	string[]		Elenco di parole da contrassegnare come parole chiave.
name	string		Nome del filtro del token. Deve contenere solo lettere, cifre, spazi, trattini o caratteri di sottolineatura, può iniziare e terminare solo con caratteri alfanumerici ed è limitato a 128 caratteri.

KeywordTokenizer

Object

Genera l'intero input come singolo token. Questo tokenizer viene implementato tramite Apache Lucene.

Nome	Tipo	Valore predefinito	Descrizione
@odata.type	string: #Microsoft.Azure.Search.KeywordTokenizer		Frammento URI che specifica il tipo di tokenizer.
bufferSize	integer (int32)	256	Dimensione del buffer di lettura in byte. Il valore predefinito è 256.
name	string		Nome del tokenizer. Deve contenere solo lettere, cifre, spazi, trattini o caratteri di sottolineatura, può iniziare e terminare solo con caratteri alfanumerici ed è limitato a 128 caratteri.

KeywordTokenizerV2

Object

Genera l'intero input come singolo token. Questo tokenizer viene implementato tramite Apache Lucene.

Nome	Tipo	Valore predefinito	Descrizione
@odata.type	string: #Microsoft.Azure.Search.KeywordTokenizerV2		Frammento URI che specifica il tipo di tokenizer.
maxTokenLength	integer (int32) maximum: 300	256	Lunghezza massima del token. Il valore predefinito è 256. I token più lunghi della lunghezza massima vengono suddivisi. La lunghezza massima del token che può essere usata è di 300 caratteri.
name	string		Nome del tokenizer. Deve contenere solo lettere, cifre, spazi, trattini o caratteri di sottolineatura, può iniziare e terminare solo con caratteri alfanumerici ed è limitato a 128 caratteri.

LengthTokenFilter

Object

Rimuove parole troppo lunghe o troppo brevi. Questo filtro di token viene implementato usando Apache Lucene.

Nome	Tipo	Valore predefinito	Descrizione
@odata.type	string: #Microsoft.Azure.Search.LengthTokenFilter		Frammento URI che specifica il tipo di filtro del token.
max	integer (int32) maximum: 300	300	Lunghezza massima in caratteri. Il valore predefinito e massimo è 300.
min	integer (int32) maximum: 300	0	Lunghezza minima in caratteri. Il valore predefinito è 0. Il valore massimo è 300. Deve essere minore del valore massimo.
name	string		Nome del filtro del token. Deve contenere solo lettere, cifre, spazi, trattini o caratteri di sottolineatura, può iniziare e terminare solo con caratteri alfanumerici ed è limitato a 128 caratteri.

LexicalAnalyzerName

Enumerazione

Definisce i nomi di tutti gli analizzatori di testo supportati dal motore di ricerca.

Valore	Descrizione
ar.lucene	Analizzatore Lucene per l'arabo.
ar.microsoft	Analizzatore Microsoft per l'arabo.
bg.lucene	Analizzatore Lucene per bulgaro.
bg.microsoft	Analizzatore Microsoft per bulgaro.
bn.microsoft	Analizzatore Microsoft per Bangla.
ca.lucene	Analizzatore Lucene per catalano.
ca.microsoft	Analizzatore Microsoft per catalano.
cs.lucene	Analizzatore Lucene per ceco.
cs.microsoft	Analizzatore Microsoft per ceco.
da.lucene	Analizzatore Lucene per danese.
da.microsoft	Analizzatore Microsoft per danese.
de.lucene	Analizzatore Lucene per tedesco.
de.microsoft	Analizzatore Microsoft per tedesco.
el.lucene	Analizzatore Lucene per greco.
el.microsoft	Analizzatore Microsoft per greco.
en.lucene	Analizzatore Lucene per l'inglese.
en.microsoft	Analizzatore Microsoft per la lingua inglese.
es.lucene	Analizzatore Lucene per spagnolo.
es.microsoft	Analizzatore Microsoft per spagnolo.
et.microsoft	Analizzatore Microsoft per Estonian.
eu.lucene	Analizzatore Lucene per basco.
fa.lucene	Analizzatore Lucene per persiano.
fi.lucene	Analizzatore Lucene per finlandese.
fi.microsoft	Analizzatore Microsoft per il finlandese.
fr.lucene	Analizzatore Lucene per francese.
fr.microsoft	Analizzatore Microsoft per francese.
ga.lucene	Analizzatore Lucene per irlandese.
gl.lucene	Analizzatore Lucene per La Galizia.
gu.microsoft	Analizzatore Microsoft per Gujarati.
he.microsoft	Analizzatore Microsoft per l'ebraico.
hi.lucene	Analizzatore Lucene per Hindi.
hi.microsoft	Analizzatore Microsoft per Hindi.
hr.microsoft	Analizzatore Microsoft per croato.
hu.lucene	Analizzatore Lucene per ungherese.
hu.microsoft	Analizzatore Microsoft per ungherese.
hy.lucene	Analizzatore Lucene per armeno.
id.lucene	Analizzatore Lucene per indonesiano.
id.microsoft	Analizzatore Microsoft per Indonesiano (Bahasa).
is.microsoft	Analizzatore Microsoft per islandese.
it.lucene	Analizzatore Lucene per italiano.
it.microsoft	Analizzatore Microsoft per italiano.
ja.lucene	Analizzatore Lucene per il giapponese.
ja.microsoft	Analizzatore Microsoft per il giapponese.
keyword	Considera l'intero contenuto di un campo come un singolo token. Ciò è utile per i dati, ad esempio i codici postali, gli ID e alcuni nomi di prodotto. Fare riferimento a http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/KeywordAnalyzer.html
kn.microsoft	Analizzatore Microsoft per Kannada.
ko.lucene	Analizzatore Lucene per coreano.
ko.microsoft	Analizzatore Microsoft per coreano.
lt.microsoft	Analizzatore Microsoft per lituano.
lv.lucene	Analizzatore Lucene per lettone.
lv.microsoft	Analizzatore Microsoft per lettone.
ml.microsoft	Analizzatore Microsoft per Malayalam.
mr.microsoft	Analizzatore Microsoft per Marathi.
ms.microsoft	Analizzatore Microsoft per il malese (alfabeto latino).
nb.microsoft	Analizzatore Microsoft per Norvegese (Bokmål).
nl.lucene	Analizzatore Lucene per olandese.
nl.microsoft	Analizzatore Microsoft per olandese.
no.lucene	Analizzatore Lucene per Norvegese.
pa.microsoft	Analizzatore Microsoft per Punjabi.
pattern	Separa in modo flessibile il testo in termini tramite un criterio di espressione regolare. Fare riferimento a http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/PatternAnalyzer.html
pl.lucene	Analizzatore Lucene per polacco.
pl.microsoft	Analizzatore Microsoft per polacco.
pt-BR.lucene	Analizzatore Lucene per portoghese (Brasile).
pt-BR.microsoft	Analizzatore Microsoft per portoghese (Brasile).
pt-PT.lucene	Analizzatore Lucene per portoghese (Portogallo).
pt-PT.microsoft	Analizzatore Microsoft per portoghese (Portogallo).
ro.lucene	Analizzatore Lucene per romeno.
ro.microsoft	Analizzatore Microsoft per romeno.
ru.lucene	Analizzatore Lucene per russo.
ru.microsoft	Analizzatore Microsoft per russo.
simple	Divide il testo in lettere non e li converte in lettere minuscole. Fare riferimento a http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/SimpleAnalyzer.html
sk.microsoft	Analizzatore Microsoft per slovacco.
sl.microsoft	Analizzatore Microsoft per sloveno.
sr-cyrillic.microsoft	Analizzatore Microsoft per serbo (cirillico).
sr-latin.microsoft	Analizzatore Microsoft per serbo (alfabeto latino).
standard.lucene	Analizzatore Lucene standard.
standardasciifolding.lucene	Analizzatore Lucene di riduzione ASCII standard. Fare riferimento a https://learn.microsoft.com/rest/api/searchservice/Custom-analyzers-in-Azure-Search#Analyzers
stop	Divide il testo in corrispondenza di lettere non; Applica i filtri di token minuscoli e non significative. Fare riferimento a http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/StopAnalyzer.html
sv.lucene	Analizzatore Lucene per svedese.
sv.microsoft	Analizzatore Microsoft per svedese.
ta.microsoft	Analizzatore Microsoft per Tamil.
te.microsoft	Analizzatore Microsoft per Telugu.
th.lucene	Analizzatore Lucene per Thai.
th.microsoft	Analizzatore Microsoft per thai.
tr.lucene	Analizzatore Lucene per turco.
tr.microsoft	Analizzatore Microsoft per turco.
uk.microsoft	Analizzatore Microsoft per ucraino.
ur.microsoft	Analizzatore Microsoft per Urdu.
vi.microsoft	Analizzatore Microsoft per vietnamiti.
whitespace	Analizzatore che usa il tokenizer di spazi vuoti. Fare riferimento a http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/WhitespaceAnalyzer.html
zh-Hans.lucene	Analizzatore Lucene per il cinese (semplificato).
zh-Hans.microsoft	Analizzatore Microsoft per il cinese (semplificato).
zh-Hant.lucene	Analizzatore Lucene per il cinese (tradizionale).
zh-Hant.microsoft	Analizzatore Microsoft per il cinese (tradizionale).

LexicalTokenizerName

Enumerazione

Definisce i nomi di tutti i tokenizer supportati dal motore di ricerca.

Valore	Descrizione
classic	Tokenizzatore basato su grammatica adatto per l'elaborazione della maggior parte dei documenti in lingua europea. Fare riferimento a http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/standard/ClassicTokenizer.html
edgeNGram	Tokenzza l'input da un bordo in n-grammi delle dimensioni specificate. Fare riferimento a https://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/ngram/EdgeNGramTokenizer.html
keyword_v2	Genera l'intero input come singolo token. Fare riferimento a http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/KeywordTokenizer.html
letter	Divide il testo in corrispondenza di lettere non. Fare riferimento a http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/LetterTokenizer.html
lowercase	Divide il testo in lettere non e li converte in lettere minuscole. Fare riferimento a http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/LowerCaseTokenizer.html
microsoft_language_stemming_tokenizer	Divide il testo usando regole specifiche della lingua e riduce le parole alle relative forme di base.
microsoft_language_tokenizer	Divide il testo usando regole specifiche della lingua.
nGram	Tokenzza l'input in n-grammi delle dimensioni specificate. Fare riferimento a http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/ngram/NGramTokenizer.html
path_hierarchy_v2	Tokenizer per gerarchie simili al percorso. Fare riferimento a http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/path/PathHierarchyTokenizer.html
pattern	Tokenizer che usa criteri regex corrispondenti per costruire token distinti. Fare riferimento a http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/pattern/PatternTokenizer.html
standard_v2	Analizzatore Lucene standard; Composto dal tokenizer standard, dal filtro minuscolo e dal filtro di arresto. Fare riferimento a http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/standard/StandardTokenizer.html
uax_url_email	Tokenzza url e messaggi di posta elettronica come un token. Fare riferimento a http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/standard/UAX29URLEmailTokenizer.html
whitespace	Divide il testo in corrispondenza degli spazi vuoti. Fare riferimento a http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/WhitespaceTokenizer.html

LimitTokenFilter

Object

Limita il numero di token durante l'indicizzazione. Questo filtro di token viene implementato usando Apache Lucene.

Nome	Tipo	Valore predefinito	Descrizione
@odata.type	string: #Microsoft.Azure.Search.LimitTokenFilter		Frammento URI che specifica il tipo di filtro del token.
consumeAllTokens	boolean	False	Valore che indica se tutti i token dall'input devono essere utilizzati anche se viene raggiunto maxTokenCount. Il valore predefinito è false.
maxTokenCount	integer (int32)	1	Numero massimo di token da produrre. Il valore predefinito è 1.
name	string		Nome del filtro del token. Deve contenere solo lettere, cifre, spazi, trattini o caratteri di sottolineatura, può iniziare e terminare solo con caratteri alfanumerici ed è limitato a 128 caratteri.

LuceneStandardAnalyzer

Object

Analizzatore Apache Lucene standard; Composto dal tokenizer standard, dal filtro minuscolo e dal filtro di arresto.

Nome	Tipo	Valore predefinito	Descrizione
@odata.type	string: #Microsoft.Azure.Search.StandardAnalyzer		Frammento URI che specifica il tipo di analizzatore.
maxTokenLength	integer (int32) maximum: 300	255	Lunghezza massima del token. Il valore predefinito è 255. I token più lunghi della lunghezza massima vengono suddivisi. La lunghezza massima del token che può essere usata è di 300 caratteri.
name	string		Nome dell'analizzatore. Deve contenere solo lettere, cifre, spazi, trattini o caratteri di sottolineatura, può iniziare e terminare solo con caratteri alfanumerici ed è limitato a 128 caratteri.
stopwords	string[]		Elenco di parole non significative.

LuceneStandardTokenizer

Object

Interrompe il testo seguendo le regole di segmentazione del testo Unicode. Questo tokenizer viene implementato tramite Apache Lucene.

Nome	Tipo	Valore predefinito	Descrizione
@odata.type	string: #Microsoft.Azure.Search.StandardTokenizer		Frammento URI che specifica il tipo di tokenizer.
maxTokenLength	integer (int32)	255	Lunghezza massima del token. Il valore predefinito è 255. I token più lunghi della lunghezza massima vengono suddivisi.
name	string		Nome del tokenizer. Deve contenere solo lettere, cifre, spazi, trattini o caratteri di sottolineatura, può iniziare e terminare solo con caratteri alfanumerici ed è limitato a 128 caratteri.

LuceneStandardTokenizerV2

Object

Interrompe il testo seguendo le regole di segmentazione del testo Unicode. Questo tokenizer viene implementato tramite Apache Lucene.

Nome	Tipo	Valore predefinito	Descrizione
@odata.type	string: #Microsoft.Azure.Search.StandardTokenizerV2		Frammento URI che specifica il tipo di tokenizer.
maxTokenLength	integer (int32) maximum: 300	255	Lunghezza massima del token. Il valore predefinito è 255. I token più lunghi della lunghezza massima vengono suddivisi. La lunghezza massima del token che può essere usata è di 300 caratteri.
name	string		Nome del tokenizer. Deve contenere solo lettere, cifre, spazi, trattini o caratteri di sottolineatura, può iniziare e terminare solo con caratteri alfanumerici ed è limitato a 128 caratteri.

MagnitudeScoringFunction

Object

Definisce una funzione che aumenta i punteggi in base alla grandezza di un campo numerico.

Nome	Tipo	Descrizione
boost	number (double)	Moltiplicatore per il punteggio non elaborato. Deve essere un numero positivo diverso da 1,0.
fieldName	string	Nome del campo utilizzato come input per la funzione di assegnazione dei punteggi.
interpolation	ScoringFunctionInterpolation	Valore che indica come verrà interpolata la priorità tra i punteggi dei documenti; il valore predefinito è "Lineare".
magnitude	MagnitudeScoringParameters	Valori dei parametri per la funzione di assegnazione dei punteggi di grandezza.
type	string: magnitude	Indica il tipo di funzione da usare. I valori validi includono grandezza, freschezza, distanza e tag. Il tipo di funzione deve essere minuscolo.

MagnitudeScoringParameters

Object

Fornisce i valori dei parametri a una funzione di assegnazione dei punteggi di grandezza.

Nome	Tipo	Descrizione
boostingRangeEnd	number (double)	Valore del campo in corrispondenza del quale termina l'boosting.
boostingRangeStart	number (double)	Valore del campo in corrispondenza del quale inizia il boosting.
constantBoostBeyondRange	boolean	Valore che indica se applicare un incremento costante per i valori di campo oltre il valore finale dell'intervallo; il valore predefinito è false.

MappingCharFilter

Object

Filtro di caratteri che applica i mapping definiti con l'opzione mapping. La corrispondenza è greedy (criteri di ricerca più lunghi in un determinato punto vince). La sostituzione può essere la stringa vuota. Questo filtro di caratteri viene implementato tramite Apache Lucene.

Nome	Tipo	Descrizione
@odata.type	string: #Microsoft.Azure.Search.MappingCharFilter	Frammento URI che specifica il tipo di filtro char.
mappings	string[]	Elenco dei mapping del formato seguente: "a=>b" (tutte le occorrenze del carattere "a" verranno sostituite con il carattere "b").
name	string	Nome del filtro char. Deve contenere solo lettere, cifre, spazi, trattini o caratteri di sottolineatura, può iniziare e terminare solo con caratteri alfanumerici ed è limitato a 128 caratteri.

MicrosoftLanguageStemmingTokenizer

Object

Divide il testo usando regole specifiche della lingua e riduce le parole alle relative forme di base.

Nome	Tipo	Valore predefinito	Descrizione
@odata.type	string: #Microsoft.Azure.Search.MicrosoftLanguageStemmingTokenizer		Frammento URI che specifica il tipo di tokenizer.
isSearchTokenizer	boolean	False	Valore che indica come viene usato il tokenizer. Impostare su true se usato come tokenizer di ricerca, impostare su false se usato come tokenizzatore di indicizzazione. Il valore predefinito è false.
language	MicrosoftStemmingTokenizerLanguage		Lingua da usare. Il valore predefinito è Inglese.
maxTokenLength	integer (int32) maximum: 300	255	Lunghezza massima del token. I token più lunghi della lunghezza massima vengono suddivisi. La lunghezza massima del token che può essere usata è di 300 caratteri. I token più lunghi di 300 caratteri vengono prima suddivisi in token di lunghezza 300 e quindi ognuno di questi token viene suddiviso in base al set di lunghezza massima del token. Il valore predefinito è 255.
name	string		Nome del tokenizer. Deve contenere solo lettere, cifre, spazi, trattini o caratteri di sottolineatura, può iniziare e terminare solo con caratteri alfanumerici ed è limitato a 128 caratteri.

MicrosoftLanguageTokenizer

Object

Divide il testo usando regole specifiche della lingua.

Nome	Tipo	Valore predefinito	Descrizione
@odata.type	string: #Microsoft.Azure.Search.MicrosoftLanguageTokenizer		Frammento URI che specifica il tipo di tokenizer.
isSearchTokenizer	boolean	False	Valore che indica come viene usato il tokenizer. Impostare su true se usato come tokenizer di ricerca, impostare su false se usato come tokenizzatore di indicizzazione. Il valore predefinito è false.
language	MicrosoftTokenizerLanguage		Lingua da usare. Il valore predefinito è Inglese.
maxTokenLength	integer (int32) maximum: 300	255	Lunghezza massima del token. I token più lunghi della lunghezza massima vengono suddivisi. La lunghezza massima del token che può essere usata è di 300 caratteri. I token più lunghi di 300 caratteri vengono prima suddivisi in token di lunghezza 300 e quindi ognuno di questi token viene suddiviso in base al set di lunghezza massima del token. Il valore predefinito è 255.
name	string		Nome del tokenizer. Deve contenere solo lettere, cifre, spazi, trattini o caratteri di sottolineatura, può iniziare e terminare solo con caratteri alfanumerici ed è limitato a 128 caratteri.

MicrosoftStemmingTokenizerLanguage

Enumerazione

Elenca le lingue supportate dal tokenizer di stemming della lingua Microsoft.

Valore	Descrizione
arabic	Seleziona il tokenizzatore di stemming Microsoft per l'arabo.
bangla	Seleziona il tokenizzatore di stemming Microsoft per Bangla.
bulgarian	Seleziona il tokenizzatore di stemming Microsoft per bulgaro.
catalan	Seleziona il tokenizzatore di stemming Microsoft per catalano.
croatian	Seleziona il tokenizzatore di stemming Microsoft per croato.
czech	Seleziona il tokenizzatore di stemming Microsoft per ceco.
danish	Seleziona il tokenizzatore di stemming Microsoft per danese.
dutch	Seleziona il tokenizzatore di stemming Microsoft per olandese.
english	Seleziona il tokenizzatore di stemming Microsoft per l'inglese.
estonian	Seleziona il tokenizzatore di stemming Microsoft per estone.
finnish	Seleziona il tokenizzatore di stemming Microsoft per il finlandese.
french	Seleziona il tokenizzatore di stemming Microsoft per francese.
german	Seleziona il tokenizzatore di stemming Microsoft per tedesco.
greek	Seleziona il tokenizzatore di stemming Microsoft per greco.
gujarati	Seleziona il tokenizer di stemming Microsoft per Gujarati.
hebrew	Seleziona il tokenizzatore di stemming Microsoft per l'ebraico.
hindi	Seleziona il tokenizzatore di stemming Microsoft per Hindi.
hungarian	Seleziona il tokenizzatore di stemming Microsoft per ungherese.
icelandic	Seleziona il tokenizzatore di stemming Microsoft per islandese.
indonesian	Seleziona il tokenizzatore di stemming Microsoft per indonesiano.
italian	Seleziona il tokenizzatore di stemming Microsoft per italiano.
kannada	Seleziona il tokenizer di stemming Microsoft per Kannada.
latvian	Seleziona il tokenizzatore di stemming Microsoft per lettone.
lithuanian	Seleziona il tokenizzatore di stemming Microsoft per lituano.
malay	Seleziona il tokenizzatore di stemming Microsoft per Malay.
malayalam	Seleziona il tokenizzatore di stemming Microsoft per Malayalam.
marathi	Seleziona il tokenizer di stemming Microsoft per Marathi.
norwegianBokmaal	Seleziona il tokenizer di stemming Microsoft per Norvegese (Bokmål).
polish	Seleziona il tokenizzatore di stemming Microsoft per polacco.
portuguese	Seleziona il tokenizzatore di stemming Microsoft per portoghese.
portugueseBrazilian	Seleziona il tokenizzatore di stemming Microsoft per portoghese (Brasile).
punjabi	Seleziona il tokenizer di stemming Microsoft per Punjabi.
romanian	Seleziona il tokenizzatore di stemming Microsoft per romeno.
russian	Seleziona il tokenizzatore di stemming Microsoft per russo.
serbianCyrillic	Seleziona il tokenizzatore di stemming Microsoft per serbo (cirillico).
serbianLatin	Seleziona il tokenizzatore di stemming Microsoft per serbo (alfabeto latino).
slovak	Seleziona il tokenizzatore di stemming Microsoft per slovacco.
slovenian	Seleziona il tokenizzatore di stemming Microsoft per sloveno.
spanish	Seleziona il tokenizzatore di stemming Microsoft per spagnolo.
swedish	Seleziona il tokenizzatore di stemming Microsoft per svedese.
tamil	Seleziona il tokenizzatore di stemming Microsoft per Il Tamil.
telugu	Seleziona il tokenizzatore di stemming Microsoft per Telugu.
turkish	Seleziona il tokenizzatore di stemming Microsoft per turco.
ukrainian	Seleziona il tokenizzatore di stemming Microsoft per ucraino.
urdu	Seleziona il tokenizer di stemming Microsoft per Urdu.

MicrosoftTokenizerLanguage

Enumerazione

Elenca le lingue supportate dal tokenizzatore di linguaggio Microsoft.

Valore	Descrizione
bangla	Seleziona il tokenizer Microsoft per Bangla.
bulgarian	Seleziona il tokenizzatore Microsoft per bulgaro.
catalan	Seleziona il tokenizer Microsoft per Catalano.
chineseSimplified	Seleziona il tokenizer Microsoft per cinese (semplificato).
chineseTraditional	Seleziona il tokenizer Microsoft per il cinese (tradizionale).
croatian	Seleziona il tokenizer Microsoft per croato.
czech	Seleziona il tokenizer Microsoft per ceco.
danish	Seleziona il tokenizer Microsoft per danese.
dutch	Seleziona il tokenizer Microsoft per olandese.
english	Seleziona il tokenizer Microsoft per l'inglese.
french	Seleziona il tokenizer Microsoft per francese.
german	Seleziona il tokenizer Microsoft per tedesco.
greek	Seleziona il tokenizer Microsoft per greco.
gujarati	Seleziona il tokenizer Microsoft per Gujarati.
hindi	Seleziona il tokenizer Microsoft per Hindi.
icelandic	Seleziona il tokenizer Microsoft per Islanda.
indonesian	Seleziona il tokenizer Microsoft per indonesiano.
italian	Seleziona il tokenizer Microsoft per Italiano.
japanese	Seleziona il tokenizer Microsoft per il giapponese.
kannada	Seleziona il tokenizer Microsoft per Kannada.
korean	Seleziona il tokenizer Microsoft per coreano.
malay	Seleziona il tokenizer Microsoft per Malay.
malayalam	Seleziona il tokenizer Microsoft per Malayalam.
marathi	Seleziona il tokenizer Microsoft per Marathi.
norwegianBokmaal	Seleziona il tokenizer Microsoft per Norvegese (Bokmål).
polish	Seleziona il tokenizer Microsoft per Polacco.
portuguese	Seleziona il tokenizer Microsoft per portoghese.
portugueseBrazilian	Seleziona il tokenizer Microsoft per portoghese (Brasile).
punjabi	Seleziona il tokenizer Microsoft per Punjabi.
romanian	Seleziona il tokenizzatore Microsoft per romeno.
russian	Seleziona il tokenizer Microsoft per russo.
serbianCyrillic	Seleziona il tokenizzatore Microsoft per serbo (cirillico).
serbianLatin	Seleziona il tokenizer Microsoft per serbo (alfabeto latino).
slovenian	Seleziona il tokenizzatore Microsoft per sloveno.
spanish	Seleziona il tokenizer Microsoft per spagnolo.
swedish	Seleziona il tokenizer Microsoft per svedese.
tamil	Seleziona il tokenizer Microsoft per Tamil.
telugu	Seleziona il tokenizer Microsoft per Telugu.
thai	Seleziona il tokenizer Microsoft per Thai.
ukrainian	Seleziona il tokenizer Microsoft per ucraino.
urdu	Seleziona il tokenizer Microsoft per Urdu.
vietnamese	Seleziona il tokenizer Microsoft per vietnamita.

NGramTokenFilter

Object

Genera n-grammi delle dimensioni specificate. Questo filtro di token viene implementato usando Apache Lucene.

Nome	Tipo	Valore predefinito	Descrizione
@odata.type	string: #Microsoft.Azure.Search.NGramTokenFilter		Frammento URI che specifica il tipo di filtro del token.
maxGram	integer (int32)	2	Lunghezza massima di n grammi. Il valore predefinito è 2.
minGram	integer (int32)	1	Lunghezza minima di n grammi. Il valore predefinito è 1. Deve essere minore del valore di maxGram.
name	string		Nome del filtro del token. Deve contenere solo lettere, cifre, spazi, trattini o caratteri di sottolineatura, può iniziare e terminare solo con caratteri alfanumerici ed è limitato a 128 caratteri.

NGramTokenFilterV2

Object

Genera n-grammi delle dimensioni specificate. Questo filtro di token viene implementato usando Apache Lucene.

Nome	Tipo	Valore predefinito	Descrizione
@odata.type	string: #Microsoft.Azure.Search.NGramTokenFilterV2		Frammento URI che specifica il tipo di filtro del token.
maxGram	integer (int32) maximum: 300	2	Lunghezza massima di n grammi. Il valore predefinito è 2. Il valore massimo è 300.
minGram	integer (int32) maximum: 300	1	Lunghezza minima di n grammi. Il valore predefinito è 1. Il valore massimo è 300. Deve essere minore del valore di maxGram.
name	string		Nome del filtro del token. Deve contenere solo lettere, cifre, spazi, trattini o caratteri di sottolineatura, può iniziare e terminare solo con caratteri alfanumerici ed è limitato a 128 caratteri.

NGramTokenizer

Object

Tokenzza l'input in n-grammi delle dimensioni specificate. Questo tokenizer viene implementato tramite Apache Lucene.

Nome	Tipo	Valore predefinito	Descrizione
@odata.type	string: #Microsoft.Azure.Search.NGramTokenizer		Frammento URI che specifica il tipo di tokenizer.
maxGram	integer (int32) maximum: 300	2	Lunghezza massima di n grammi. Il valore predefinito è 2. Il valore massimo è 300.
minGram	integer (int32) maximum: 300	1	Lunghezza minima di n grammi. Il valore predefinito è 1. Il valore massimo è 300. Deve essere minore del valore di maxGram.
name	string		Nome del tokenizer. Deve contenere solo lettere, cifre, spazi, trattini o caratteri di sottolineatura, può iniziare e terminare solo con caratteri alfanumerici ed è limitato a 128 caratteri.
tokenChars	TokenCharacterKind[]		Classi di caratteri da mantenere nei token.

OutputFieldMappingEntry

Object

Mapping dei campi di output per una competenza.

Nome	Tipo	Descrizione
name	string	Nome dell'output definito dalla competenza.
targetName	string	Nome di destinazione dell'output. È facoltativo e il nome predefinito è .

PathHierarchyTokenizerV2

Object

Tokenizer per gerarchie simili al percorso. Questo tokenizer viene implementato tramite Apache Lucene.

Nome	Tipo	Valore predefinito	Descrizione
@odata.type	string: #Microsoft.Azure.Search.PathHierarchyTokenizerV2		Frammento URI che specifica il tipo di tokenizer.
delimiter	string (char)	/	Carattere delimitatore da utilizzare. Il valore predefinito è "/".
maxTokenLength	integer (int32) maximum: 300	300	Lunghezza massima del token. Il valore predefinito e massimo è 300.
name	string		Nome del tokenizer. Deve contenere solo lettere, cifre, spazi, trattini o caratteri di sottolineatura, può iniziare e terminare solo con caratteri alfanumerici ed è limitato a 128 caratteri.
replacement	string (char)	/	Valore che, se impostato, sostituisce il carattere delimitatore. Il valore predefinito è "/".
reverse	boolean	False	Valore che indica se generare token in ordine inverso. Il valore predefinito è false.
skip	integer (int32)	0	Numero di token iniziali da ignorare. Il valore predefinito è 0.

PatternAnalyzer

Object

Separa in modo flessibile il testo in termini tramite un criterio di espressione regolare. Questo analizzatore viene implementato usando Apache Lucene.

Nome	Tipo	Valore predefinito	Descrizione
@odata.type	string: #Microsoft.Azure.Search.PatternAnalyzer		Frammento URI che specifica il tipo di analizzatore.
flags	RegexFlags		Flag di espressione regolare.
lowercase	boolean	True	Valore che indica se i termini devono essere minuscoli. Il valore predefinito è true.
name	string		Nome dell'analizzatore. Deve contenere solo lettere, cifre, spazi, trattini o caratteri di sottolineatura, può iniziare e terminare solo con caratteri alfanumerici ed è limitato a 128 caratteri.
pattern	string	\W+	Modello di espressione regolare per trovare la corrispondenza con i separatori di token. Il valore predefinito è un'espressione che corrisponde a uno o più caratteri non alfanumerici.
stopwords	string[]		Elenco di parole non significative.

PatternCaptureTokenFilter

Object

Usa espressioni regolari Java per generare più token, uno per ogni gruppo di acquisizione in uno o più modelli. Questo filtro di token viene implementato usando Apache Lucene.

Nome	Tipo	Valore predefinito	Descrizione
@odata.type	string: #Microsoft.Azure.Search.PatternCaptureTokenFilter		Frammento URI che specifica il tipo di filtro del token.
name	string		Nome del filtro del token. Deve contenere solo lettere, cifre, spazi, trattini o caratteri di sottolineatura, può iniziare e terminare solo con caratteri alfanumerici ed è limitato a 128 caratteri.
patterns	string[]		Elenco di modelli da confrontare con ogni token.
preserveOriginal	boolean	True	Valore che indica se restituire il token originale anche se uno dei modelli corrisponde. Il valore predefinito è true.

PatternReplaceCharFilter

Object

Filtro di caratteri che sostituisce i caratteri nella stringa di input. Usa un'espressione regolare per identificare le sequenze di caratteri da mantenere e un criterio di sostituzione per identificare i caratteri da sostituire. Ad esempio, dato il testo di input "aa bb aa bb", pattern "(aa)\s+(bb)" e sostituzione "$1#$2", il risultato sarà "aa#bb aa#bb". Questo filtro di caratteri viene implementato tramite Apache Lucene.

Nome	Tipo	Descrizione
@odata.type	string: #Microsoft.Azure.Search.PatternReplaceCharFilter	Frammento URI che specifica il tipo di filtro char.
name	string	Nome del filtro char. Deve contenere solo lettere, cifre, spazi, trattini o caratteri di sottolineatura, può iniziare e terminare solo con caratteri alfanumerici ed è limitato a 128 caratteri.
pattern	string	Modello di espressione regolare.
replacement	string	Testo sostitutivo.

PatternReplaceTokenFilter

Object

Nome	Tipo	Descrizione
@odata.type	string: #Microsoft.Azure.Search.PatternReplaceTokenFilter	Frammento URI che specifica il tipo di filtro del token.
name	string	Nome del filtro del token. Deve contenere solo lettere, cifre, spazi, trattini o caratteri di sottolineatura, può iniziare e terminare solo con caratteri alfanumerici ed è limitato a 128 caratteri.
pattern	string	Modello di espressione regolare.
replacement	string	Testo sostitutivo.

PatternTokenizer

Object

Tokenizer che usa criteri regex corrispondenti per costruire token distinti. Questo tokenizer viene implementato tramite Apache Lucene.

Nome	Tipo	Valore predefinito	Descrizione
@odata.type	string: #Microsoft.Azure.Search.PatternTokenizer		Frammento URI che specifica il tipo di tokenizer.
flags	RegexFlags		Flag di espressione regolare.
group	integer (int32)	-1	Ordinale in base zero del gruppo corrispondente nel modello di espressione regolare da estrarre nei token. Usare -1 se si vuole usare l'intero modello per suddividere l'input in token, indipendentemente dai gruppi corrispondenti. Il valore predefinito è -1.
name	string		Nome del tokenizer. Deve contenere solo lettere, cifre, spazi, trattini o caratteri di sottolineatura, può iniziare e terminare solo con caratteri alfanumerici ed è limitato a 128 caratteri.
pattern	string	\W+	Modello di espressione regolare per trovare la corrispondenza con i separatori di token. Il valore predefinito è un'espressione che corrisponde a uno o più caratteri non alfanumerici.

PhoneticEncoder

Enumerazione

Identifica il tipo di codificatore fonetico da usare con phoneticTokenFilter.

Valore	Descrizione
beiderMorse	Codifica un token in un valore Beider-Morse.
caverphone1	Codifica un token in un valore Caverphone 1.0.
caverphone2	Codifica un token in un valore Caverphone 2.0.
cologne	Codifica un token in un valore fonetico di Colonia.
doubleMetaphone	Codifica un token in un valore metaphone doppio.
haasePhonetik	Codifica un token usando il perfezionamento haase dell'algoritmo Kölner Phonetik.
koelnerPhonetik	Codifica un token usando l'algoritmo Kölner Phonetik.
metaphone	Codifica un token in un valore Metaphone.
nysiis	Codifica un token in un valore NYSIIS.
refinedSoundex	Codifica un token in un valore Soundex raffinato.
soundex	Codifica un token in un valore Soundex.

PhoneticTokenFilter

Object

Creare token per corrispondenze fonetiche. Questo filtro di token viene implementato usando Apache Lucene.

Nome	Tipo	Valore predefinito	Descrizione
@odata.type	string: #Microsoft.Azure.Search.PhoneticTokenFilter		Frammento URI che specifica il tipo di filtro del token.
encoder	PhoneticEncoder	metaphone	Codificatore fonetico da usare. Il valore predefinito è "metaphone".
name	string		Nome del filtro del token. Deve contenere solo lettere, cifre, spazi, trattini o caratteri di sottolineatura, può iniziare e terminare solo con caratteri alfanumerici ed è limitato a 128 caratteri.
replace	boolean	True	Valore che indica se i token codificati devono sostituire i token originali. Se false, i token codificati vengono aggiunti come sinonimi. Il valore predefinito è true.

PrioritizedFields

Object

Descrive i campi titolo, contenuto e parole chiave da usare per la classificazione semantica, le didascalie, le evidenziazioni e le risposte.

Nome	Tipo	Descrizione
prioritizedContentFields	SemanticField[]	Definisce i campi di contenuto da usare per la classificazione semantica, le didascalie, le evidenziazioni e le risposte. Per ottenere un risultato ottimale, i campi selezionati devono contenere testo in formato in linguaggio naturale. L'ordine dei campi nella matrice rappresenta la priorità. I campi con priorità inferiore possono essere troncati se il contenuto è lungo.
prioritizedKeywordsFields	SemanticField[]	Definisce i campi delle parole chiave da usare per la classificazione semantica, le didascalie, le evidenziazioni e le risposte. Per ottenere il risultato migliore, i campi selezionati devono contenere un elenco di parole chiave. L'ordine dei campi nella matrice rappresenta la priorità. I campi con priorità inferiore possono essere troncati se il contenuto è lungo.
titleField	SemanticField	Definisce il campo del titolo da usare per la classificazione semantica, le didascalie, le evidenziazioni e le risposte. Se nell'indice non è presente un campo titolo, lasciare vuoto questo campo.

RegexFlags

Enumerazione

Definisce i flag che possono essere combinati per controllare il modo in cui vengono usate le espressioni regolari nell'analizzatore dei criteri e nel tokenizzatore di criteri.

Valore	Descrizione
CANON_EQ	Abilita l'equivalenza canonica.
CASE_INSENSITIVE	Abilita la corrispondenza senza distinzione tra maiuscole e minuscole.
COMMENTS	Consente spazi vuoti e commenti nel modello.
DOTALL	Abilita la modalità dotall.
LITERAL	Abilita l'analisi letterale del modello.
MULTILINE	Abilita la modalità multilinea.
UNICODE_CASE	Abilita la riduzione del case compatibile con Unicode.
UNIX_LINES	Abilita la modalità righe Unix.

ScalarQuantizationParameters

Object

Contiene i parametri specifici della quantizzazione scalare.

Nome	Tipo	Descrizione
quantizedDataType	VectorSearchCompressionTargetDataType	Tipo di dati quantizzato di valori vettoriali compressi.

ScalarQuantizationVectorSearchCompressionConfiguration

Object

Contiene opzioni di configurazione specifiche per il metodo di compressione della quantizzazione scalare usato durante l'indicizzazione e l'esecuzione di query.

Nome	Tipo	Valore predefinito	Descrizione
defaultOversampling	number (double)		Fattore di sovracampionamento predefinito. L'overcampionamento richiede internamente più documenti (specificati da questo moltiplicatore) nella ricerca iniziale. Questo aumenta il set di risultati che verranno rivalutati usando punteggi di somiglianza ricalcolata da vettori con precisione completa. Il valore minimo è 1, ovvero nessun sovracampionamento (1x). Questo parametro può essere impostato solo quando rerankWithOriginalVectors è true. I valori più elevati migliorano il richiamo a scapito della latenza.
kind	string: scalarQuantization		Nome del tipo di metodo di compressione da configurare per l'uso con la ricerca vettoriale.
name	string		Nome da associare a questa configurazione specifica.
rerankWithOriginalVectors	boolean	True	Se impostato su true, una volta ottenuto il set ordinato di risultati calcolati usando vettori compressi, questi verranno rivalutati ricalcolando i punteggi di somiglianza con precisione completa. Ciò migliorerà il richiamo a scapito della latenza.
scalarQuantizationParameters	ScalarQuantizationParameters		Contiene i parametri specifici della quantizzazione scalare.

ScoringFunctionAggregation

Enumerazione

Definisce la funzione di aggregazione usata per combinare i risultati di tutte le funzioni di assegnazione dei punteggi in un profilo di punteggio.

Valore	Descrizione
average	Aumentare i punteggi in base alla media di tutti i risultati della funzione di punteggio.
firstMatching	Aumentare i punteggi usando la prima funzione di assegnazione dei punteggi applicabile nel profilo di punteggio.
maximum	Aumentare i punteggi in base al massimo di tutti i risultati della funzione di assegnazione dei punteggi.
minimum	Aumentare i punteggi in base al minimo di tutti i risultati della funzione di assegnazione dei punteggi.
sum	Aumentare i punteggi in base alla somma di tutti i risultati della funzione di assegnazione dei punteggi.

ScoringFunctionInterpolation

Enumerazione

Definisce la funzione usata per interpolare il boosting del punteggio in un intervallo di documenti.

Valore	Descrizione
constant	Incrementa i punteggi in base a un fattore costante.
linear	Aumenta i punteggi in base a una quantità che diminuisce in modo lineare. Questa è l'interpolazione predefinita per le funzioni di assegnazione dei punteggi.
logarithmic	Aumenta i punteggi per una quantità che diminuisce in modo logaritmico. Gli boost diminuiscono rapidamente per i punteggi più alti e più lentamente man mano che i punteggi diminuiscono. Questa opzione di interpolazione non è consentita nelle funzioni di assegnazione dei punteggi dei tag.
quadratic	Aumenta i punteggi in base a un importo che diminuisce quadraticamente. Gli boost diminuiscono lentamente per i punteggi più alti e più rapidamente man mano che i punteggi diminuiscono. Questa opzione di interpolazione non è consentita nelle funzioni di assegnazione dei punteggi dei tag.

ScoringProfile

Object

Definisce i parametri per un indice di ricerca che influisce sul punteggio nelle query di ricerca.

Nome	Tipo	Descrizione
functionAggregation	ScoringFunctionAggregation	Valore che indica come combinare i risultati delle singole funzioni di assegnazione dei punteggi. Il valore predefinito è "Sum". Ignorato se non sono presenti funzioni di assegnazione dei punteggi.
functions	ScoringFunction[]: DistanceScoringFunction[] FreshnessScoringFunction[] MagnitudeScoringFunction[] TagScoringFunction[]	Raccolta di funzioni che influisce sull'assegnazione dei punteggi dei documenti.
name	string	Nome del profilo di assegnazione dei punteggi.
text	TextWeights	Parametri che aumentano il punteggio in base alle corrispondenze di testo in determinati campi di indice.

SearchField

Object

Rappresenta un campo in una definizione di indice, che descrive il nome, il tipo di dati e il comportamento di ricerca di un campo.

Nome	Tipo	Descrizione
analyzer	LexicalAnalyzerName	Nome dell'analizzatore da utilizzare per il campo. Questa opzione può essere usata solo con i campi ricercabili e non può essere impostata insieme a searchAnalyzer o indexAnalyzer. Dopo aver scelto l'analizzatore, non può essere modificato per il campo. Deve essere Null per i campi complessi.
dimensions	integer (int32) minimum: 2 maximum: 2048	Dimensionalità del campo vettore.
facetable	boolean	Valore che indica se consentire il riferimento al campo nelle query facet. In genere usato in una presentazione dei risultati della ricerca che include il conteggio dei riscontri per categoria (ad esempio, cercare fotocamere digitali e vedere i riscontri per marchio, per impostazione predefinita, per prezzo e così via). Questa proprietà deve essere Null per i campi complessi. I campi di tipo Edm.GeographyPoint o Collection(Edm.GeographyPoint) non possono essere facciabili. Il valore predefinito è true per tutti gli altri campi semplici.
fields	SearchField[]	Elenco di sottocampi se si tratta di un campo di tipo Edm.ComplexType o Collection(Edm.ComplexType). Deve essere null o vuoto per i campi semplici.
filterable	boolean	Valore che indica se abilitare il riferimento al campo nelle query $filter. filtrabile differisce dalla modalità di gestione delle stringhe. I campi di tipo Edm.String o Collection(Edm.String) che sono filtrabili non subiscono interruzioni di parole, quindi i confronti sono solo per corrispondenze esatte. Ad esempio, se si imposta tale campo f su "sunny day", $filter=f eq 'sunny' non troverà corrispondenze, ma $filter=f eq 'sunny day' will. Questa proprietà deve essere Null per i campi complessi. Il valore predefinito è true per i campi semplici e null per i campi complessi.
indexAnalyzer	LexicalAnalyzerName	Nome dell'analizzatore utilizzato in fase di indicizzazione per il campo. Questa opzione può essere usata solo con i campi ricercabili. Deve essere impostato insieme a searchAnalyzer e non può essere impostato insieme all'opzione analizzatore. Questa proprietà non può essere impostata sul nome di un analizzatore del linguaggio; usare invece la proprietà analyzer se è necessario un analizzatore del linguaggio. Dopo aver scelto l'analizzatore, non può essere modificato per il campo. Deve essere Null per i campi complessi.
key	boolean	Valore che indica se il campo identifica in modo univoco i documenti nell'indice. È necessario scegliere esattamente un campo di primo livello in ogni indice come campo chiave e deve essere di tipo Edm.String. I campi chiave possono essere usati per cercare i documenti direttamente e aggiornare o eliminare documenti specifici. Il valore predefinito è false per i campi semplici e null per i campi complessi.
name	string	Nome del campo, che deve essere univoco all'interno dell'insieme fields del campo indice o padre.
retrievable	boolean	Valore che indica se il campo può essere restituito in un risultato della ricerca. È possibile disabilitare questa opzione se si vuole usare un campo (ad esempio, margine) come filtro, ordinamento o meccanismo di assegnazione dei punteggi, ma non si vuole che il campo sia visibile all'utente finale. Questa proprietà deve essere true per i campi chiave e deve essere null per i campi complessi. Questa proprietà può essere modificata nei campi esistenti. L'abilitazione di questa proprietà non comporta alcun aumento dei requisiti di archiviazione degli indici. Il valore predefinito è true per i campi semplici, false per i campi vettoriali e null per i campi complessi.
searchAnalyzer	LexicalAnalyzerName	Nome dell'analizzatore utilizzato in fase di ricerca per il campo. Questa opzione può essere usata solo con i campi ricercabili. Deve essere impostato insieme a indexAnalyzer e non può essere impostato insieme all'opzione analizzatore. Questa proprietà non può essere impostata sul nome di un analizzatore del linguaggio; usare invece la proprietà analyzer se è necessario un analizzatore del linguaggio. Questo analizzatore può essere aggiornato in un campo esistente. Deve essere Null per i campi complessi.
searchable	boolean	Valore che indica se il campo è ricercabile full-text. Ciò significa che verrà sottoposta a analisi come l'interruzione delle parole durante l'indicizzazione. Se si imposta un campo ricercabile su un valore come "sunny day", internamente verrà suddiviso nei singoli token "sunny" e "day". In questo modo vengono attivate ricerche full-text per questi termini. I campi di tipo Edm.String o Collection(Edm.String) sono ricercabili per impostazione predefinita. Questa proprietà deve essere false per i campi semplici di altri tipi di dati non stringa e deve essere Null per i campi complessi. Nota: i campi ricercabili utilizzano spazio aggiuntivo nell'indice per supportare versioni aggiuntive con token del valore del campo per le ricerche full-text. Se si desidera risparmiare spazio nell'indice e non è necessario includere un campo nelle ricerche, impostare searchable su false.
sortable	boolean	Valore che indica se abilitare il campo a cui fare riferimento nelle espressioni $orderby. Per impostazione predefinita, il motore di ricerca ordina i risultati in base al punteggio, ma in molte esperienze gli utenti vogliono ordinare in base ai campi nei documenti. Un campo semplice può essere ordinato solo se è a valore singolo (ha un singolo valore nell'ambito del documento padre). I campi di raccolta semplici non possono essere ordinabili, perché sono multivalore. Anche i campi secondari semplici di raccolte complesse sono multivalore e pertanto non possono essere ordinabili. Questo vale sia se si tratta di un campo padre immediato o di un campo predecessore, che è la raccolta complessa. I campi complessi non possono essere ordinabili e la proprietà ordinabile deve essere Null per tali campi. L'impostazione predefinita per ordinabile è true per i campi semplici con valori singoli, false per i campi semplici multivalore e null per i campi complessi.
stored	boolean	Valore non modificabile che indica se il campo verrà salvato separatamente su disco da restituire in un risultato di ricerca. È possibile disabilitare questa opzione se non si prevede di restituire il contenuto del campo in una risposta di ricerca per risparmiare sui costi di archiviazione. Questa impostazione può essere impostata solo durante la creazione dell'indice e solo per i campi vettoriali. Questa proprietà non può essere modificata per i campi esistenti o impostata su false per i nuovi campi. Se questa proprietà è impostata su false, anche la proprietà 'recuperabile' deve essere impostata su false. Questa proprietà deve essere true o unset per i campi chiave, per i nuovi campi e per i campi non vettoriali e deve essere Null per i campi complessi. La disabilitazione di questa proprietà ridurrà i requisiti di archiviazione degli indici. Il valore predefinito è true per i campi vettoriali.
synonymMaps	string[]	Elenco dei nomi delle mappe sinonimie da associare a questo campo. Questa opzione può essere usata solo con i campi ricercabili. Attualmente è supportata una sola mappa sinonimia per campo. L'assegnazione di una mappa sinonimia a un campo garantisce che i termini di query destinati a tale campo vengano espansi in fase di query usando le regole nella mappa dei sinonimi. Questo attributo può essere modificato nei campi esistenti. Deve essere null o una raccolta vuota per campi complessi.
type	SearchFieldDataType	Tipo di dati del campo.
vectorEncoding	VectorEncodingFormat	Formato di codifica per interpretare il contenuto del campo.
vectorSearchProfile	string	Nome del profilo di ricerca vettoriale che specifica l'algoritmo e il vettore da usare durante la ricerca nel campo vettoriale.

SearchFieldDataType

Enumerazione

Definisce il tipo di dati di un campo in un indice di ricerca.

Valore	Descrizione
Edm.Boolean	Indica che un campo contiene un valore booleano (true o false).
Edm.Byte	Indica che un campo contiene un intero senza segno a 8 bit. Questa opzione è valida solo se utilizzata con Collection(Edm.Byte).
Edm.ComplexType	Indica che un campo contiene uno o più oggetti complessi che a loro volta dispongono di sottocampi di altri tipi.
Edm.DateTimeOffset	Indica che un campo contiene un valore di data/ora, incluse le informazioni sul fuso orario.
Edm.Double	Indica che un campo contiene un numero a virgola mobile a precisione doppia IEEE.
Edm.GeographyPoint	Indica che un campo contiene una posizione geografica in termini di longitudine e latitudine.
Edm.Half	Indica che un campo contiene un numero a virgola mobile a metà precisione. Questa opzione è valida solo se utilizzata con Collection(Edm.Half).
Edm.Int16	Indica che un campo contiene un intero con segno a 16 bit. Questa opzione è valida solo se utilizzata con Collection(Edm.Int16).
Edm.Int32	Indica che un campo contiene un intero con segno a 32 bit.
Edm.Int64	Indica che un campo contiene un intero con segno a 64 bit.
Edm.SByte	Indica che un campo contiene un intero con segno a 8 bit. Questa opzione è valida solo se utilizzata con Collection(Edm.SByte).
Edm.Single	Indica che un campo contiene un numero a virgola mobile e precisione singola. Questa opzione è valida solo se utilizzata con Collection(Edm.Single).
Edm.String	Indica che un campo contiene una stringa.

SearchIndex

Object

Rappresenta una definizione di indice di ricerca, che descrive i campi e il comportamento di ricerca di un indice.

Nome	Tipo	Descrizione
@odata.etag	string	ETag dell'indice.
analyzers	LexicalAnalyzer[]: CustomAnalyzer[] LuceneStandardAnalyzer[] PatternAnalyzer[] StopAnalyzer[]	Analizzatori per l'indice.
charFilters	CharFilter[]: MappingCharFilter[] PatternReplaceCharFilter[]	Filtro dei caratteri per l'indice.
corsOptions	CorsOptions	Opzioni per controllare la condivisione di risorse tra le origini (CORS) per l'indice.
defaultScoringProfile	string	Nome del profilo di assegnazione dei punteggi da utilizzare se non è specificato alcun oggetto nella query. Se questa proprietà non è impostata e nella query non viene specificato alcun profilo di punteggio, verrà usato il punteggio predefinito (tf-idf).
encryptionKey	SearchResourceEncryptionKey	Descrizione di una chiave di crittografia creata in Azure Key Vault. Questa chiave viene usata per fornire un livello aggiuntivo di crittografia dei dati inattivi quando si vuole garantire che nessuno, nemmeno Microsoft, possa decrittografare i dati. Dopo aver crittografato i dati, i dati rimarranno sempre crittografati. Il servizio di ricerca ignorerà i tentativi di impostare questa proprietà su Null. È possibile modificare questa proprietà in base alle esigenze se si vuole ruotare la chiave di crittografia; I dati non saranno interessati. La crittografia con chiavi gestite dal cliente non è disponibile per i servizi di ricerca gratuiti ed è disponibile solo per i servizi a pagamento creati il 1° gennaio 2019.
fields	SearchField[]	Campi dell'indice.
name	string	Nome dell'indice.
scoringProfiles	ScoringProfile[]	Profili di punteggio per l'indice.
semantic	SemanticSettings	Definisce i parametri per un indice di ricerca che influisce sulle funzionalità semantiche.
similarity	Similarity: BM25Similarity ClassicSimilarity	Tipo di algoritmo di somiglianza da usare per l'assegnazione dei punteggi e la classificazione dei documenti corrispondenti a una query di ricerca. L'algoritmo di somiglianza può essere definito solo in fase di creazione dell'indice e non può essere modificato negli indici esistenti. Se null, viene usato l'algoritmo ClassicSimilarity.
suggesters	Suggester[]	Suggerimenti per l'indice.
tokenFilters	TokenFilter[]: AsciiFoldingTokenFilter[] CjkBigramTokenFilter[] CommonGramTokenFilter[] DictionaryDecompounderTokenFilter[] EdgeNGramTokenFilter[] EdgeNGramTokenFilterV2[] ElisionTokenFilter[] KeepTokenFilter[] KeywordMarkerTokenFilter[] LengthTokenFilter[] LimitTokenFilter[] NGramTokenFilter[] NGramTokenFilterV2[] PatternCaptureTokenFilter[] PatternReplaceTokenFilter[] PhoneticTokenFilter[] ShingleTokenFilter[] SnowballTokenFilter[] StemmerOverrideTokenFilter[] StemmerTokenFilter[] StopwordsTokenFilter[] SynonymTokenFilter[] TruncateTokenFilter[] UniqueTokenFilter[] WordDelimiterTokenFilter[]	Il token filtra per l'indice.
tokenizers	LexicalTokenizer[]: ClassicTokenizer[] EdgeNGramTokenizer[] KeywordTokenizer[] KeywordTokenizerV2[] LuceneStandardTokenizer[] LuceneStandardTokenizerV2[] MicrosoftLanguageStemmingTokenizer[] MicrosoftLanguageTokenizer[] NGramTokenizer[] PathHierarchyTokenizerV2[] PatternTokenizer[] UaxUrlEmailTokenizer[]	Tokenizer per l'indice.
vectorSearch	VectorSearch	Contiene le opzioni di configurazione correlate alla ricerca vettoriale.

SearchIndexerDataNoneIdentity

Object

Cancella la proprietà Identity di un'origine dati.

Nome	Tipo	Descrizione
@odata.type	string: #Microsoft.Azure.Search.DataNoneIdentity	Frammento URI che specifica il tipo di identità.

SearchIndexerDataUserAssignedIdentity

Object

Specifica l'identità di un'origine dati da usare.

Nome	Tipo	Descrizione
@odata.type	string: #Microsoft.Azure.Search.DataUserAssignedIdentity	Frammento URI che specifica il tipo di identità.
userAssignedIdentity	string	ID risorsa di Azure completo di un'identità gestita assegnata dall'utente in genere nel formato "/subscriptions/12345678-1234-1234-1234-1234567890ab/resourceGroups/rg/providers/Microsoft.ManagedIdentity/userAssignedIdentities/myId" che dovrebbe essere stato assegnato al servizio di ricerca.

SearchResourceEncryptionKey

Object

Una chiave di crittografia gestita dal cliente in Azure Key Vault. Le chiavi create e gestite possono essere usate per crittografare o decrittografare i dati inattivi, ad esempio indici e mappe sinonimi.

Nome	Tipo	Descrizione
accessCredentials	AzureActiveDirectoryApplicationCredentials	Credenziali facoltative di Azure Active Directory usate per l'accesso ad Azure Key Vault. Non obbligatorio se invece si usa l'identità gestita.
keyVaultKeyName	string	Nome della chiave di Azure Key Vault da usare per crittografare i dati inattivi.
keyVaultKeyVersion	string	Versione della chiave di Azure Key Vault da usare per crittografare i dati inattivi.
keyVaultUri	string	L'URI dell'insieme di credenziali delle chiavi di Azure, detto anche nome DNS, che contiene la chiave da usare per crittografare i dati inattivi. Un URI di esempio potrebbe essere `https://my-keyvault-name.vault.azure.net`.

SemanticConfiguration

Object

Definisce una configurazione specifica da usare nel contesto delle funzionalità semantiche.

Nome	Tipo	Descrizione
name	string	Nome della configurazione semantica.
prioritizedFields	PrioritizedFields	Descrive i campi titolo, contenuto e parola chiave da usare per classificazione semantica, didascalie, evidenziazioni e risposte. È necessario impostare almeno una delle tre sottoproprietà (titleField, prioritizedKeywordsFields e prioritizedContentFields).

SemanticField

Object

Campo utilizzato come parte della configurazione semantica.

Nome	Tipo	Descrizione
fieldName	string

SemanticSettings

Object

Definisce i parametri per un indice di ricerca che influisce sulle funzionalità semantiche.

Nome	Tipo	Descrizione
configurations	SemanticConfiguration[]	Configurazioni semantiche per l'indice.
defaultConfiguration	string	Consente di impostare il nome di una configurazione semantica predefinita nell'indice, rendendolo facoltativo per passarlo come parametro di query ogni volta.

ShingleTokenFilter

Object

Crea combinazioni di token come singolo token. Questo filtro di token viene implementato usando Apache Lucene.

Nome	Tipo	Valore predefinito	Descrizione
@odata.type	string: #Microsoft.Azure.Search.ShingleTokenFilter		Frammento URI che specifica il tipo di filtro del token.
filterToken	string	_	Stringa da inserire per ogni posizione in cui non è presente alcun token. Il valore predefinito è un carattere di sottolineatura ("_").
maxShingleSize	integer (int32) minimum: 2	2	Dimensione massima di stringola. Il valore predefinito e minimo è 2.
minShingleSize	integer (int32) minimum: 2	2	Dimensioni minime di stringola. Il valore predefinito e minimo è 2. Deve essere minore del valore di maxShingleSize.
name	string		Nome del filtro del token. Deve contenere solo lettere, cifre, spazi, trattini o caratteri di sottolineatura, può iniziare e terminare solo con caratteri alfanumerici ed è limitato a 128 caratteri.
outputUnigrams	boolean	True	Valore che indica se il flusso di output conterrà i token di input (unigrammi) e gli shingles. Il valore predefinito è true.
outputUnigramsIfNoShingles	boolean	False	Valore che indica se restituire unigrammi per quei tempi in cui non sono disponibili lo shingles. Questa proprietà ha la precedenza quando outputUnigrams è impostato su false. Il valore predefinito è false.
tokenSeparator	string		Stringa da usare durante l'unione di token adiacenti per formare una strizzaglia. Il valore predefinito è uno spazio singolo (" ").

SnowballTokenFilter

Object

Filtro che deriva le parole usando uno stemmer generato da Snowball. Questo filtro di token viene implementato usando Apache Lucene.

Nome	Tipo	Descrizione
@odata.type	string: #Microsoft.Azure.Search.SnowballTokenFilter	Frammento URI che specifica il tipo di filtro del token.
language	SnowballTokenFilterLanguage	Lingua da usare.
name	string	Nome del filtro del token. Deve contenere solo lettere, cifre, spazi, trattini o caratteri di sottolineatura, può iniziare e terminare solo con caratteri alfanumerici ed è limitato a 128 caratteri.

SnowballTokenFilterLanguage

Enumerazione

Lingua da usare per un filtro token Snowball.

Valore	Descrizione
armenian	Seleziona il tokenizzatore di stemming Lucene Snowball per armeno.
basque	Seleziona il tokenizzatore di stemming Lucene Snowball per basco.
catalan	Seleziona il tokenizzatore di stemming Lucene Snowball per catalano.
danish	Seleziona il tokenizzatore di stemming Lucene Snowball per danese.
dutch	Seleziona il tokenizer di stemming Lucene Snowball per olandese.
english	Seleziona il tokenizzatore di stemming Lucene Snowball per l'inglese.
finnish	Seleziona il tokenizzatore di stemming Lucene Snowball per il finlandese.
french	Seleziona il tokenizzatore di stemming Lucene Snowball per francese.
german	Seleziona il tokenizzatore di stemming Lucene Snowball per il tedesco.
german2	Seleziona il tokenizer di stemming Lucene Snowball che usa l'algoritmo variant tedesco.
hungarian	Seleziona il tokenizzatore di stemming Lucene Snowball per ungherese.
italian	Seleziona il tokenizzatore di stemming Lucene Snowball per l'italiano.
kp	Seleziona il tokenizer di stemming Lucene Snowball per olandese che usa l'algoritmo di stemming Kraaij-Pohlmann.
lovins	Seleziona il tokenizer di stemming Lucene Snowball per l'inglese che usa l'algoritmo di stemming Lovins.
norwegian	Seleziona il tokenizzatore di stemming Lucene Snowball per Norvegese.
porter	Seleziona il tokenizer di stemming Lucene Snowball per l'inglese che usa l'algoritmo stemming Porter.
portuguese	Seleziona il tokenizzatore di stemming Lucene Snowball per portoghese.
romanian	Seleziona il tokenizzatore di stemming Lucene Snowball per romeno.
russian	Seleziona il tokenizer di stemming Lucene Snowball per russo.
spanish	Seleziona il tokenizzatore di stemming Lucene Snowball per spagnolo.
swedish	Seleziona il tokenizzatore di stemming Lucene Snowball per svedese.
turkish	Seleziona il tokenizzatore di stemming Lucene Snowball per turco.

StemmerOverrideTokenFilter

Object

Consente di eseguire l'override di altri filtri di stemming con stemming basato su dizionario personalizzato. Tutti i termini con stemmy-stemming verranno contrassegnati come parole chiave in modo che non vengano stemmati lungo la catena. Deve essere posizionato prima di qualsiasi filtro di stemming. Questo filtro di token viene implementato usando Apache Lucene.

Nome	Tipo	Descrizione
@odata.type	string: #Microsoft.Azure.Search.StemmerOverrideTokenFilter	Frammento URI che specifica il tipo di filtro del token.
name	string	Nome del filtro del token. Deve contenere solo lettere, cifre, spazi, trattini o caratteri di sottolineatura, può iniziare e terminare solo con caratteri alfanumerici ed è limitato a 128 caratteri.
rules	string[]	Elenco delle regole di stemming nel formato seguente: "word => stem", ad esempio: "ran => run".

StemmerTokenFilter

Object

Filtro di stemming specifico della lingua. Questo filtro di token viene implementato usando Apache Lucene.

Nome	Tipo	Descrizione
@odata.type	string: #Microsoft.Azure.Search.StemmerTokenFilter	Frammento URI che specifica il tipo di filtro del token.
language	StemmerTokenFilterLanguage	Lingua da usare.
name	string	Nome del filtro del token. Deve contenere solo lettere, cifre, spazi, trattini o caratteri di sottolineatura, può iniziare e terminare solo con caratteri alfanumerici ed è limitato a 128 caratteri.

StemmerTokenFilterLanguage

Enumerazione

Lingua da usare per un filtro di token stemmer.

Valore	Descrizione
arabic	Seleziona il tokenizzatore di stemming Lucene per l'arabo.
armenian	Seleziona il tokenizzatore di stemming Lucene per armeno.
basque	Seleziona il tokenizzatore di stemming Lucene per basco.
brazilian	Seleziona il tokenizzatore di stemming Lucene per portoghese (Brasile).
bulgarian	Seleziona il tokenizzatore di stemming Lucene per bulgaro.
catalan	Seleziona il tokenizzatore di stemming Lucene per catalano.
czech	Seleziona il tokenizzatore di stemming Lucene per ceco.
danish	Seleziona il tokenizzatore di stemming Lucene per danese.
dutch	Seleziona il tokenizer di stemming Lucene per olandese.
dutchKp	Seleziona il tokenizer di stemming Lucene per olandese che usa l'algoritmo di stemming Kraaij-Pohlmann.
english	Seleziona il tokenizer di stemming Lucene per l'inglese.
finnish	Seleziona il tokenizzatore di stemming Lucene per il finlandese.
french	Seleziona il tokenizzatore di stemming Lucene per francese.
galician	Seleziona il tokenizzatore di stemming Lucene per la Galizia.
german	Seleziona il tokenizer di stemming Lucene per il tedesco.
german2	Seleziona il tokenizer di stemming Lucene che usa l'algoritmo variant tedesco.
greek	Seleziona il tokenizzatore di stemming Lucene per greco.
hindi	Seleziona il tokenizzatore di stemming Lucene per hindi.
hungarian	Seleziona il tokenizzatore di stemming Lucene per ungherese.
indonesian	Seleziona il tokenizzatore di stemming Lucene per indonesiano.
irish	Seleziona il tokenizer di stemming Lucene per Irlandese.
italian	Seleziona il tokenizzatore di stemming Lucene per italiano.
latvian	Seleziona il tokenizzatore di stemming Lucene per lettone.
lightEnglish	Seleziona il tokenizzatore di stemming Lucene per l'inglese che esegue lo stemming chiaro.
lightFinnish	Seleziona il tokenizzatore di stemming Lucene per il finlandese che esegue lo stemming chiaro.
lightFrench	Seleziona il tokenizzatore di stemming Lucene per francese che esegue lo stemming chiaro.
lightGerman	Seleziona il tokenizzatore di stemming Lucene per tedesco che esegue lo stemming chiaro.
lightHungarian	Seleziona il tokenizzatore di stemming Lucene per ungherese che esegue lo stemming chiaro.
lightItalian	Seleziona il tokenizzatore di stemming Lucene per italiano che esegue lo stemming chiaro.
lightNorwegian	Seleziona il tokenizer di stemming Lucene per Norvegese (Bokmål) che esegue lo stemming chiaro.
lightNynorsk	Seleziona il tokenizer di stemming Lucene per norvegese (Nynorsk) che esegue lo stemming chiaro.
lightPortuguese	Seleziona il tokenizzatore di stemming Lucene per portoghese che esegue lo stemming chiaro.
lightRussian	Seleziona il tokenizzatore di stemming Lucene per russo che esegue lo stemming chiaro.
lightSpanish	Seleziona il tokenizzatore di stemming Lucene per spagnolo che esegue lo stemming chiaro.
lightSwedish	Seleziona il tokenizzatore di stemming Lucene per lo stemming svedese che esegue lo stemming chiaro.
lovins	Seleziona il tokenizer di stemming Lucene per l'inglese che usa l'algoritmo di stemming Lovins.
minimalEnglish	Seleziona il tokenizzatore di stemming Lucene per l'inglese che esegue lo stemming minimo.
minimalFrench	Seleziona il tokenizzatore di stemming Lucene per francese che esegue lo stemming minimo.
minimalGalician	Seleziona il tokenizzatore di stemming Lucene per la Galizia che esegue lo stemming minimo.
minimalGerman	Seleziona il tokenizzatore di stemming Lucene per tedesco che esegue lo stemming minimo.
minimalNorwegian	Seleziona il tokenizer di stemming Lucene per Norvegese (Bokmål) che esegue lo stemming minimo.
minimalNynorsk	Seleziona il tokenizer di stemming Lucene per Norvegese (Nynorsk) che esegue lo stemming minimo.
minimalPortuguese	Seleziona il tokenizzatore di stemming Lucene per portoghese che esegue lo stemming minimo.
norwegian	Seleziona il tokenizer di stemming Lucene per Norvegese (Bokmål).
porter2	Seleziona il tokenizer di stemming Lucene per l'inglese che usa l'algoritmo stemming Porter2.
portuguese	Seleziona il tokenizzatore di stemming Lucene per portoghese.
portugueseRslp	Seleziona il tokenizer di stemming Lucene per portoghese che usa l'algoritmo di stemming RSLP.
possessiveEnglish	Seleziona il tokenizer di stemming Lucene per l'inglese che rimuove i possessi finali dalle parole.
romanian	Seleziona il tokenizzatore di stemming Lucene per romeno.
russian	Seleziona il tokenizer di stemming Lucene per russo.
sorani	Seleziona il tokenizzatore di stemming Lucene per Sorani.
spanish	Seleziona il tokenizer di stemming Lucene per spagnolo.
swedish	Seleziona il tokenizzatore di stemming Lucene per svedese.
turkish	Seleziona il tokenizzatore di stemming Lucene per turco.

StopAnalyzer

Object

Divide il testo in corrispondenza di lettere non; Applica i filtri di token minuscoli e non significative. Questo analizzatore viene implementato usando Apache Lucene.

Nome	Tipo	Descrizione
@odata.type	string: #Microsoft.Azure.Search.StopAnalyzer	Frammento URI che specifica il tipo di analizzatore.
name	string	Nome dell'analizzatore. Deve contenere solo lettere, cifre, spazi, trattini o caratteri di sottolineatura, può iniziare e terminare solo con caratteri alfanumerici ed è limitato a 128 caratteri.
stopwords	string[]	Elenco di parole non significative.

StopwordsList

Enumerazione

Identifica un elenco predefinito di parole non significative specifiche della lingua.

Valore	Descrizione
arabic	Seleziona l'elenco delle parole non significative per l'arabo.
armenian	Seleziona l'elenco delle parole non significative per armeno.
basque	Seleziona l'elenco delle parole non significative per basco.
brazilian	Seleziona l'elenco delle parole non significative per portoghese (Brasile).
bulgarian	Seleziona l'elenco delle parole non significative per bulgaro.
catalan	Seleziona l'elenco delle parole non significative per catalano.
czech	Seleziona l'elenco delle parole non significative per il ceco.
danish	Seleziona l'elenco delle parole non significative per danese.
dutch	Seleziona l'elenco delle parole non significative per olandese.
english	Seleziona l'elenco delle parole non significative per l'inglese.
finnish	Seleziona l'elenco delle parole non significative per il finlandese.
french	Seleziona l'elenco delle parole non significative per il francese.
galician	Seleziona l'elenco delle parole non significative per la Galizia.
german	Seleziona l'elenco delle parole non significative per il tedesco.
greek	Seleziona l'elenco delle parole non significative per il greco.
hindi	Seleziona l'elenco delle parole non significative per hindi.
hungarian	Seleziona l'elenco delle parole non significative per ungherese.
indonesian	Seleziona l'elenco delle parole non significative per indonesiano.
irish	Seleziona l'elenco delle parole non significative per Irlandese.
italian	Seleziona l'elenco delle parole non significative per italiano.
latvian	Seleziona l'elenco delle parole non significative per lettone.
norwegian	Seleziona l'elenco delle parole non significative per Norvegese.
persian	Seleziona l'elenco delle parole non significative per persiano.
portuguese	Seleziona l'elenco delle parole non significative per il portoghese.
romanian	Seleziona l'elenco delle parole non significative per romeno.
russian	Seleziona l'elenco delle parole non significative per russo.
sorani	Seleziona l'elenco delle parole non significative per Sorani.
spanish	Seleziona l'elenco delle parole non significative per spagnolo.
swedish	Seleziona l'elenco delle parole non significative per svedese.
thai	Seleziona l'elenco delle parole non significative per Thai.
turkish	Seleziona l'elenco delle parole non significative per turco.

StopwordsTokenFilter

Object

Rimuove le parole non significative da un flusso di token. Questo filtro di token viene implementato usando Apache Lucene.

Nome	Tipo	Valore predefinito	Descrizione
@odata.type	string: #Microsoft.Azure.Search.StopwordsTokenFilter		Frammento URI che specifica il tipo di filtro del token.
ignoreCase	boolean	False	Valore che indica se ignorare la distinzione tra maiuscole e minuscole. Se true, tutte le parole vengono convertite in lettere minuscole. Il valore predefinito è false.
name	string		Nome del filtro del token. Deve contenere solo lettere, cifre, spazi, trattini o caratteri di sottolineatura, può iniziare e terminare solo con caratteri alfanumerici ed è limitato a 128 caratteri.
removeTrailing	boolean	True	Valore che indica se ignorare l'ultimo termine di ricerca se si tratta di una parola non significativa. Il valore predefinito è true.
stopwords	string[]		Elenco di parole non significative. Questa proprietà e la proprietà elenco parole non significative non possono essere entrambe impostate.
stopwordsList	StopwordsList	english	Elenco predefinito di parole non significative da usare. Questa proprietà e la proprietà stopwords non possono essere entrambe impostate. Il valore predefinito è Inglese.

Suggester

Object

Definisce il modo in cui l'API Suggerisci deve essere applicata a un gruppo di campi nell'indice.

Nome	Tipo	Descrizione
name	string	Nome del suggerimento.
searchMode	SuggesterSearchMode	Valore che indica le funzionalità del suggerimento.
sourceFields	string[]	Elenco di nomi di campo a cui si applica il suggerimento. Ogni campo deve essere ricercabile.

SuggesterSearchMode

Enumerazione

Valore che indica le funzionalità del suggerimento.

Valore	Descrizione
analyzingInfixMatching	Trova la corrispondenza di termini e prefissi interi consecutivi in un campo. Ad esempio, per il campo 'The fastest brown fox', le query 'fast' e 'fastest brow' corrispondono entrambi.

SynonymTokenFilter

Object

Trova la corrispondenza con sinonimi singoli o con più parole in un flusso di token. Questo filtro di token viene implementato usando Apache Lucene.

Nome	Tipo	Valore predefinito	Descrizione
@odata.type	string: #Microsoft.Azure.Search.SynonymTokenFilter		Frammento URI che specifica il tipo di filtro del token.
expand	boolean	True	Valore che indica se tutte le parole nell'elenco dei sinonimi (se => notazione non viene utilizzata) verranno mappate tra loro. Se true, tutte le parole nell'elenco dei sinonimi (se => notazione non viene usata) verranno mappate tra loro. L'elenco seguente: incredibile, incredibile, favoloso, incredibile, incredibile, incredibile, incredibile, incredibile => incredibile, incredibile, favoloso, incredibile, incredibile. Se false, l'elenco seguente: incredibile, incredibile, favoloso, incredibile, incredibile sarà equivalente a: incredibile, incredibile, incredibile, incredibile => incredibile. Il valore predefinito è true.
ignoreCase	boolean	False	Valore che indica se inserire l'input con distinzione tra maiuscole e minuscole per la corrispondenza. Il valore predefinito è false.
name	string		Nome del filtro del token. Deve contenere solo lettere, cifre, spazi, trattini o caratteri di sottolineatura, può iniziare e terminare solo con caratteri alfanumerici ed è limitato a 128 caratteri.
synonyms	string[]		Elenco di sinonimi in uno dei due formati seguenti: 1. incredibile, incredibile, favoloso => incredibile - tutti i termini sul lato sinistro di => simbolo verrà sostituito con tutti i termini sul lato destro; 2. incredibile, incredibile, favoloso, incredibile - elenco delimitato da virgole di parole equivalenti. Impostare l'opzione espandi per modificare la modalità di interpretazione dell'elenco.

TagScoringFunction

Object

Definisce una funzione che aumenta i punteggi dei documenti con valori stringa corrispondenti a un determinato elenco di tag.

Nome	Tipo	Descrizione
boost	number (double)	Moltiplicatore per il punteggio non elaborato. Deve essere un numero positivo diverso da 1,0.
fieldName	string	Nome del campo utilizzato come input per la funzione di assegnazione dei punteggi.
interpolation	ScoringFunctionInterpolation	Valore che indica come verrà interpolata la priorità tra i punteggi dei documenti; il valore predefinito è "Lineare".
tag	TagScoringParameters	Valori dei parametri per la funzione di assegnazione dei punteggi dei tag.
type	string: tag	Indica il tipo di funzione da usare. I valori validi includono grandezza, freschezza, distanza e tag. Il tipo di funzione deve essere minuscolo.

TagScoringParameters

Object

Fornisce i valori dei parametri a una funzione di assegnazione dei punteggi di tag.

Nome	Tipo	Descrizione
tagsParameter	string	Nome del parametro passato nelle query di ricerca per specificare l'elenco di tag da confrontare con il campo di destinazione.

TextWeights

Object

Definisce i pesi nei campi di indice per i quali le corrispondenze devono aumentare il punteggio nelle query di ricerca.

Nome	Tipo	Descrizione
weights	object	Dizionario di pesi per campo per aumentare il punteggio dei documenti. Le chiavi sono nomi di campo e i valori sono i pesi per ogni campo.

TokenCharacterKind

Enumerazione

Rappresenta le classi di caratteri in cui può funzionare un filtro di token.

Valore	Descrizione
digit	Mantiene le cifre nei token.
letter	Mantiene le lettere nei token.
punctuation	Mantiene la punteggiatura nei token.
symbol	Mantiene i simboli nei token.
whitespace	Mantiene gli spazi vuoti nei token.

TokenFilterName

Enumerazione

Definisce i nomi di tutti i filtri di token supportati dal motore di ricerca.

Valore	Descrizione
apostrophe	Rimuove tutti i caratteri dopo un apostrofo (incluso l'apostrofo stesso). Fare riferimento a http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/tr/ApostropheFilter.html
arabic_normalization	Filtro token che applica il normalizzatore arabo per normalizzare l'ortografia. Fare riferimento a http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/ar/ArabicNormalizationFilter.html
asciifolding	Converte caratteri Unicode alfabetici, numerici e simbolici che non si trovano nei primi 127 caratteri ASCII (blocco Unicode "Latino di base") nei rispettivi equivalenti ASCII, se tali equivalenti esistono. Fare riferimento a http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/ASCIIFoldingFilter.html
cjk_bigram	Forma bigrams dei termini CJK generati dal tokenizer standard. Fare riferimento a http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/cjk/CJKBigramFilter.html
cjk_width	Normalizza le differenze di larghezza CJK. Piega le varianti fullwidth ASCII nell'equivalente alfabeto latino di base e le varianti Katakana a metà larghezza nell'equivalente Kana. Fare riferimento a http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/cjk/CJKWidthFilter.html
classic	Rimuove i possessivi inglesi e i punti dagli acronimi. Fare riferimento a http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/standard/ClassicFilter.html
common_grams	Costruisci bigram per i termini che si verificano di frequente durante l'indicizzazione. Anche i termini singoli sono indicizzati, con bigrams sovrapposti. Fare riferimento a http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/commongrams/CommonGramsFilter.html
edgeNGram_v2	Genera n-grammi delle dimensioni specificate a partire dalla parte anteriore o posteriore di un token di input. Fare riferimento a http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/ngram/EdgeNGramTokenFilter.html
elision	Rimuove le elisioni. Ad esempio, "l'avion" (il piano) verrà convertito in "avion" (piano). Fare riferimento a http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/util/ElisionFilter.html
german_normalization	Normalizza i caratteri tedeschi in base all'euristica dell'algoritmo snowball German2. Fare riferimento a http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/de/GermanNormalizationFilter.html
hindi_normalization	Normalizza il testo in hindi per rimuovere alcune differenze nelle varianti ortografiche. Fare riferimento a http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/hi/HindiNormalizationFilter.html
indic_normalization	Normalizza la rappresentazione Unicode del testo nelle lingue indiane. Fare riferimento a http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/in/IndicNormalizationFilter.html
keyword_repeat	Genera ogni token in ingresso due volte, una volta come parola chiave e una volta come parola chiave non. Fare riferimento a http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/KeywordRepeatFilter.html
kstem	Filtro kstem ad alte prestazioni per l'inglese. Fare riferimento a http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/en/KStemFilter.html
length	Rimuove parole troppo lunghe o troppo brevi. Fare riferimento a http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/LengthFilter.html
limit	Limita il numero di token durante l'indicizzazione. Fare riferimento a http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/LimitTokenCountFilter.html
lowercase	Normalizza il testo del token in lettere minuscole. Fare riferimento a https://lucene.apache.org/core/6_6_1/analyzers-common/org/apache/lucene/analysis/core/LowerCaseFilter.html
nGram_v2	Genera n-grammi delle dimensioni specificate. Fare riferimento a http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/ngram/NGramTokenFilter.html
persian_normalization	Applica la normalizzazione per il persiano. Fare riferimento a http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/fa/PersianNormalizationFilter.html
phonetic	Creare token per corrispondenze fonetiche. Fare riferimento a https://lucene.apache.org/core/4_10_3/analyzers-phonetic/org/apache/lucene/analysis/phonetic/package-tree.html
porter_stem	Usa l'algoritmo stemming Porter per trasformare il flusso di token. Fare riferimento a http://tartarus.org/~martin/PorterStemmer
reverse	Inverte la stringa del token. Fare riferimento a http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/reverse/ReverseStringFilter.html
scandinavian_folding	Piega i caratteri scandinavi åÅäæÄÆ->a e öÖøØ->o. Inoltre discrimina l'uso di vocali doppie aa, ae, ao, oe e oo, lasciando solo il primo. Fare riferimento a http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/ScandinavianFoldingFilter.html
scandinavian_normalization	Normalizza l'uso dei caratteri scandinavi intercambiabili. Fare riferimento a http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/ScandinavianNormalizationFilter.html
shingle	Crea combinazioni di token come singolo token. Fare riferimento a http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/shingle/ShingleFilter.html
snowball	Filtro che deriva le parole usando uno stemmer generato da Snowball. Fare riferimento a http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/snowball/SnowballFilter.html
sorani_normalization	Normalizza la rappresentazione Unicode del testo Sorani. Fare riferimento a http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/ckb/SoraniNormalizationFilter.html
stemmer	Filtro di stemming specifico della lingua. Fare riferimento a https://learn.microsoft.com/rest/api/searchservice/Custom-analyzers-in-Azure-Search#TokenFilters
stopwords	Rimuove le parole non significative da un flusso di token. Fare riferimento a http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/StopFilter.html
trim	Taglia gli spazi vuoti iniziali e finali dai token. Fare riferimento a http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/TrimFilter.html
truncate	Tronca i termini a una lunghezza specifica. Fare riferimento a http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/TruncateTokenFilter.html
unique	Filtra i token con lo stesso testo del token precedente. Fare riferimento a http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/RemoveDuplicatesTokenFilter.html
uppercase	Normalizza il testo del token in lettere maiuscole. Fare riferimento a https://lucene.apache.org/core/6_6_1/analyzers-common/org/apache/lucene/analysis/core/UpperCaseFilter.html
word_delimiter	Suddivide le parole in parole secondarie ed esegue trasformazioni facoltative nei gruppi di sottoword.

TruncateTokenFilter

Object

Tronca i termini a una lunghezza specifica. Questo filtro di token viene implementato usando Apache Lucene.

Nome	Tipo	Valore predefinito	Descrizione
@odata.type	string: #Microsoft.Azure.Search.TruncateTokenFilter		Frammento URI che specifica il tipo di filtro del token.
length	integer (int32) maximum: 300	300	Lunghezza in corrispondenza della quale verranno troncati i termini. Il valore predefinito e massimo è 300.
name	string		Nome del filtro del token. Deve contenere solo lettere, cifre, spazi, trattini o caratteri di sottolineatura, può iniziare e terminare solo con caratteri alfanumerici ed è limitato a 128 caratteri.

UaxUrlEmailTokenizer

Object

Tokenzza url e messaggi di posta elettronica come un token. Questo tokenizer viene implementato tramite Apache Lucene.

Nome	Tipo	Valore predefinito	Descrizione
@odata.type	string: #Microsoft.Azure.Search.UaxUrlEmailTokenizer		Frammento URI che specifica il tipo di tokenizer.
maxTokenLength	integer (int32) maximum: 300	255	Lunghezza massima del token. Il valore predefinito è 255. I token più lunghi della lunghezza massima vengono suddivisi. La lunghezza massima del token che può essere usata è di 300 caratteri.
name	string		Nome del tokenizer. Deve contenere solo lettere, cifre, spazi, trattini o caratteri di sottolineatura, può iniziare e terminare solo con caratteri alfanumerici ed è limitato a 128 caratteri.

UniqueTokenFilter

Object

Filtra i token con lo stesso testo del token precedente. Questo filtro di token viene implementato usando Apache Lucene.

Nome	Tipo	Valore predefinito	Descrizione
@odata.type	string: #Microsoft.Azure.Search.UniqueTokenFilter		Frammento URI che specifica il tipo di filtro del token.
name	string		Nome del filtro del token. Deve contenere solo lettere, cifre, spazi, trattini o caratteri di sottolineatura, può iniziare e terminare solo con caratteri alfanumerici ed è limitato a 128 caratteri.
onlyOnSamePosition	boolean	False	Valore che indica se rimuovere duplicati solo nella stessa posizione. Il valore predefinito è false.

VectorEncodingFormat

Enumerazione

Formato di codifica per l'interpretazione del contenuto del campo vettoriale.

Valore	Descrizione
packedBit	Formato di codifica che rappresenta i bit compressi in un tipo di dati più ampio.

VectorSearch

Object

Contiene le opzioni di configurazione correlate alla ricerca vettoriale.

Nome	Tipo	Descrizione
algorithms	VectorSearchAlgorithmConfiguration[]: ExhaustiveKnnVectorSearchAlgorithmConfiguration[] HnswVectorSearchAlgorithmConfiguration[]	Contiene opzioni di configurazione specifiche dell'algoritmo utilizzato durante l'indicizzazione o l'esecuzione di query.
compressions	VectorSearchCompressionConfiguration[]: BinaryQuantizationVectorSearchCompressionConfiguration[] ScalarQuantizationVectorSearchCompressionConfiguration[]	Contiene opzioni di configurazione specifiche del metodo di compressione utilizzato durante l'indicizzazione o l'esecuzione di query.
profiles	VectorSearchProfile[]	Definisce le combinazioni di configurazioni da usare con la ricerca vettoriale.
vectorizers	VectorSearchVectorizer[]: AzureOpenAIVectorizer[] WebApiVectorizer[]	Contiene opzioni di configurazione su come vettorizzare le query vettoriali di testo.

VectorSearchAlgorithmKind

Enumerazione

Algoritmo utilizzato per l'indicizzazione e l'esecuzione di query.

Valore	Descrizione
exhaustiveKnn	Algoritmo KNN completo che eseguirà la ricerca di forza bruta.
hnsw	HNSW (Gerarchica Navigable Small World), un tipo di algoritmo di prossimità approssimativo.

VectorSearchAlgorithmMetric

Enumerazione

Metrica di somiglianza da usare per i confronti vettoriali. È consigliabile scegliere la stessa metrica di somiglianza del modello di incorporamento su cui è stato eseguito il training.

Valore	Descrizione
cosine	Misura l'angolo tra vettori per quantificare la loro somiglianza, ignorando la grandezza. Più piccolo è l'angolo, più vicino alla somiglianza.
dotProduct	Calcola la somma dei prodotti a livello di elemento per misurare l'allineamento e la somiglianza della grandezza. Più grande e più positivo, più vicino alla somiglianza.
euclidean	Calcola la distanza di linea retta tra vettori in uno spazio multidimensionale. Minore è la distanza, più vicina è la somiglianza.
hamming	Applicabile solo ai tipi di dati binari compressi in bit. Determina la differenza contando posizioni diverse nei vettori binari. Meno differenze, maggiore è la somiglianza.

VectorSearchCompressionKind

Enumerazione

Metodo di compressione utilizzato per l'indicizzazione e l'esecuzione di query.

Valore	Descrizione
binaryQuantization	Quantizzazione binaria, un tipo di metodo di compressione. Nella quantizzazione binaria, i valori dei vettori originali vengono compressi nel tipo binario più ristretto discretizzando e rappresentando ogni componente di un vettore usando valori binari, riducendo così le dimensioni complessive dei dati.
scalarQuantization	Quantizzazione scalare, un tipo di metodo di compressione. Nella quantizzazione scalare, i valori dei vettori originali vengono compressi in un tipo più stretto discretizzando e rappresentando ogni componente di un vettore usando un set ridotto di valori quantizzati, riducendo così le dimensioni complessive dei dati.

VectorSearchCompressionTargetDataType

Enumerazione

Tipo di dati quantizzato di valori vettoriali compressi.

Valore	Descrizione
int8

VectorSearchProfile

Object

Definisce una combinazione di configurazioni da usare con la ricerca vettoriale.

Nome	Tipo	Descrizione
algorithm	string	Nome della configurazione dell'algoritmo di ricerca vettoriale che specifica l'algoritmo e i parametri facoltativi.
compression	string	Nome della configurazione del metodo di compressione che specifica il metodo di compressione e i parametri facoltativi.
name	string	Nome da associare a questo particolare profilo di ricerca vettoriale.
vectorizer	string	Nome della vettorializzazione configurata per l'uso con la ricerca vettoriale.

VectorSearchVectorizerKind

Enumerazione

Metodo di vettorizzazione da usare durante il tempo di query.

Valore	Descrizione
azureOpenAI	Generare incorporamenti usando una risorsa OpenAI di Azure in fase di query.
customWebApi	Generare incorporamenti usando un endpoint Web personalizzato in fase di query.

WebApiParameters

Object

Specifica le proprietà per la connessione a un vettore definito dall'utente.

Nome	Tipo	Descrizione
authIdentity	SearchIndexerDataIdentity: SearchIndexerDataNoneIdentity SearchIndexerDataUserAssignedIdentity	Identità gestita assegnata dall'utente usata per le connessioni in uscita. Se viene specificato un authResourceId e non viene specificato, viene usata l'identità gestita assegnata dal sistema. Negli aggiornamenti all'indicizzatore, se l'identità non è specificata, il valore rimane invariato. Se impostato su "none", il valore di questa proprietà viene cancellato.
authResourceId	string	Si applica agli endpoint personalizzati che si connettono a codice esterno in una funzione di Azure o a un'altra applicazione che fornisce le trasformazioni. Questo valore deve essere l'ID applicazione creato per la funzione o l'app quando è stato registrato con Azure Active Directory. Se specificata, la vettorializzazione si connette alla funzione o all'app usando un ID gestito (sistema o assegnato dall'utente) del servizio di ricerca e il token di accesso della funzione o dell'app, usando questo valore come ID risorsa per creare l'ambito del token di accesso.
httpHeaders	object	Intestazioni necessarie per effettuare la richiesta HTTP.
httpMethod	string	Metodo per la richiesta HTTP.
timeout	string (duration)	Timeout desiderato per la richiesta. Il valore predefinito è 30 secondi.
uri	string (uri)	URI dell'API Web che fornisce il vettore.

WebApiVectorizer

Object

Specifica un vettore definito dall'utente per generare l'incorporamento del vettore di una stringa di query. L'integrazione di un vettore esterno viene ottenuta usando l'interfaccia API Web personalizzata di un set di competenze.

Nome	Tipo	Descrizione
customWebApiParameters	WebApiParameters	Specifica le proprietà del vettore definito dall'utente.
kind	string: customWebApi	Nome del tipo di metodo di vettorizzazione configurato per l'uso con la ricerca vettoriale.
name	string	Nome da associare a questo particolare metodo di vettorizzazione.

WordDelimiterTokenFilter

Object

Suddivide le parole in parole secondarie ed esegue trasformazioni facoltative nei gruppi di sottoword. Questo filtro di token viene implementato usando Apache Lucene.

Nome	Tipo	Valore predefinito	Descrizione
@odata.type	string: #Microsoft.Azure.Search.WordDelimiterTokenFilter		Frammento URI che specifica il tipo di filtro del token.
catenateAll	boolean	False	Valore che indica se tutte le parti della sottomaschera verranno catenate. Ad esempio, se è impostato su true, "Azure-Search-1" diventa "AzureSearch1". Il valore predefinito è false.
catenateNumbers	boolean	False	Valore che indica se le esecuzioni massime di parti numerice verranno catenate. Ad esempio, se è impostato su true, "1-2" diventa "12". Il valore predefinito è false.
catenateWords	boolean	False	Valore che indica se verranno catenate le esecuzioni massime delle parti di parola. Ad esempio, se questa opzione è impostata su true, "Azure-Search" diventa "AzureSearch". Il valore predefinito è false.
generateNumberParts	boolean	True	Valore che indica se generare le parole secondarie per il numero. Il valore predefinito è true.
generateWordParts	boolean	True	Valore che indica se generare parole di parte. Se impostata, fa sì che vengano generate parti di parole; ad esempio "AzureSearch" diventa "Azure" "Search". Il valore predefinito è true.
name	string		Nome del filtro del token. Deve contenere solo lettere, cifre, spazi, trattini o caratteri di sottolineatura, può iniziare e terminare solo con caratteri alfanumerici ed è limitato a 128 caratteri.
preserveOriginal	boolean	False	Valore che indica se le parole originali verranno mantenute e aggiunte all'elenco delle parole secondarie. Il valore predefinito è false.
protectedWords	string[]		Elenco di token da proteggere dall'essere delimitato.
splitOnCaseChange	boolean	True	Valore che indica se dividere le parole in caseChange. Ad esempio, se è impostato su true, "AzureSearch" diventa "Azure" "Search". Il valore predefinito è true.
splitOnNumerics	boolean	True	Valore che indica se suddividere i numeri. Ad esempio, se è impostato su true, "Azure1Search" diventa "Azure" "1" "Search". Il valore predefinito è true.
stemEnglishPossessive	boolean	True	Valore che indica se rimuovere "'s" finale per ogni sottoword. Il valore predefinito è true.

Condividi tramite

Indexes - Create

Parametri dell'URI

Intestazione della richiesta

Corpo della richiesta

Risposte

Esempio

SearchServiceCreateIndex

Esempio di richiesta

Risposta di esempio

Definizioni

AsciiFoldingTokenFilter

AzureActiveDirectoryApplicationCredentials

AzureOpenAIEmbeddingSkill

AzureOpenAIModelName

AzureOpenAIParameters

AzureOpenAIVectorizer

BinaryQuantizationVectorSearchCompressionConfiguration

BM25Similarity

CharFilterName

CjkBigramTokenFilter

CjkBigramTokenFilterScripts

ClassicSimilarity

ClassicTokenizer

CommonGramTokenFilter

CorsOptions

CustomAnalyzer

DictionaryDecompounderTokenFilter

DistanceScoringFunction

DistanceScoringParameters

EdgeNGramTokenFilter

EdgeNGramTokenFilterSide

EdgeNGramTokenFilterV2

EdgeNGramTokenizer

ElisionTokenFilter

ErrorAdditionalInfo

ErrorDetail

ErrorResponse

ExhaustiveKnnParameters

ExhaustiveKnnVectorSearchAlgorithmConfiguration

FreshnessScoringFunction

FreshnessScoringParameters

HnswParameters

HnswVectorSearchAlgorithmConfiguration

InputFieldMappingEntry

KeepTokenFilter

KeywordMarkerTokenFilter

KeywordTokenizer

KeywordTokenizerV2

LengthTokenFilter

LexicalAnalyzerName

LexicalTokenizerName

LimitTokenFilter

LuceneStandardAnalyzer

LuceneStandardTokenizer

LuceneStandardTokenizerV2

MagnitudeScoringFunction

MagnitudeScoringParameters

MappingCharFilter

MicrosoftLanguageStemmingTokenizer

MicrosoftLanguageTokenizer

MicrosoftStemmingTokenizerLanguage

MicrosoftTokenizerLanguage

NGramTokenFilter

NGramTokenFilterV2

NGramTokenizer

OutputFieldMappingEntry

PathHierarchyTokenizerV2

PatternAnalyzer

PatternCaptureTokenFilter

PatternReplaceCharFilter

PatternReplaceTokenFilter

PatternTokenizer

PhoneticEncoder

PhoneticTokenFilter

PrioritizedFields

RegexFlags

ScalarQuantizationParameters

ScalarQuantizationVectorSearchCompressionConfiguration

ScoringFunctionAggregation