Share via


CustomAnalyzer Klasse

Definition

Ermöglicht Es Ihnen, die Kontrolle über den Prozess der Konvertierung von Text in indizierbare/durchsuchbare Token zu übernehmen. Es handelt sich um eine benutzerdefinierte Konfiguration, die aus einem einzelnen vordefinierten Tokenizer und einem oder mehreren Filtern besteht. Der Tokenizer ist für die Aufteilung von Text in Token verantwortlich, und die Filter zum Ändern von Token, die vom Tokenizer ausgegeben werden.

[Newtonsoft.Json.JsonObject("#Microsoft.Azure.Search.CustomAnalyzer")]
public class CustomAnalyzer : Microsoft.Azure.Search.Models.Analyzer
[<Newtonsoft.Json.JsonObject("#Microsoft.Azure.Search.CustomAnalyzer")>]
type CustomAnalyzer = class
    inherit Analyzer
Public Class CustomAnalyzer
Inherits Analyzer
Vererbung
CustomAnalyzer
Attribute
Newtonsoft.Json.JsonObjectAttribute

Konstruktoren

CustomAnalyzer()

Initialisiert eine neue instance der CustomAnalyzer-Klasse.

CustomAnalyzer(String, TokenizerName, IList<TokenFilterName>, IList<CharFilterName>)

Initialisiert eine neue instance der CustomAnalyzer-Klasse.

Eigenschaften

CharFilters

Ruft eine Liste von Zeichenfiltern ab, die zum Vorbereiten von Eingabetext verwendet werden, bevor er vom Tokenizer verarbeitet wird, oder legt diese fest. Beispielsweise kann er bestimmte Zeichen oder Symbole ersetzen. Die Filter werden in der Reihenfolge ausgeführt, in der sie aufgelistet sind.

Name

Ruft den Namen des Analysetools ab oder legt den Namen des Analysetools fest. Er darf nur Buchstaben, Ziffern, Leerzeichen, Bindestriche und Unterstriche enthalten. Er muss mit alphanumerischen Zeichen beginnen und enden und darf maximal 128 Zeichen lang sein.

(Geerbt von Analyzer)
TokenFilters

Ruft eine Liste von Tokenfiltern ab, die zum Herausfiltern oder Ändern der von einem Tokenizer generierten Token verwendet werden, oder legt diese fest. Sie können beispielsweise einen Filter für Kleinbuchstaben angeben, mit dem alle Zeichen in Kleinbuchstaben konvertiert werden. Die Filter werden in der Reihenfolge ausgeführt, in der sie aufgelistet sind.

Tokenizer

Ruft den Namen des Tokenizers ab, der verwendet werden soll, um fortlaufenden Text in eine Sequenz von Token zu unterteilen, z. B. das Aufteilen eines Satzes in Wörter, oder legt diesen fest. Mögliche Werte: "classic", "edgeNGram", "keyword_v2", "letter", "lowercase", "microsoft_language_tokenizer", "microsoft_language_stemming_tokenizer", "nGram", "path_hierarchy_v2", "pattern", "standard_v2", "uax_url_email", "whitespace"

Methoden

Validate()

Überprüfen Sie das Objekt.

Gilt für: