Freigeben über


CustomAnalyzer Klasse

Definition

Ermöglicht Es Ihnen, die Kontrolle über den Prozess der Konvertierung von Text in indizierbare/durchsuchbare Token zu übernehmen. Es handelt sich um eine benutzerdefinierte Konfiguration, die aus einem einzelnen vordefinierten Tokenizer und einem oder mehreren Filtern besteht. Der Tokenizer ist für die Aufteilung von Text in Token verantwortlich, und die Filter zum Ändern von Token, die vom Tokenizer ausgegeben werden.

public class CustomAnalyzer : Azure.Search.Documents.Indexes.Models.LexicalAnalyzer
type CustomAnalyzer = class
    inherit LexicalAnalyzer
Public Class CustomAnalyzer
Inherits LexicalAnalyzer
Vererbung
CustomAnalyzer

Konstruktoren

CustomAnalyzer(String, LexicalTokenizerName)

Initialisiert eine neue instance von CustomAnalyzer.

Eigenschaften

CharFilters

Eine Liste von Zeichenfiltern, die zum Vorbereiten von Eingabetext verwendet werden, bevor er vom Tokenizer verarbeitet wird. Beispielsweise kann er bestimmte Zeichen oder Symbole ersetzen. Die Filter werden in der Reihenfolge ausgeführt, in der sie aufgelistet sind.

Name

Der Name des Analysetools. Er darf nur Buchstaben, Ziffern, Leerzeichen, Bindestriche und Unterstriche enthalten. Er muss mit alphanumerischen Zeichen beginnen und enden und darf maximal 128 Zeichen lang sein.

(Geerbt von LexicalAnalyzer)
TokenFilters

Eine Liste von Tokenfiltern, die verwendet werden, um die von einem Tokenizer generierten Token herauszufiltern oder zu ändern. Sie können beispielsweise einen Filter für Kleinbuchstaben angeben, mit dem alle Zeichen in Kleinbuchstaben konvertiert werden. Die Filter werden in der Reihenfolge ausgeführt, in der sie aufgelistet sind.

TokenizerName

Der Name des Tokenizers, der verwendet werden soll, um fortlaufenden Text in eine Sequenz von Token zu unterteilen, z. B. das Aufteilen eines Satzes in Wörter.

Gilt für: