WordDelimiterTokenFilter Klasse
Definition
Wichtig
Einige Informationen beziehen sich auf Vorabversionen, die vor dem Release ggf. grundlegend überarbeitet werden. Microsoft übernimmt hinsichtlich der hier bereitgestellten Informationen keine Gewährleistungen, seien sie ausdrücklich oder konkludent.
Unterteilt Wörter in Teilwörter und führt optionale Transformationen in Teilwortgruppen durch. Dieser Tokenfilter wird mit Apache Lucene implementiert.
public class WordDelimiterTokenFilter : Azure.Search.Documents.Indexes.Models.TokenFilter
type WordDelimiterTokenFilter = class
inherit TokenFilter
Public Class WordDelimiterTokenFilter
Inherits TokenFilter
- Vererbung
Konstruktoren
WordDelimiterTokenFilter(String) |
Initialisiert eine neue instance von WordDelimiterTokenFilter. |
Eigenschaften
CatenateAll |
Ein -Wert, der angibt, ob alle Teilwortteile kategorisiert werden. Wenn dies beispielsweise auf true festgelegt ist, wird "Azure-Search-1" zu "AzureSearch1". Der Standardwert ist "false". |
CatenateNumbers |
Ein -Wert, der angibt, ob maximale Ausführungen von Zahlenteilen kategorisiert werden. Wenn dies beispielsweise auf TRUE festgelegt ist, wird "1-2" zu "12". Der Standardwert ist "false". |
CatenateWords |
Ein -Wert, der angibt, ob maximale Ausführungen von Wortteilen kategorisiert werden. Wenn dies beispielsweise auf true festgelegt ist, wird "Azure-Search" zu "AzureSearch". Der Standardwert ist "false". |
GenerateNumberParts |
Ein -Wert, der angibt, ob Zahlenunterwörter generiert werden sollen. Der Standardwert ist "true". |
GenerateWordParts |
Ein -Wert, der angibt, ob Teilwörter generiert werden sollen. Wenn festgelegt, werden Teile von Wörtern generiert; beispielsweise wird "AzureSearch" zu "Azure" "Search". Der Standardwert ist "true". |
Name |
Der Name des Tokenfilters. Er darf nur Buchstaben, Ziffern, Leerzeichen, Bindestriche und Unterstriche enthalten. Er muss mit alphanumerischen Zeichen beginnen und enden und darf maximal 128 Zeichen lang sein. (Geerbt von TokenFilter) |
PreserveOriginal |
Ein -Wert, der angibt, ob ursprüngliche Wörter beibehalten und der Unterwortliste hinzugefügt werden. Der Standardwert ist "false". |
ProtectedWords |
Eine Liste der Token, die vor dem Trennen geschützt werden sollen. |
SplitOnCaseChange |
Ein -Wert, der angibt, ob Wörter in caseChange aufgeteilt werden sollen. Wenn dies beispielsweise auf TRUE festgelegt ist, wird "AzureSearch" zu "Azure" "Search". Der Standardwert ist "true". |
SplitOnNumerics |
Ein Wert, der angibt, ob auf Zahlen aufgeteilt werden soll. Wenn dies beispielsweise auf true festgelegt ist, wird "Azure1Search" zu "Azure" "1" "Search". Der Standardwert ist "true". |
StemEnglishPossessive |
Ein Wert, der angibt, ob nachfolgende "'s" für jedes Unterwort entfernt werden sollen. Der Standardwert ist "true". |
Gilt für:
Feedback
https://aka.ms/ContentUserFeedback.
Bald verfügbar: Im Laufe des Jahres 2024 werden wir GitHub-Issues stufenweise als Feedbackmechanismus für Inhalte abbauen und durch ein neues Feedbacksystem ersetzen. Weitere Informationen finden Sie unterFeedback senden und anzeigen für