你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

PatternTokenizer 类

定义

使用正则表达式模式匹配来构造不同令牌的 Tokenizer。 此 tokenizer 是使用 Apache Lucene 实现的。 http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/pattern/PatternTokenizer.html

[Newtonsoft.Json.JsonObject("#Microsoft.Azure.Search.PatternTokenizer")]
public class PatternTokenizer : Microsoft.Azure.Search.Models.Tokenizer
[<Newtonsoft.Json.JsonObject("#Microsoft.Azure.Search.PatternTokenizer")>]
type PatternTokenizer = class
    inherit Tokenizer
Public Class PatternTokenizer
Inherits Tokenizer
继承
PatternTokenizer
属性
Newtonsoft.Json.JsonObjectAttribute

构造函数

PatternTokenizer()

初始化 PatternTokenizer 类的新实例。

PatternTokenizer(String, String, Nullable<RegexFlags>, Nullable<Int32>)

初始化 PatternTokenizer 类的新实例。

属性

Flags

获取或设置正则表达式标志。 可能的值包括:“CANON_EQ”、“CASE_INSENSITIVE”、“COMMENTS”、“DOTALL”、“LITERAL”、“MULTILINE”、“UNICODE_CASE”、“UNIX_LINES”

Group

获取或设置正则表达式模式中要提取到标记中的匹配组的从零开始的序号。 如果要使用整个模式将输入拆分为标记,而不考虑匹配的组,请使用 -1。 默认值为 -1。

Name

获取或设置 tokenizer 的名称。 它必须仅包含字母、数字、空格、短划线或下划线,只能以字母数字字符开头和结尾,且最多包含 128 个字符。

(继承自 Tokenizer)
Pattern

获取或设置正则表达式模式以匹配标记分隔符。 默认值是匹配一个或多个空格字符的表达式。

方法

Validate()

验证 对象。

适用于