你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

CustomAnalyzer 类

定义

允许你控制将文本转换为可索引/可搜索令牌的过程。 它是用户定义的配置,由单个预定义的 tokenizer 和一个或多个筛选器组成。 tokenizer 负责将文本分解为令牌,以及用于修改 tokenizer 发出的令牌的筛选器。

[Newtonsoft.Json.JsonObject("#Microsoft.Azure.Search.CustomAnalyzer")]
public class CustomAnalyzer : Microsoft.Azure.Search.Models.Analyzer
[<Newtonsoft.Json.JsonObject("#Microsoft.Azure.Search.CustomAnalyzer")>]
type CustomAnalyzer = class
    inherit Analyzer
Public Class CustomAnalyzer
Inherits Analyzer
继承
CustomAnalyzer
属性
Newtonsoft.Json.JsonObjectAttribute

构造函数

CustomAnalyzer()

初始化 CustomAnalyzer 类的新实例。

CustomAnalyzer(String, TokenizerName, IList<TokenFilterName>, IList<CharFilterName>)

初始化 CustomAnalyzer 类的新实例。

属性

CharFilters

获取或设置字符筛选器的列表,这些筛选器用于在由 tokenizer 处理输入文本之前准备输入文本。 例如,它们可以替换某些字符或符号。 筛选器按其列出顺序运行。

Name

获取或设置分析器的名称。 它必须仅包含字母、数字、空格、短划线或下划线,只能以字母数字字符开头和结尾,且最多包含 128 个字符。

(继承自 Analyzer)
TokenFilters

获取或设置用于筛选或修改 tokenizer 生成的标记的标记筛选器的列表。 例如,可以指定将所有字符转换为小写的小写筛选器。 筛选器按其列出顺序运行。

Tokenizer

获取或设置用于将连续文本划分为标记序列的 tokenizer 的名称,例如将句子分解为单词。 可能的值包括:“classic”、“edgeNGram”、“keyword_v2”、“letter”、“lowercase”、“microsoft_language_tokenizer”、“microsoft_language_stemming_tokenizer”、“nGram”、“path_hierarchy_v2”、“pattern”、“standard_v2”、“uax_url_email”、“whitespace”

方法

Validate()

验证 对象。

适用于