你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

CustomAnalyzer interface

允许你控制将文本转换为可索引/可搜索令牌的过程。 它是用户定义的配置,由单个预定义的 tokenizer 和一个或多个筛选器组成。 tokenizer 负责将文本分解为令牌,以及用于修改 tokenizer 发出的令牌的筛选器。

属性

charFilters

用于在标记器处理输入文本之前准备输入文本的字符筛选器列表。 例如,它们可以替换某些字符或符号。 筛选器按列出顺序运行。

name

分析器的名称。 它必须仅包含字母、数字、空格、短划线或下划线,只能以字母数字字符开头和结尾,且最多包含 128 个字符。

odatatype

多态鉴别器

tokenFilters

用于筛选或修改 tokenizer 生成的令牌的令牌筛选器列表。 例如,可以指定将所有字符转换为小写的小写筛选器。 筛选器按列出顺序运行。

tokenizerName

用于将连续文本划分为一系列标记(例如将句子分解为单词)的 tokenizer 的名称。 KnownTokenizerNames 是包含内置 tokenizer 名称的枚举。

属性详细信息

charFilters

用于在标记器处理输入文本之前准备输入文本的字符筛选器列表。 例如,它们可以替换某些字符或符号。 筛选器按列出顺序运行。

charFilters?: string[]

属性值

string[]

name

分析器的名称。 它必须仅包含字母、数字、空格、短划线或下划线,只能以字母数字字符开头和结尾,且最多包含 128 个字符。

name: string

属性值

string

odatatype

多态鉴别器

odatatype: "#Microsoft.Azure.Search.CustomAnalyzer"

属性值

"#Microsoft.Azure.Search.CustomAnalyzer"

tokenFilters

用于筛选或修改 tokenizer 生成的令牌的令牌筛选器列表。 例如,可以指定将所有字符转换为小写的小写筛选器。 筛选器按列出顺序运行。

tokenFilters?: string[]

属性值

string[]

tokenizerName

用于将连续文本划分为一系列标记(例如将句子分解为单词)的 tokenizer 的名称。 KnownTokenizerNames 是包含内置 tokenizer 名称的枚举。

tokenizerName: string

属性值

string