你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn。
CustomAnalyzer interface
允许你控制将文本转换为可索引/可搜索令牌的过程。 它是用户定义的配置,由单个预定义的 tokenizer 和一个或多个筛选器组成。 tokenizer 负责将文本分解为令牌,以及用于修改 tokenizer 发出的令牌的筛选器。
属性
char |
用于在标记器处理输入文本之前准备输入文本的字符筛选器列表。 例如,它们可以替换某些字符或符号。 筛选器按列出顺序运行。 |
name | 分析器的名称。 它必须仅包含字母、数字、空格、短划线或下划线,只能以字母数字字符开头和结尾,且最多包含 128 个字符。 |
odatatype | 多态鉴别器 |
token |
用于筛选或修改 tokenizer 生成的令牌的令牌筛选器列表。 例如,可以指定将所有字符转换为小写的小写筛选器。 筛选器按列出顺序运行。 |
tokenizer |
用于将连续文本划分为一系列标记(例如将句子分解为单词)的 tokenizer 的名称。 KnownTokenizerNames 是包含内置 tokenizer 名称的枚举。 |
属性详细信息
charFilters
用于在标记器处理输入文本之前准备输入文本的字符筛选器列表。 例如,它们可以替换某些字符或符号。 筛选器按列出顺序运行。
charFilters?: string[]
属性值
string[]
name
分析器的名称。 它必须仅包含字母、数字、空格、短划线或下划线,只能以字母数字字符开头和结尾,且最多包含 128 个字符。
name: string
属性值
string
odatatype
多态鉴别器
odatatype: "#Microsoft.Azure.Search.CustomAnalyzer"
属性值
"#Microsoft.Azure.Search.CustomAnalyzer"
tokenFilters
用于筛选或修改 tokenizer 生成的令牌的令牌筛选器列表。 例如,可以指定将所有字符转换为小写的小写筛选器。 筛选器按列出顺序运行。
tokenFilters?: string[]
属性值
string[]
tokenizerName
用于将连续文本划分为一系列标记(例如将句子分解为单词)的 tokenizer 的名称。 KnownTokenizerNames 是包含内置 tokenizer 名称的枚举。
tokenizerName: string
属性值
string