共用方式為


MicrosoftLanguageTokenizer interface

使用語言特定規則來分割文字。

Extends

屬性

isSearchTokenizer

值,指出如何使用Tokenizer。 如果使用 做為搜尋Tokenizer,請將 設定為 true,如果做為索引標記化工具,則設定為 false。 默認值為 false。

language

要使用的語言。 預設值為英文。

maxTokenLength

令牌長度上限。 分割長度超過最大長度的令牌。 可以使用的令牌長度上限為 300 個字元。 超過 300 個字元的令牌會先分割成長度為 300 的令牌,然後每個令牌都會根據設定的令牌長度上限來分割。 預設值為 255。

odatatype

多型歧視性,指定這個物件可以是的不同類型

繼承的屬性

name

Tokenizer 的名稱。 它只能包含字母、數位、空格、破折號或底線,只能以英數位元開頭和結尾,而且限制為128個字元。

屬性詳細資料

isSearchTokenizer

值,指出如何使用Tokenizer。 如果使用 做為搜尋Tokenizer,請將 設定為 true,如果做為索引標記化工具,則設定為 false。 默認值為 false。

isSearchTokenizer?: boolean

屬性值

boolean

language

要使用的語言。 預設值為英文。

language?: MicrosoftTokenizerLanguage

屬性值

maxTokenLength

令牌長度上限。 分割長度超過最大長度的令牌。 可以使用的令牌長度上限為 300 個字元。 超過 300 個字元的令牌會先分割成長度為 300 的令牌,然後每個令牌都會根據設定的令牌長度上限來分割。 預設值為 255。

maxTokenLength?: number

屬性值

number

odatatype

多型歧視性,指定這個物件可以是的不同類型

odatatype: "#Microsoft.Azure.Search.MicrosoftLanguageTokenizer"

屬性值

"#Microsoft.Azure.Search.MicrosoftLanguageTokenizer"

繼承的屬性詳細資料

name

Tokenizer 的名稱。 它只能包含字母、數位、空格、破折號或底線,只能以英數位元開頭和結尾,而且限制為128個字元。

name: string

屬性值

string

繼承自BaseLexicalTokenizer.name