MicrosoftLanguageTokenizer interface

使用語言特定規則來分割文字。

屬性

isSearchTokenizer	值，指出如何使用Tokenizer。如果使用做為搜尋Tokenizer，請將設定為 true，如果做為索引標記化工具，則設定為 false。默認值為 false。
language	要使用的語言。預設值為英文。
maxTokenLength	令牌長度上限。分割長度超過最大長度的令牌。可以使用的令牌長度上限為 300 個字元。超過 300 個字元的令牌會先分割成長度為 300 的令牌，然後每個令牌都會根據設定的令牌長度上限來分割。預設值為 255。
odatatype	多型歧視性，指定這個物件可以是的不同類型

name	Tokenizer 的名稱。它只能包含字母、數位、空格、破折號或底線，只能以英數位元開頭和結尾，而且限制為128個字元。

值，指出如何使用Tokenizer。如果使用做為搜尋Tokenizer，請將設定為 true，如果做為索引標記化工具，則設定為 false。默認值為 false。

isSearchTokenizer?: boolean

boolean

要使用的語言。預設值為英文。

language?: MicrosoftTokenizerLanguage

令牌長度上限。分割長度超過最大長度的令牌。可以使用的令牌長度上限為 300 個字元。超過 300 個字元的令牌會先分割成長度為 300 的令牌，然後每個令牌都會根據設定的令牌長度上限來分割。預設值為 255。

maxTokenLength?: number

number

多型歧視性，指定這個物件可以是的不同類型

odatatype: "#Microsoft.Azure.Search.MicrosoftLanguageTokenizer"

"#Microsoft.Azure.Search.MicrosoftLanguageTokenizer"

Tokenizer 的名稱。它只能包含字母、數位、空格、破折號或底線，只能以英數位元開頭和結尾，而且限制為128個字元。

name: string

string