MicrosoftLanguageTokenizer interface
使用語言特定規則來分割文字。
- Extends
屬性
is |
值,指出如何使用Tokenizer。 如果使用 做為搜尋Tokenizer,請將 設定為 true,如果做為索引標記化工具,則設定為 false。 默認值為 false。 |
language | 要使用的語言。 預設值為英文。 |
max |
令牌長度上限。 分割長度超過最大長度的令牌。 可以使用的令牌長度上限為 300 個字元。 超過 300 個字元的令牌會先分割成長度為 300 的令牌,然後每個令牌都會根據設定的令牌長度上限來分割。 預設值為 255。 |
odatatype | 多型歧視性,指定這個物件可以是的不同類型 |
繼承的屬性
name | Tokenizer 的名稱。 它只能包含字母、數位、空格、破折號或底線,只能以英數位元開頭和結尾,而且限制為128個字元。 |
屬性詳細資料
isSearchTokenizer
值,指出如何使用Tokenizer。 如果使用 做為搜尋Tokenizer,請將 設定為 true,如果做為索引標記化工具,則設定為 false。 默認值為 false。
isSearchTokenizer?: boolean
屬性值
boolean
language
maxTokenLength
令牌長度上限。 分割長度超過最大長度的令牌。 可以使用的令牌長度上限為 300 個字元。 超過 300 個字元的令牌會先分割成長度為 300 的令牌,然後每個令牌都會根據設定的令牌長度上限來分割。 預設值為 255。
maxTokenLength?: number
屬性值
number
odatatype
多型歧視性,指定這個物件可以是的不同類型
odatatype: "#Microsoft.Azure.Search.MicrosoftLanguageTokenizer"
屬性值
"#Microsoft.Azure.Search.MicrosoftLanguageTokenizer"
繼承的屬性詳細資料
name
Tokenizer 的名稱。 它只能包含字母、數位、空格、破折號或底線,只能以英數位元開頭和結尾,而且限制為128個字元。
name: string
屬性值
string