NGramTokenizer interface
將輸入標記化為指定大小的 n-gram。 這個 Tokenizer 是使用 Apache Lucene 實作。
- Extends
屬性
max |
n-gram 長度上限。 預設值為 2。 最大值為300。 |
min |
最小 n-gram 長度。 預設值為 1。 最大值為300。 必須小於 maxGram的值。 |
odatatype | 多型歧視性,指定這個物件可以是的不同類型 |
token |
要保留在令牌中的字元類別。 |
繼承的屬性
name | Tokenizer 的名稱。 它只能包含字母、數位、空格、破折號或底線,只能以英數位元開頭和結尾,而且限制為128個字元。 |
屬性詳細資料
maxGram
n-gram 長度上限。 預設值為 2。 最大值為300。
maxGram?: number
屬性值
number
minGram
最小 n-gram 長度。 預設值為 1。 最大值為300。 必須小於 maxGram的值。
minGram?: number
屬性值
number
odatatype
多型歧視性,指定這個物件可以是的不同類型
odatatype: "#Microsoft.Azure.Search.NGramTokenizer"
屬性值
"#Microsoft.Azure.Search.NGramTokenizer"
tokenChars
繼承的屬性詳細資料
name
Tokenizer 的名稱。 它只能包含字母、數位、空格、破折號或底線,只能以英數位元開頭和結尾,而且限制為128個字元。
name: string
屬性值
string