EdgeNGramTokenizer interface
Tokenizuje dane wejściowe z krawędzi do n-gramów danego rozmiaru. Ten tokenizer jest implementowany przy użyciu platformy Apache Lucene.
- Extends
Właściwości
max |
Maksymalna długość n-grama. Wartość domyślna to 2. Wartość maksymalna to 300. |
min |
Minimalna długość n-grama. Domyślna wartość wynosi 1. Wartość maksymalna to 300. Musi być mniejsza niż wartość maxGram. |
odatatype | Dyskryminator polimorficzny, który określa różne typy, które mogą być tym obiektem |
token |
Klasy znaków do przechowywania w tokenach. |
Właściwości dziedziczone
name | Nazwa tokenizatora. Musi zawierać tylko litery, cyfry, spacje, kreski lub podkreślenia, mogą zaczynać i kończyć się wyłącznie znakami alfanumerycznymi i jest ograniczona do 128 znaków. |
Szczegóły właściwości
maxGram
Maksymalna długość n-grama. Wartość domyślna to 2. Wartość maksymalna to 300.
maxGram?: number
Wartość właściwości
number
minGram
Minimalna długość n-grama. Domyślna wartość wynosi 1. Wartość maksymalna to 300. Musi być mniejsza niż wartość maxGram.
minGram?: number
Wartość właściwości
number
odatatype
Dyskryminator polimorficzny, który określa różne typy, które mogą być tym obiektem
odatatype: "#Microsoft.Azure.Search.EdgeNGramTokenizer"
Wartość właściwości
"#Microsoft.Azure.Search.EdgeNGramTokenizer"
tokenChars
Klasy znaków do przechowywania w tokenach.
tokenChars?: TokenCharacterKind[]
Wartość właściwości
Szczegóły właściwości dziedziczonej
name
Nazwa tokenizatora. Musi zawierać tylko litery, cyfry, spacje, kreski lub podkreślenia, mogą zaczynać i kończyć się wyłącznie znakami alfanumerycznymi i jest ograniczona do 128 znaków.
name: string
Wartość właściwości
string
Dziedziczone zBaseLexicalTokenizer.name