Udostępnij za pośrednictwem


EdgeNGramTokenizer interface

Tokenizuje dane wejściowe z krawędzi do n-gramów danego rozmiaru. Ten tokenizer jest implementowany przy użyciu platformy Apache Lucene.

Extends

Właściwości

maxGram

Maksymalna długość n-grama. Wartość domyślna to 2. Wartość maksymalna to 300.

minGram

Minimalna długość n-grama. Domyślna wartość wynosi 1. Wartość maksymalna to 300. Musi być mniejsza niż wartość maxGram.

odatatype

Dyskryminator polimorficzny, który określa różne typy, które mogą być tym obiektem

tokenChars

Klasy znaków do przechowywania w tokenach.

Właściwości dziedziczone

name

Nazwa tokenizatora. Musi zawierać tylko litery, cyfry, spacje, kreski lub podkreślenia, mogą zaczynać i kończyć się wyłącznie znakami alfanumerycznymi i jest ograniczona do 128 znaków.

Szczegóły właściwości

maxGram

Maksymalna długość n-grama. Wartość domyślna to 2. Wartość maksymalna to 300.

maxGram?: number

Wartość właściwości

number

minGram

Minimalna długość n-grama. Domyślna wartość wynosi 1. Wartość maksymalna to 300. Musi być mniejsza niż wartość maxGram.

minGram?: number

Wartość właściwości

number

odatatype

Dyskryminator polimorficzny, który określa różne typy, które mogą być tym obiektem

odatatype: "#Microsoft.Azure.Search.EdgeNGramTokenizer"

Wartość właściwości

"#Microsoft.Azure.Search.EdgeNGramTokenizer"

tokenChars

Klasy znaków do przechowywania w tokenach.

tokenChars?: TokenCharacterKind[]

Wartość właściwości

Szczegóły właściwości dziedziczonej

name

Nazwa tokenizatora. Musi zawierać tylko litery, cyfry, spacje, kreski lub podkreślenia, mogą zaczynać i kończyć się wyłącznie znakami alfanumerycznymi i jest ograniczona do 128 znaków.

name: string

Wartość właściwości

string

Dziedziczone zBaseLexicalTokenizer.name