NGramTokenizer interface

Referensi

Paket:: @azure/search-documents

Tokenisasi input menjadi n-gram dari ukuran yang diberikan. Tokenizer ini diimplementasikan menggunakan Apache Lucene.

Extends: BaseLexicalTokenizer

Properti

maxGram	Panjang maksimum n-gram. Defaultnya adalah 2. Maksimum adalah 300.
minGram	Panjang n-gram minimum. Defaultnya adalah 1. Maksimum adalah 300. Harus kurang dari nilai maxGram.
odatatype	Diskriminator polimorfik, yang menentukan berbagai jenis objek ini dapat
tokenChars	Kelas karakter untuk disimpan dalam token.

Properti yang Diwariskan

name	Nama tokenizer. Nama hanya boleh berisi huruf, digit, spasi, garis putus-putus, atau garis bawah, hanya dapat dimulai dan diakhiri dengan karakter alfanumerik, dan dibatasi hingga 128 karakter.

Detail Properti

maxGram

Panjang maksimum n-gram. Defaultnya adalah 2. Maksimum adalah 300.

maxGram?: number

Nilai Properti

number

minGram

Panjang n-gram minimum. Defaultnya adalah 1. Maksimum adalah 300. Harus kurang dari nilai maxGram.

minGram?: number

Nilai Properti

number

odatatype

Diskriminator polimorfik, yang menentukan berbagai jenis objek ini dapat

odatatype: "#Microsoft.Azure.Search.NGramTokenizer"

Nilai Properti

"#Microsoft.Azure.Search.NGramTokenizer"

tokenChars

Kelas karakter untuk disimpan dalam token.

tokenChars?: TokenCharacterKind[]

Nilai Properti

TokenCharacterKind[]

Detail Properti yang Diwariskan

name

Nama tokenizer. Nama hanya boleh berisi huruf, digit, spasi, garis putus-putus, atau garis bawah, hanya dapat dimulai dan diakhiri dengan karakter alfanumerik, dan dibatasi hingga 128 karakter.

name: string

Nilai Properti

string

Diwarisi DariBaseLexicalTokenizer.name

Bagikan melalui

NGramTokenizer interface

Properti

Properti yang Diwariskan

Detail Properti

maxGram

Nilai Properti

minGram

Nilai Properti

odatatype

Nilai Properti

tokenChars

Nilai Properti

Detail Properti yang Diwariskan

name

Nilai Properti

Sumber Daya Tambahan: