ClassicTokenizer interface
ほとんどのヨーロッパ言語ドキュメントの処理に適した文法ベースのトークナイザー。 このトークナイザーは、Apache Lucene を使用して実装されます。
- Extends
プロパティ
| max |
トークンの最大長。 既定値は 255 です。 最大長を超えるトークンは分割されます。 使用できるトークンの最大長は 300 文字です。 |
| odatatype | ポリモーフィック識別子。このオブジェクトは、さまざまな型を指定します。 |
継承されたプロパティ
| name | トークナイザーの名前。 文字、数字、スペース、ダッシュ、アンダースコアのみを含める必要があり、開始と終了は英数字のみで、128 文字に制限されます。 |
プロパティの詳細
maxTokenLength
トークンの最大長。 既定値は 255 です。 最大長を超えるトークンは分割されます。 使用できるトークンの最大長は 300 文字です。
maxTokenLength?: number
プロパティ値
number
odatatype
ポリモーフィック識別子。このオブジェクトは、さまざまな型を指定します。
odatatype: "#Microsoft.Azure.Search.ClassicTokenizer"
プロパティ値
"#Microsoft.Azure.Search.ClassicTokenizer"
継承されたプロパティの詳細
name
トークナイザーの名前。 文字、数字、スペース、ダッシュ、アンダースコアのみを含める必要があり、開始と終了は英数字のみで、128 文字に制限されます。
name: string
プロパティ値
string